Hiperdeflación de 📉 IA La hiperinflación es cuando los precios aumentan un 50% por mes, un shock económico extremo. El costo de la inferencia de IA avanzada se está desinflando mucho más allá de eso. Del recuerdo al razonamiento A medida que el costo / token se desploma, también crece el consumo. Una consulta básica de chatbot puede tomar ~ 100 tokens, la generación de código complejo ~ 100,000 y un flujo de trabajo agencial de varios pasos o una tarea de razonamiento pueden tomar un millón. Me recuerda al viejo adagio "Lo que Intel da, Microsoft quita" refundido para NVIDIA e IA.
8.16K