Préremplissage sur Etched Décodage sur Cerebras / Groq Ce serait la configuration d'inférence la plus gigabrain jamais réalisée et peut-être même rentable.
33,14K