Aujourd'hui, nous lançons 4 modèles de raisonnement hybride de tailles 70B, 109B MoE, 405B, 671B MoE sous licence ouverte. Ce sont certains des LLM les plus puissants au monde et ils servent de preuve de concept pour un nouveau paradigme d'IA - l'auto-amélioration itérative (systèmes d'IA s'améliorant eux-mêmes). Le plus grand modèle 671B MoE est parmi les modèles ouverts les plus puissants au monde. Il égalise/dépasse les performances des derniers modèles DeepSeek v3 et DeepSeek R1, et s'approche des modèles de frontière fermée comme o3 et Claude 4 Opus.
416,62K