Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Directeur de la robotique de NVIDIA et scientifique émérite. Co-responsable du laboratoire GEAR. Résoudre l’IAG physique, un moteur à la fois. Stanford Ph.D. 1er stagiaire d’OpenAI.
Écoutez mes paroles : chaque année à partir de maintenant sera l'Année de la Robotique. Si opus 4.5/nanobanana vous a époustouflé - eh bien, vous n'avez encore rien vu dans le Monde des Atomes. Profitez du train LLM tant qu'il dure. Je monte dans la prochaine fusée 🚀
Bonne année à tous 🎊
(désolé, je n'ai pas pu résister à la plus ancienne figure de slop dans l'IA)

205
Tout le monde s'inquiète à propos du codage de l'ambiance. Dans l'esprit des fêtes, permettez-moi de partager mon anxiété sur le far west de la robotique. 3 leçons que j'ai apprises en 2025.
1. Le matériel est en avance sur le logiciel, mais la fiabilité du matériel limite sévèrement la vitesse d'itération du logiciel.
Nous avons vu des arts d'ingénierie exquis comme Optimus, e-Atlas, Figure, Neo, G1, etc. Notre meilleure IA n'a pas extrait tout le jus de ce matériel de pointe. Le corps est plus capable que ce que le cerveau peut commander. Pourtant, garder ces robots nécessite une équipe opérationnelle entière. Contrairement aux humains, les robots ne guérissent pas des contusions. La surchauffe, les moteurs cassés, les problèmes de firmware bizarres nous hantent quotidiennement. Les erreurs sont irréversibles et impitoyables.
Ma patience était la seule chose qui a évolué.
2. Le benchmarking est toujours un désastre épique dans la robotique.
Les normies LLM pensaient que MMLU et SWE-Bench étaient du bon sens. Gardez votre 🍺 pour la robotique. Personne n'est d'accord sur quoi que ce soit : plateforme matérielle, définition de la tâche, rubriques de notation, simulateur ou configurations du monde réel. Tout le monde est SOTA, par définition, sur le benchmark qu'il définit à la volée pour chaque annonce. Chacun choisit la plus belle démo parmi 100 essais.
Nous devons faire mieux en tant que domaine en 2026 et arrêter de traiter la reproductibilité et la discipline scientifique comme des citoyens de seconde classe.
3. VLM basé sur VLA semble erroné.
VLA signifie "modèle vision-langage-action" et a été l'approche dominante pour les cerveaux de robots. La recette est simple : prendre un point de contrôle VLM pré-entraîné et greffer un module d'action par-dessus. Mais si vous y réfléchissez, les VLM sont hyper-optimisés pour grimper des benchmarks comme le questionnement visuel. Cela implique deux problèmes : (1) la plupart des paramètres dans les VLM sont pour le langage et la connaissance, pas pour la physique ; (2) les encodeurs visuels sont activement réglés pour *écarter* les détails de bas niveau, car le Q&A nécessite seulement une compréhension de haut niveau. Mais les détails minutieux comptent beaucoup pour la dextérité.
Il n'y a aucune raison pour que la performance de VLA évolue à mesure que les paramètres de VLM évoluent. Le pré-entraînement est mal aligné. Le modèle de monde vidéo semble être un objectif de pré-entraînement beaucoup mieux adapté pour la politique robotique. Je parie gros là-dessus.

461
2024 : L'IA est le copilote
2025+ : les humains sont le copilote
Le copilote est la nouvelle compétence en ingénierie. Il n'est pas facile de quitter le siège du conducteur - nous devons apprendre à penser à la manière de l'IA et nous adapter aux flux de travail étrangers. Aidez l'IA à nous aider.

Andrej Karpathy27 déc. 2025
Je ne me suis jamais senti aussi en retard en tant que programmeur. La profession est en train d'être dramatiquement refondue alors que les contributions des programmeurs deviennent de plus en plus rares et éparses. J'ai le sentiment que je pourrais être 10 fois plus puissant si je parvenais simplement à bien assembler ce qui est devenu disponible au cours de l'année écoulée, et le fait de ne pas saisir cette opportunité ressemble clairement à un problème de compétence. Il y a une nouvelle couche d'abstraction programmable à maîtriser (en plus des couches habituelles en dessous) impliquant des agents, des sous-agents, leurs invites, contextes, mémoires, modes, permissions, outils, plugins, compétences, hooks, MCP, LSP, commandes slash, flux de travail, intégrations IDE, et un besoin de construire un modèle mental englobant pour les forces et les faiblesses d'entités fondamentalement stochastiques, faillibles, incompréhensibles et changeantes, soudainement mêlées à ce qui était autrefois le bon vieux génie. Clairement, un puissant outil extraterrestre a été distribué, sauf qu'il n'est accompagné d'aucun manuel et que tout le monde doit comprendre comment le tenir et l'utiliser, tandis que le tremblement de terre de magnitude 9 qui en résulte secoue la profession. Retroussez vos manches pour ne pas prendre de retard.
220
Meilleurs
Classement
Favoris
