Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jim Fan
Diretor de Robótica da NVIDIA & Cientista Distinto. Colíder do laboratório GEAR. Resolução de IAG Física, um motor de cada vez. Stanford Ph.D. 1º estagiário da OpenAI.
Atende às minhas palavras: todos os anos a partir de agora serão o Ano da Robótica. Se o opus 4.5/nanobanana te deixou de boca aberta - bem, ainda não viste nada no Mundo dos Átomos. Aproveita o comboio LLM enquanto dura. Estou a embarcar na próxima nave espacial 🚀
Feliz ano novo a todos 🎊
(desculpa, não consegui resistir à figura mais antiga da IA)

200
Todos estão em pânico com a codificação de vibrações. No espírito das festas, permita-me compartilhar minha ansiedade sobre o faroeste da robótica. 3 lições que aprendi em 2025.
1. O hardware está à frente do software, mas a confiabilidade do hardware limita severamente a velocidade de iteração do software.
Vimos artes de engenharia requintadas como Optimus, e-Atlas, Figure, Neo, G1, etc. Nossa melhor IA não extraiu todo o suco desse hardware de fronteira. O corpo é mais capaz do que o cérebro pode comandar. No entanto, cuidar desses robôs exige uma equipe inteira de operação. Ao contrário dos humanos, os robôs não se curam de contusões. Superaquecimento, motores quebrados, problemas bizarros de firmware nos assombram diariamente. Erros são irreversíveis e impiedosos.
Minha paciência foi a única coisa que escalou.
2. O benchmarking ainda é um desastre épico na robótica.
Os normies de LLM pensaram que MMLU e SWE-Bench são senso comum. Segure sua 🍺 para a robótica. Ninguém concorda em nada: plataforma de hardware, definição de tarefa, rubricas de pontuação, simulador ou configurações do mundo real. Todos são SOTA, por definição, no benchmark que definem no momento para cada anúncio de notícias. Todos escolhem a demonstração mais bonita de 100 tentativas.
Precisamos fazer melhor como campo em 2026 e parar de tratar a reprodutibilidade e a disciplina científica como cidadãos de segunda classe.
3. VLM baseado em VLA parece errado.
VLA significa "modelo visão-linguagem-ação" e tem sido a abordagem dominante para cérebros robóticos. A receita é simples: pegue um ponto de verificação VLM pré-treinado e enxerte um módulo de ação por cima. Mas se você pensar bem, os VLMs são hiper-otimizados para escalar benchmarks como perguntas e respostas visuais. Isso implica dois problemas: (1) a maioria dos parâmetros em VLMs é para linguagem e conhecimento, não para física; (2) os codificadores visuais são ativamente ajustados para *descartar* detalhes de baixo nível, porque Q&A só requer compreensão de alto nível. Mas detalhes minuciosos importam muito para a destreza.
Não há razão para o desempenho do VLA escalar à medida que os parâmetros do VLM escalam. O pré-treinamento está desalinhado. O modelo de mundo em vídeo parece ser um objetivo de pré-treinamento muito melhor para a política robótica. Estou apostando alto nisso.

457
2024: A IA é o copiloto
2025+: os humanos são o copiloto
O copiloto é a nova habilidade de engenharia. Não é fácil deixar o lugar do motorista - devemos aprender a pensar da maneira da IA e adaptar-nos aos fluxos de trabalho alienígenas. Ajudar a IA a ajudar-nos.

Andrej Karpathy27/12/2025
Nunca me senti tão atrasado como programador. A profissão está a ser dramaticamente reformulada à medida que os bits contribuídos pelo programador se tornam cada vez mais escassos e intercalados. Tenho a sensação de que poderia ser 10X mais poderoso se apenas conseguisse juntar corretamente o que se tornou disponível ao longo do último ~ano e a falha em reivindicar o impulso parece decididamente uma questão de habilidade. Há uma nova camada programável de abstração para dominar (além das camadas habituais abaixo) envolvendo agentes, subagentes, os seus prompts, contextos, memória, modos, permissões, ferramentas, plugins, habilidades, ganchos, MCP, LSP, comandos de barra, fluxos de trabalho, integrações de IDE, e a necessidade de construir um modelo mental abrangente para as forças e armadilhas de entidades fundamentalmente estocásticas, falíveis, incompreensíveis e em mudança que se misturaram subitamente com o que costumava ser a boa e velha engenharia. Claramente, alguma ferramenta poderosa e alienígena foi passada, exceto que vem sem manual e todos têm que descobrir como segurá-la e operá-la, enquanto o resultado magnitude 9 de um terremoto está a abalar a profissão. Arregaça as mangas para não ficar para trás.
216
Top
Classificação
Favoritos
