caramba... A Hugging Face arrasou novamente! 🔥 eles acabaram de lançar um blog gratuito (LIVRO) que cobre a realidade sem rodeios de construir modelos SOTA. eu não vi nenhum laboratório/pesquisador entrar nas verdadeiras decisões por trás da pesquisa de LLM e suas nuances. isto é literalmente uma joia. Programa: → Bússola de treinamento: por que → o que → como → Todo grande modelo começa com uma pequena ablação → Projetando a arquitetura do modelo → A arte da curadoria de dados → A maratona de treinamento → Além dos modelos base — pós-treinamento em 2025 → Infraestrutura - o herói não reconhecido folheando o blog, isso é incrivelmente detalhado, assim como o seu playbook de ultrascale. eu vou ler isso e compartilhar mais sobre isso nos próximos dias. Leia aqui: