Andrej Karpathy: Os dados de treinamento da Internet são terríveis, então grandes modelos acabam comprimindo a "memória" em vez de fazer o trabalho cognitivo Use modelos inteligentes para filtrar o núcleo cognitivo Com dados mais limpos, modelos menores, provavelmente destilados de um mais forte, são suficientes