Andrej Karpathy: Data pelatihan internet sangat buruk, sehingga model besar akhirnya mengompresi "memori" alih-alih melakukan pekerjaan kognitif Gunakan model cerdas untuk memfilter ke inti kognitif Dengan data yang lebih bersih, model yang lebih kecil, kemungkinan disuling dari yang lebih kuat, sudah cukup