Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
la semaine dernière, Karpathy a publié le GUIDE ULTIME pour se lancer rapidement dans les LLMs  
dans ce projet, vous construirez tous les éléments essentiels, le tout en moins de 8k lignes de code
> entraîner le tokenizer — nouvelle implémentation en rust
> préformer un LLM transformateur sur fineweb  
> évaluer le score de base sur un ensemble de métriques
> midtrain — conversations utilisateur-assistant à partir de smoltalk,  
>   questions à choix multiples, utilisation d'outils
> sft, puis évaluer le modèle de chat sur :
>   connaissances générales MCQ (arc-e/c, mmlu)
>   mathématiques (gsm8k)
>   code (humaneval)
> rl le modèle (optionnellement) sur gsm8k avec "grpo"
> inférence efficace :
>   cache kv, préremplissage/décodage rapide
>   utilisation d'outils (interpréteur python, en bac à sable)
>   accès via cli ou interface web semblable à chatgpt
> rédiger un seul rapport markdown,  
>   résumant + gamifiant l'ensemble du pipeline
le modèle que vous construirez :
> uniquement rotatif (pas d'embeddings positionnels)
> qk norm...

Meilleurs
Classement
Favoris

