La tokenizzazione è solo un caso speciale di "chunking" - la costruzione di dati di basso livello in astrazioni di alto livello - che è a sua volta fondamentale per l'intelligenza. La nostra nuova architettura, che consente la suddivisione gerarchica in blocchi dinamici, non solo è priva di tokenizzatore, ma semplicemente si adatta meglio.
Sukjun (June) Hwang
Sukjun (June) Hwang12 lug 2025
La tokenizzazione è stata l'ultima barriera per modelli linguistici veramente end-to-end. Abbiamo sviluppato l'H-Net: una rete gerarchica che sostituisce la tokenizzazione con un processo di suddivisione dinamica direttamente all'interno del modello, scoprendo e operando automaticamente su unità significative di dati.
Questo è stato un progetto incredibilmente importante per me: volevo risolverlo da anni, ma non avevo idea di come. Tutto questo è stato @sukjun_hwang e @fluorane un lavoro straordinario! Ho scritto della storia del suo sviluppo e di ciò che potrebbe accadere dopo. La rete H:
194,77K