GPU-pinomme sekä NVIDIAlle että AMD:lle, lukuun ottamatta minimaalisia allekirjoitettuja laiteohjelmistoja, on 100 % avointa lähdekoodia ja puhdasta Pythonia kääntäjää lukuun ottamatta. Se ei käytä toimittajan ajureita, kehyksiä tai kirjastoja. Siksi sen saaminen toimimaan Macissa on niin helppoa. Kääntäjissä käytämme AMD:ssä ylävirran LLVM:ää ja NVIDIA:ssa MESA-projektin NAK-kääntäjää. Aiomme myös korvata kääntäjän puhtaalla tinygradilla vuoden tai kahden kuluttua. Kun RANGEIFY on yhdistetty, laskutavaramme vastaavat nyt uusinta tekniikkaa, TVM-tyyliä. Opiskelemme ThunderKittensin ja TileLangin nopeutta tällä tasolla, ja kaiken tämän pitäisi olla valmis 200 päivässä AMD Llama 405B -koulutussopimuksemme eräpäivään mennessä. Tinygradin pienen koon ja puhtaan Python-luonteen ansiosta se on helpoin ML-kirjasto edistyä, eli nopein parannuskaltevuus. Megakernel-tyylillä aikataulutuksessa, MODeL_opt tyylillä suunnittelussa ja E-graph-tyylillä symbolisessa muodossa, meidän pitäisi puhaltaa PyTorchin ja JAX:n nopeuden huippuluokan ohi. Jos teemme niin, NVIDIAn vallihauta on ohi. Uuden kiihdyttimen lisääminen tinygradiin on korkeintaan 1000 riviä. Enkä tarkoita lisätä uutta kiihdytintä ytimen ajurin, kääntäjän ja kirjastojen avulla. Vain 1000 riviä ohjelmistoa *kokonaiselle* kiihdyttimelle, joka puhuu suoraan PCIe-palkeissa, kuten mitä tinygrad tekee nyt NVIDIA- ja AMD-grafiikkasuorittimilla.
@geerlingguy Tai itse asiassa AMD on vielä helpompaa. Asenna vain 'extra/usbgpu/tbgpu' -ohjain ja AMD=1
@geerlingguy Tai itse asiassa AMD on vielä helpompaa. Asenna vain 'extra/usbgpu/tbgpu' -ohjain ja AMD=1. 0 aikoo tukea Inteliä tällä tasolla.
57,12K