Tekoälyn talous on saavuttamassa kriittisen käännekohdan. Tutkimusten mukaan eturintaman tekoälymallien koulutuskustannusten ennustetaan nousevan yli 1 miljardiin dollariin vuoteen 2027 mennessä. @AnthropicAI:n toimitusjohtaja Dario Amodei ennusti, että ensi vuonna tekoälymallien koulutuskustannukset kasvavat muutamaan miljardiin dollariin ajoa kohden. "Vuonna 2026 yhden mallin kouluttaminen voi olla yli 10 miljardia dollaria. Hän odottaa, että vuoteen 2027 mennessä malliyrityksillä on tavoitteita rakentaa 100 miljardin dollarin koulutusklustereita."
Laitteistoeste on hämmästyttävä: GPT-800:n kouluttamiseen käytetyn laitteiston hankkiminen maksoi noin 40 miljoonaa dollaria, kun taas jaksotetut kustannukset maksoivat 40 miljoonaa dollaria. Koulutuskustannusten kasvaessa ~2,4 × vuodessa tehottomasta laskentainfrastruktuurista on tulossa eksistentiaalinen uhka tekoälyyrityksille, jotka eivät pysty optimoimaan kulutustaan.
Erittelemme todelliset kustannukset: 7B-parametrin LLM:n kouluttaminen 1-2 biljoonalla tokenilla vaatii ~60 000 H100 GPU-tuntia. Meidän hinnallamme (1,49 dollaria/tunti) se on yhteensä 89 400 dollaria. Sama työmäärä AWS on-demandissa? Huikeat 405 000 dollaria. Muut pilvipalveluntarjoajat vaihtelevat 179 400–209 400 dollarin välillä, kun taas paikalliset ratkaisut maksavat noin 300 000 dollaria täysin kuoletettuina.
Alustamme tarjoaa selkeän edun: 2,5 × halvempi kuin alennettu AWS ja 3-4 × halvempi kuin tyypilliset pilvipalveluntarjoajat. On-prem-infrastruktuuri maksaa 6-9 × enemmän, kun kaikki kulut otetaan huomioon. Tiimeille, jotka pyrkivät budjettiystävälliseen ja läpinäkyvään LLM-koulutuksen skaalaamiseen, tarjontamme tarjoaa välittömiä säästöjä ja toiminnan yksinkertaistamista.
Mallien kasvaessa laskentatehokkuus ei ole vain mukava asia – se on kilpailuvallihauta. Kysymys ei ole siitä, onko sinulla varaa optimoida, vaan siitä, onko sinulla varaa olla optimoimatta. Aloita tekoälybudjettisi maksimointi jo tänään osoitteessa .
Viittaukset Epookki AI. "GPU:n hinta-suorituskykytrendit." Aikakausi AI, 2022, . Hobbhahn, Marius ja Tamay Besiroglu. "GPU:n hinta-suorituskykytrendit." Aikakausi AI, 2022, . TRG:n palvelinkeskukset. "Säästöjen vapauttaminen: Miksi NVIDIA H100 -grafiikkasuorittimet ylittävät AWS:n vuokrakustannukset." TRG-palvelinkeskukset, 2023, Cottier, Ben et al. "Frontier AI -mallien kouluttamisen nousevat kustannukset." arXiv, 2024,
Katso koko blogi täältä:
1,95K