8 tekoälymalliarkkitehtuuria, visuaalisesti selitettynä: Kaikki puhuvat LLM:istä, mutta on olemassa kokonainen perhe erikoistuneita malleja, jotka tekevät uskomattomia asioita. Tässä nopea yhteenveto: 1. LLM (Suuret kielimallit) Teksti menee sisään, tokenisoidaan upotuksiin, käsitellään muuntajien kautta, ja teksti tulee ulos. ↳ GPT, Claude, Kaksoset, Llama. 2. LCM (Large Concept Models) Toimii konseptitasolla, ei tokeneilla. Syöte jaetaan lauseiksi, kuljetetaan SONAR-upotusten kautta ja käytetään diffuusiota ennen tulostamista. ↳ Metan LCM on edelläkävijä. 3. LAM (Suuret toimintamallit) Muuttaa aikomuksen toiminnaksi. Syöte kulkee havainnon, intentiontunnistuksen, tehtävien jakamisen ja sitten toimintojen suunnittelun kautta muistin avulla ennen suoritusta. ↳ Rabbit R1, Microsoft UFO, Claude Tietokoneen käyttö. 4. MoE (asiantuntijoiden sekoitus) Reititin päättää, ketkä erikoistuneet "asiantuntijat" käsittelevät kyselysi. Vain asiaankuuluvat asiantuntijat aktivoituvat. Tulokset käyvät läpi valinnan ja käsittelyn. ↳ Mixtral, GPT-4, DeepSeek. ...