testade 500+ modeller i år och levererar en AI-produkt med +6 000 användare. Observerade: 1. chatten når ett tak 2. Model Wars avfärdar äldre modeller 3. öppen källkod är bättre för byggare 4. utvärderingar bör mäta uppgiftsutförande 5. Kontext är viktigare än förbättrat resonemang