Bu yıl +6k kullanıcılı bir yapay zeka ürünü gönderen 500+ model test etti. Gözlenen: 1. Sohbet bir tavana ulaşıyor 2. Model savaşları eski modelleri küçümsedi 3. Açık kaynak inşaatçılar için daha iyidir 4. Değerlendirmeler görev yürütmesini ölçmelidir 5. Bağlam, gelişmiş akıl yürütmeden daha önemlidir