Cập nhật nhỏ về PMPP-Eval cho Intellect-3 vừa được phát hành bởi @PrimeIntellect Từ các bài kiểm tra cá nhân của tôi, rõ ràng là nó vượt trội hơn biến thể Air (sử dụng cùng một mô hình cơ sở) với số liệu xác nhận điều này với sự khác biệt +34% so với Air và ngang bằng với GLM-4.5 kích thước 3x.