GPT-5 только что был выпущен. Давайте оценим его производительность в достижении сложных возможностей, похожих на AGI: - @grok 4 (Мышление) превосходит @OpenAI GPT-5 (Высокий) как в тестах ARC-AGI-2 (сложное рассуждение), так и в тестах ARC-AGI-1 (менее требовательные). - Превосходная точность Grok 4 сопровождается значительно более высокими затратами на задачу, варьирующимися от 2 до 4 долларов. - Более легкие варианты GPT-5 (мини/нано) обеспечивают сбалансированный компромисс между производительностью и стоимостью по этим критериям. Обратите внимание, что тест ARC-AGI-3 в настоящее время проводится, и результаты вышеуказанных тестов не подразумевают превосходства модели. h/t @arcprize
1,29K