омг 🤯 - 9/12 на Putnam 2025! Если вы не в AI + математике, вы можете пропустить потрясающий результат, полученный здесь. Объяснение: - ноль обучения на тестовом наборе / benchmaxxing! Модель обнаружила/обработала вопросы 2025 года автономно одновременно со студентами, работая параллельно с ними. - Putnam намного сложнее, чем IMO! Нацелен на студентов бакалавриата (в отличие от старшеклассников для IMO), это тест с математическими вопросами уровня исследовательского проекта. Медианный балл обычно 0 (да, большинство участников не может решить ни одного вопроса…) - AxiomMath - это стартап, которому 4 месяца…