看到這個模型解決這些 IMO 問題並達到金級表現,真是太神奇了。幾個想法 🧵
Alexander Wei
Alexander Wei2025年7月19日
1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).
這個模型在沒有像 lean 或編碼這樣的工具的情況下解決這些問題,它僅僅使用自然語言,並且只有 4.5 小時。我們看到模型在非常高的層次上進行推理——嘗試不同的策略,從例子中進行觀察,並測試假設。
我們從 AIME (GPT 4o) 的 12% 到現在的 IMO 金牌,這真是太瘋狂了,僅僅 15 個月的時間。我們進步得非常快。如果明年模型能夠推導出新的定理並對原創數學研究做出貢獻,我也不會感到驚訝!
796.41K