熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
看到這個模型解決這些 IMO 問題並達到金級表現,真是太神奇了。幾個想法 🧵

2025年7月19日
1/N I’m excited to share that our latest @OpenAI experimental reasoning LLM has achieved a longstanding grand challenge in AI: gold medal-level performance on the world’s most prestigious math competition—the International Math Olympiad (IMO).

這個模型在沒有像 lean 或編碼這樣的工具的情況下解決這些問題,它僅僅使用自然語言,並且只有 4.5 小時。我們看到模型在非常高的層次上進行推理——嘗試不同的策略,從例子中進行觀察,並測試假設。
我們從 AIME (GPT 4o) 的 12% 到現在的 IMO 金牌,這真是太瘋狂了,僅僅 15 個月的時間。我們進步得非常快。如果明年模型能夠推導出新的定理並對原創數學研究做出貢獻,我也不會感到驚訝!
796.41K
熱門
排行
收藏