我厭倦了METR的時間範圍鬆弛。這個基準就像其他所有複雜的編碼基準,只是結果經過創意渲染,它有一個上限(100%和16小時),並且它沒有建議任何你不應該已經從「飽和」中得出的結論。
Beff – e/acc
Beff – e/acc8月12日 07:29
廣義相對論花了愛因斯坦8年的思考時間來計算。 一旦人工智慧的任務持續時間達到數年到數十年,它將開始發明關於物理世界的全新理論。 這是新的擴展軸。
1.85K