我厌倦了METR的时间范围松弛。这个基准就像其他所有复杂的编码基准,只是结果经过创意渲染,它有一个上限(100%和16小时),并且它没有建议任何你不应该已经从“饱和”中得出的结论。
Beff – e/acc
Beff – e/acc8月12日 07:29
广义相对论花费了爱因斯坦8年的思考时间。 一旦人工智能的任务持续时间达到数年到数十年,它将开始发明关于物理世界的全新理论。 这就是新的扩展轴。
1.85K