Мне надоела неразбериха с временными рамками METR. Этот бенчмарк такой же, как и любой другой сложный кодировочный бенчмарк, только с креативно представленными результатами, у него есть потолок (100% и 16 часов), и он не предлагает ничего, что вы не должны были бы уже заключить из «насыщения».
Beff – e/acc
Beff – e/acc12 авг., 07:29
Общая теория относительности потребовала 8 лет вычислительного времени мозга Эйнштейна. Как только ИИ достигнет задач, требующих годы или десятилетия, он начнет изобретать совершенно новые теории о физическом мире. Это новая ось масштабирования.
1,89K