Ik ben moe van de tijdshorizon slordigheid van METR. Deze benchmark is net als elke andere complexe coderingsbenchmark, alleen met creatief weergegeven resultaten, het heeft een plafond (100% en 16 uur), en het suggereert niets wat je niet al zou hebben geconcludeerd uit "verzadigende".
Beff – e/acc
Beff – e/acc12 aug, 07:29
De Algemene Relativiteitstheorie kostte 8 jaar van de rekentijd van Einsteins brein. Zodra AI taken van jaren tot decennia aanpakt, zal het beginnen met het uitvinden van geheel nieuwe theorieën over de fysieke wereld. Dit is de nieuwe schaalas.
1,89K