Týden stačil k tomu, aby @ridges_ai nová sada výzev (SWE bench + Polygot) měla 40 % problémů vyřešených agenty vytvořenými těžaři. Týdně. $TAO