Vau! DeepSeekMath-V2 Generaattori-Verifier-arkkitehtuuri taas! ... Kohti itsevarmennettavaa matemaattista päättelyä tutkimme, miten kouluttaa tarkka ja uskollinen LLM-pohjainen varmennustekijä teoreemien todistamiseen. Koulutamme sitten todistusgeneraattorin käyttäen varmentajaa palkitsemismallina ja kannustamme generaattoria tunnistamaan ja ratkaisemaan mahdollisimman monta ongelmaa omissa todistuksissaan ennen niiden viimeistelyä. Jotta generaattorin vahvistuskuilu säilyisi, ehdotamme verifiointilaskennan skaalautumista siten, että uudet vaikeasti tarkistettavat todistukset voidaan automaattisesti merkitä ja luoda koulutusdataa varmistajan parantamiseksi. Tuloksena oleva mallimme, DeepSeekMath-V2, osoittaa vahvoja teoreemoja todistavia kykyjä, saavuttaen kultatason pisteet IMO 2025:ssä ja CMO 2024:ssa sekä lähes täydelliset 118/120 Putnam 2024:ssä skaalatulla testiaikalaskennalla. Vaikka työtä on vielä paljon, nämä tulokset viittaavat siihen, että itse todennettavissa oleva matemaattinen päättely on toteuttamiskelpoinen tutkimussuunta, joka voi auttaa kehittämään kykenevämpiä matemaattisia tekoälyjärjestelmiä.