DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

¡Guau! DeepSeekMath-V2 ¡Arquitectura Generador-Verificador de nuevo! ... Hacia un razonamiento matemático auto-verificable, investigamos cómo entrenar un verificador basado en LLM que sea preciso y fiel para la demostración de teoremas. Luego entrenamos un generador de pruebas utilizando el verificador como modelo de recompensa, e incentivamos al generador a identificar y resolver tantos problemas como sea posible en sus propias pruebas antes de finalizarlas. Para mantener la brecha de generación-verificación a medida que el generador se vuelve más fuerte, proponemos escalar la computación de verificación para etiquetar automáticamente nuevas pruebas difíciles de verificar, creando datos de entrenamiento para mejorar aún más el verificador. Nuestro modelo resultante, DeepSeekMath-V2, demuestra fuertes capacidades de demostración de teoremas, logrando puntuaciones de nivel oro en IMO 2025 y CMO 2024 y un casi perfecto 118/120 en Putnam 2024 con computación escalada en el tiempo de prueba. Si bien queda mucho trabajo por hacer, estos resultados sugieren que el razonamiento matemático auto-verificable es una dirección de investigación factible que puede ayudar a desarrollar sistemas de IA matemática más capaces.

Parte superior

Clasificación

Favoritos