Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¡Guau! DeepSeekMath-V2
¡Arquitectura Generador-Verificador de nuevo!
... Hacia un razonamiento matemático auto-verificable, investigamos cómo entrenar un verificador basado en LLM que sea preciso y fiel para la demostración de teoremas. Luego entrenamos un generador de pruebas utilizando el verificador como modelo de recompensa, e incentivamos al generador a identificar y resolver tantos problemas como sea posible en sus propias pruebas antes de finalizarlas. Para mantener la brecha de generación-verificación a medida que el generador se vuelve más fuerte, proponemos escalar la computación de verificación para etiquetar automáticamente nuevas pruebas difíciles de verificar, creando datos de entrenamiento para mejorar aún más el verificador. Nuestro modelo resultante, DeepSeekMath-V2, demuestra fuertes capacidades de demostración de teoremas, logrando puntuaciones de nivel oro en IMO 2025 y CMO 2024 y un casi perfecto 118/120 en Putnam 2024 con computación escalada en el tiempo de prueba. Si bien queda mucho trabajo por hacer, estos resultados sugieren que el razonamiento matemático auto-verificable es una dirección de investigación factible que puede ayudar a desarrollar sistemas de IA matemática más capaces.

Parte superior
Clasificación
Favoritos

