DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

ANTHROPIC DESCUBRE CÓMO INMUNIZAR A LA IA CONTRA DECISIONES REALMENTE MALAS Anthropic afirma que ahora puede vacunar a la IA contra el mal. Utilizando "vectores de persona" para rastrear rasgos como el engaño o la adulación, los investigadores entrenaron modelos de lenguaje inyectando deliberadamente comportamientos negativos y luego corrigiéndolos a mitad del entrenamiento. El resultado: menos alucinaciones, más control y sin pérdida de inteligencia. En lugar de eliminar rasgos después de los hechos, este método guía a los modelos antes de que la corrupción se instale. Es temprano, pero la tecnología puede finalmente permitir a los desarrolladores frenar la deriva de la IA con precisión quirúrgica antes de que los bots comiencen a adular a dictadores o a inventar mentiras para ganar argumentos. Fuente: techxplore

81,67K

Parte superior

Clasificación

Favoritos