Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
¿Por qué DeepSeek-OCR es tan IMPORTANTE?
Los LLM existentes luchan con entradas largas porque solo pueden manejar un número fijo de tokens, conocido como ventana de contexto, y el costo de atención crece rápidamente a medida que las entradas se hacen más largas.
DeepSeek-OCR adopta un nuevo enfoque.
En lugar de enviar contexto largo directamente a un LLM, lo convierte en una imagen, comprime esa imagen en tokens visuales y luego pasa esos tokens al LLM.
Menos tokens conducen a un menor costo computacional de la atención y una ventana de contexto efectiva más grande. Esto hace que los chatbots y los modelos de documentos sean más capaces y eficientes.
¿Cómo se construye DeepSeek-OCR? El sistema tiene dos partes principales:
1. Codificador: Procesa una imagen de texto, extrae las características visuales y las comprime en una pequeña cantidad de tokens de visión.
2. Decodificador: Un modelo de lenguaje de Mezcla de Expertos que lee esos tokens y genera texto un token a la vez, similar a un transformador estándar de solo decodificador.
¿Cuándo usarlo?
DeepSeek-OCR muestra que el texto se puede comprimir de manera eficiente utilizando representaciones visuales.
Es especialmente útil para manejar documentos muy largos que superan los límites de contexto estándar. Puede usarlo para la compresión de contexto, tareas de OCR estándar o análisis profundo, como convertir tablas y diseños complejos en texto.
A ti: ¿Qué opinas sobre el uso de tokens visuales para manejar problemas de contexto largo en LLM? ¿Podría convertirse en el próximo estándar para los modelos grandes?
--
Acabamos de lanzar Conviértete en un ingeniero de IA | Aprender haciendo: Cohorte 2. Si te perdiste la Cohorte 1, ahora es tu oportunidad de unirte a nosotros para la Cohorte 2.
Compruébalo aquí:
#AI #AIEngineer #MachineLearning...

Populares
Ranking
Favoritas

