Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Alex Xu
¿Por qué es DeepSeek-OCR un GRAN TRATO?
Los LLM existentes tienen dificultades con entradas largas porque solo pueden manejar un número fijo de tokens, conocido como la ventana de contexto, y el costo de atención crece rápidamente a medida que las entradas se alargan.
DeepSeek-OCR adopta un nuevo enfoque.
En lugar de enviar el contexto largo directamente a un LLM, lo convierte en una imagen, comprime esa imagen en tokens visuales y luego pasa esos tokens al LLM.
Menos tokens conducen a un menor costo computacional por atención y a una ventana de contexto efectiva más grande. Esto hace que los chatbots y los modelos de documentos sean más capaces y eficientes.
¿Cómo se construye DeepSeek-OCR? El sistema tiene dos partes principales:
1. Codificador: Procesa una imagen de texto, extrae las características visuales y las comprime en un pequeño número de tokens de visión.
2. Decodificador: Un modelo de lenguaje Mixture of Experts que lee esos tokens y genera texto un token a la vez, similar a un transformador estándar solo de decodificador.
¿Cuándo usarlo?
DeepSeek-OCR muestra que el texto se puede comprimir de manera eficiente utilizando representaciones visuales.
Es especialmente útil para manejar documentos muy largos que superan los límites de contexto estándar. Puedes usarlo para compresión de contexto, tareas estándar de OCR o análisis profundo, como convertir tablas y diseños complejos en texto.
Te toca a ti: ¿Qué piensas sobre el uso de tokens visuales para manejar problemas de contexto largo en los LLM? ¿Podría esto convertirse en el próximo estándar para modelos grandes?
--
Acabamos de lanzar Conviértete en un Ingeniero de IA | Aprende Haciendo: Cohorte 2. Si te perdiste la Cohorte 1, ahora es tu oportunidad de unirte a nosotros para la Cohorte 2.
Échale un vistazo aquí:
#AI #AIEngineer #MachineLearning

75,89K
🚀 Nuevo Lanzamiento: ¡Conviértete en un AI Engineer | Aprende Haciendo | Cohorte 2!
Después del increíble éxito de nuestra primera cohorte (casi 500 personas asistieron), ¡estoy emocionado de anunciar el lanzamiento de la Cohorte 2 de Conviértete en un AI Engineer!
Este no es solo otro curso sobre marcos y herramientas de IA. Nuestro objetivo es ayudar a los ingenieros a construir la base y el conjunto de habilidades de extremo a extremo necesarios para prosperar como ingenieros de IA.
Aquí está lo que hace especial a esta cohorte:
• Aprende haciendo: Construye aplicaciones de IA del mundo real, no solo mirando videos.
• Ruta de aprendizaje estructurada y sistemática: Sigue un plan de estudios cuidadosamente diseñado que te lleva paso a paso, desde los fundamentos hasta temas avanzados.
• Retroalimentación y mentoría en vivo: Obtén retroalimentación directa de instructores y compañeros.
• Impulsado por la comunidad: ¡Aprender solo es difícil. Aprender con una comunidad es fácil!
Nos enfocamos en la construcción de habilidades, no solo en la teoría o el aprendizaje pasivo. Nuestro objetivo es que cada participante se lleve una sólida base para construir sistemas de IA.
Si te perdiste la Cohorte 1, ahora es tu oportunidad de unirte a nosotros para la Cohorte 2.
Míralo aquí:
#AI #AIEngineer #MachineLearning

271
Parte superior
Clasificación
Favoritos


