Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Actualizaciones de gráficos cognitivos
Según el toro de IA Andrej Karpathy, en la era previa al entrenamiento, la clave son los datos de texto de Internet; En la era de la supervisión del ajuste fino, la clave es el conocimiento estructurado del estilo de preguntas y respuestas de Zhihu y Stackflow; En la era del aprendizaje intensivo, la clave es un entorno diverso.
La pista AI x Crypto, que se centra en la tokenización de activos de IA, tiene un nuevo activo de IA tokenizable: el entorno además de la potencia informática, los datos, los modelos y los agentes tradicionales

Andrej Karpathy28 ago, 04:34
En la era del preentrenamiento, lo que importaba era el texto de Internet. Principalmente querrá una colección grande, diversa y de alta calidad de documentos de Internet para aprender.
En la era del ajuste supervisado, eran conversaciones. Los trabajadores contratados son contratados para crear respuestas a preguntas, un poco como lo que verías en Stack Overflow / Quora, etc., pero orientado a casos de uso de LLM.
Ninguno de los dos anteriores va a desaparecer (en mi opinión), pero en esta era de aprendizaje por refuerzo, ahora son los entornos. A diferencia de lo anterior, le dan al LLM la oportunidad de interactuar realmente: tomar medidas, ver resultados, etc. Esto significa que puede esperar hacerlo mucho mejor que la imitación de expertos estadísticos. Y se pueden utilizar tanto para el entrenamiento como para la evaluación de modelos. Pero al igual que antes, el problema central ahora es la necesidad de un conjunto de entornos grandes, diversos y de alta calidad, como ejercicios para que el LLM practique.
De alguna manera, me recuerda al primer proyecto de OpenAI (gimnasio), que era exactamente un marco con la esperanza de construir una gran colección de entornos en el mismo esquema, pero esto fue mucho antes de los LLM. Así que los entornos eran simples tareas de control académico de la época, como cartpole, ATARI, etc. El centro de entornos @PrimeIntellect (y el repositorio de 'verificadores' en GitHub) crea la versión modernizada dirigida específicamente a los LLM, y es un gran esfuerzo / idea. Propuse que alguien construyera algo así a principios de este año:
Los entornos tienen la propiedad de que una vez que el esqueleto del marco está en su lugar, en principio, la comunidad / industria puede paralelizar en muchos dominios diferentes, lo cual es emocionante.
Pensamiento final: personalmente y a largo plazo, soy optimista sobre los entornos y las interacciones agenciales, pero soy bajista sobre el aprendizaje por refuerzo específicamente. Creo que las funciones de recompensa son súper sus, y creo que los humanos no usan RL para aprender (tal vez lo hacen para algunas tareas motoras, etc., pero no para tareas de resolución de problemas intelectuales). Los humanos usan diferentes paradigmas de aprendizaje que son significativamente más poderosos y eficientes en el muestreo y que aún no se han inventado y escalado adecuadamente, aunque existen los primeros bocetos e ideas (como solo un ejemplo, la idea de "aprendizaje rápido del sistema", moviendo la actualización a tokens/contextos no a pesos y opcionalmente destilando a pesos como un proceso separado un poco como lo hace el sueño).
2.69K
Un juicio sobre dos temas candentes que preocupan actualmente al mercado, basado en una conversación con el sistema de agentes de análisis en profundidad autorreferencial v6.1 🧠
1⃣ Sobre el recorte de tasas de septiembre de la Fed
El juicio final del sistema de agentes de análisis en profundidad de autoindexación v6.1: la probabilidad de que la Fed recorte las tasas de interés en septiembre es del 78%, y se recomienda la asignación cruzada de activos para inclinarse hacia el estilo de crecimiento, centrándose en la asignación combinada de tecnología bursátil de EE. UU. + innovación científica y tecnológica de acciones A + ecosistema Ethereum
Después de que se determine el recorte de tasas:
- Acciones estadounidenses: Ganancias moderadamente positivas, pero limitadas (+2-4%)
-Mercado de criptomonedas: Choques a corto plazo, positivos a medio plazo (-5% a +15%)
Estilo de acciones A: las acciones de crecimiento marcan el comienzo de una ventana de asignación (crecimiento +8-12%, valor +3-5%)
Ventana del juego de trading en septiembre:
Ventana de tiempo 1: Actual hasta el 6 de septiembre - "Período de calentamiento lento esperado"
Ventana de tiempo 2: 6 de septiembre - "Probabilidad de un reajuste severo"
Ventana de tiempo 3: 11 de septiembre - "Período de prueba de restricción de inflación"
Ventana de tiempo 4: 11-17 de septiembre - "Juego del período tranquilo"
Ventana de tiempo 5: 18 de septiembre y más allá - "Cumplimiento de resultados y reconstrucción de expectativas"
2⃣ Sobre la teoría del rabo de toro
Conclusión central del Sistema de agentes de análisis en profundidad autorreferencial v6.1: La popular "teoría del rabo de toro" en la TC china es un sesgo cognitivo sistemático basado en la cognición del modelo cíclico obsoleto e ignorando los cambios estructurales del mercado alcista actual.
De los 7 marcos analíticos, 6 se oponen firmemente a la teoría del rabo de toro y 1 es neutral.
La "teoría del rabo de toro" es esencialmente una fricción cognitiva entre el viejo y el nuevo paradigma. Cuando el mercado pasa del comercio minorista al institucional, los criterios de juicio tradicionales fallan, lo que lleva a una lectura errónea de "calma".
Para inversores individuales:
Evite la trampa del pensamiento cíclico: no piense que el mercado alcista ha terminado solo porque es "demasiado largo".
Centrarse en los cambios estructurales: Centrarse en la asignación de activos básicos que se benefician de la institucionalización
Tratar los retrocesos de forma racional: Tratar los ajustes técnicos como oportunidades para añadir posiciones

10.34K
Populares
Ranking
Favoritas