Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Mise à jour de la carte cognitive
Selon le grand expert en IA Andrej Karpathy, à l'ère de la pré-formation, la clé est les données textuelles d'Internet ; à l'ère du réglage supervisé, la clé est la structure de connaissances structurées des questions-réponses de Zhihu et Stackflow ; à l'ère de l'apprentissage par renforcement, la clé est la diversité des environnements.
Dans le domaine AI x Crypto, qui se concentre sur la tokenisation des actifs d'IA, en plus de la puissance de calcul traditionnelle, des données, des modèles et des agents, il existe de nouveaux actifs d'IA pouvant être tokenisés : l'environnement.

Andrej Karpathy28 août, 04:34
À l'ère du pré-entraînement, ce qui comptait, c'était le texte d'internet. Vous voudriez principalement une grande collection diversifiée et de haute qualité de documents internet à partir desquels apprendre.
À l'ère du finetuning supervisé, ce sont les conversations qui comptaient. Des travailleurs sous contrat sont engagés pour créer des réponses à des questions, un peu comme ce que vous verriez sur Stack Overflow / Quora, etc., mais orienté vers les cas d'utilisation des LLM.
Aucun des deux précédents ne disparaîtra (à mon avis), mais à cette époque de l'apprentissage par renforcement, ce sont maintenant les environnements qui comptent. Contrairement aux précédents, ils donnent au LLM l'opportunité d'interagir réellement - de prendre des actions, de voir des résultats, etc. Cela signifie que vous pouvez espérer faire beaucoup mieux qu'une imitation experte statistique. Et ils peuvent être utilisés à la fois pour l'entraînement et l'évaluation du modèle. Mais tout comme auparavant, le problème central est maintenant de nécessiter un ensemble large, diversifié et de haute qualité d'environnements, comme exercices pour que le LLM puisse s'entraîner.
D'une certaine manière, je me rappelle du tout premier projet d'OpenAI (gym), qui était exactement un cadre espérant construire une grande collection d'environnements dans le même schéma, mais c'était bien avant les LLM. Donc, les environnements étaient des tâches de contrôle académique simples de l'époque, comme cartpole, ATARI, etc. Le hub d'environnements @PrimeIntellect (et le dépôt `verifiers` sur GitHub) construit la version modernisée ciblant spécifiquement les LLM, et c'est un grand effort/une grande idée. J'ai proposé que quelqu'un construise quelque chose comme ça plus tôt cette année :
Les environnements ont la propriété qu'une fois que le squelette du cadre est en place, en principe, la communauté/l'industrie peut paralléliser à travers de nombreux domaines différents, ce qui est excitant.
Dernière pensée - personnellement et à long terme, je suis optimiste sur les environnements et les interactions agentiques mais je suis pessimiste sur l'apprentissage par renforcement spécifiquement. Je pense que les fonctions de récompense sont super suspectes, et je pense que les humains n'utilisent pas l'apprentissage par renforcement pour apprendre (peut-être le font-ils pour certaines tâches motrices, etc., mais pas pour des tâches de résolution de problèmes intellectuels). Les humains utilisent différents paradigmes d'apprentissage qui sont significativement plus puissants et efficaces en échantillonnage et qui n'ont pas encore été correctement inventés et mis à l'échelle, bien que des esquisses et des idées précoces existent (comme juste un exemple, l'idée de "l'apprentissage par prompt système", déplaçant la mise à jour vers des tokens/contextes et non des poids et distillant éventuellement vers des poids comme un processus séparé un peu comme le sommeil le fait).
2,69K
Jugement sur deux questions brûlantes actuellement préoccupantes pour le marché - basé sur le dialogue avec le système d'Agent d'analyse approfondie auto-référentielle v6.1 🧠
1⃣ Concernant la baisse des taux de la Réserve fédérale en septembre
Le jugement final du système d'Agent d'analyse approfondie auto-référentielle v6.1 : probabilité de baisse des taux de la Réserve fédérale en septembre de 78 %, recommandation de répartition d'actifs en faveur du style de croissance, en mettant l'accent sur la combinaison de la technologie des actions américaines + les actions innovantes A + l'écosystème Ethereum.
Après confirmation de la baisse des taux :
- Actions américaines : léger bénéfice, mais hausse limitée (+2-4%)
- Marché des cryptomonnaies : fluctuations à court terme, bénéfice à moyen terme (-5% à +15%)
Style des actions A : les actions de croissance bénéficient d'une fenêtre de répartition (croissance +8-12%, valeur +3-5%)
Fenêtre de temps pour le jeu de trading de septembre :
Fenêtre de temps 1 : Actuellement jusqu'au 6 septembre - "période d'attente lente"
Fenêtre de temps 2 : 6 septembre - "période de re-pricing drastique"
Fenêtre de temps 3 : 11 septembre - "période de test des contraintes d'inflation"
Fenêtre de temps 4 : 11-17 septembre - "jeu de silence"
Fenêtre de temps 5 : 18 septembre et après - "réalisation des résultats et reconstruction des attentes"
2⃣ Concernant la théorie de la queue de taureau
Conclusion principale du système d'Agent d'analyse approfondie auto-référentielle v6.1 : la "théorie de la queue de taureau" populaire dans le CT chinois est un biais cognitif systémique, basé sur une compréhension obsolète des cycles, ignorant les changements structurels actuels du marché haussier.
Parmi les 7 cadres d'analyse, 6 s'opposent fermement à la théorie de la queue de taureau, 1 est neutre.
La "théorie de la queue de taureau" est en réalité un frottement cognitif durant la période de transition entre anciens et nouveaux paradigmes. Lorsque le marché passe d'une dynamique pilotée par les petits investisseurs à une dynamique pilotée par les institutions, les critères de jugement traditionnels échouent, entraînant une mauvaise interprétation de la "calme".
Pour les investisseurs individuels :
Évitez le piège de la pensée cyclique : ne pensez pas que le marché haussier est terminé simplement parce que "le temps est trop long"
Concentrez-vous sur les changements structurels : mettez l'accent sur la répartition des actifs clés bénéficiant de l'institutionnalisation
Abordez les corrections de manière rationnelle : considérez les ajustements techniques comme des opportunités d'achat.

10,34K
Meilleurs
Classement
Favoris