Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Cognitieve kaart update
Volgens AI-expert Andrej Karpathy is de sleutel in het pre-trainings tijdperk de internet tekstdata; in het tijdperk van supervisie fine-tuning is de sleutel de gestructureerde kennis van vraag-en-antwoord op platforms zoals Zhihu en Stackoverflow; in het tijdperk van versterkend leren is de sleutel een diversiteit aan omgevingen.
In de AI x Crypto sector, die zich richt op de tokenisatie van AI-activa, zijn er naast traditionele rekenkracht, data, modellen en agenten nieuwe tokeniseerbare AI-activa: omgevingen.

Andrej Karpathy28 aug, 04:34
In het tijdperk van pretraining was internettekst belangrijk. Je zou voornamelijk een grote, diverse, hoogwaardige verzameling internetdocumenten willen hebben om van te leren.
In het tijdperk van gesuperviseerde finetuning waren het gesprekken. Contractwerkers worden ingehuurd om antwoorden te creëren op vragen, een beetje zoals je zou zien op Stack Overflow / Quora, of iets dergelijks, maar gericht op LLM-gebruikscases.
Geen van beide bovenstaande gaat verdwijnen (imo), maar in dit tijdperk van versterkend leren zijn het nu omgevingen. In tegenstelling tot het bovenstaande geven ze de LLM de kans om daadwerkelijk te interageren - acties te ondernemen, uitkomsten te zien, enz. Dit betekent dat je kunt hopen veel beter te presteren dan statistische expertimitatie. En ze kunnen zowel voor modeltraining als evaluatie worden gebruikt. Maar net als voorheen is het kernprobleem nu dat er een grote, diverse, hoogwaardige set omgevingen nodig is, als oefeningen voor de LLM om tegen te oefenen.
In sommige opzichten word ik herinnerd aan OpenAI's allereerste project (gym), dat precies een framework was dat hoopte een grote verzameling omgevingen in hetzelfde schema op te bouwen, maar dit was lang voordat LLM's bestonden. Dus de omgevingen waren eenvoudige academische controle taken van die tijd, zoals cartpole, ATARI, enz. De @PrimeIntellect omgevingenhub (en de `verifiers` repo op GitHub) bouwt de gemoderniseerde versie specifiek gericht op LLM's, en het is een geweldige inspanning/idee. Ik heb eerder dit jaar voorgesteld dat iemand iets dergelijks zou bouwen:
Omgevingen hebben de eigenschap dat zodra het skelet van het framework op zijn plaats is, in principe de gemeenschap / industrie kan paralleliseren over veel verschillende domeinen, wat spannend is.
Laatste gedachte - persoonlijk en op lange termijn ben ik optimistisch over omgevingen en agentische interacties, maar ik ben pessimistisch over versterkend leren specifiek. Ik denk dat beloningsfuncties super verdacht zijn, en ik denk dat mensen RL niet gebruiken om te leren (misschien doen ze dat voor sommige motorische taken, maar niet voor intellectuele probleemoplossingstaken). Mensen gebruiken verschillende leerparadigma's die aanzienlijk krachtiger en monsterlijk efficiënter zijn en die nog niet goed zijn uitgevonden en opgeschaald, hoewel vroege schetsen en ideeën bestaan (als slechts één voorbeeld, het idee van "systeem prompt leren", waarbij de update naar tokens/contexten gaat en niet naar gewichten en optioneel distilleren naar gewichten als een apart proces, een beetje zoals slaap dat doet).
2,69K
Beoordeling van de huidige twee populaire vragen op de markt - gebaseerd op gesprekken met het zelfrefererende diepgaande analyse Agent-systeem v6.1 🧠
1⃣ Over de renteverlaging door de Fed in september
De uiteindelijke beoordeling van het zelfrefererende diepgaande analyse Agent-systeem v6.1: de kans op een renteverlaging door de Fed in september is 78%, de aanbeveling voor cross-asset allocatie is om te leunen naar groeistijlen, met speciale aandacht voor de combinatie van Amerikaanse technologie-aandelen + A-aandelen in de innovatieve sector + het Ethereum-ecosysteem.
Na bevestiging van de renteverlaging:
- Amerikaanse aandelen: gematigd positief, maar beperkte stijging (+2-4%)
- Crypto-markt: korte termijn schommelingen, middellange termijn positief (-5% tot +15%)
A-aandelenstijl: groeiaandelen krijgen een allocatievenster (groei +8-12%, waarde +3-5%)
De handelsstrijd tijdvenster in september:
Tijdvenster 1: Heden tot 6 september - "verwachting langzaam opwarmingsperiode"
Tijdvenster 2: 6 september - "kans herwaarderingsperiode"
Tijdvenster 3: 11 september - "inflatiebeperkings testperiode"
Tijdvenster 4: 11-17 september - "stilteperiode strijd"
Tijdvenster 5: 18 september en daarna - "resultaat realisatie en verwachting reconstructie"
2⃣ Over de 'Bull Tail Theory'
De kernconclusie van het zelfrefererende diepgaande analyse Agent-systeem v6.1: de populaire "Bull Tail Theory" in het Chinees CT is een systematische cognitieve bias, gebaseerd op verouderde cyclische modelbegrip, en negeert de structurele veranderingen in de huidige bullmarkt.
Van de 7 analysekaders zijn er 6 sterk tegen de Bull Tail Theory en 1 neutraal.
De "Bull Tail Theory" is in wezen een cognitieve wrijving in de overgangsperiode tussen oude en nieuwe paradigma's. Wanneer de markt van retail-gedreven naar institutioneel-gedreven verschuift, falen de traditionele beoordelingscriteria, wat leidt tot een verkeerde interpretatie van "kalme".
Voor particuliere investeerders:
Vermijd de valkuil van cyclisch denken: denk niet dat de bullmarkt voorbij is omdat "de tijd te lang is"
Let op structurele veranderingen: focus op de allocatie van kernactiva die profiteren van institutionalisering
Behandel correcties rationeel: beschouw technische aanpassingen als een kans om bij te kopen.

10,34K
Boven
Positie
Favorieten