Populære emner
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Oppdateringer av kognitiv graf
I følge AI-oksen Andrej Karpathy, i tiden før trening, er nøkkelen Internett-tekstdata; I en tid med tilsyn med finjustering, er nøkkelen den strukturerte kunnskapen om Zhihu og Stackflows Q&A-stil; I en tid med intensiv læring er nøkkelen et mangfoldig miljø.
AI x Crypto-sporet, som fokuserer på tokenisering av AI-eiendeler, har en ny tokeniserbar AI-eiendel: miljøet i tillegg til tradisjonell datakraft, data, modeller og agenter

Andrej Karpathy28. aug., 04:34
I en tid med fortrening var det internetttekst som betydde noe. Du vil først og fremst ha en stor, mangfoldig samling av internettdokumenter av høy kvalitet å lære av.
I en tid med overvåket finjustering var det samtaler. Kontraktsarbeidere er ansatt for å lage svar på spørsmål, litt som det du vil se på Stack Overflow / Quora, eller etc., men rettet mot LLM-brukstilfeller.
Ingen av de to ovennevnte forsvinner (imo), men i denne epoken med forsterkende læring er det nå miljøer. I motsetning til de ovennevnte, gir de LLM en mulighet til å faktisk samhandle - iverksette handlinger, se resultater osv. Dette betyr at du kan håpe å gjøre det mye bedre enn statistisk ekspertimitasjon. Og de kan brukes både til modelltrening og evaluering. Men akkurat som før, er kjerneproblemet nå å trenge et stort, mangfoldig sett med miljøer av høy kvalitet, som øvelser for LLM å øve mot.
På noen måter blir jeg minnet om OpenAIs aller første prosjekt (treningsstudio), som var akkurat et rammeverk i håp om å bygge en stor samling miljøer i samme skjema, men dette var lenge før LLM-er. Så miljøene var enkle akademiske kontrolloppgaver på den tiden, som cartpole, ATARI, etc. Huben for @PrimeIntellect miljøer (og «verifikatorer»-repositoriet på GitHub) bygger den moderniserte versjonen som er spesielt rettet mot LLM-er, og det er en flott innsats/idé. Jeg foreslo at noen skulle bygge noe lignende tidligere i år:
Miljøer har den egenskapen at når skjelettet til rammeverket er på plass, kan i prinsippet samfunnet/industrien parallellisere på tvers av mange ulike domener, noe som er spennende.
Siste tanke - personlig og langsiktig, jeg er bullish på miljøer og agentiske interaksjoner, men jeg er bearish på forsterkende læring spesifikt. Jeg tror at belønningsfunksjoner er super sus, og jeg tror mennesker ikke bruker RL for å lære (kanskje de gjør det for noen motoriske oppgaver osv., men ikke intellektuelle problemløsningsoppgaver). Mennesker bruker forskjellige læringsparadigmer som er betydelig kraftigere og prøveeffektive, og som ikke har blitt ordentlig oppfunnet og skalert ennå, selv om tidlige skisser og ideer eksisterer (som bare ett eksempel, ideen om "systemrask læring", flytte oppdateringen til tokens/kontekster ikke vekter og eventuelt destillere til vekter som en egen prosess litt som søvn gjør).
2,79K
En dom over to hete problemstillinger som markedet for tiden er opptatt av - basert på en samtale med den selvrefererende dybdeanalysen Agent system v6.1 🧠
1⃣ Om Feds rentekutt i september
Den endelige dommen fra den selvindekserende dybdeanalysen Agent system v6.1: sannsynligheten for at Fed kutter renten i september er 78 %, og kryssaktivaallokeringen anbefales å lene seg mot vekststilen, med fokus på kombinasjonsallokeringen av amerikansk aksjeteknologi + A-aksjevitenskap og teknologiinnovasjon + Ethereum-økosystem
Etter at rentekuttet er bestemt:
- Amerikanske aksjer: Moderat positive, men begrensede gevinster (+2-4%)
-Kryptomarkedet: Kortsiktige sjokk, positiv på mellomlang sikt (-5 % til +15 %)
A-aksjestil: Vekstaksjer innleder et allokeringsvindu (vekst +8-12 %, verdi +3-5 %)
Handelsspillvindu i september:
Tidsvindu 1: Gjeldende til 6. september - "Forventet langsom oppvarmingsperiode"
Tidsvindu 2: 6. september - "Sannsynlighet for alvorlig omprising"
Tidsvindu 3: 11. september - "Testperiode for inflasjonsbegrensning"
Tidsvindu 4: 11.-17. september - "Stille periodespill"
Tidsvindu 5: 18. september og utover - "Resultatoppfyllelse og forventningsrekonstruksjon"
2⃣ Om oksehaleteori
Kjernekonklusjonen av Self-Referential In-depth Analysis Agent System v6.1: Den populære "oksehaleteorien" i kinesisk CT er en systematisk kognitiv skjevhet basert på utdatert syklisk modellkognisjon og ignorering av de strukturelle endringene i det nåværende oksemarkedet.
Av de 7 analytiske rammeverkene er 6 sterkt imot oksehaleteori og 1 er nøytral.
"Oksehaleteorien" er i hovedsak en kognitiv friksjon mellom de gamle og nye paradigmene. Når markedet skifter fra detaljhandel til institusjonelle, mislykkes tradisjonelle vurderingskriterier, noe som fører til en feillesning av "ro".
For individuelle investorer:
Unngå den sykliske tenkefellen: Ikke tro at oksemarkedet er over bare fordi det er «for langt».
Fokus på strukturelle endringer: Fokus på allokering av kjerneaktiva som drar nytte av institusjonalisering
Behandle tilbaketrekkinger rasjonelt: Behandle tekniske justeringer som muligheter til å legge til posisjoner

10,4K
Topp
Rangering
Favoritter