Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Actualizări cognitive ale graficului
Potrivit taurului AI Andrej Karpathy, în era pre-antrenament, cheia sunt datele text de pe Internet; În era supravegherii reglajelor fine, cheia este cunoașterea structurată a stilului de întrebări și răspunsuri al lui Zhihu și Stackflow; În era învățării intensive, cheia este un mediu divers.
Pista AI x Crypto, care se concentrează pe tokenizarea activelor AI, are un nou activ AI tokenizabil: mediul în plus față de puterea de calcul tradițională, datele, modelele și agenții

Andrej Karpathy28 aug., 04:34
În epoca pretraining-ului, ceea ce conta era textul de pe internet. Ați dori în primul rând o colecție mare, diversă și de înaltă calitate de documente de pe internet din care să învățați.
În epoca reglajelor fine supravegheate, erau conversațiile. Lucrătorii contractuali sunt angajați pentru a crea răspunsuri la întrebări, un pic ca ceea ce ați vedea pe Stack Overflow / Quora sau etc., dar orientat către cazurile de utilizare LLM.
Niciunul dintre cele două de mai sus nu va dispărea (imo), dar în această eră a învățării prin întărire, acum sunt medii. Spre deosebire de cele de mai sus, ele oferă LLM oportunitatea de a interacționa efectiv - de a lua măsuri, de a vedea rezultatele etc. Aceasta înseamnă că puteți spera să faceți mult mai bine decât imitația experților statistici. Și pot fi folosite atât pentru antrenamentul modelelor, cât și pentru evaluare. Dar, la fel ca înainte, problema de bază acum este nevoie de un set mare, divers și de înaltă calitate de medii, ca exerciții împotriva cărora LLM să exerseze.
Într-un fel, îmi amintesc de primul proiect OpenAI (gym), care a fost exact un framework care spera să construiască o colecție mare de medii în aceeași schemă, dar asta a fost cu mult înainte de LLM-uri. Deci mediile erau simple sarcini de control academic ale vremii, cum ar fi cărucior, ATARI etc. Hub-ul de medii @PrimeIntellect (și depozitul "verificatori" de pe GitHub) construiește versiunea modernizată care vizează în mod specific LLM-urile și este un efort/idee grozav. Am propus ca cineva să construiască ceva asemănător la începutul acestui an:
Mediile au proprietatea că, odată ce scheletul cadrului este la locul său, în principiu, comunitatea / industria poate paraleliza în multe domenii diferite, ceea ce este interesant.
Gând final - personal și pe termen lung, sunt optimist în ceea ce privește mediile și interacțiunile agentice, dar sunt pesimist în ceea ce privește învățarea prin întărire în mod specific. Cred că funcțiile de recompensă sunt super sus, și cred că oamenii nu folosesc RL pentru a învăța (poate o fac pentru unele sarcini motorii etc., dar nu pentru sarcini de rezolvare a problemelor intelectuale). Oamenii folosesc diferite paradigme de învățare care sunt semnificativ mai puternice și mai eficiente în eșantionare și care nu au fost încă inventate și scalate în mod corespunzător, deși există schițe și idei timpurii (ca doar un exemplu, ideea de "învățare promptă a sistemului", mutarea actualizării la tokenuri/contexte nu la greutăți și, opțional, distilarea la greutăți ca un proces separat, un pic ca somnul).
2,96K
O judecată asupra a două probleme fierbinți de care piața este preocupată în prezent - bazată pe o conversație cu sistemul de agenți de analiză aprofundată autoreferențială v6.1 🧠
1⃣ Despre reducerea ratei dobânzii de către Fed în septembrie
Judecata finală a sistemului de agenți de analiză aprofundată cu auto-indexare v6.1: probabilitatea ca Fed să reducă ratele dobânzilor în septembrie este de 78%, iar alocarea încrucișată a activelor este recomandată pentru a înclina spre stilul de creștere, concentrându-se pe alocarea combinată a tehnologiei acțiunilor americane + știință și inovație tehnologică a acțiunilor A + ecosistemul Ethereum
După determinarea reducerii dobânzii:
- Acțiuni americane: Câștiguri moderate, pozitive, dar limitate (+2-4%)
-Piața cripto: șocuri pe termen scurt, pozitive pe termen mediu (-5% până la +15%)
Stilul acțiunilor A: Acțiunile de creștere inaugurează o fereastră de alocare (creștere +8-12%, valoare +3-5%)
Fereastra de joc de tranzacționare în septembrie:
Fereastra de timp 1: Curent până la 6 septembrie - "Perioada de încălzire lentă așteptată"
Fereastra de timp 2: 6 septembrie - "Probabilitatea unei reprețuri severe"
Fereastra de timp 3: 11 septembrie - "Perioada de testare a reținerii inflației"
Fereastra de timp 4: 11-17 septembrie - "Joc de perioadă liniștită"
Fereastra de timp 5: 18 septembrie și mai departe - "Îndeplinirea rezultatelor și reconstrucția așteptărilor"
2⃣ Despre teoria cozii de bou
Concluzia de bază a sistemului de agenți de analiză aprofundată autoreferențială v6.1: Populara "teorie a cozii de bou" în CT chineză este o prejudecată cognitivă sistematică bazată pe cunoașterea modelului ciclic învechit și ignorând schimbările structurale ale pieței bull actuale.
Dintre cele 7 cadre analitice, 6 se opun puternic teoriei cozii de bou și 1 este neutru.
"Teoria cozii de bou" este în esență o frecare cognitivă între vechile și noile paradigme. Când piața trece de la retail la instituțional, criteriile tradiționale de judecată eșuează, ceea ce duce la o interpretare greșită a "calmului".
Pentru investitorii individuali:
Evitați capcana gândirii ciclice: nu credeți că piața bull s-a încheiat doar pentru că este "prea lungă".
Concentrarea pe schimbările structurale: Concentrarea pe alocarea activelor de bază care beneficiază de instituționalizare
Tratați rațional retragerile: tratați ajustările tehnice ca oportunități de a adăuga poziții

10,47K
Limită superioară
Clasament
Favorite