Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

NingNing
Aktualizacja mapy poznawczej
Według eksperta AI Andreja Karpathy'ego, w erze pre-treningu kluczowe były dane tekstowe z internetu; w erze nadzorowanego dostrajania kluczowa była strukturalna wiedza z pytań i odpowiedzi na platformach takich jak Zhihu i Stackoverflow; w erze uczenia przez wzmocnienie kluczowe było zróżnicowane środowisko.
Skupiając się na tokenizacji aktywów AI w obszarze AI x Crypto, poza tradycyjną mocą obliczeniową, danymi, modelami i agentami, pojawiły się nowe aktywa AI, które można tokenizować: środowisko.

Andrej Karpathy28 sie, 04:34
W erze wstępnego uczenia, to, co miało znaczenie, to teksty z internetu. Głównie chciałbyś mieć dużą, różnorodną, wysokiej jakości kolekcję dokumentów internetowych, z których można się uczyć.
W erze nadzorowanego dostrajania, to były rozmowy. Zatrudniani są pracownicy kontraktowi do tworzenia odpowiedzi na pytania, trochę jak to, co można zobaczyć na Stack Overflow / Quora, czy innych, ale skierowane w stronę zastosowań LLM.
Żadne z powyższych nie zniknie (moim zdaniem), ale w tej erze uczenia przez wzmocnienie, to teraz środowiska. W przeciwieństwie do powyższych, dają LLM możliwość rzeczywistej interakcji - podejmowania działań, obserwowania wyników itd. Oznacza to, że można mieć nadzieję na znacznie lepsze wyniki niż statystyczna imitacja ekspertów. Mogą być używane zarówno do treningu modelu, jak i oceny. Ale tak jak wcześniej, podstawowym problemem jest teraz potrzeba dużego, różnorodnego, wysokiej jakości zestawu środowisk, jako ćwiczeń dla LLM do praktyki.
W pewnym sensie przypomina mi to pierwszy projekt OpenAI (gym), który był dokładnie ramą mającą na celu zbudowanie dużej kolekcji środowisk w tym samym schemacie, ale to było dużo przed LLM. Tak więc środowiska były prostymi akademickimi zadaniami kontrolnymi tamtych czasów, takimi jak cartpole, ATARI itd. Hub środowisk @PrimeIntellect (i repozytorium `verifiers` na GitHubie) buduje zmodernizowaną wersję, skierowaną specjalnie na LLM, i to jest świetny wysiłek/pomysł. Zasugerowałem, że ktoś zbuduje coś podobnego na początku tego roku:
Środowiska mają tę właściwość, że gdy szkielet ramy jest na miejscu, w zasadzie społeczność/branża może równolegle działać w wielu różnych dziedzinach, co jest ekscytujące.
Ostatnia myśl - osobiście i długoterminowo, jestem optymistyczny co do środowisk i interakcji agentowych, ale pesymistyczny co do uczenia przez wzmocnienie w szczególności. Uważam, że funkcje nagrody są bardzo podejrzane, i myślę, że ludzie nie używają RL do nauki (może robią to w przypadku niektórych zadań motorycznych itd., ale nie w zadaniach rozwiązywania problemów intelektualnych). Ludzie używają różnych paradygmatów uczenia, które są znacznie potężniejsze i bardziej efektywne pod względem próbkowania i które nie zostały jeszcze odpowiednio wynalezione i skalowane, chociaż istnieją wczesne szkice i pomysły (jako jeden przykład, pomysł "uczenia się z podpowiedzi systemowych", przenosząc aktualizację na tokeny/konteksty, a nie wagi i opcjonalnie destylując do wag jako osobny proces, trochę jak sen).
2,75K
Ocena dwóch aktualnych gorących kwestii na rynku - na podstawie rozmowy z systemem Agent do analizy głębokiej z auto-referencją v6.1 🧠
1⃣ O obniżce stóp procentowych przez Fed we wrześniu
Ostateczna ocena systemu Agent do analizy głębokiej z auto-referencją v6.1: prawdopodobieństwo obniżki stóp przez Fed we wrześniu wynosi 78%, zalecenie dotyczące alokacji aktywów między różnymi klasami aktywów powinno być skierowane w stronę stylu wzrostu, z szczególnym uwzględnieniem kombinacji akcji technologicznych z USA + akcji innowacyjnych z Chin + ekosystemu Ethereum.
Po potwierdzeniu obniżki stóp:
- Akcje w USA: umiarkowanie korzystne, ale ograniczone wzrosty (+2-4%)
- Rynek kryptowalut: krótkoterminowe wahania, średnioterminowo korzystne (-5% do +15%)
Styl akcji w Chinach: akcje wzrostowe zyskują okno alokacji (wzrost +8-12%, wartość +3-5%)
Okno czasowe dla handlu we wrześniu:
Okno czasowe 1: obecnie do 6 września - "okres powolnego wzrostu oczekiwań"
Okno czasowe 2: 6 września - "okres gwałtownej redystrybucji prawdopodobieństwa"
Okno czasowe 3: 11 września - "okres testowania ograniczeń inflacyjnych"
Okno czasowe 4: 11-17 września - "okres gry w milczeniu"
Okno czasowe 5: 18 września i później - "realizacja wyników i rekonstrukcja oczekiwań"
2⃣ O teorii ogona byka
Kluczowe wnioski systemu Agent do analizy głębokiej z auto-referencją v6.1: popularna w chińskim CT teoria "ogona byka" jest systematycznym błędem poznawczym, opartym na przestarzałych wzorcach cyklicznych, ignorującym strukturalne zmiany w obecnym rynku byka.
W 7 ramach analitycznych, 6 stanowczo sprzeciwia się teorii ogona byka, 1 jest neutralny.
"Teoria ogona byka" jest w rzeczywistości poznawczym tarciem w okresie przejścia między starym a nowym paradygmatem. Gdy rynek przechodzi z napędu inwestorów detalicznych na napęd instytucjonalny, tradycyjne standardy oceny przestają działać, co prowadzi do błędnej interpretacji "spokoju".
Dla inwestorów indywidualnych:
Unikaj pułapek myślenia cyklicznego: nie zakładaj, że rynek byka się kończy tylko dlatego, że "czas jest zbyt długi"
Zwracaj uwagę na zmiany strukturalne: skoncentruj się na alokacji w kluczowe aktywa korzystające z instytucjonalizacji
Racjonalnie podchodź do korekt: traktuj techniczne dostosowania jako okazje do zwiększenia pozycji.

10,35K
Najlepsze
Ranking
Ulubione