Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

François Chollet
Spoluzakladatel @ndea. Spoluzakladatel @arcprize. Tvůrce Keras a ARC-AGI. Autor knihy "Hluboké učení s Pythonem".
Otevřené otázky o ekonomice jízdy bez řidiče:
1. Jaké bude snížení nákladů (oproti Uberu/Lyftu) za odstranění řidiče?
2. O kolik toto snížení nákladů zvýší poptávku?
3. Ovlivnila by změna UX výrazně poptávku?
4. Zaznamenali bychom velký nárůst geografické dostupnosti (nejsou potřeba řidiči = můžeme na silnice dostat více taxíků)?
Pro 1: mzdové náklady na jízdu Lyftem/Uberem po započtení všeho ostatního jsou pouze 20-40 % ceny, což v nejlepším případě omezuje snížení na -40 %. Síť taxi bez řidiče by však měla výrazně vyšší fixní náklady (inženýři AI, datová centra) a nenulové přidané jednotkové náklady (časté čištění interiéru, amortizace samořídícího hardwaru), takže realisticky se díváme spíše na -15-20 %.
Je tedy nepochybné, že autonomní jízdy ve velkém měřítku budou levnější než současné služby jízdy na zavolání. Velikost efektu však bude mnohem menší, než většina lidí očekává. Stále budou poměrně drahé.
Za 2: asi ne o tolik -- kvůli dynamickému cenotvorbě už ceny kolísají o víc a ještě před pár lety Uber silně dotoval poptávku, takže máme nějaká data, co by se stalo s 20% levnějšími jízdami. TAM v oblastech, které jsou již dobře obsluhovány Uberem/Lyftem, by mohl vzrůst o ~20 % v mílích, zatímco v dolarech by měl zůstat konstantní.
Za 3: již víme (prostřednictvím nasazení Waymo), že lidé dávají přednost tomu, aby v autě nebyl řidič, a zákazníci necitliví na cenu jsou ochotni za tuto zkušenost zaplatit více. Není to však všechno pozitivní: objevily se obavy o čistotu vozu (snadno řešitelná, ale to zvyšuje jednotkové náklady). Celkově si nemyslím, že změna UX příliš zvýší TAM, protože pro většinu lidí bude kritickým faktorem cena a dostupnost.
Pro 4: toto je jeden je spíše zástupný znak. Většina nákladů na autonomní síť jsou fixní náklady; Inkrementální jednotkové náklady jsou především amortizace nákladů na automobil (chyba zaokrouhlení) a čištění. To znamená, že autonomní síť má potenciál mít mnohem vyšší pokrytí než současná síť Uber/Lyft. Určitě to ale nebude tak, že by se tyto sítě rozšířily *kamkoliv*, alespoň ne s krátkou čekací dobou. Myslím, že z tohoto efektu uvidíme určitý nárůst TAM, možná +20-30 %.
Celkově bychom měli očekávat postupné zvýšení TAM v dolarovém vyjádření, ale celkově bude trh spíše jako Uber++ než jako nové dopravní paradigma. Většina lidí v USA, zejména mimo hustě osídlené oblasti, bude stále řídit vlastní auto.
36,46K
Grok 4 je stále nejmodernější na ARC-AGI-2 mezi hraničními modely.
15,9 % pro Grok 4 vs. 9,9 % pro GPT-5.

ARC Prize8. 8. 01:29
GPT-5 na ARC-AGI Semi Private Eval
GPT-5
* ARC-AGI-1: 65,7 %, 0,51 $/úkol
* ARC-AGI-2: 9,9 %, 0,73 $/úkol
GPT-5 Mini
* ARC-AGI-1: 54,3 %, 0,12 $/úkol
* ARC-AGI-2: 4,4 %, 0,20 $/úloha
GPT-5 Nano
* ARC-AGI-1: 16,5 %, 0,03 $/úloha
* ARC-AGI-2: 2,5 %, 0,03 $/úloha

556
Výsledky GPT-5 na ARC-AGI 1 & 2!
Horní linie:
65.7 % na ARC-AGI-1
9.9% na ARC-AGI-2

ARC Prize8. 8. 01:29
GPT-5 na ARC-AGI Semi Private Eval
GPT-5
* ARC-AGI-1: 65,7 %, 0,51 $/úkol
* ARC-AGI-2: 9,9 %, 0,73 $/úkol
GPT-5 Mini
* ARC-AGI-1: 54,3 %, 0,12 $/úkol
* ARC-AGI-2: 4,4 %, 0,20 $/úloha
GPT-5 Nano
* ARC-AGI-1: 16,5 %, 0,03 $/úloha
* ARC-AGI-2: 2,5 %, 0,03 $/úloha

38,96K
Článek "Hierarchické modely uvažování" v poslední době koluje a na Twitteru sbírá desítky tisíc lajků v desítkách polovirálních vláken, což je u výzkumné práce docela neobvyklé.
Článek tvrdí, že ARC-AGI-1 s přesností 40,3 % s malým modelem (27M parametrů) trénovaným od nuly bez jakýchkoli externích trénovacích dat – pokud by to bylo skutečné, představovalo by to zásadní průlom v uvažování.
Právě jsem se hluboce ponořil do papíru a kódové základny...
Je to dobré čtení, podrobné, ale snadno sledovatelné. Myslím, že prezentované nápady jsou docela zajímavé a architektura je pravděpodobně cenná.
Tento koncept mi připomíná mnoho různých nápadů, se kterými jsem se setkal během "zlatého věku" výzkumu architektury DL, přibližně v letech 2016-2018. Tento typ výzkumu nebyl nějakou dobu populární, takže je hezké vidět obnovený zájem o alternativní architektury.
Experimentální nastavení se však zdá být kriticky chybné, což znamená, že v současné době nemáme žádný empirický signál (alespoň z ARC-AGI) o tom, zda je architektura skutečně užitečná nebo ne.
Experiment ARC-AGI-1 dělá na základě mého čtení kódu pro přípravu dat následující:
1. Trénujte na 876 404 úkolech, které jsou variantami 960 původních úkolů generovaných rozšířením:
... 400 z ARC-AGI-1/vlak
... 400 z ARC-AGI-1/eval
... 160 od společnosti ConceptARC
2. Testujte na 400 úkolech (ARC-AGI-1/eval) rozšířením každého úkolu do ~1000 variant (ve skutečnosti je to celkem pouze 368 151 kvůli idiosynkraziím procesu augmentace), vytvořením předpovědi pro každou variantu a snížením předpovědí na N=2 prostřednictvím většinového hlasování.
Stručně řečeno: trénují na testovacích datech.
Můžete se ptát, počkat, proč je přesnost 40 % a ne 100 %? Je model silně podfitovaný?
Je to proto, že trénovací data a testovací data představují stejné původní úlohy *v různých variantách*. Rozšíření dat se aplikuje nezávisle na úlohách eval v trénovacích datech a na úlohy eval v testovacích datech.
Experiment tedy zhruba měří, jak se modelu podaří zobecnit na procedurálně generované varianty stejných úloh (tj. zda se model dokáže naučit obrátit pevnou sadu statických transformací mřížky).
Takže – zatím se příliš nevzrušujte. Ale myslím si, že tento druh výzkumu architektury je cenný (pokud je doprovázen řádným empirickým ověřovacím signálem) a že myšlenka HRM je velmi zajímavá.
Aby bylo jasno, nemyslím si, že autoři měli v úmyslu uvést v omyl a zakrýt experimentální problém – pravděpodobně si neuvědomili, co jejich tréninkové nastavení ve skutečnosti znamená.
19,75K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější