Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jeremy Howard
Doufejme, že už žádné další lamy MoE...

Simon Willison15. 8. 08:13
Jsem opravdu velmi nadšený, že to slyším. Rád bych viděl, jak Llama 4.1 obnoví značku Llama - vydání Llama 3.1/3.2/3.3 byla fantastická a z Qwen 3 jsme viděli, kolik údernosti mohou tyto menší modely zabalit
Llama 4 Scout a Maverick byli příliš velcí!
28,26K
Jeremy Howard repostoval/a
Jiný právník ve stručném vyjádření uvedl spoustu falešných případů s halucinacemi způsobenými umělou inteligencí. Řekla, že to neudělala vědomě.
Soud nařizuje sankce:
-Právní zástupce musí napsat dopis třem soudcům, kterým připsal falešné případy
-Právní zástupce je vyhozen z případu; profesionální hac zrušen
-Krátce zasažen
-Právní zástupce musí klientovi předat kopii příkazu
-Právní zástupce musí zaslat příkaz každému soudci, který předsedá kterémukoli z jejích případů
-Soud zašle kopii příkazu všem státním advokátním komorám, kde je právní zástupce povolen.

142,57K
Jeremy Howard repostoval/a
Takový mám pocit z vibe kódování.
Každý projekt, který zkouším a který má nějakou komplikaci, má okamžitý nával pokroku. Věci jsou úžasné a cítím se jako superschopnost. Potom... jak přidávám další složitost, věci se zhroutí až zastaví.
Jediné projekty, které si myslím, že dokážu vytvořit, jsou ty, které spadají do této "vibrační zóny". Prototypy, uživatelská rozhraní, produkty – cokoli, co je jednoduché a má nízkou složitost, přesně zapadá do této zóny. Důkaz konceptů, interakcí a podobně. Nástroje jsou schopny vytvářet věci, které se do tohoto slotu vejdou.
Ale.
Všechno se rozpadá na kousky, jak se křivka složitosti zvyšuje. A problém je v tom, že každý dobrý proces návrhu produktu je stále složitější. Základní prototyp se změní na dobrý prototyp, jakmile má vrstvené interakce, přechody, dobré afordance, stavy vznášení, 1000 drobných detailů, díky nimž něco působí správně a skutečně.
Výhodou kódování vibrací má být to, že se pohybujete rychle a můžete věci vybičovat – umělá inteligence tak udělá všechnu práci za vás. Problém je v tom, že ztrácí páru, jakmile se přidá potřebná složitost. Neustále se předělává, přepisuje kód, ovlivňuje věci, které spolu nesouvisí, a pak způsobuje další problémy.
Pokud však k tomu přidáte tuto složitost, každé sezení kódování vibrací se rychle změní na mlácení do chyb.
Nejsem si jistý řešením tohoto problému. U tradičního prototypování je řešením duplikování, přidání větší složitosti, vytvoření více snímků/scén, vyladění, fork atd.
S vibe kódováním však může jedna malá výzva zničit doslova vše. Je fáze, kdy skončím tak, že chodím po okamžitých skořápkách - snažím se nedávat tomu příliš mnoho nebo příliš málo kontextu, aby se to nezvrtlo a všechno nerozbilo.
Existuje jen několik výjimek. @cursor a @framer.
S Cursorem mohu dělat velké pokroky, dávat mu úzký kontext a musím schvalovat úpravy, které provádí. To mi připadá jako správný pracovní postup. Problém je, že nevidím věc, kterou vytváří, protože je to IDE, ne vizuální prostředí. Ano, mohu vytvářet místní sestavení a obnovovat prohlížeč a všechny tyto věci. Vizuální stránka se však z kódování zcela vytratila. Je to nástroj pro vývojáře.
Framer to dělá správně, protože umožňuje pouze úzké aktualizace v rámci jedné komponenty na stránce. Ano, je to omezující, protože může dělat pouze jednu věc najednou, ale alespoň se nesnaží vytvořit celou stránku od začátku a spravovat ji celou prostřednictvím rozhraní s rychlou výzvou.
To se zdá jako správný přístup.
@Cursor: Umožní umělé inteligenci upravovat cokoli, ale umožní uživateli tyto úpravy schvalovat a vidět je v kontextu.
@Framer: Umožněte umělé inteligenci upravovat pouze jeden soubor nebo komponentu, abyste udrželi složitost na minimu a omezili katastrofické úpravy.
Jsem optimista a věřím, že nástroje jako @Figma, @Lovable, @Bolt a @V0 mohou vytvořit skvělé prototypy, ale pořád narážím na zdi, když přijde na to, abych udělal něco víc než jen základní prototyp interakce. Musí toho IMO dělat méně.
Doufejme, že tyto nástroje přidají další ovládací prvky, které jsou ve stejné linii jako kurzor a rámec. Ještě dodám, že je to podobné, jako to děláme s generováním grafů @Basedash. Ale nejsme vibrační nástroj v normálním slova smyslu, takže paralely jsou trochu těžší nakreslit.

211,07K
Jeremy Howard repostoval/a
Prezentace pro mou přednášku "LLM Reasoning" na Stanfordu CS 25:
Klíčové body:
1. Uvažování v LLM jednoduše znamená generování sekvence mezilehlých tokenů před vytvořením konečné odpovědi. Zda se to podobá lidskému uvažování, je irelevantní. Zásadním poznatkem je, že modely transformátorů se mohou stát téměř libovolně výkonnými generováním mnoha mezilehlých tokenů, aniž by bylo nutné měnit velikost modelu (
2. Předtrénované modely, dokonce i bez jakéhokoli doladění, jsou schopné uvažování. Problém je v tom, že výstupy založené na uvažování se často neobjevují na vrcholu distribuce výstupů, takže standardní nenasytné dekódování je nedokáže zobrazit (
3. K vyvolání uvažování se běžně používaly techniky nabádání (např. nabádání myšlenkového řetězce nebo "přemýšlejme krok za krokem") a jemné ladění pod dohledem. Nyní se ukázalo, že nejúčinnější metodou je jemné doladění RL. Tento trik byl nezávisle objeven několika laboratořemi. Ve společnosti Google má zásluhu Jonathan Lai z mého týmu. Na základě naší teorie (viz bod 1) by se škálování RL mělo zaměřit spíše na generování dlouhých odpovědí než na něco jiného.
4. LLM uvažování lze výrazně zlepšit generováním více odpovědí a jejich následnou agregací, spíše než spoléháním se na jedinou odpověď (
177,27K
Top
Hodnocení
Oblíbené
Co je v trendu on-chain
Populární na X
Nejvyšší finanční vklady v poslední době
Nejpozoruhodnější