Mój inauguracyjny post @delphi_intel dotyczy modeli wideo Gen AI. Podsumowanie poniżej (1/10) 👇 s/o do @moonshot6666 za jego opinię na temat tego eseju @PJaccetturo za ten filmik z szumem wokół narkotyków, który bezwstydnie ukradnę. TLDR: filmy są 2-3 lata opóźnione w tekście. Stają się bardzo dobre, bardzo szybko
1. Ludzie są istotami wizualnymi. Modality treści Gen AI prawdopodobnie będzie zmierzać w kierunku rozkładu podobnego do sieci:
2. Rynek jest duży: >40 mld USD+ mld USD do 2030 r. (z odpowiednimi przyległościami). Zakłócenia w marketingu, rozrywce i edukacji są oczywiste, ale mają również wyraźne implikacje dla robotyki, nadzoru i długoterminowych zadań agenturowych
3. Krajobraz ma dużą konkurencję między stosami Obejmuje firmy modelskie, aplikacje multimodalne, mówiące awatary, synchronizację ust i wiele innych. Nie wspominając już o całej infrastrukturze niezbędnej do napędzania prawdziwych modeli i aplikacji multimodalnych. s/o do @venturetwins i @a16z do mapy
4. Wschód kontra Zachód. Wyścig jest w dużej mierze podzielony między USA i Chiny. W modelach wideo prym wiodą Chiny (9 z 15 najlepszych modeli) s/o @ArtificialAnlys
6. Przewaga Big Tech: wprowadzenie tych nowych możliwości do ekosystemów użytkowników >1b przyniesie wysoki zwrot z inwestycji Opierając się na poniższych atrybutach, nie jest szokujące, że duzi gracze, tacy jak $Goog, $meta, $techy, $baba i Bytedance, są dobrze pozycjonowani.
7. Akumulacja wartości: Jednocześnie dostrzegamy obszary w całym stosie - szczególnie w infrastrukturze i aplikacjach - gdzie nowi gracze mogą wyodrębnić duże biznesy. (Tak, będziesz musiał przeczytać rzeczywisty raport, aby uzyskać jakiekolwiek informacje, leniuchu)
8. Prawdziwa wielomodalność Dziś modele wideo wyglądają jak zabawki. Ale dane wideo i symulacje stają się coraz bardziej istotnym wkładem w długoterminowe zadania agentowe i w rozpoczęcie rewolucji robotycznej. Modele wideo mogą okazać się iskrą.
4,46K