Co dalej z AI? Może inteligencja fizycznie specyficzna, bardziej niż sztuczna inteligencja ogólna. Oto szkic tezy. (1) Po pierwsze, AI wchodzi teraz w dół cyklu hype. Każda technologia, niezależnie od tego, jak niesamowita, przechodzi przez to. To właściwie jeden z najlepszych momentów na inwestowanie i budowanie, gdy przestrzeń zaczyna się kurczyć. (2) Po drugie, AI jest zarówno niezwykle przydatne do wyszukiwania, podsumowywania, wizualizacji i prototypowania *jak i* niezwykle irytującym źródłem spamu, oszustw i bałaganu. Zbyt wielu skupi się wyłącznie na negatywach. (3) Po trzecie, dokładny plateau AI jest dość nieoczekiwany. Fakt, że obecne modele wydają się osiągnąć szczyt w „znacznie lepszym wyszukiwaniu w sieci i podsumowywaniu”, nie jest tym, co większość by przewidziała w 2022 roku. Zakłócenie Google to historyczne osiągnięcie, ale to nie jest bóg maszyny. (4) Jedna teza na temat tego, dlaczego modele plateau w ten sposób, jest taka, że AI w stylu LLM naprawdę *tylko* powtarza, a nie myśli w rzeczywistości. To jest w dół, a nie w górę. Teraz można z tym osiągnąć znacznie więcej, niż większość myślała. Ale nie można dojść do całkowicie nowych myśli. (5) To prowadzi do kolejnego punktu: jak już mówiłem, AI cyfrowe działa w sposób środkowy, a nie end-to-end. Ponieważ wąskie gardło dla AI cyfrowego to podpowiadanie i weryfikacja. (6) Jednak *fizyczne* AI — w sensie prowadzenia robotów — *może* wykonać rzeczy end-to-end, chociaż po zainwestowaniu dużej ilości energii w przypadki brzegowe. Na przykład, samochody autonomiczne teraz naprawdę mogą zabrać cię z punktu A do punktu B. Robią to end-to-end. (7) Tak więc, niezwykle dobrze określone i ekonomicznie wartościowe problemy ze świata fizycznego, takie jak „prowadź z punktu A do punktu B”, to miejsca, w których powinniśmy zobaczyć znaczący postęp AI. Nazwij to inteligencją fizycznie specyficzną. (8) Chińskie roboty w szczególności będą wykonywać zadanie za zadaniem, w wielu formatach poza tylko samochodami czy humanoidami. Roboty chodnikowe i drony dostawcze są już aktywne w Chinach, obok samochodów autonomicznych, a ich sektor sprzętowy przyspiesza. (9) Jednym z powodów, dla których warto być bardziej krótkoterminowo optymistycznym w kwestii inteligencji fizycznie specyficznej, a nie sztucznej inteligencji ogólnej, jest to, że świat fizyczny jest rzeczywisty, podczas gdy świat cyfrowy może być fikcyjny. @drfeifei zwrócił uwagę, że podręcznikowa koncepcja jednoczesnej lokalizacji i mapowania (SLAM) jest w rzeczywistości explicytnym modelem świata fizycznego, czego wszyscy wiemy, że brakuje w sferze cyfrowej. (10) W szczególności, jeśli masz N różnych robotów, które wszystkie wykonują SLAM (lub równoważne) i przesyłają swoje dane z czujników do centralnej bazy danych, to w pewnym sensie uczą się one z tego samego świata fizycznego i od siebie nawzajem. Miliony przejechanych mil przez samochody autonomiczne pokazują, że ta strategia działa. (11) Porównaj to z światem cyfrowym. Tekst może być fałszywy, może być fikcyjny, i rzeczywiście często tak jest. A to jest podwójnie prawdziwe, gdy tekst AI przenika do sieci. (12) Tak więc N robotów odczuwających świat fizyczny zbiegnie się w konsensusowej rzeczywistości. Robot Unitree i robot Tesli będą postrzegać te same obiekty. W przeciwieństwie do tego, N agentów w świecie cyfrowym po prostu wciąż przyswajają tekst i obrazy, które mogą i będą niespójne. (13) W przypadku braku podpisów cyfrowych, dane online używane do szkolenia AI będą nie tylko wewnętrznie niespójne, ale także fałszywe w subtelny lub głęboki sposób. Rzeczywiście, powszechne modele AI zapewniają, że wiele danych cyfrowych (poza twardymi granicami cyfrowymi) stanie się fałszywych, lub bałaganu, lub agentów AI rozmawiających ze sobą. ...