Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Kontrola przychodzi na końcu tym razem. Ale nadchodzi.

14 lis 2024
Często mówię o kontroli w AI. Ale zrozumiałem, że czasami ludzie myślą, że mam na myśli "lepsze podpowiedzi". Oto moje przemyślenia na temat tego, co mam na myśli przez kontrolę: rozwiązujemy grafikę wstecz.
Historia grafiki komputerowej podąża za wyraźnym postępem: najpierw pojawiła się kontrola, potem jakość. Zajęło to dziesięciolecia, aby ustalić odpowiednie abstrakcje - krzywe, trójkąty, wielokąty, siatki - które pozwoliłyby nam narysować dokładnie to, co chcieliśmy na ekranie. Te fundamentalne elementy nie zmieniły się zbytnio, ponieważ okazały się być właściwymi. Od ręki Ed'a Catmulla do nowoczesnych silników gier, podstawowe zasady, jak kontrolujemy piksele, pozostały niezwykle stabilne. Fundamenty pojawiły się nie tylko dla kontroli, ale jako efektywne sposoby opisywania i renderowania złożonych scen.
Jakość renderowania była ostatnią granicą. Sześcian modelowany w 1987 roku przy użyciu pierwszej wersji Rendermana podąża za tymi samymi zasadami geometrycznymi, co jeden modelowany w Blenderze dzisiaj. To, co jest dramatycznie inne, to renderowanie - oświetlenie, materiały, cienie i odbicia, które sprawiają, że wydaje się rzeczywiste. Przemysł spędził dziesięciolecia na zamykaniu doliny niesamowitości, budując coraz bardziej zaawansowane systemy renderowania, aby zbliżyć się do fotorealizmu. Oczywiście wiele innowacji w grafice poprawiło zarówno kontrolę, jak i jakość jednocześnie, a historia postępu grafiki jest bardziej złożona niż tylko "kontrola, a potem jakość."
Ale ta kolejność nie była przypadkowa. Sam pipeline graficzny ją narzuca: geometria definiuje, co chcemy narysować, shadery określają, jak to wygląda. Nawet silniki czasu rzeczywistego podążają za tym wzorem - najpierw ustalając kontrolę poziomu szczegółowości, a następnie poprawiając jakość renderowania w ramach tych ograniczeń.
AI całkowicie odwróciło ten postęp.
Dzisiejsze modele generatywne osiągają fotorealistyczną jakość renderowania, która dorównuje lub przewyższa tradycyjne pipeline'y, skutecznie ucząc się całego stosu grafiki - od geometrii po globalne oświetlenie - poprzez masowe szkolenie. Zlikwidowały tradycyjne rozdzielenie między modelowaniem a renderowaniem, tworząc system end-to-end, który może produkować oszałamiające obrazy z wysokopoziomowych opisów.
Czego brakuje, to kontrola.
Chociaż możemy generować fotorealistyczne sceny w kilka sekund, brakuje nam precyzyjnej kontroli, którą zapewniły dziesięciolecia badań nad grafiką. Nie możemy łatwo dostosować geometrii, precyzyjnie dostroić materiałów ani manipulować oświetleniem z taką szczegółowością, jakiej oczekują artyści. Deterministyczny charakter tradycyjnej grafiki - gdzie każdy parametr ma przewidywalny efekt - został zastąpiony modelami probabilistycznymi.
To jest problem odwrotnej grafiki: rozwiązaliśmy renderowanie przed rozwiązaniem kontroli. Nasze modele mogą tworzyć oszałamiające obrazy, ale brakuje im fundamentalnych abstrakcji, które uczyniły grafikę komputerową tak potężną - zdolności do wprowadzania precyzyjnych, zamierzonych zmian na każdym poziomie szczegółowości.
To nie jest trwałe ograniczenie. Tak jak grafika komputerowa ostatecznie rozwiązała problem renderowania, AI rozwiąże problem kontroli. Pytanie nie brzmi, czy, ale jak. Znajdujemy odpowiednie abstrakcje do kontrolowania modeli generatywnych - odpowiednik krzywych, trójkątów i wielokątów, które zrewolucjonizowały grafikę komputerową wcześniej. Myślę, że rozwiązania mogą wyglądać inaczej. Nowe prymitywy do kontroli, które są natywne dla sieci neuronowych, mogą być właściwą odpowiedzią, zamiast próbować wprowadzać tradycyjne koncepcje grafiki w ten nowy paradygmat. Chociaż myślę również, że istnieją hybrydowe podejścia łączące tradycyjną grafikę z AI, które warto zbadać.
Celem pozostaje zapewnienie tego samego poziomu przewidywalności i precyzji, który uczynił grafikę komputerową podstawowym narzędziem do twórczej ekspresji. To ostateczny cel, ale lepszy: w czasie rzeczywistym, tani i z precyzyjną kontrolą, która jest tak intuicyjna i uniwersalna, jak to możliwe.
Kontrola przychodzi na końcu tym razem. Ale nadchodzi.
5,3K
Najlepsze
Ranking
Ulubione