to jest naprawdę szalone od kiedy pojawiła się AI, każdy model biologiczny miał tę samą ograniczenie: trenować go na jednej chorobie, działa tylko na tę chorobę. ponownie trenować dla jakiegokolwiek nowego leku, pacjenta lub tkanki. obietnica modelu podstawowego dla biologii praktycznie nie istniała. przewidywanie zero-shot było niemożliwe. aż do teraz. Model Arc Institute (Stack) uczy się z grup komórek zamiast jednej na raz. w sposób, w jaki LLM-y widzą słowa w zdaniu, a nie w izolacji, komórki stają się kontekstem dla siebie nawzajem. możesz pokazać mu komórki, które były traktowane lekiem, a on przewiduje, jak zupełnie różne komórki zareagowałyby na ten sam lek. nawet jeśli nikt nigdy nie przeprowadził tego eksperymentu. nawet jeśli ta tkanka nigdy nie była zakłócona. nawet jeśli ta kombinacja nigdy nie istniała w treningu. same komórki stają się podpowiedziami, tylko z inferencji. możesz teraz zapytać biologię. "co by zrobiły komórki wątroby, gdybym dał im ten lek na raka?" i odpowiada rzeczywistymi przewidywaniami ekspresji genów. jeszcze nie idealnie, ale na tyle dobrze, że pokonał istniejące metody w 28 z 31 benchmarków (praktycznie niespotykane w tej dziedzinie, gdzie pokonanie 60% uważane jest za dobre). użyli go do zbudowania wirtualnego atlasu perturbacji: 28 ludzkich tkanek, 40 klas komórek, 201 leków. nie wymaga laboratorium. czysto in silico. gdy zweryfikowali to w rzeczywistych eksperymentach w laboratorium, przewidywania się zgadzały. discovery leków obecnie kosztuje ponad 5 milionów dolarów i 2 lata na eksperyment, który może się nie udać. teraz najpierw przeszukujesz obliczeniowo. "które tkanki będą miały efekty off-target?" "jak komórki tego pacjenta zareagują inaczej?" pytania, które kiedyś wymagały milionów w dotacjach, teraz potrzebują tylko GPU. powoli, ale pewnie rozwiązujemy biologię.