Ranking wyzwania Obesity ML zaczyna pokazywać prawdziwe sygnały! We współpracy z @Schmidt_Center wykorzystujemy uczenie maszynowe do przewidywania, jak komórki reagują na zmiany wpływające na rozwój i magazynowanie tłuszczu. Zaprojektowaliśmy dwa tory oceny, aby sprawdzić, jak dobrze modele przewidują, co się dzieje wewnątrz komórek, gdy w nie ingerujemy. Ten wątek wyjaśnia, jak działa ranking…
Najpierw, co mamy na myśli, mówiąc o interwencji (lub „zakłóceniu”) komórki? Zakłócenie to kontrolowana zmiana, którą stosujemy w komórce, na przykład włączając/wyłączając gen lub dodając lek, aby zobaczyć, jak komórka reaguje. Ta reakcja to to, co twój model ma przewidzieć.
Wyzwanie ma dwa tory, z których każdy testuje inną umiejętność. Tor 1: Metryki na poziomie transkryptomu To pomoże odpowiedzieć na pytanie, czy Twój model potrafi przewidzieć, jak zmienia się ekspresja genów po zakłóceniu. Tor 2: Metryki na poziomie programu To pomoże odpowiedzieć na pytanie, czy Twój model potrafi przewidzieć, w jakim stanie kończy się komórka.
Ścieżka 1: Metryki w skali transkryptomu Gdy zakłócamy działanie komórki, tysiące genów mogą zmieniać swoją aktywność. Ta ścieżka pyta: Czy Twój model przewidział, które geny wzrosły, które spadły i o ile? Oceniamy to za pomocą dwóch metryk.
Metryka 1: Delta Pearsona Mierzy, jak blisko są twoje prognozy do tego, co faktycznie się wydarzyło. - Czy przewidziałeś właściwy kierunek zmiany? - Czy przewidziałeś właściwą wielkość? Im bliższe dopasowania, tym wyższy wynik.
Metryka 2: Maksymalne Rozbieżności Średnie (MMD) Zamiast sprawdzać geny jeden po drugim, MMD patrzy na całość. Zadaje pytanie: - Czy twoja przewidywana dystrybucja ekspresji genów wygląda jak prawdziwa? To pomaga wykrywać modele, które pomijają ogólną strukturę.
Ścieżka 2: Metryki na poziomie programu Geny współpracują, aby wprowadzić komórki w stany biologiczne. Po zakłóceniu komórka może przejść do: - wstępnej tkanki tłuszczowej - dojrzałej tkanki tłuszczowej - trybu przechowywania tłuszczu Ta ścieżka sprawdza, czy Twój model poprawnie przewiduje te wyniki.
Mierzymy to za pomocą czegoś, co nazywamy „odległością L1”. Porównuje: - rzeczywistą proporcję komórek w każdym stanie vs - przewidywane proporcje przez twój model Im mniejsza odległość, tym lepsze zrozumienie tego, czym staje się komórka.
116