Clasamentul Obesity ML Challenge începe să dea un semnal real! În parteneriat cu @Schmidt_Center, folosim învățarea automată pentru a prezice modul în care celulele răspund la schimbările care influențează dezvoltarea și depozitarea grăsimii. Am proiectat două trasee de evaluare pentru a testa cât de bine prezic modelele ce se întâmplă în interiorul celulelor atunci când intervenim în ele. Acest fir explică cum funcționează clasamentul...
În primul rând, ce înțelegem prin intervenția (sau "perturbarea") unei celule? O perturbație este o schimbare controlată pe care o aplicăm unei celule, cum ar fi pornirea/dezactivarea unei gene sau adăugarea unui medicament, pentru a vedea cum răspunde celula. Acest răspuns este ceea ce modelul tău este rugat să prevadă.
Provocarea are două trasee, fiecare testând o abilitate diferită. Piesa 1: Metrici la nivelul întregului transcriptom Acest lucru va ajuta să răspundă dacă modelul tău poate prezice cum se schimbă expresia genică după o perturbație. Traseul 2: Metrici la nivel de program Acest lucru va ajuta să răspundă dacă modelul tău poate prezice starea în care ajunge celula.
Piesa 1: Metrici la nivelul întregului transcriptom Când perturbăm o celulă, mii de gene pot schimba activitatea. Această piesă întreabă: Modelul tău a prezis ce gene au crescut, care au scăzut și cu cât de mult? Evaluăm acest lucru folosind două metrici.
Metrica 1: Delta Pearson Aceasta măsoară cât de aproape sunt predicțiile tale de ceea ce s-a întâmplat de fapt. - Ai prezis direcția corectă a schimbării? - Ai prezis magnitudinea corectă? Cu cât meciurile sunt mai strânse, cu atât scorul este mai mare.
Metrica 2: Discrepanța medie maximă (MMD) În loc să verifice genele una câte una, MMD privește imaginea de ansamblu. Întreabă: - Distribuția ta prezisă a expresiei gene seamănă cu cea reală? Acest lucru ajută la detectarea modelelor care ratează structura generală.
Traseul 2: Metrici la nivel de program Genele lucrează împreună pentru a împinge celulele în stări biologice. După o perturbare, o celulă poate trece în: - pre-grăsime - grăsime matură - modul de stocare a grăsimii Această pistă verifică dacă modelul tău prezice corect aceste rezultate.
Măsurăm acest lucru folosind ceva numit "distanța L1". Aceasta compară: - proporția reală a celulelor în fiecare stare vs - proporțiile prezise ale modelului tău Cu cât distanța este mai mică, cu atât înțelegerea a ceea ce devine celula este mai bună.
114