La classifica della sfida Obesity ML inizia a mostrare segnali reali! In collaborazione con @Schmidt_Center, stiamo utilizzando l'apprendimento automatico per prevedere come le cellule rispondono ai cambiamenti che influenzano lo sviluppo e l'immagazzinamento dei grassi. Abbiamo progettato due percorsi di valutazione per testare quanto bene i modelli prevedono cosa succede all'interno delle cellule quando interveniamo su di esse. Questo thread spiega come funziona la classifica…
Innanzitutto, cosa intendiamo per intervenire (o "perturbare") una cellula? Una perturbazione è un cambiamento controllato che applichiamo a una cellula, come attivare/disattivare un gene o aggiungere un farmaco, per vedere come risponde la cellula. Quella risposta è ciò che il tuo modello è chiamato a prevedere.
La sfida ha due percorsi, ognuno dei quali testa una competenza diversa. Percorso 1: Metriche a livello di trascrittoma Questo aiuterà a rispondere se il tuo modello può prevedere come cambia l'espressione genica dopo una perturbazione. Percorso 2: Metriche a livello di programma Questo aiuterà a rispondere se il tuo modello può prevedere in quale stato si trova la cellula.
Traccia 1: Metriche a livello di trascrittoma Quando perturbiamo una cellula, migliaia di geni possono cambiare attività. Questa traccia chiede: Il tuo modello ha previsto quali geni sono aumentati, quali sono diminuiti e di quanto? Valutiamo questo utilizzando due metriche.
Metri 1: Pearson Delta Questo misura quanto le tue previsioni siano vicine a ciò che è realmente accaduto. - Hai previsto la giusta direzione del cambiamento? - Hai previsto la giusta magnitudine? Più le corrispondenze sono vicine, più alto è il punteggio.
Metrica 2: Massima Discrepanza Media (MMD) Invece di controllare i geni uno per uno, MMD guarda l'intero quadro. Si chiede: - La distribuzione dell'espressione genica prevista assomiglia a quella reale? Questo aiuta a rilevare modelli che mancano della struttura complessiva.
Traccia 2: metriche a livello di programma I geni lavorano insieme per spingere le cellule in stati biologici. Dopo una perturbazione, una cellula può spostarsi in: - pre grasso - grasso maturo - modalità di stoccaggio dei grassi Questa traccia verifica se il tuo modello prevede correttamente questi risultati.
Misuriamo questo utilizzando qualcosa chiamato "distanza L1". Confronta: - la proporzione reale delle cellule in ciascuno stato vs - le proporzioni previste dal tuo modello Minore è la distanza, migliore è la comprensione di ciò che diventa la cellula.
130