¡La tabla de clasificación del Desafío de ML sobre la Obesidad está comenzando a mostrar señales reales! En colaboración con @Schmidt_Center, estamos utilizando el aprendizaje automático para predecir cómo responden las células a los cambios que influyen en el desarrollo y almacenamiento de grasa. Diseñamos dos pistas de evaluación para probar qué tan bien los modelos predicen lo que sucede dentro de las células cuando intervenimos en ellas. Este hilo explica cómo funciona la tabla de clasificación…
Primero, ¿qué queremos decir con intervenir (o "perturbar") una célula? Una perturbación es un cambio controlado que aplicamos a una célula, como activar/desactivar un gen o añadir un fármaco, para ver cómo responde la célula. Esa respuesta es lo que se le pide a tu modelo que prediga.
El desafío tiene dos pistas, cada una probando una habilidad diferente. Pista 1: Métricas a nivel de transcriptoma Esto ayudará a responder si tu modelo puede predecir cómo cambia la expresión génica después de una perturbación. Pista 2: Métricas a nivel de programa Esto ayudará a responder si tu modelo puede predecir en qué estado termina la célula.
Pista 1: Métricas a nivel del transcriptoma Cuando perturbamos una célula, miles de genes pueden cambiar su actividad. Esta pista pregunta: ¿Tu modelo predijo qué genes aumentaron, cuáles disminuyeron y en qué medida? Evaluamos esto utilizando dos métricas.
Métrica 1: Delta de Pearson Esto mide cuán cerca están tus predicciones de lo que realmente sucedió. - ¿Predijiste la dirección correcta del cambio? - ¿Predijiste la magnitud correcta? Cuanto más cercanas sean las coincidencias, mayor será la puntuación.
Métrica 2: Discrepancia Media Máxima (MMD) En lugar de verificar genes uno por uno, MMD observa el panorama completo. Pregunta: - ¿La distribución de expresión génica que predijiste se parece a la real? Esto ayuda a detectar modelos que no capturan la estructura general.
Seguimiento 2: Métricas a nivel de programa Los genes trabajan juntos para empujar a las células hacia estados biológicos. Después de una perturbación, una célula puede cambiar a: - pre grasa - grasa madura - modo de almacenamiento de grasa Este seguimiento verifica si tu modelo predice estos resultados correctamente.
Medimos esto utilizando algo llamado "distancia L1". Compara: - la proporción real de células en cada estado vs - las proporciones predichas por tu modelo Cuanto menor sea la distancia, mejor será la comprensión de lo que se convierte la célula.
124