肥胖机器学习挑战赛的排行榜开始显示出真实的信号! 我们与@Schmidt_Center合作,利用机器学习预测细胞如何响应影响脂肪发展和储存的变化。 我们设计了两个评估轨道,以测试模型在我们干预细胞时预测细胞内部发生的情况的能力。 这个线程解释了排行榜是如何运作的…
首先,我们所说的干预(或“扰动”)细胞是什么意思? 扰动是我们对细胞施加的受控变化,比如开启/关闭一个基因或添加一种药物,以观察细胞的反应。 这种反应就是你的模型需要预测的内容。
该挑战有两个赛道,每个赛道测试不同的技能。 赛道 1:转录组范围的指标 这将帮助回答您的模型是否能够预测在扰动后基因表达的变化。 赛道 2:程序级别的指标 这将帮助回答您的模型是否能够预测细胞最终处于什么状态。
轨道 1:转录组范围的指标 当我们扰动一个细胞时,成千上万的基因可能会改变活性。 这个轨道询问: 你的模型是否预测了哪些基因上调,哪些基因下调,以及变化幅度有多大? 我们使用两个指标来评估这一点。
指标 1:皮尔逊德尔塔 这衡量了你的预测与实际发生的情况有多接近。 - 你预测了变化的正确方向吗? - 你预测了正确的幅度吗? 匹配越接近,得分越高。
指标 2:最大均值差异 (MMD) MMD 不是逐个检查基因,而是从整体上进行观察。它问: - 你预测的基因表达分布看起来像真实的分布吗? 这有助于检测缺失整体结构的模型。
轨道 2:程序级指标 基因共同作用使细胞进入生物状态。 在扰动后,细胞可能会转变为: - 前脂肪 - 成熟脂肪 - 脂肪储存模式 此轨道检查您的模型是否正确预测了这些结果。
我们使用一种叫做“L1 距离”的方法来测量这一点。 它比较: - 每个状态中细胞的真实比例 与 - 你模型预测的比例 距离越小,越能更好地理解细胞的变化。
126