Прогнозирование состояния клеток в ранее невидимых условиях, таких как болезнь или в ответ на лекарство, обычно требовало переобучения для каждого нового биологического контекста. Сегодня Arc выпускает Stack, модель-основу, которая учится моделировать состояние клеток в новых условиях непосредственно во время вывода, без необходимости в дообучении.
Stack захватывает то, что большинство моделей упускает: клеточный контекст. Т-клетка в воспаленной ткани ведет себя иначе, не только из-за своих собственных генов, но и из-за своей среды. Stack обрабатывает клетки вместе и учится на этих взаимосвязях.
Точно так же, как текстовые подсказки направляют языковые модели, клетки служат подсказками в Stack. Она может наблюдать за иммунными клетками, обработанными лекарством, и предсказывать, как эпителиальные клетки отреагируют на то же самое лекарство, задача, для которой никогда не проводилось явное обучение. Это первая модель на основе одиночных клеток, способная к обучению в контексте или обобщению на новые задачи во время вывода.
Команда использовала Stack для создания Perturb Sapiens: атласа из ~20,000 предсказанных клеточных реакций по 28 тканям и 201 возмущению + подмножество, валидированное с использованием отложенных наборов данных, подтверждающее, что предсказания отражают реальную биологию.
272