1/ Если DeepSeek-Math-V2 стоит за недавним скачком баллов до 38/50, то вписать модель размером ~700 ГБ в один H100, который имеет примерно 6 минут времени выполнения на математическую задачу (это ограничения Kaggle), на следующий день после ее выпуска было бы впечатляющим достижением.