1/ Se o DeepSeek-Math-V2 está por trás do recente salto de pontuação para 38/50, então encaixar um modelo de ~700GB em uma única H100 que tem aproximadamente 6 minutos de tempo de execução por problema matemático (essas são as restrições do Kaggle) um dia após seu lançamento seria uma conquista impressionante.