1/ Se o DeepSeek-Math-V2 está por trás do recente salto de pontuação para 38/50, então encaixar um modelo de ~700GB em um único H100 que tenha aproximadamente 6 minutos de tempo de execução por problema matemático (essas são as restrições de Kaggle) um dia após seu lançamento seria uma conquista impressionante.