1/ Nếu DeepSeek-Math-V2 đứng sau sự gia tăng điểm số gần đây lên 38/50, thì việc phù hợp một mô hình ~700GB vào một H100 duy nhất có khoảng 6 phút thời gian chạy cho mỗi bài toán (đây là các giới hạn của Kaggle) một ngày sau khi phát hành sẽ là một thành tựu ấn tượng.