NVIDIA 執行長:GROK 5 是一場 7 兆參數的 TIME 競賽 詹森·黃正在專注於真正的挑戰:不是製作更大的模型,而是快速訓練它們,而不會耗盡電力或預算。 Grok 5 正處於這場競賽的中心。 “下一個前沿模型。 埃隆已經提到下一個版本的 Grok,我相信是 Grok 5,擁有 7 兆參數。 這個是 10,而綠色代表 Blackwell。 在 Rubin 的情況下,注意到吞吐量要高得多,因此只需要這些系統的四分之一就能在我們給定的這個一個月的時間框架內訓練模型。” 來源:@rohanpaul_ai