熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
如果你有 2 分鐘的時間來閱讀這篇長文,你將會得到我對 Chat-GPT5 的誠實反饋。
我很期待嘗試 Chat-GPT5,今天我與 Google Gemini 2.5 Pro 和 Claude 4 一起進行了超過 4 小時的實時測試。
最終的評價是……
我對結果非常失望。Google Gemini 在大多數提示中表現最佳,而 Claude 4 通常排在第二(查看下面的表格:3 是好,1 是差)
ChatGPT 唯一表現出色的任務是創建一個基於瀏覽器的音樂生成器,能夠對移動鼠標和點擊等輸入做出反應(甚至還有一個超棒的錄音功能),但在其他方面,它未能提供預期的結果,並且經常在 2-3 次提示後仍無法產生有效的示例。
為了提供完整的背景,我在官方網站上測試了 Chat-GPT,然後使用了 Cursor。使用 Cursor 時,它的表現好得多,但仍然遠遠落後於其他模型。我最討厭的就是它從第一個提示開始就卡住了,沒有產出任何有效的東西,而另外兩個模型幾乎總是有某種輸出,至少可以檢查和測試。
今天,我還發現 Google Gemini 允許你創建一個多人應用程序。是的,你沒聽錯:它可以同步狀態和轉換,例如,用於多人遊戲(使用 Firebase,但仍然令人印象深刻,能夠獲得一個可工作的原型!)。免費的。當然,它不是完美的,但這為原型設計開啟了許多可能性,特別是小型多人遊戲。
話雖如此,我認為 GPT-5 是一個強大的模型,而且速度相當快,但我原本期待它能絕對超越這兩個較舊的模型,但事實並非如此,至少根據我測試的基準(我在實時測試之前沒有嘗試過它們)。
我很樂意與認為這是 "你應該使用或被拋在後面的新模型" 的人討論,因為在這一特定測試中(持續了超過 4 小時),我的經驗並非如此。
道德:不要相信你在社交媒體上看到的一切,或者更好的是,不要相信任何人。
自己進行測試,並用自己的大腦思考。

@patloeber 抱歉,打錯字了,太興奮了
4.5K
熱門
排行
收藏