熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
nano-banana的更新,是一個AI創新的歷史性節點。
這個模型揭開了一塊AI行業的一塊遮羞布。
所有能打的AI繪畫模型,不是產品的原因,
僅僅是因為不懂業務,只看需求!
他們認為,客戶的需求很重要,
於是追求完成這個需求。
但是完成這個需求,需要扎實的業務功底。
和一個巨長的業務執行流程,整個路徑非常複雜。
相當於讓一個種地的老漢,去米其林後廚做一份牛排。
大廠同行:都在追求炫酷的簡單輸入,炫技輸出。
領導很興奮,員工跑斷腿,效果打折,周期創作周期巨長。實際在業務上,能解決的問題非常有限,業務識別空缺,導致模型產品化路徑的曲折。
總是研究的放後面,能引發話題的放前面。
廢了一百年的努力,做出來一個半吊子東西。
結果:小白罵娘,從業者罵娘,行銷號捧上天,消費者寥寥無幾。
小廠同行:技術實力不足,資源不足,使了大勁滿足一點點需求,還需要強大的知識探索欲,技術實踐成本高,花幾個月時間,巨大資金成本解決一個小問題。有一部分使用基礎,熊瞎子劈苞米,消費者丟一群再拉一群。迭代根本沒法持續覆蓋。
結果:學會的用煩了,沒學會的又很難學會。
開源同行:應用做了七七八八,精神世界滿足開花,加起來服務沒幾十萬人,全都是賺到錢沒給開源創作者花。模型迭代一次,墳頭高一尺,沒準哪個模型出來,過去的技術根本沒有迭代的必要。
結果:有道義的同行人,紛紛跳坑,只剩下幾個孤兒。
懂業務,是做AI的前提。
我很早就說過,2023年我之所以用AI繪畫,
是因為我要畫分鏡,我們花了大量的努力,
在2024年初就實現了和名人合影,訓練一致性模型。
很多現在簡單的功能在一年多前都可以實現,
不懂業務的人,連看都看不懂。
今天nano-banana每一個功能都是直切業務核心點的。
他不是單純的一個模型技術的更新。
論修改,其實有很多了,方法也有很多。
但是這個模型,一次性把所有的業務關鍵打通了。
其實sora已經很厲害,
但是sora對業務的覆蓋沒那麼全面。
幾個月前,很多谷子店類的供應商,
都開始用sora做業務內容了。
但限制很多,可是從我們對模型理解來說,
開源模型是技術瓶頸,
但是對於sora這些模型,有些業務細分,
不應該是這個模型的瓶頸。
舉個簡單的例子,讓柯南從空手到拿一枝花沒有問題。
但是你讓一個手辦,手上多一個東西卻非常難。
從業務的角度講,這件事其實一點不難。
可sora就是不給你優化,
是技術不到位嗎?MJ那麼簡單的操作,實現不了嗎?
完全就是對業務理解的偏差。
那麼我們再舉一個MJ的例子,
這個模型的審美水平強不強?
說實話,一年以前,
我們就可以用這個模型來實現多視角服裝模特了。
還有仿真人的虛擬真人角色創建。
但是技術實現上非常討巧,
至今可能沒人能做到,
我們也不願意把這些東西傳播出去。
但大多數人的視野裡,是看不到MJ模型本身的能力的。
MJ公司追求的什麼我也不知道,
就知道他們在不斷的做,跟業務貼邊的東西,
就是不好好優化,導致這個模型的二次修正特別多。
我再說一遍,上面兩個問題,不是模型能力不行,
就是公司對各行各業需求的業務不理解。
谷歌證明給你們看了,誰也不需要反駁,
站著挨打就完事了。
20.82K
熱門
排行
收藏