nano-banana的更新,是一個AI創新的歷史性節點。 這個模型揭開了一塊AI行業的一塊遮羞布。 所有能打的AI繪畫模型,不是產品的原因, 僅僅是因為不懂業務,只看需求! 他們認為,客戶的需求很重要, 於是追求完成這個需求。 但是完成這個需求,需要扎實的業務功底。 和一個巨長的業務執行流程,整個路徑非常複雜。 相當於讓一個種地的老漢,去米其林後廚做一份牛排。 大廠同行:都在追求炫酷的簡單輸入,炫技輸出。 領導很興奮,員工跑斷腿,效果打折,周期創作周期巨長。實際在業務上,能解決的問題非常有限,業務識別空缺,導致模型產品化路徑的曲折。 總是研究的放後面,能引發話題的放前面。 廢了一百年的努力,做出來一個半吊子東西。 結果:小白罵娘,從業者罵娘,行銷號捧上天,消費者寥寥無幾。 小廠同行:技術實力不足,資源不足,使了大勁滿足一點點需求,還需要強大的知識探索欲,技術實踐成本高,花幾個月時間,巨大資金成本解決一個小問題。有一部分使用基礎,熊瞎子劈苞米,消費者丟一群再拉一群。迭代根本沒法持續覆蓋。 結果:學會的用煩了,沒學會的又很難學會。 開源同行:應用做了七七八八,精神世界滿足開花,加起來服務沒幾十萬人,全都是賺到錢沒給開源創作者花。模型迭代一次,墳頭高一尺,沒準哪個模型出來,過去的技術根本沒有迭代的必要。 結果:有道義的同行人,紛紛跳坑,只剩下幾個孤兒。 懂業務,是做AI的前提。 我很早就說過,2023年我之所以用AI繪畫, 是因為我要畫分鏡,我們花了大量的努力, 在2024年初就實現了和名人合影,訓練一致性模型。 很多現在簡單的功能在一年多前都可以實現, 不懂業務的人,連看都看不懂。 今天nano-banana每一個功能都是直切業務核心點的。 他不是單純的一個模型技術的更新。 論修改,其實有很多了,方法也有很多。 但是這個模型,一次性把所有的業務關鍵打通了。 其實sora已經很厲害, 但是sora對業務的覆蓋沒那麼全面。 幾個月前,很多谷子店類的供應商, 都開始用sora做業務內容了。 但限制很多,可是從我們對模型理解來說, 開源模型是技術瓶頸, 但是對於sora這些模型,有些業務細分, 不應該是這個模型的瓶頸。 舉個簡單的例子,讓柯南從空手到拿一枝花沒有問題。 但是你讓一個手辦,手上多一個東西卻非常難。 從業務的角度講,這件事其實一點不難。 可sora就是不給你優化, 是技術不到位嗎?MJ那麼簡單的操作,實現不了嗎? 完全就是對業務理解的偏差。 那麼我們再舉一個MJ的例子, 這個模型的審美水平強不強? 說實話,一年以前, 我們就可以用這個模型來實現多視角服裝模特了。 還有仿真人的虛擬真人角色創建。 但是技術實現上非常討巧, 至今可能沒人能做到, 我們也不願意把這些東西傳播出去。 但大多數人的視野裡,是看不到MJ模型本身的能力的。 MJ公司追求的什麼我也不知道, 就知道他們在不斷的做,跟業務貼邊的東西, 就是不好好優化,導致這個模型的二次修正特別多。 我再說一遍,上面兩個問題,不是模型能力不行, 就是公司對各行各業需求的業務不理解。 谷歌證明給你們看了,誰也不需要反駁, 站著挨打就完事了。
20.82K