nano-banana的更新,是一个AI创新的历史性节点。 这个模型揭开了一块AI行业的一块遮羞布。 所有能打的AI绘画模型,不是产品的原因, 仅仅是因为不懂业务,只看需求! 他们认为,客户的需求很重要, 于是追求完成这个需求。 但是完成这个需求,需要扎实的业务功底。 和一个巨长的业务执行流程,整个路径非常复杂。 相当于让一个种地的老汉,去米其林后厨做一份牛排。 大厂同行:都在追求炫酷的简单输入,炫技输出。 领导很兴奋,员工跑断腿,效果打折,周期创作周期巨长。实际在业务上,能解决的问题非常有限,业务识别空缺,导致模型产品化路径的曲折。 总是研究的放后面,能引发话题的放前面。 废了一百年的努力,做出来一个半吊子东西。 结果:小白骂娘,从业者骂娘,营销号捧上天,消费者寥寥无几。 小厂同行:技术实力不足,资源不足,使了大劲满足一点点需求,还需要强大的知识探索欲,技术实践成本高,花几个月时间,巨大资金成本解决一个小问题。有一部分使用基础,熊瞎子劈苞米,消费者丢一群再拉一群。迭代根本没法持续覆盖。 结果:学会的用烦了,没学会的又很难学会。 开源同行:应用做了七七八八,精神世界满足开花,加起来服务没几十万人,全都是赚到钱没给开源创作者花。模型迭代一次,坟头高一尺,没准哪个模型出来,过去的技术根本没有迭代的必要。 结果:有道义的同行人,纷纷跳坑,只剩下几个孤儿。 懂业务,是做AI的前提。 我很早就说过,2023年我之所以用AI绘画, 是因为我要画分镜,我们花了大量的努力, 在2024年初就实现了和名人合影,训练一致性模型。 很多现在简单的功能在一年多前都可以实现, 不懂业务的人,连看都看不懂。 今天nano-banana每一个功能都是直切业务核心点的。 他不是单纯的一个模型技术的更新。 论修改,其实有很多了,方法也有很多。 但是这个模型,一次性把所有的业务关窍打通了。 其实sora已经很厉害, 但是sora对业务的覆盖没那么全面。 几个月前,很多谷子店类的供应商, 都开始用sora做业务内容了。 但限制很多,可是从我们对模型理解来说, 开源模型是技术瓶颈, 但是对于sora这些模型,有些业务细分, 不应该是这个模型的瓶颈。 举个简单的例子,让柯南从空手到拿一枝花没有问题。 但是你让一个手办,手上多一个东西却非常难。 从业务的角度讲,这件事其实一点不难。 可sora就是不给你优化, 是技术不到位吗?MJ那么简单的操作,实现不了吗? 完全就是对业务理解的偏差。 那么我们再举一个MJ的例子, 这个模型的审美水平强不强? 说实话,一年以前, 我们就可以用这个模型来实现多视角服装模特了。 还有仿真人的虚拟真人角色创建。 但是技术实现上非常讨巧, 至今可能没人能做到, 我们也不愿意把这些东西传播出去。 但大多数人的视野里,是看不到MJ模型本身的能力的。 MJ公司追求的什么我也不知道, 就知道他们在不断的做,跟业务贴边的东西, 就是不好好优化,导致这个模型的二次修正特别多。 我再说一遍,上面两个问题,不是模型能力不行, 就是公司对各行各业需求的业务不理解。 谷歌证明给你们看了,谁也不需要反驳, 站着挨打就完事了。
19.63K