谷歌搞了个叫nanobanana 2的图像生成新玩意

嘿,你听说没,谷歌搞了个叫NanoBanana 2的图像生成新玩意,这次真的是大升级!直接给Gemini平台塞进去,打开Fast模式就能用,特别方便。底层核心用的是最新的Gemini 3.1 Flash引擎,代号Gemini 3.1 Flash Image,把图像生成从“抄像素”变成了“做逻辑”。现在它最牛的地方在于能懂物理场景,像物体挡住东西、光线拐弯、东西掉地上这些复杂动作都能看懂。先把这些关系分析清楚,再去画图,这样就把错误率直接干到了80%以下,特别是动态场景看着特别顺眼。而且它写字也很靠谱,多国语言的复杂排版都能弄明白。实测多段落文字错别率不到0.3%,数学公式更是准到了99.2%。设计师只要发句话就能让它直接画UI界面的草图,连按钮在哪儿、字多大都能随手调。 这个角色一致性技术也挺强,哪怕换发型、变表情或者灯光变了,人脸长得还是那副样子,误差不会超过5%。现在还能传14张参考图进去让它融合,这种多图处理的本事在时尚设计上特别好用。 视频这块儿也有大改动,用户直接用大白话就能指挥它改视频里的颜色或者加动态元素。分辨率直接冲到了4K,还保证60fps流畅播放,文件体积还比以前小了40%。 对比老款,这次从架构到分辨率全换新了。文字错误率从15%猛跌到了0.3%,就连参考图处理都从3张变成了14张。这些升级让它在医疗影像和建筑设计这些专业领域也能用得顺手。 总之,NanoBanana 2真的把图像生成技术带向了新高度。谷歌这次真的是给了大家一个非常高效、灵活的工具包。我觉得这肯定会引领下一波图像生成的新潮流,推动各个行业都跟着一起创新。