谷歌发布新一代图像生成与编辑模型Nano Banana 2 以更低成本冲击行业应用边界

谷歌北京时间2月27日凌晨发布了Gemini 3.1 Flash Image（Nano Banana 2），这是继去年8月首代产品和11月Pro版本之后的又一次更新。新模型在性能与成本之间找到了新的平衡点。从性能表现看，Nano Banana 2成绩亮眼。根据独立测评机构Artificial Analysis的数据，该模型以Nano Banana Pro一半的价格在文生图榜单中排名第一，图像编辑榜单中排名第三。大模型竞技场LMArena的最新排行也证实了该点，Nano Banana 2的文生图测试得分达到1280，超越了GPT Image 1.5和Nano Banana Pro。价格优势是这一版本的核心竞争力。在谷歌AI Studio平台上，Nano Banana 2生成每张1000像素图片的单价为0.067美元，输入价格为0.5美元，而Nano Banana Pro的对应价格分别为0.134美元和2元。用户可以以更低的成本获得相当甚至更优的生成效果，大幅降低了AI图像生成工具的使用门槛。技术上，Nano Banana 2在多个上实现了升级。模型融合了Gemini对世界的理解能力，结合网络搜索的实时信息和图像数据，使生成内容更贴近现实。视觉表现上，模型能呈现更生动的光照效果、更丰富的纹理细节和更清晰的画面质感。文本渲染和多语言翻译功能的增强，也提升了其在国际化应用中的潜力。谷歌开发了两个演示应用来展示新功能。"靠窗座位"程序允许用户指定全球任意地点和窗户位置，模型可根据实时天气数据生成逼真的窗外景象。"全球广告本地化器"则能将英文广告图像翻译成多种语言版本，为出海企业的国际化运营提供便利。不过，实际应用中仍存在局限。在用地图截图生成特定地点全景图的测试中，Nano Banana 2虽然保持了一定的审美水准，成功还原了广州塔、猎德大桥等标志性景点，但在地理位置准确性和中文字体标注上仍有错误。这表明当前模型在处理复杂、精细的现实场景时，准确性和稳定性还需继续提升。

Nano Banana 2的发布展现了人工智能的发展潜力，也暴露了技术的现实局限。在AI快速迭代的时代，关键不在于技术能否取代人类，而在于人类如何有效地运用技术。