谷歌北京时间2月27日凌晨发布了Gemini 3.1 Flash Image(Nano Banana 2),这是继去年8月首代产品和11月Pro版本之后的又一次更新。新模型在性能与成本之间找到了新的平衡点。 从性能表现看,Nano Banana 2成绩亮眼。根据独立测评机构Artificial Analysis的数据,该模型以Nano Banana Pro一半的价格在文生图榜单中排名第一,图像编辑榜单中排名第三。大模型竞技场LMArena的最新排行也证实了该点,Nano Banana 2的文生图测试得分达到1280,超越了GPT Image 1.5和Nano Banana Pro。 价格优势是这一版本的核心竞争力。在谷歌AI Studio平台上,Nano Banana 2生成每张1000像素图片的单价为0.067美元,输入价格为0.5美元,而Nano Banana Pro的对应价格分别为0.134美元和2元。用户可以以更低的成本获得相当甚至更优的生成效果,大幅降低了AI图像生成工具的使用门槛。 技术上,Nano Banana 2在多个上实现了升级。模型融合了Gemini对世界的理解能力,结合网络搜索的实时信息和图像数据,使生成内容更贴近现实。视觉表现上,模型能呈现更生动的光照效果、更丰富的纹理细节和更清晰的画面质感。文本渲染和多语言翻译功能的增强,也提升了其在国际化应用中的潜力。 谷歌开发了两个演示应用来展示新功能。"靠窗座位"程序允许用户指定全球任意地点和窗户位置,模型可根据实时天气数据生成逼真的窗外景象。"全球广告本地化器"则能将英文广告图像翻译成多种语言版本,为出海企业的国际化运营提供便利。 不过,实际应用中仍存在局限。在用地图截图生成特定地点全景图的测试中,Nano Banana 2虽然保持了一定的审美水准,成功还原了广州塔、猎德大桥等标志性景点,但在地理位置准确性和中文字体标注上仍有错误。这表明当前模型在处理复杂、精细的现实场景时,准确性和稳定性还需继续提升。
Nano Banana 2的发布展现了人工智能的发展潜力,也暴露了技术的现实局限。在AI快速迭代的时代,关键不在于技术能否取代人类,而在于人类如何有效地运用技术。