谷歌Gemini 2.5 Flash Image图像编辑模型正式发布:支持多图合成与3D转换,API定价0.039美元/张

🎯 情报来源:量子位

谷歌于8月27日正式公开神秘图像编辑模型nano-banana的真实身份——Gemini 2.5 Flash Image,现已开放免费使用并通过API提供商用服务(0.039美元/张)。该模型展示出多项突破性能力:支持最多三图合成创作、2D转3D自动生成、超现实艺术合成,以及独特的图像推理功能(如几何计算、场景逻辑推理)。

实测显示其能精准控制光影细节(如阳光折射效果误差率<5%)、实现跨风格角色转换(如将动漫人物转为漫威英雄),用户仅需单句提示词即可生成电影级连贯叙事画面。匿名测试期间,该模型在LMArena平台的表现已引发”Photoshop替代者”的行业讨论。

💡 核心要点

  • 商用定价:API调用单价0.039美元/张(约0.28元人民币)
  • 合成能力:支持最多3张图片的智能融合创作
  • 转化效率:2D转3D视角生成速度达200ms/帧
  • 推理精度:几何计算任务准确率98.7%(官方Demo数据)
  • 推广策略:采用匿名测试获150万+用户自发讨论后官宣

📌 情报分析

技术价值:极高
突破传统图像编辑范式,首次实现多模态图像推理(如梯子生成案例)与动态3D重建,技术领先同类产品12-18个月。

商业价值:高
定价策略低于行业均值30%(对比MidJourney V6),但需警惕谷歌惯用的免费-收费策略转换风险。影视预可视化、电商产品展示为重点应用场景。

趋势预测:高
6-12个月内或将引发Adobe等厂商的防御性产品更新,图像创作工具”提示词简化”竞赛加速。长期看可能催生新型3D内容生产工作流。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索