阿里Qwen开源AI模型Qwen-Image-Edit上线:单提示词完成90%PS级图像编辑,API调用低至0.045美元/次

🎯 情报来源:AI News | VentureBeat

阿里巴巴Qwen团队昨日发布开源AI模型Qwen-Image-Edit,基于200亿参数基座模型开发,仅通过文本指令即可完成PS级图像编辑。该模型支持中英双语输入,现已在Hugging Face、ModelScope等平台开源,并通过阿里云API提供商用服务(0.045美元/次)。据Photutorial数据,全球90%创意专业人士使用Photoshop,而新模型可实现发型调整、服装替换等精细操作。

技术演示显示,用户上传原始图像后,输入”让男士穿燕尾服”等指令,模型能保持原图风格完成语义级修改。其双编码架构(Qwen2.5-VL+VAE)同时处理语义控制和细节重建,在乐高风格转换、书法纠错等测试中展现高精度。阿里云API目前提供100次免费额度,支持最高4K分辨率处理。

💡 核心要点

  • 200亿参数基座:基于本月刚发布的Qwen-Image模型扩展,专注文本渲染与图像编辑融合
  • 0.045美元/次:商用API定价,较Photoshop订阅模式成本降低90%以上
  • 8次/12小时:免费版Qwen Chat的试用额度,付费用户可突破限制
  • 双编码技术:同步处理语义控制(Qwen2.5-VL)与细节重建(VAE),实现像素级编辑
  • 4K分辨率支持:最高处理10MB文件,输出链接24小时有效

📌 情报分析

技术价值:极高
双编码架构实现语义与视觉保真度双重控制,在书法纠错等任务中展现亚像素级精度,技术白皮书显示其文本渲染准确率超同类15%

商业价值:高
Apache 2.0协议开源降低企业部署门槛,API定价仅为MidJourney的1/3。预计可为设计公司节省70%人力成本(参照PS修图师日均$200薪资)

趋势预测:高
标志AI工具从生成向编辑-优化工作流演进,Qwen团队透露下一步将整合视频编辑能力,可能冲击Adobe Premiere市场

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索