智象未来发布多模态AI神器vivago2.0:整合开源SOTA模型HiDream-I1,支持图片视频播客一键生成

🎯 情报来源:量子位

智象未来(HiDream.ai)推出多模态AI创作工具vivago2.0,整合开源模型HiDream-I1的进阶能力,实现图片、视频、播客生成一体化。该产品提供300+特效模板及图像Agent交互功能,其底层模型HiDream-I1曾以170亿参数在开源24小时内登顶文生图竞技场榜单。

核心要点:

  • vivago2.0整合图片生成(支持文本/图文混合输入)、视频转换(图片转视频/文字生视频)、唇形同步播客三大核心功能
  • 内置图像Agent支持自然语言交互修图,提供提示词优化及批量处理能力
  • 开源模型HiDream-I1采用稀疏混合专家技术,在HPS、GenEval等基准测试中获得SOTA
  • 团队2024年完成数亿元A轮融资,与慈文传媒、上影集团等达成战略合作
  • 产品已实现Web/App全球同步上线,服务器因访问量过大出现拥堵

📌 情报分析

技术价值:极高

双流-单流混合稀疏DiT结构结合渐进式分辨率训练,文本编码采用CLIP+T5+Llama 3.1混合策略,参数效率与生成质量平衡。

商业价值:高

2024年AIGC市场60%收入来自图像/视频,产品已验证PMF;300+特效模板降低使用门槛,符合从SaaS向RaaS演进的商业化路径。

趋势预测:

3-6个月内可能推出更多垂直行业解决方案,基于现有IP二创合作加速内容生态构建,视频生成质量有望达到商用4K标准。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索