🎯 情报来源:量子位
智象未来(HiDream.ai)推出多模态AI创作工具vivago2.0,整合开源模型HiDream-I1的进阶能力,实现图片、视频、播客生成一体化。该产品提供300+特效模板及图像Agent交互功能,其底层模型HiDream-I1曾以170亿参数在开源24小时内登顶文生图竞技场榜单。
核心要点:
- vivago2.0整合图片生成(支持文本/图文混合输入)、视频转换(图片转视频/文字生视频)、唇形同步播客三大核心功能
- 内置图像Agent支持自然语言交互修图,提供提示词优化及批量处理能力
- 开源模型HiDream-I1采用稀疏混合专家技术,在HPS、GenEval等基准测试中获得SOTA
- 团队2024年完成数亿元A轮融资,与慈文传媒、上影集团等达成战略合作
- 产品已实现Web/App全球同步上线,服务器因访问量过大出现拥堵
📌 情报分析
技术价值:极高
双流-单流混合稀疏DiT结构结合渐进式分辨率训练,文本编码采用CLIP+T5+Llama 3.1混合策略,参数效率与生成质量平衡。
商业价值:高
2024年AIGC市场60%收入来自图像/视频,产品已验证PMF;300+特效模板降低使用门槛,符合从SaaS向RaaS演进的商业化路径。
趋势预测:
3-6个月内可能推出更多垂直行业解决方案,基于现有IP二创合作加速内容生态构建,视频生成质量有望达到商用4K标准。