阿里巴巴通义实验室发布LAM:单图秒级生成超写实3D数字人,手机渲染达120FPS

🎯 情报来源:机器之心

近日,阿里巴巴通义实验室3D团队推出了一项名为LAM(Large Avatar Model)的技术,能够通过单张图像实时生成可驱动的高斯3D头像,突破了传统方法对多视角数据或复杂后处理的依赖。该技术在虚拟会议、影视制作、游戏开发等领域具有广泛应用潜力。

LAM的核心亮点包括单图秒级生成超写实3D数字人、WebGL跨平台超实时驱动渲染(手机端可达120FPS),以及开源低延迟实时交互对话数字人SDK。

核心要点:

  • LAM基于FLAME头部模板初始化高斯球位置,并结合形状混合形变与骨骼线性蒙皮驱动机制,降低生成复杂度。
  • 利用预训练的DinoV2提取多层级特征,通过交叉注意力模块预测3D高斯球属性,提升细节建模能力。
  • 实验显示,LAM以超写实图像质量刷新记录,在VFHQ和HDTF数据集上性能超越NeRF和3D高斯溅射方法。

📌 情报分析

技术价值:极高

LAM通过单图输入和一次前向传播生成高质量3D头像,无需神经后处理,直接兼容传统图形渲染管线,解决了传统方法计算成本高、泛化能力弱的问题。

商业价值:高

轻量化模型和跨平台渲染架构使LAM适用于多种硬件设备,支持智能客服、情感陪伴等低延迟应用,显著降低了3D数字人开发和部署的成本。

趋势预测:

未来3-6个月内,LAM可能推动3D数字人技术在消费级市场的普及,特别是在移动端和Web端的应用场景中,进一步加速虚拟内容创作工具的发展。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索