Turing Labs高价雇佣艺术家采集数据,AI训练进入高质量数据竞争时代

🎯 情报来源:AI News & Artificial Intelligence | TechCrunch

今年夏天,艺术家Taylor和室友头戴GoPro摄像机进行为期一周的行为数据采集,为Turing Labs的AI视觉模型提供训练素材。她们每天需同步拍摄5小时的多角度视频,实际工作时长达到7小时,报酬丰厚但伴随生理不适(如长时间佩戴导致前额红肿)。Turing Labs正通过类似方式雇佣厨师、建筑工人等蓝领工作者,构建专有视频数据集。

该公司首席AGI官Sudarshan Sivaraman强调,人工采集是获得多样化数据的唯一途径。目前其数据75%-80%为基于原始视频生成的合成数据,但原始数据质量被视为关键。与此同时,邮件AI公司Fyxer也发现数据质量比数量更重要,早期曾以4:1的比例配置行政助理与工程师团队进行专业数据标注。

💡 核心要点

  • 数据采集成本:艺术家日薪达7小时工作时长,头部设备导致明显生理不适
  • 数据构成:Turing Labs合成数据占比75%-80%,但强调原始数据质量决定上限
  • 行业趋势:Fyxer早期数据团队中,专业标注人员与工程师比例达4:1
  • 商业策略:两家公司均将专有数据视为核心竞争壁垒

📌 情报分析

技术价值:高
视频数据训练视觉模型对序列化问题解决能力有显著提升,但合成数据质量依赖原始素材,技术天花板明确

商业价值:极高
专有数据构建成本(Turing单日采集成本预估$500+/人)形成天然竞争壁垒,符合AI产业从算力竞争转向数据竞争的趋势

趋势预测:高
高质量人工标注岗位需求将持续增长,据Fyxer案例推算,专业数据标注团队规模可能达到技术团队的3-5倍

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索