小红书发布全球首个社交大模型RedOne:8大任务平均提升14.02%,有害内容曝光率降低11.23%

🎯 情报来源:量子位

小红书NLP团队于2025年8月1日正式推出全球首个面向社交网络的定制化大模型RedOne。该模型采用创新的三阶段训练策略(CPT→SFT→PO),在8个核心SNS任务上实现平均14.02%的性能提升,其中有害内容检测曝光率降低11.23%,浏览后搜索点击率提升14.95%。测试显示,其32B版本在社交翻译等任务中超越基础模型Qwen2.5达7.56%。

研究团队构建了包含2000亿tokens的超大规模训练数据集,通过领域继续预训练注入社交文化知识,在保持通用能力衰减小于1%的前提下,使SNS任务性能提升最高达23.8%。线上A/B测试证实,基于RedOne的任务微调模型全面超越单任务基线,展现强大的领域适应性。

💡 核心要点

  • 性能突破:8大SNS任务平均提升14.02%,社交翻译任务提升7.56%
  • 业务价值:有害内容曝光率降低11.23%,浏览后搜索点击率提升14.95%
  • 训练规模:2000亿tokens混合数据集,包含通用语料与SNS特定数据
  • 架构创新:三阶段训练策略使SNS任务性能提升最高达23.8%
  • 成本优势:7B模型性能媲美更大规模基础模型

📌 情报分析

技术价值:极高
三阶段训练框架(CPT+SFT+DPO)实现领域知识注入与泛化能力平衡,消融实验显示各阶段贡献度明确。32B版本在OOD任务上保持86.7%准确率,验证架构鲁棒性。

商业价值:高
线上测试证实其直接提升平台核心指标,内容审核效率提升可降低人工成本30%以上。但需验证跨文化场景适应性。

趋势预测:高
开创垂类大模型新范式,预计2年内将出现5-8个同类竞品。社交平台内容治理市场空间可达百亿规模,但需警惕数据隐私合规风险。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索