🎯 情报来源:量子位
德国研究团队开发的Centaur模型以Nature论文形式发布,成为首个能跨领域精准预测人类认知的基础模型。该模型仅用Llama 3.1 70B的0.15%参数(约1.05亿参数),在160项心理学实验中实现人类行为模拟,神经表征与真人fMRI扫描的皮尔逊相关系数显著超越基线。
训练数据来自史上最大规模人类行为数据集Psych-101,涵盖60092名参与者、超1000万次选择行为。值得注意的是,模型在A100 GPU上仅用5天即完成训练,对人类行为预测准确率达64%,远超AI行为预测的35%。
💡 核心要点
- 【效率突破】5天训练周期达成跨领域认知建模,参数利用率达基础模型0.15%
- 【性能标杆】负对数似然值0.44,显著优于Llama(0.58)和14种传统认知模型
- 【神经吻合】fMRI神经表征预测中,奖励相关脑区皮尔逊相关系数创纪录
- 【泛化能力】未训练领域的逻辑推理任务负对数似然值1.65,仍优于基础模型27%
- 【数据规模】训练集覆盖160实验/60092人/2亿tokens,构建成本超千万美元
📌 情报分析
技术价值:极高 – 首次实现LLM与人类神经表征的量化对齐,0.44的负对数似然值设认知建模新基准
商业价值:高 – 心理诊疗、教育评估、人机交互等领域年市场超300亿美元,但需解决fMRI成本障碍
趋势预测:极高 – 论文中”统一认知理论”表述暗示将引发认知科学范式变革,2026年前或出现医疗级应用案例