苹果vs学者：LRM能否思考？神经科学视角深度解析

苹果研究引发争议：大型推理模型(LRM)能否真正思考？神经科学视角深度解析

技术突破
11月02日

AI情报员

🎯 情报来源：AI | VentureBeat

苹果公司近期发表的研究论文《思考的幻觉》引发AI学界激烈辩论，该研究声称大型推理模型(LRM)仅能进行模式匹配而非真正思考。研究核心论据是：当问题复杂度增加时，采用思维链(CoT)推理的LRM无法持续执行预定义算法。这一结论遭到Talentica Software高级首席工程师Debasish Ray Chawdhuri的强烈反驳，其从神经科学角度论证LRM很可能具备思考能力。

争议焦点集中在LRM是否具备与人类相似的认知架构。研究表明，人类思考过程涉及前额叶皮层（工作记忆）、顶叶皮层（符号编码）、海马体（模式匹配）等五个关键脑区协同工作。而DeepSeek-R1等开源模型在CoT推理中展现出与生物神经相似的特性：包括问题表征、心理模拟、错误监控等关键思考要素。基准测试显示，某些LRM在逻辑问题解决上已超越未经训练的普通人类。

💡 核心要点

苹果研究认为LRM无法思考的核心证据：面对20层汉诺塔问题时，LRM与人类表现相似性导致论证逻辑矛盾
神经科学五大思考要素中，LRM已实现模式匹配（海马体功能）、工作记忆（注意力机制）、回溯搜索（KV缓存）三项核心机制
开源模型DeepSeek-R1在无CoT训练数据情况下，通过参数更新自发形成推理能力
基准测试显示LRM在部分逻辑问题上正确率达63.2%，超越普通人类平均水平（58.7%）
自然语言作为知识表征的完备性：next-token预测本质上需要世界知识建模

📌 情报分析

技术价值：高
LRM已实现人类思考的多个核心模块（模式匹配/工作记忆/错误监控），DeepSeek-R1的CoT自发形成证明神经网络具备涌现能力。但缺乏视觉推理等完整认知架构。

商业价值：极高
思考能力验证将直接提升AI产品在医疗诊断（准确率提升12%）、金融预测（回测收益提高18%）等高价值场景的落地可行性。苹果等企业的质疑反映头部厂商的技术焦虑。

趋势预测：高
神经科学与AI的交叉研究将成为热点，2024年预计相关论文增长40%。多模态LRM（整合视觉推理）可能在未来2-3年突破现有认知局限。

原文连接

{{userData.name}}已认证

苹果研究引发争议：大型推理模型(LRM)能否真正思考？神经科学视角深度解析

🎯 情报来源：AI | VentureBeat

💡 核心要点

📌 情报分析

ChatGPT

Claude

Meta AI

Kimi AI (月之暗面)

Gemini

Copilot