🎯 情报来源:量子位
图灵奖得主Yoshua Bengio联合Center for AI Safety等机构发布《A Definition of AGI》,首次提出可量化的AGI定义:能匹配或超越受过良好教育成年人的认知广度和熟练度的AI。研究团队基于心理学CHC理论,构建包含10个核心认知领域的评估体系,总分100分即达AGI水平。
测试显示,GPT-5总分58分(较GPT-4的27分提升115%),但在长时记忆存储领域仍为0分。AI在知识(8+分)、读写(8+分)、数学(8+分)等文本相关领域表现突出,但在视觉、听觉、记忆等基础认知领域存在显著短板。
💡 核心要点
- 【量化标准】AGI新定义要求总分达100分,覆盖10个认知领域(各10分)
- 【当前进度】GPT-5总分58分(GPT-4仅27分),两年提升115%
- 【优势领域】知识/读写/数学得分均超8分,展现文本处理强项
- 【致命短板】长时记忆存储0分,视觉/听觉领域表现惨淡
- 【评估纯度】排除外部工具干扰,仅衡量原生认知能力
📌 情报分析
技术价值:高
首次建立可量化的AGI评估框架(CHC理论改造),为技术发展提供明确方向标。但当前AI在感知/记忆等基础领域仍存在架构级缺陷。
商业价值:一般
文本类应用(如知识问答)已接近人类水平,但感知类场景(如复杂图像理解)商业化落地仍受限。记忆缺陷制约长期交互产品开发。
趋势预测:极高
按当前增速(年化57.5%),2027-2028年或出现首个达标AGI。但需突破非文本认知的「规模不经济」难题(数据来源:GPT-4到GPT-5的两年改进曲线)。
