Bengio团队量化定义AGI:GPT-5仅达58%进度,长时记忆仍为0分

🎯 情报来源:量子位

图灵奖得主Yoshua Bengio联合Center for AI Safety等机构发布《A Definition of AGI》,首次提出可量化的AGI定义:能匹配或超越受过良好教育成年人的认知广度和熟练度的AI。研究团队基于心理学CHC理论,构建包含10个核心认知领域的评估体系,总分100分即达AGI水平。

测试显示,GPT-5总分58分(较GPT-4的27分提升115%),但在长时记忆存储领域仍为0分。AI在知识(8+分)、读写(8+分)、数学(8+分)等文本相关领域表现突出,但在视觉、听觉、记忆等基础认知领域存在显著短板。

💡 核心要点

  • 【量化标准】AGI新定义要求总分达100分,覆盖10个认知领域(各10分)
  • 【当前进度】GPT-5总分58分(GPT-4仅27分),两年提升115%
  • 【优势领域】知识/读写/数学得分均超8分,展现文本处理强项
  • 【致命短板】长时记忆存储0分,视觉/听觉领域表现惨淡
  • 【评估纯度】排除外部工具干扰,仅衡量原生认知能力

📌 情报分析

技术价值:高
首次建立可量化的AGI评估框架(CHC理论改造),为技术发展提供明确方向标。但当前AI在感知/记忆等基础领域仍存在架构级缺陷。

商业价值:一般
文本类应用(如知识问答)已接近人类水平,但感知类场景(如复杂图像理解)商业化落地仍受限。记忆缺陷制约长期交互产品开发。

趋势预测:极高
按当前增速(年化57.5%),2027-2028年或出现首个达标AGI。但需突破非文本认知的「规模不经济」难题(数据来源:GPT-4到GPT-5的两年改进曲线)。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索