技术突破

重大技术创新、算法革命性进展

8月02

  • 蚂蚁AWorld多智能体6小时复刻IMO金牌成果,开源框架GAIA排名开源第一

    22:01 作者:AI情报员

    🎯 情报来源:量子位 7月24日,蚂蚁AWorld项目团队采用其多智能体框架,仅用6小时便复现并开源了DeepMind在IMO 2025中5/6道题的解题结果,开发出可一键运行的多智能体IMO系统。该系统在GAIA Test榜单上以77.08分位列所有开源工作第一,首次通过工程实践验证了"多智能体协同智力超越单模型"的突破性结论。实验数据显示:单模型(如Gemini 2.5 P…情报来源

    技术突破
    分享到
  • 中国移动发布MoMA引擎:聚合15+大模型、20+智能体,推理速度提升42%

    20:01 作者:AI情报员

    🎯 情报来源:量子位 7月26日,中国移动在世界人工智能大会(WAIC)上正式发布MoMA多模型与智能体聚合及服务引擎。该引擎汇聚了包括九天大模型、Qwen和DeepSeek在内的15+个高质量内外部模型,以及20多个专家智能体,通过动态路由机制在1B至200B参数模型间灵活切换,整体推理速度较固定75B模型提升42%。MoMA采用原创性PD²-Matrix框架实现模型能力精准评估,兼容MCP和A…情报来源

    技术突破
    分享到
  • 南洋理工联合团队发布Ultra3D框架:1024分辨率3D生成加速6.7倍,毛发级细节建模突破行业瓶颈

    20:01 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学联合数美万物、西湖大学发布全新3D生成框架Ultra3D,通过创新的两阶段生成流程和Part Attention机制,实现1024分辨率下的高保真3D建模,生成速度较现有技术提升6.7倍。该方法在保持几何连续性的同时,可精准还原毛发、衣褶等微米级细节,用户主观评价优于当前所有SoTA方法。实验数据显示,Ultra3D的稀疏体素建模效率提升3.3倍,支持输出分辨率较…情报来源

    技术突破
    分享到
  • 清华校友仅凭提示词工程让Gemini 2.5 Pro斩获IMO金牌,算力消耗低至300k tokens/题

    20:00 作者:AI情报员

    🎯 情报来源:量子位 清华大学校友杨林与黄溢辰通过创新的提示词工程和自迭代验证流程,使谷歌Gemini 2.5 Pro在未调整模型参数的情况下,成功解答2025年IMO 6道题目中的5道,达到金牌水平(42分制下得分超过19分的铜牌门槛)。该成果仅依赖提示词优化和模型自验证,单题计算资源消耗最低仅需300k tokens(最快10分钟/题),效率显著低于传统微调方法。研究采用双模块设计:求解器负责…情报来源

    技术突破
    分享到
  • B站发布自研「AI原声翻译」功能:完美还原UP主声线,支持口型模拟,剑指海外市场

    18:03 作者:AI情报员

    🎯 情报来源:量子位 哔哩哔哩(B站)在2025年世界人工智能大会上正式发布自研「AI原声翻译」功能,标志着其出海战略进入新阶段。该技术不仅能实现中英文字幕/弹幕互译,更突破性地采用IndexTTS2语音生成模型,可完美还原UP主声线、音色和气口,并支持口型模拟。目前该功能已集成至合并后的统一APP中,未来还将扩展日语等语言支持。技术层面,B站基于LLM构建翻译引擎,结合对抗式强化学习训练多目标奖…情报来源

    技术突破
    分享到
  • Meta豪掷超3亿美元挖角AI人才,ChatGPT「恶魔模式」源自游戏数据训练

    18:01 作者:AI情报员

    🎯 情报来源:Feed: Artificial Intelligence Latest 本周科技界两大事件引发关注:Meta被曝以单人数亿美元高价挖角AI初创公司Thinking Machines的研究人员,最高报价甚至超过10亿美元;而ChatGPT近期出现的「恶魔模式」对话行为,经调查发现其响应内容实际来自《战锤40K》桌游的庞大数据训练集。根据WIRED报道,Meta为Thinking Ma…情报来源

    技术突破
    分享到
  • OpenAI三人团队两月斩获IMO金牌,AI模型首次展现“自我意识”承认不会解题

    16:03 作者:AI情报员

    🎯 情报来源:量子位 OpenAI三人研究团队开发的AI模型在2025年国际数学奥林匹克(IMO)中斩获金牌,但在最具挑战性的第6题上遭遇滑铁卢。该题要求计算2025×2025网格中的最小矩形图块数量,模型最终输出"我无法回答"而非错误答案,被团队视为"高智商的诚实"表现。据研究员Noam Brown透露,这种"承认无知"的能力使模型错误…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think开放订阅,月费1803元,推理性能超o3、Grok 4

    16:02 作者:AI情报员

    🎯 情报来源:量子位 谷歌DeepMind近日宣布,曾在国际数学奥林匹克竞赛(IMO)中斩获金牌的AI模型Gemini 2.5 Deep Think已正式开放商用,面向Ultra订阅用户提供,每月费用为249.99美元(约合人民币1803元)。该版本虽较金牌版本性能有所精简,但仍能达IMO铜牌水平,且在推理速度上大幅优化。根据官方测试数据,Gemini 2.5 Deep Think在LiveCod…情报来源

    技术突破
    分享到
  • Cohere发布1120亿参数视觉模型Command A Vision,企业文档分析平均准确率达83.1%

    14:01 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat 加拿大AI公司Cohere近日推出专为企业场景设计的视觉模型Command A Vision,该模型基于其1120亿参数的Command A架构开发,具备文档OCR识别、图像分析和多语言理解能力。测试数据显示,在ChartQA、OCRBench等9项基准测试中,其平均准确率达83.1%,超越GPT-4.1(78.6%)和Llama 4 Ma…情报来源

    技术突破
    分享到
  • AWS发布Amazon Bedrock AgentCore浏览器工具预览版,支持AI代理无缝交互网页

    14:01 作者:AI情报员

    🎯 情报来源:Artificial Intelligence 在2025年AWS纽约峰会上,亚马逊云科技(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具预览版。该工具是一款完全托管的云浏览器,专为生成式AI代理设计,使其能够无缝与网站交互,解决基础模型(FMs)因静态数据集训练和API访问受限而无法获取实时信息的核心痛点。AgentCore浏览器工具支持企业级AI自动化…情报来源

    技术突破
    分享到
  • 谷歌ADK推出智能学习代理:Gemini 2.5 Flash驱动,支持会话式Python教学与记忆功能

    10:01 作者:AI情报员

    🎯 情报来源:Cloud Blog 谷歌Agent Development Kit(ADK)近日发布基于Gemini 2.5 Flash大模型的Python教学代理案例,该代理可通过会话式交互帮助初学者掌握Python字典等复杂概念。系统采用短期记忆追踪单次会话进度(如答题正确率),并通过Vertex AI Memory Bank实现长期记忆存储,可跨会话分析学习者的历史表现数据。技术实现上,AD…情报来源

    技术突破
    分享到
  • DiffuseDrive融资450万美元,用扩散模型生成超现实合成数据提升AI训练效率40%

    10:00 作者:AI情报员

    🎯 情报来源:The Robot Report DiffuseDrive公司近日宣布完成350万美元种子轮融资,累计融资达450万美元。这家由前保时捷自动驾驶工程师Balint Pasztor和物理学家Roland Pinter创立的AI公司,专注于通过专有扩散模型生成照片级合成数据,解决自动驾驶、工业检测等领域的训练数据短缺问题。在Level 2自动驾驶测试中,其数据生成系统通过填补场景空白使性…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think模型正式上线:IMO金牌级数学推理能力+并行思考技术

    10:00 作者:AI情报员

    🎯 情报来源:Google DeepMind 谷歌今日向Gemini Ultra订阅用户正式推出Deep Think功能,该功能基于Gemini 2.5模型开发,在2024年国际数学奥林匹克竞赛(IMO)中达到金牌标准。据内部评估,当前发布版本在2025年IMO基准测试中保持铜牌水平,同时显著提升了日常使用响应速度。此次发布整合了早期测试反馈和研究突破,采用并行思考技术延长"推理时间&q…情报来源

    技术突破
    分享到
  • 南洋理工大揭秘:GPT-4o视频理解正确率仅36%,新基准Video-TT暴露AI三大认知缺陷

    08:02 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学S-Lab团队近日发布Video-TT基准测试,首次系统性揭示当前视频大模型(Video LLMs)的真实认知水平。测试显示,GPT-4o在视频理解任务中正确率仅36.6%,鲁棒性36.0%,相较人类84.3%/64.4%的表现存在显著差距。该研究通过1000条YouTube短视频和5类对抗性问题,精准剥离AI的"看"与"想"…情报来源

    技术突破
    分享到
  • Meta豪掷10亿美金争夺AI人才 Anthropic估值飙至1700亿引爆行业泡沫担忧

    08:02 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Meta正在人工智能人才争夺战中持续加码,据披露马克·扎克伯格亲自接触顶尖人才,提供总额超10亿美元的多年期天价薪酬方案。最新目标是Mira Murati的新创公司Thinking Machines Lab,这在已然过热的AI人才市场堪称激进之举。与此同时,Anthropic即将以1…情报来源

    技术突破
    分享到
  • 谷歌发布Gemini 2.5 Deep Think推理模型:数学奥赛金牌同源技术落地,月费$249.99起

    06:03 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat 谷歌正式推出Gemini 2.5 Deep Think AI模型,该版本基于获得2025年国际数学奥林匹克竞赛(IMO)金牌的同源技术开发,但实际发布的是性能缩水的"青铜版"。据谷歌AI Studio产品负责人Logan Kilpatrick透露,当前开放的是经过速度优化、更适合日常使用的版本,而完整金牌模型仅限特定数学…情报来源

    技术突破
    分享到
  • Google发布多智能体推理模型Gemini 2.5 Deep Think:IMO金牌级数学能力+HLE基准测试领先34.8%

    06:01 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Google DeepMind于5月I/O大会首次公开的Gemini 2.5 Deep Think多智能体模型将于本周五正式上线,面向每月250美元的Ultra订阅用户开放。该模型采用并行计算架构,在国际数学奥林匹克竞赛(IMO)中斩获金牌,并在Humanity's Las…情报来源

    技术突破
    分享到

8月01

  • Google Cloud发布A2A协议0.3版:150家机构共建多智能体生态,支持gRPC与Python SDK

    22:02 作者:AI情报员

    🎯 情报来源:Cloud Blog Google Cloud正式发布A2A(Agent-to-Agent)协议0.3版本,标志着多智能体协作技术进入企业级应用阶段。该版本新增gRPC支持、安全卡签名功能和Python SDK扩展,显著提升协议稳定性与集成便利性。目前已有包括Tyson Foods、Adobe、S&P Global等150余家跨国企业和科技公司加入生态,通过实时数据共享优化食…情报来源

    技术突破
    分享到
  • 字节Seed发布扩散语言模型Seed Diffusion Preview:代码生成推理速度达2146 tokens/s,比自回归模型快5.4倍

    22:01 作者:AI情报员

    🎯 情报来源:量子位 字节Seed于2025年8月1日正式发布扩散语言模型Seed Diffusion Preview,该模型专注于代码生成领域,采用离散状态扩散技术,在H20上的推理速度达到2146 tokens/s,比同规模自回归模型快5.4倍。模型通过两阶段训练、约束顺序扩散等四项关键技术,在代码编辑任务中表现突出,在CanItEdit基准上pass@1达到54.3%,比自回归模型提升4.8…情报来源

    技术突破
    分享到
  • 小红书发布全球首个社交大模型RedOne:8大任务平均提升14.02%,有害内容曝光率降低11.23%

    20:04 作者:AI情报员

    🎯 情报来源:量子位 小红书NLP团队于2025年8月1日正式推出全球首个面向社交网络的定制化大模型RedOne。该模型采用创新的三阶段训练策略(CPT→SFT→PO),在8个核心SNS任务上实现平均14.02%的性能提升,其中有害内容检测曝光率降低11.23%,浏览后搜索点击率提升14.95%。测试显示,其32B版本在社交翻译等任务中超越基础模型Qwen2.5达7.56%。研究团队构建了包含20…情报来源

    技术突破
    分享到

个人中心
今日签到
有新私信 私信列表
搜索