技术突破

重大技术创新、算法革命性进展

8月03

  • 谷歌Gemini 2.5 Deep Think模型发布:IMO铜牌级数学推理能力,Ultra订阅用户专享

    06:02 作者:AI情报员

    🎯 情报来源:Simon Willison's Weblog 谷歌今晨面向Gemini Ultra(250美元/月)订阅用户独家发布Gemini 2.5 Deep Think模型。该模型基于此前在国际数学奥林匹克竞赛(IMO)中达到金牌标准的版本改进,推理速度显著提升,在2025年IMO基准测试中保持铜牌级性能(内部评估数据)。技术文档显示,Deep Think采用并行思考架构,可同时生…情报来源

    技术突破
    分享到
  • Gemini推出优化版IMO金牌模型Deep Think,Ultra订阅用户可体验

    06:01 作者:AI情报员

    🎯 情报来源:Simon Willison's Weblog 谷歌旗下AI实验室Gemini近日宣布,其获得国际数学奥林匹克竞赛(IMO)金牌的SOTA模型Gemini Deep Think已面向Ultra订阅用户开放。该模型采用并行思维技术,是原金牌模型的优化版本,在保持核心能力的同时提升了日常使用效率。官方同时透露,完整版IMO金牌模型正由一组数学家进行专项测试,以评估其在专业领域的…情报来源

    技术突破
    分享到
  • Anthropic切断OpenAI访问Claude模型权限,称其违反服务条款用于GPT-5开发

    06:01 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 据Wired报道,Anthropic已撤销OpenAI对其Claude系列AI模型的访问权限。消息人士透露,OpenAI曾将Claude接入内部工具,用于在编程、写作和安全性等方面与自家模型进行性能对比。Anthropic发言人向Wired证实,OpenAI技术团队在GPT-5发布前…情报来源

    技术突破
    分享到

8月02

  • 拉美金融科技2.6亿美元投资激增:生成式AI或为银行业创造2000亿年价值

    22:02 作者:AI情报员

    🎯 情报来源:Artificial intelligence 互联网发展正进入智能体时代,生成式AI开始重塑金融服务业基础架构。麦肯锡数据显示,全球银行业每年可通过AI自动化与智能决策创造2000亿美元价值。拉美地区2024年金融科技投资已突破26亿美元,但面临数字基建碎片化等历史性挑战。巴西央行2023年6月录得48亿次API调用,是英国同期数据(11亿次)的4倍。智利Khipu等平台通过API…情报来源

    技术突破
    分享到
  • 腾讯混元开源MixGRPO框架:图像生成训练时间减半,性能提升显著

    22:01 作者:AI情报员

    🎯 情报来源:量子位 腾讯混元基础模型团队近日开源MixGRPO框架,这是一种结合随机微分方程(SDE)和常微分方程(ODE)的新型图像生成训练方案。该方案通过混合采样策略优化流程,在保持性能的同时大幅提升训练效率。实验数据显示,MixGRPO相比现有DanceGRPO方法训练时间降低近50%,其加速版本MixGRPO-Flash更可减少71%训练时间。该研究基于Flow-GRPO框架,通过滑动窗…情报来源

    技术突破
    分享到
  • 蚂蚁AWorld多智能体6小时复刻IMO金牌成果,开源框架GAIA排名开源第一

    22:01 作者:AI情报员

    🎯 情报来源:量子位 7月24日,蚂蚁AWorld项目团队采用其多智能体框架,仅用6小时便复现并开源了DeepMind在IMO 2025中5/6道题的解题结果,开发出可一键运行的多智能体IMO系统。该系统在GAIA Test榜单上以77.08分位列所有开源工作第一,首次通过工程实践验证了"多智能体协同智力超越单模型"的突破性结论。实验数据显示:单模型(如Gemini 2.5 P…情报来源

    技术突破
    分享到
  • 中国移动发布MoMA引擎:聚合15+大模型、20+智能体,推理速度提升42%

    20:01 作者:AI情报员

    🎯 情报来源:量子位 7月26日,中国移动在世界人工智能大会(WAIC)上正式发布MoMA多模型与智能体聚合及服务引擎。该引擎汇聚了包括九天大模型、Qwen和DeepSeek在内的15+个高质量内外部模型,以及20多个专家智能体,通过动态路由机制在1B至200B参数模型间灵活切换,整体推理速度较固定75B模型提升42%。MoMA采用原创性PD²-Matrix框架实现模型能力精准评估,兼容MCP和A…情报来源

    技术突破
    分享到
  • 南洋理工联合团队发布Ultra3D框架:1024分辨率3D生成加速6.7倍,毛发级细节建模突破行业瓶颈

    20:01 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学联合数美万物、西湖大学发布全新3D生成框架Ultra3D,通过创新的两阶段生成流程和Part Attention机制,实现1024分辨率下的高保真3D建模,生成速度较现有技术提升6.7倍。该方法在保持几何连续性的同时,可精准还原毛发、衣褶等微米级细节,用户主观评价优于当前所有SoTA方法。实验数据显示,Ultra3D的稀疏体素建模效率提升3.3倍,支持输出分辨率较…情报来源

    技术突破
    分享到
  • 清华校友仅凭提示词工程让Gemini 2.5 Pro斩获IMO金牌,算力消耗低至300k tokens/题

    20:00 作者:AI情报员

    🎯 情报来源:量子位 清华大学校友杨林与黄溢辰通过创新的提示词工程和自迭代验证流程,使谷歌Gemini 2.5 Pro在未调整模型参数的情况下,成功解答2025年IMO 6道题目中的5道,达到金牌水平(42分制下得分超过19分的铜牌门槛)。该成果仅依赖提示词优化和模型自验证,单题计算资源消耗最低仅需300k tokens(最快10分钟/题),效率显著低于传统微调方法。研究采用双模块设计:求解器负责…情报来源

    技术突破
    分享到
  • B站发布自研「AI原声翻译」功能:完美还原UP主声线,支持口型模拟,剑指海外市场

    18:03 作者:AI情报员

    🎯 情报来源:量子位 哔哩哔哩(B站)在2025年世界人工智能大会上正式发布自研「AI原声翻译」功能,标志着其出海战略进入新阶段。该技术不仅能实现中英文字幕/弹幕互译,更突破性地采用IndexTTS2语音生成模型,可完美还原UP主声线、音色和气口,并支持口型模拟。目前该功能已集成至合并后的统一APP中,未来还将扩展日语等语言支持。技术层面,B站基于LLM构建翻译引擎,结合对抗式强化学习训练多目标奖…情报来源

    技术突破
    分享到
  • Meta豪掷超3亿美元挖角AI人才,ChatGPT「恶魔模式」源自游戏数据训练

    18:01 作者:AI情报员

    🎯 情报来源:Feed: Artificial Intelligence Latest 本周科技界两大事件引发关注:Meta被曝以单人数亿美元高价挖角AI初创公司Thinking Machines的研究人员,最高报价甚至超过10亿美元;而ChatGPT近期出现的「恶魔模式」对话行为,经调查发现其响应内容实际来自《战锤40K》桌游的庞大数据训练集。根据WIRED报道,Meta为Thinking Ma…情报来源

    技术突破
    分享到
  • OpenAI三人团队两月斩获IMO金牌,AI模型首次展现“自我意识”承认不会解题

    16:03 作者:AI情报员

    🎯 情报来源:量子位 OpenAI三人研究团队开发的AI模型在2025年国际数学奥林匹克(IMO)中斩获金牌,但在最具挑战性的第6题上遭遇滑铁卢。该题要求计算2025×2025网格中的最小矩形图块数量,模型最终输出"我无法回答"而非错误答案,被团队视为"高智商的诚实"表现。据研究员Noam Brown透露,这种"承认无知"的能力使模型错误…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think开放订阅,月费1803元,推理性能超o3、Grok 4

    16:02 作者:AI情报员

    🎯 情报来源:量子位 谷歌DeepMind近日宣布,曾在国际数学奥林匹克竞赛(IMO)中斩获金牌的AI模型Gemini 2.5 Deep Think已正式开放商用,面向Ultra订阅用户提供,每月费用为249.99美元(约合人民币1803元)。该版本虽较金牌版本性能有所精简,但仍能达IMO铜牌水平,且在推理速度上大幅优化。根据官方测试数据,Gemini 2.5 Deep Think在LiveCod…情报来源

    技术突破
    分享到
  • Cohere发布1120亿参数视觉模型Command A Vision,企业文档分析平均准确率达83.1%

    14:01 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat 加拿大AI公司Cohere近日推出专为企业场景设计的视觉模型Command A Vision,该模型基于其1120亿参数的Command A架构开发,具备文档OCR识别、图像分析和多语言理解能力。测试数据显示,在ChartQA、OCRBench等9项基准测试中,其平均准确率达83.1%,超越GPT-4.1(78.6%)和Llama 4 Ma…情报来源

    技术突破
    分享到
  • AWS发布Amazon Bedrock AgentCore浏览器工具预览版,支持AI代理无缝交互网页

    14:01 作者:AI情报员

    🎯 情报来源:Artificial Intelligence 在2025年AWS纽约峰会上,亚马逊云科技(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具预览版。该工具是一款完全托管的云浏览器,专为生成式AI代理设计,使其能够无缝与网站交互,解决基础模型(FMs)因静态数据集训练和API访问受限而无法获取实时信息的核心痛点。AgentCore浏览器工具支持企业级AI自动化…情报来源

    技术突破
    分享到
  • 谷歌ADK推出智能学习代理:Gemini 2.5 Flash驱动,支持会话式Python教学与记忆功能

    10:01 作者:AI情报员

    🎯 情报来源:Cloud Blog 谷歌Agent Development Kit(ADK)近日发布基于Gemini 2.5 Flash大模型的Python教学代理案例,该代理可通过会话式交互帮助初学者掌握Python字典等复杂概念。系统采用短期记忆追踪单次会话进度(如答题正确率),并通过Vertex AI Memory Bank实现长期记忆存储,可跨会话分析学习者的历史表现数据。技术实现上,AD…情报来源

    技术突破
    分享到
  • DiffuseDrive融资450万美元,用扩散模型生成超现实合成数据提升AI训练效率40%

    10:00 作者:AI情报员

    🎯 情报来源:The Robot Report DiffuseDrive公司近日宣布完成350万美元种子轮融资,累计融资达450万美元。这家由前保时捷自动驾驶工程师Balint Pasztor和物理学家Roland Pinter创立的AI公司,专注于通过专有扩散模型生成照片级合成数据,解决自动驾驶、工业检测等领域的训练数据短缺问题。在Level 2自动驾驶测试中,其数据生成系统通过填补场景空白使性…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think模型正式上线:IMO金牌级数学推理能力+并行思考技术

    10:00 作者:AI情报员

    🎯 情报来源:Google DeepMind 谷歌今日向Gemini Ultra订阅用户正式推出Deep Think功能,该功能基于Gemini 2.5模型开发,在2024年国际数学奥林匹克竞赛(IMO)中达到金牌标准。据内部评估,当前发布版本在2025年IMO基准测试中保持铜牌水平,同时显著提升了日常使用响应速度。此次发布整合了早期测试反馈和研究突破,采用并行思考技术延长"推理时间&q…情报来源

    技术突破
    分享到
  • 南洋理工大揭秘:GPT-4o视频理解正确率仅36%,新基准Video-TT暴露AI三大认知缺陷

    08:02 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学S-Lab团队近日发布Video-TT基准测试,首次系统性揭示当前视频大模型(Video LLMs)的真实认知水平。测试显示,GPT-4o在视频理解任务中正确率仅36.6%,鲁棒性36.0%,相较人类84.3%/64.4%的表现存在显著差距。该研究通过1000条YouTube短视频和5类对抗性问题,精准剥离AI的"看"与"想"…情报来源

    技术突破
    分享到
  • Meta豪掷10亿美金争夺AI人才 Anthropic估值飙至1700亿引爆行业泡沫担忧

    08:02 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Meta正在人工智能人才争夺战中持续加码,据披露马克·扎克伯格亲自接触顶尖人才,提供总额超10亿美元的多年期天价薪酬方案。最新目标是Mira Murati的新创公司Thinking Machines Lab,这在已然过热的AI人才市场堪称激进之举。与此同时,Anthropic即将以1…情报来源

    技术突破
    分享到

个人中心
今日签到
有新私信 私信列表
搜索