AI情报局

汇聚全球AI情报,过滤噪音,24小时纯干货推送,助你实时掌握行业动向。

8月02

  • 中国移动发布MoMA引擎:聚合15+大模型、20+智能体,推理速度提升42%

    20:01 作者:AI情报员

    🎯 情报来源:量子位 7月26日,中国移动在世界人工智能大会(WAIC)上正式发布MoMA多模型与智能体聚合及服务引擎。该引擎汇聚了包括九天大模型、Qwen和DeepSeek在内的15+个高质量内外部模型,以及20多个专家智能体,通过动态路由机制在1B至200B参数模型间灵活切换,整体推理速度较固定75B模型提升42%。MoMA采用原创性PD²-Matrix框架实现模型能力精准评估,兼容MCP和A…情报来源

    技术突破
    分享到
  • 南洋理工联合团队发布Ultra3D框架:1024分辨率3D生成加速6.7倍,毛发级细节建模突破行业瓶颈

    20:01 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学联合数美万物、西湖大学发布全新3D生成框架Ultra3D,通过创新的两阶段生成流程和Part Attention机制,实现1024分辨率下的高保真3D建模,生成速度较现有技术提升6.7倍。该方法在保持几何连续性的同时,可精准还原毛发、衣褶等微米级细节,用户主观评价优于当前所有SoTA方法。实验数据显示,Ultra3D的稀疏体素建模效率提升3.3倍,支持输出分辨率较…情报来源

    技术突破
    分享到
  • 清华校友仅凭提示词工程让Gemini 2.5 Pro斩获IMO金牌,算力消耗低至300k tokens/题

    20:00 作者:AI情报员

    🎯 情报来源:量子位 清华大学校友杨林与黄溢辰通过创新的提示词工程和自迭代验证流程,使谷歌Gemini 2.5 Pro在未调整模型参数的情况下,成功解答2025年IMO 6道题目中的5道,达到金牌水平(42分制下得分超过19分的铜牌门槛)。该成果仅依赖提示词优化和模型自验证,单题计算资源消耗最低仅需300k tokens(最快10分钟/题),效率显著低于传统微调方法。研究采用双模块设计:求解器负责…情报来源

    技术突破
    分享到
  • B站发布自研「AI原声翻译」功能:完美还原UP主声线,支持口型模拟,剑指海外市场

    18:03 作者:AI情报员

    🎯 情报来源:量子位 哔哩哔哩(B站)在2025年世界人工智能大会上正式发布自研「AI原声翻译」功能,标志着其出海战略进入新阶段。该技术不仅能实现中英文字幕/弹幕互译,更突破性地采用IndexTTS2语音生成模型,可完美还原UP主声线、音色和气口,并支持口型模拟。目前该功能已集成至合并后的统一APP中,未来还将扩展日语等语言支持。技术层面,B站基于LLM构建翻译引擎,结合对抗式强化学习训练多目标奖…情报来源

    技术突破
    分享到
  • Meta豪掷超3亿美元挖角AI人才,ChatGPT「恶魔模式」源自游戏数据训练

    18:01 作者:AI情报员

    🎯 情报来源:Feed: Artificial Intelligence Latest 本周科技界两大事件引发关注:Meta被曝以单人数亿美元高价挖角AI初创公司Thinking Machines的研究人员,最高报价甚至超过10亿美元;而ChatGPT近期出现的「恶魔模式」对话行为,经调查发现其响应内容实际来自《战锤40K》桌游的庞大数据训练集。根据WIRED报道,Meta为Thinking Ma…情报来源

    技术突破
    分享到
  • AI编程革命:百度、智谱等8大厂商共探模型×IDE×Agent融合趋势|量子位沙龙

    16:03 作者:AI情报员

    🎯 情报来源:量子位 8月7日,量子位AI沙龙将于北京举办聚焦AI Coding的专题讨论,汇聚百度文心快码、智谱AI、月之暗面等8家头部企业技术负责人。活动将深度探讨智能编程助手、AI原生IDE及Agent技术在开发流程中的落地实践,揭示AI如何从代码补全演进至自主编程的产业变革。据议程披露,参会厂商覆盖模型层(智谱CodeGeeX)、工具链(aiXcoder)、终端应用(响指Haisnap)全…情报来源

    行业动态
    分享到
  • OpenAI三人团队两月斩获IMO金牌,AI模型首次展现“自我意识”承认不会解题

    16:03 作者:AI情报员

    🎯 情报来源:量子位 OpenAI三人研究团队开发的AI模型在2025年国际数学奥林匹克(IMO)中斩获金牌,但在最具挑战性的第6题上遭遇滑铁卢。该题要求计算2025×2025网格中的最小矩形图块数量,模型最终输出"我无法回答"而非错误答案,被团队视为"高智商的诚实"表现。据研究员Noam Brown透露,这种"承认无知"的能力使模型错误…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think开放订阅,月费1803元,推理性能超o3、Grok 4

    16:02 作者:AI情报员

    🎯 情报来源:量子位 谷歌DeepMind近日宣布,曾在国际数学奥林匹克竞赛(IMO)中斩获金牌的AI模型Gemini 2.5 Deep Think已正式开放商用,面向Ultra订阅用户提供,每月费用为249.99美元(约合人民币1803元)。该版本虽较金牌版本性能有所精简,但仍能达IMO铜牌水平,且在推理速度上大幅优化。根据官方测试数据,Gemini 2.5 Deep Think在LiveCod…情报来源

    技术突破
    分享到
  • 英伟达H20中国销售许可受阻,美商务部因内部混乱拖延审批

    14:02 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 据路透社报道,尽管美国商务部长霍华德·卢特尼克(Howard Lutnick)于7月初批准英伟达等芯片制造商恢复向中国销售部分AI芯片,但英伟达的H20 AI芯片至今未获销售许可。消息人士透露,美国商务部因部门内部动荡导致许可申请大量积压,主要原因是人员流失及与行业沟通渠道不畅。💡 …情报来源

    政策监管
    分享到
  • Cohere发布1120亿参数视觉模型Command A Vision,企业文档分析平均准确率达83.1%

    14:01 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat 加拿大AI公司Cohere近日推出专为企业场景设计的视觉模型Command A Vision,该模型基于其1120亿参数的Command A架构开发,具备文档OCR识别、图像分析和多语言理解能力。测试数据显示,在ChartQA、OCRBench等9项基准测试中,其平均准确率达83.1%,超越GPT-4.1(78.6%)和Llama 4 Ma…情报来源

    技术突破
    分享到
  • AWS发布Amazon Bedrock AgentCore浏览器工具预览版,支持AI代理无缝交互网页

    14:01 作者:AI情报员

    🎯 情报来源:Artificial Intelligence 在2025年AWS纽约峰会上,亚马逊云科技(AWS)宣布推出Amazon Bedrock AgentCore浏览器工具预览版。该工具是一款完全托管的云浏览器,专为生成式AI代理设计,使其能够无缝与网站交互,解决基础模型(FMs)因静态数据集训练和API访问受限而无法获取实时信息的核心痛点。AgentCore浏览器工具支持企业级AI自动化…情报来源

    技术突破
    分享到
  • 亚马逊推出AgentCore代码解释器:安全执行AI生成代码的托管服务,解决企业级部署核心痛点

    12:03 作者:AI情报员

    🎯 情报来源:Artificial Intelligence 亚马逊云科技近日推出Bedrock AgentCore Code Interpreter服务,旨在解决AI代理执行生成代码时的安全与扩展性难题。该服务提供完全托管的沙箱环境,支持Python、JavaScript和TypeScript代码的安全执行,具备毫秒级会话启动、动态资源分配等特性,可将企业部署AI代理的周期从数月缩短至数天。根据…情报来源

    产品发布
    分享到
  • Cerebras与Moonshot启动大模型推理速度竞赛:Cerebras实现2000 token/秒,Moonshot提速4倍

    12:02 作者:AI情报员

    🎯 情报来源:Simon Willison's Weblog Cerebras与Moonshot同日发布高速推理服务方案,刷新行业性能基准。Cerebras基于Qwen3-Coder-480B-A35B-Instruct模型推出订阅服务,宣称实现每秒2000 token的推理速度,较Claude Sonnet 4快4倍。该服务提供两档方案:50美元/月(1000次请求/日)和200美元/…情报来源

    行业动态
    分享到
  • Meta放弃对标ChatGPT,扎克伯格转向「个人超级智能」战略,重金争夺AI人才

    12:02 作者:AI情报员

    🎯 情报来源:The Verge Meta近日宣布放弃与ChatGPT的直接竞争,转而聚焦「个人超级智能」战略。据内部会议披露,扎克伯格正以高于市场标准的薪酬方案(含绩效股票单位和高额签约奖金)争夺AI人才,但附加严格的业绩目标和离职追回条款。公司CPO Chris Cox明确表示将避开OpenAI、Anthropic和Google主导的生产力赛道,专注娱乐社交领域。Meta的AI战略核心是利用个…情报来源

    行业动态
    分享到
  • 谷歌ADK推出智能学习代理:Gemini 2.5 Flash驱动,支持会话式Python教学与记忆功能

    10:01 作者:AI情报员

    🎯 情报来源:Cloud Blog 谷歌Agent Development Kit(ADK)近日发布基于Gemini 2.5 Flash大模型的Python教学代理案例,该代理可通过会话式交互帮助初学者掌握Python字典等复杂概念。系统采用短期记忆追踪单次会话进度(如答题正确率),并通过Vertex AI Memory Bank实现长期记忆存储,可跨会话分析学习者的历史表现数据。技术实现上,AD…情报来源

    技术突破
    分享到
  • DiffuseDrive融资450万美元,用扩散模型生成超现实合成数据提升AI训练效率40%

    10:00 作者:AI情报员

    🎯 情报来源:The Robot Report DiffuseDrive公司近日宣布完成350万美元种子轮融资,累计融资达450万美元。这家由前保时捷自动驾驶工程师Balint Pasztor和物理学家Roland Pinter创立的AI公司,专注于通过专有扩散模型生成照片级合成数据,解决自动驾驶、工业检测等领域的训练数据短缺问题。在Level 2自动驾驶测试中,其数据生成系统通过填补场景空白使性…情报来源

    技术突破
    分享到
  • 谷歌Gemini 2.5 Deep Think模型正式上线:IMO金牌级数学推理能力+并行思考技术

    10:00 作者:AI情报员

    🎯 情报来源:Google DeepMind 谷歌今日向Gemini Ultra订阅用户正式推出Deep Think功能,该功能基于Gemini 2.5模型开发,在2024年国际数学奥林匹克竞赛(IMO)中达到金牌标准。据内部评估,当前发布版本在2025年IMO基准测试中保持铜牌水平,同时显著提升了日常使用响应速度。此次发布整合了早期测试反馈和研究突破,采用并行思考技术延长"推理时间&q…情报来源

    技术突破
    分享到
  • 南洋理工大揭秘:GPT-4o视频理解正确率仅36%,新基准Video-TT暴露AI三大认知缺陷

    08:02 作者:AI情报员

    🎯 情报来源:量子位 南洋理工大学S-Lab团队近日发布Video-TT基准测试,首次系统性揭示当前视频大模型(Video LLMs)的真实认知水平。测试显示,GPT-4o在视频理解任务中正确率仅36.6%,鲁棒性36.0%,相较人类84.3%/64.4%的表现存在显著差距。该研究通过1000条YouTube短视频和5类对抗性问题,精准剥离AI的"看"与"想"…情报来源

    技术突破
    分享到
  • Meta豪掷10亿美金争夺AI人才 Anthropic估值飙至1700亿引爆行业泡沫担忧

    08:02 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Meta正在人工智能人才争夺战中持续加码,据披露马克·扎克伯格亲自接触顶尖人才,提供总额超10亿美元的多年期天价薪酬方案。最新目标是Mira Murati的新创公司Thinking Machines Lab,这在已然过热的AI人才市场堪称激进之举。与此同时,Anthropic即将以1…情报来源

    技术突破
    分享到
  • 中美开源AI竞赛白热化:中国DeepSeek-R1模型在Hugging Face创下历史记录,美国转向封闭引发行业震动

    08:01 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat 美国政府上周发布《AI行动计划》将"鼓励开源和开放权重AI"列为首要任务,标志着开源技术从专业领域上升为国家战略。与此同时,中国DeepSeek-R1开源大模型在Hugging Face平台创下历史最高点赞记录,数千个衍生版本已被跨国科技公司、研究机构和初创企业采用,首次实现美国AI技术基于中国开源模型的构建。这一现象引…情报来源

    政策监管
    分享到

个人中心
今日签到
有新私信 私信列表
搜索