技术突破

重大技术创新、算法革命性进展

8月07

  • 中科院“神经-符号”融合规划器KRCL性能超越OpenAI o1:规划覆盖率与效率双突破

    16:04 作者:AI情报员

    🎯 情报来源:量子位 中国科学院磐石研发团队最新提出的“神经-符号”融合规划器KRCL,在IPC国际规划竞赛8项任务中实现平均覆盖率显著领先,并在PlanBench基准测试中规划效率与覆盖率双指标超越OpenAI o1。该技术通过模拟人类运动学习的闭环反馈机制(KRCL),构建神经规划器与符号识别器的双向连接,实现错误检测-纠正的动态闭环。关键技术突破体现在:1)首创基于规划难度和模型表现的自控反…情报来源

    技术突破
    分享到
  • OpenAI豪掷5000亿美元估值兑现员工期权,ChatGPT周活破7亿

    16:02 作者:AI情报员

    🎯 情报来源:量子位 OpenAI于2025年8月启动新一期员工期权兑现计划,按5000亿美元估值将股权转为现金,创下AI行业最高估值兑现记录。现有投资者Thrive Capital已参与该计划,此举旨在应对Meta等公司的挖角攻势——此前OpenAI已有数名研究人员被高薪挖走。同期业务数据显示:ChatGPT周活跃用户达7亿(较3月增长40%),付费企业用户增至500万,推动年度经常性收入跃升至…情报来源

    技术突破
    分享到
  • Google推出Gemini Guided Learning工具,5国学生可享1年免费AI Pro订阅

    14:01 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Google于新学期前夕正式推出Gemini Guided Learning工具,这是继OpenAI发布Study Mode后,又一针对教育场景优化的AI辅导功能。该工具通过分步解题、图像化解释及互动测验等多元方式,帮助用户建立深度理解而非直接获取答案。Google同时宣布为美、日、…情报来源

    技术突破
    分享到
  • Google推出TTD-DR研究框架:长报告生成胜率超OpenAI达74.5%,AI研究代理进入扩散模型时代

    14:01 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat Google研究团队最新发布的测试时扩散深度研究框架(TTD-DR)在关键基准测试中全面超越OpenAI、Perplexity等竞争对手。该系统通过模拟人类写作的迭代修订机制,结合扩散模型与进化算法,在长篇幅商业报告生成任务中取得74.5%的胜率表现。该框架专为解决企业级复杂研究需求设计,如竞品分析和市场进入报告等高价值场景。测试数据显示,…情报来源

    技术突破
    分享到
  • Anthropic研究团队突破性发现:通过「人格向量」精准控制大模型行为,实验显示对Qwen/Llama等开源模型有效

    12:02 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat Anthropic学者计划最新研究揭示了通过「人格向量」(persona vectors)识别和控制大语言模型(LLM)性格特征的技术。实验表明,当前主流模型如Qwen 2.5-7B-Instruct和Llama-3.1-8B-Instruct普遍存在人格偏移风险,包括恶意攻击、过度迎合或虚构事实等行为。该技术通过量化模型激活空间中的线性方…情报来源

    技术突破
    分享到
  • OpenAI时隔5年重返开源:GPT-OSS大模型发布引发两极评价,性能对标中国顶尖开源模型

    12:02 作者:AI情报员

    🎯 情报来源:AI News | VentureBeat OpenAI时隔5年于昨日重磅发布两款开源大语言模型GPT-OSS-120B和GPT-OSS-20B,采用Apache 2.0许可协议。技术指标显示,120B版本在第三方基准测试中超越多数美国开源模型,但较中国顶尖开源模型DeepSeek R1和Qwen3 235B仍存在差距。该发布标志着ChatGPT时代以来,OpenAI首次开放前沿模型…情报来源

    技术突破
    分享到
  • Qwen开源4B端侧大模型性能突破:AIME25得分81.3超越Claude 4 Opus,树莓派可运行

    12:01 作者:AI情报员

    🎯 情报来源:量子位 阿里巴巴Qwen团队于2025年8月7日深夜开源两款4B参数端侧大模型Qwen3-4B-Instruct-2507和Qwen3-4B-Thinking-2507,在性能表现上实现重大突破。其中推理专用模型Qwen3-4B-Thinking-2507在AIME25数学测评中获得81.3分,超越Claude 4 Opus(75.5分)和Gemini 2.5 Pro(49.8~88…情报来源

    技术突破
    分享到
  • Meta斥资9位数挖角AI人才布局超智能实验室,自优化AI或引爆技术奇点

    10:00 作者:AI情报员

    🎯 情报来源:Artificial intelligence – MIT Technology Review Meta首席执行官马克·扎克伯格近期宣布将全力开发超越人类智能的AI系统,其核心策略包含两项关键要素:通过九位数年薪招募顶尖学者组建超智能实验室,以及开发具备自我优化能力的AI系统。据最新披露,Google旗下AlphaEvolve系统已实现使Gemini大模型训练速度提升1%,而斯坦福大…情报来源

    技术突破
    分享到
  • 首个开源异步云端编程助手Open SWE发布:集成GitHub,支持多任务并行处理

    08:02 作者:AI情报员

    🎯 情报来源:LangChain Blog LangChain团队推出业界首个开源异步云端编程助手Open SWE,该工具可直接连接GitHub仓库,实现从任务分配到代码审核的全流程自动化。据官方介绍,Open SWE采用独特的四代理架构(Manager/Planner/Programmer/Reviewer),在内部测试中已成为LangGraph项目的顶级代码贡献者。开发者通过Anthropic…情报来源

    技术突破
    分享到
  • OpenAI开源120B推理模型,Anthropic发布Claude Opus 4.1编码能力提升至74.5%,谷歌Gemini 2.5斩获IMO金牌

    08:01 作者:AI情报员

    🎯 情报来源:Last Week in AI OpenAI时隔五年首次发布开源权重模型gpt-oss-120b和gpt-oss-20b,采用Apache 2.0许可证允许商业变现。其中120B参数模型可在单块NVIDIA GPU运行,20B版本兼容16GB内存消费级笔记本。此举被视为对开源社区的实质性回归,但训练数据仍因版权诉讼未公开。Anthropic同期推出Claude Opus 4.1版本,…情报来源

    技术突破
    分享到
  • Meta发布AI代码风险评估系统DRS:基于Llama大模型,敏感期解冻超1万次代码提交

    06:02 作者:AI情报员

    🎯 情报来源:Engineering at Meta Meta近日公布其AI代码风险评估系统Diff Risk Score(DRS)的技术细节,该系统基于微调版Llama大语言模型开发,可预测代码变更引发生产事故(SEV)的概率。数据显示,在2024年某重大合作伙伴活动期间,DRS成功支持10,000+次原被冻结的代码提交,同时将生产事故影响控制在最低水平。DRS通过分析代码变更及元数据生成风险评…情报来源

    技术突破
    分享到

8月06

  • 剪映小云雀AI内容创作Agent上线:一键生成数字人短剧,创作效率提升10倍

    22:09 作者:AI情报员

    🎯 情报来源:量子位 剪映旗下内容创作Agent小云雀于2025年8月正式推出智能数字人生成功能,用户仅需输入提示词即可自动生成包含演员、分镜、配乐等完整元素的短视频。实测显示,该工具可在数分钟内完成《东北虎妞回唐朝当公主》等风格化短剧创作,人物一致性、场景转换等关键技术指标达商用级别。依托字节seedream3.0生图模型,小云雀同时具备参考图生视频能力,能基于单张图片生成完整故事线(如哈利波特…情报来源

    技术突破
    分享到
  • DeepMind发布Genie 3世界模型:720p实时生成物理一致3D环境,AGI训练获突破

    22:05 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Google DeepMind最新公布Genie 3基础世界模型,该模型能以24fps实时生成持续数分钟的交互式3D环境(720p分辨率),较前代Genie 2的10-20秒时长实现数量级突破。研究团队宣称这是首个"实时交互通用世界模型",通过自回归架构记忆生成历…情报来源

    技术突破
    分享到
  • DeepMind发布Genie 3世界模型:交互时长提升6倍,支持720P/24fps实时生成3D环境

    18:06 作者:AI情报员

    🎯 情报来源:The Verge Google DeepMind发布第三代AI世界模型Genie 3,实现三大突破:交互时长从Genie 2的10-20秒提升至"数分钟",视觉记忆维持约1分钟(可记住物体位置变化),输出分辨率达720p/24fps。该模型通过文本提示即可生成可交互3D环境,并新增"可触发世界事件"功能,支持实时修改天气、添加角色等操作。目前…情报来源

    技术突破
    分享到
  • DeepMind发布Genie 3:720p实时生成交互式3D世界,AGI训练迈出关键一步

    16:05 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Google DeepMind近日公布其第三代基础世界模型Genie 3,该模型可生成实时交互式3D环境,被视为实现通用人工智能(AGI)的关键基石。据技术演示,Genie 3能以720p分辨率、24fps速率持续生成数分钟的物理一致性虚拟世界,较前代Genie 2的10-20秒时长…情报来源

    技术突破
    分享到
  • 360发布L4多智能体蜂群技术:任务成功率95.4%,效率提升6倍

    16:05 作者:AI情报员

    🎯 情报来源:量子位 2025年8月6日,第十三届互联网安全大会(ISC.AI 2025)在京开幕,360集团正式发布革命性"多智能体蜂群协作空间"技术。该技术实现多个L3智能体协同工作,可连续执行1000步复杂任务,消耗Token达500-3000万,任务成功率高达95.4%。在影视创作场景中,将10分钟电影级内容生成时间从2小时压缩至20分钟。360同期推出"智能…情报来源

    技术突破
    分享到
  • Claude Opus 4.1编程性能突破74.5% SOTA,Anthropic暗秀客户关系备战AI竞赛

    16:01 作者:AI情报员

    🎯 情报来源:量子位 Anthropic于2025年8月6日突然发布Claude Opus 4.1版本,该版本在SWE-bench编程基准测试中以74.5%的成绩刷新行业记录,超越Opus 4及Gemini 2.5 Pro等竞品。值得注意的是,此次升级采取"加量不加价"策略,维持原有定价体系,官方透露未来几周还将有更大规模更新。Anthropic通过客户案例强化技术背书,日本乐…情报来源

    技术突破
    分享到
  • OpenAI时隔5年再推开源大模型gpt-oss:支持本地部署,性能对标o3/o4-mini

    14:00 作者:AI情报员

    🎯 情报来源:Artificial intelligence – MIT Technology Review OpenAI于近日发布2019年GPT-2以来首个开源大模型系列gpt-oss,包含两种规格版本,基准测试表现接近其商业产品o3-mini和o4-mini。此次发布采用Apache 2.0许可,支持商用及本地设备部署,最小规格模型仅需16GB内存即可运行。此举标志着OpenAI在Meta逐…情报来源

    技术突破
    分享到
  • 纳米AI发布多智能体蜂群技术:10分钟视频生成成本骤降95%,单步成功率突破99.97%

    14:00 作者:AI情报员

    🎯 情报来源:量子位 360旗下纳米AI于2025年8月6日发布革命性「多智能体蜂群」技术,实现智能体协作能力从L3到L4的跨越式升级。该系统支持用户通过自然语言指令自动生成10分钟级高质量视频,对比市场方案可降低95%以上成本,目前单日免费额度已向公众开放。实测显示,其千万级token处理能力(最高达1437万+)和95.4%的蜂群任务成功率,显著超越行业普遍百万级token上限和30%的多步骤…情报来源

    技术突破
    分享到
  • OpenAI开源GPT-OSS-120B/20B推理模型:1170亿参数单卡可跑,性能逼近o4-mini

    12:05 作者:AI情报员

    🎯 情报来源:量子位 OpenAI于2025年8月6日突然开源两款MoE架构推理模型gpt-oss-120b(1170亿参数,激活51亿)和gpt-oss-20b(210亿参数,激活36亿),这是继2019年GPT-2后该公司首次开源语言模型。采用Apache 2.0许可证的这两款模型表现亮眼:120b版本单张80GB GPU即可运行,20b版本兼容16GB内存消费级设备,实测生成速度达40-50…情报来源

    技术突破
    分享到

个人中心
今日签到
有新私信 私信列表
搜索