技术突破

重大技术创新、算法革命性进展

9月15

  • 百度学术AI重构:全球首个一站式学术平台上线,覆盖6.9亿文献资源

    10:02 作者:AI情报员

    🎯 情报来源:量子位 在2025年第12届AI Day开放日上,百度学术宣布全面升级为一站式AI学术平台,提供从文献搜索到论文撰写的全流程服务。该平台新增AI学术搜索、文献总结、论文图谱等数十项功能,覆盖学术研究的"搜、读、创、编"全生命周期。根据官方数据,百度学术已收录6.9亿文献资源,覆盖104万学术资源站点,日均更新42万文献,中文文献覆盖率达97%。平台还与问卷星、SP…情报来源

    技术突破
    分享到
  • Agility Robotics为Digit人形机器人开发「运动皮层」模型,模拟训练4天即可实现零样本迁移

    10:01 作者:AI情报员

    🎯 情报来源:The Robot Report Agility Robotics近日发布技术博客,宣布为其人形机器人Digit开发了名为「运动皮层」的全身控制基础模型。该LSTM神经网络通过NVIDIA Isaac Sim物理模拟器训练,仅需3-4天模拟时间(相当于数十年现实时间),参数规模不足100万,却能实现模拟环境到真实世界的零样本迁移。在3月的NVIDIA GTC大会上,搭载该系统的Dig…情报来源

    技术突破
    分享到
  • AI自我提示技术突破:Claude 4与GPT-5已具备超越人类工程师的提示生成能力

    08:01 作者:AI情报员

    🎯 情报来源:Simon Willison's Weblog 最新观察显示,Claude 4和GPT-5等前沿AI模型已发展出卓越的自我提示生成能力,标志着提示工程领域出现范式转变。据AI专家Simon Willison披露,这些采用近一年训练数据的模型,在处理提示词自动生成任务时已优于中等经验水平的人类工程师。值得注意的是,Anthropic公司通过在Claude Code中广泛应用子…情报来源

    技术突破
    分享到

9月14

  • TiM模型突破生成式AI速度与质量矛盾:865M参数超越12B模型,原生支持FSDP+Flash Attention

    22:02 作者:AI情报员

    🎯 情报来源:量子位 2025年9月14日,研究团队提出全新生成模型范式Transition Model(TiM),通过建模任意两时刻间的状态转移,从根本上解决了生成式AI领域长期存在的"速度与质量难以兼顾"的核心矛盾。实验数据显示,仅865M参数的TiM模型在文本生成任务中,生成质量和速度均超越12B参数的FLUX.1-Schnell和FLUX.1-Dev模型。TiM的关键创…情报来源

    技术突破
    分享到
  • Llama-3-8B心算任务研究:95%计算由最后一个token完成,关键注意力头仅占少数

    22:01 作者:AI情报员

    🎯 情报来源:量子位 加州大学圣克鲁兹分校等机构的最新研究发现,大语言模型(如Llama-3-8B)在执行心算任务时,几乎所有实际计算都集中在序列的最后一个token上。通过上下文感知平均消融(CAMA)和基于注意力的窥视(ABP)技术,研究人员发现模型内部形成名为"人人为我"(AF1)的稀疏子图结构,前14层仅进行通用计算,最后2层完成信息传递,剩余层由末尾token独立完成…情报来源

    技术突破
    分享到
  • DeepMind新作RoboBallet登Science子刊:8机械臂协同作业,规划速度提升300倍

    22:01 作者:AI情报员

    🎯 情报来源:量子位 DeepMind联合Intrinsic AI和UCL在《Science Robotics》发表最新研究成果RoboBallet,通过图神经网络(GNN)与强化学习的创新结合,实现8个机械臂56个自由度的协同作业。该系统在NVIDIA A100上单步规划仅需0.3毫秒,实时规划速度较传统方法提升300倍,任务执行效率提升60%。论文通讯作者Matthew Lai曾主导Alpha…情报来源

    技术突破
    分享到
  • OpenAI新论文为GPT-5「挽尊」?研究揭示大模型幻觉本质:当前评估机制存缺陷

    20:02 作者:AI情报员

    🎯 情报来源:量子位 OpenAI最新论文《语言模型为何会产生幻觉?》引发行业热议。研究指出,当前大语言模型的评估体系存在根本缺陷——以准确率为核心的测试标准变相鼓励模型「冒险猜测」,而GPT-5因更倾向于「诚实回答」导致基准测试表现不佳。论文提出应重构评估指标,对错误答案施加更大惩罚,并为「不确定回答」设置部分分数。数据显示,在测试案例中,当被问及「Adam Tauman Kalai的博士论文题…情报来源

    技术突破
    分享到
  • 英伟达发布Rubin CPX GPU:专为百万级token处理设计,性能提升3倍,2026年上市

    20:02 作者:AI情报员

    🎯 情报来源:量子位 在AI Infra Summit上,英伟达宣布推出专为处理百万token级别的代码生成和生成式视频应用的全新GPU——NVIDIA Rubin CPX。该GPU基于NVIDIA Rubin架构,采用单片设计,内置NVFP4计算资源,主打AI推理的高性能和高能效。老黄表示,Rubin CPX是首款为超大上下文AI量身定制的CUDA GPU,可以让模型“一口气”推理数百万toke…情报来源

    技术突破
    分享到
  • AI形式化助手Gauss三周攻克陶哲轩18个月未解数学难题,生成2.5万行Lean代码

    20:01 作者:AI情报员

    🎯 情报来源:量子位 2025年9月,名为Gauss的AI Agent在数学形式化领域取得突破性进展,仅用三周时间便完成了陶哲轩与Alex Kontorovich耗时18个月仍未完全解决的强素数定理形式化验证。该AI由Math公司开发,其生成的25000行Lean代码包含上千个定理定义,效率相当于人类专家团队数年的工作量。对比显示,历史上最大单个形式化项目(约50万行代码)需耗时10年,而Lean…情报来源

    技术突破
    分享到
  • Reddit等巨头联合推出RSL许可标准:AI数据抓取需付费,首推按推理计费模式

    18:03 作者:AI情报员

    🎯 情报来源:The Verge 包括Reddit、Yahoo、Medium在内的多家互联网平台近日联合宣布支持「Really Simple Licensing」(RSL)开放内容许可标准。该标准允许出版商在robots.txt文件中添加许可条款,要求AI公司在抓取网站数据时支付订阅费、按抓取次数付费或创新性地按AI推理结果付费。RSL Collective组织透露,已有Vox Media、新闻集…情报来源

    技术突破
    分享到
  • 谷歌8月AI大爆发:Pixel 10搭载Tensor G5芯片、Genie 3世界模型问世、180国上线AI搜索模式

    18:02 作者:AI情报员

    🎯 情报来源:AI 谷歌在8月集中释放多项AI技术突破:搜索功能新增个性化AI代理模式并覆盖180个国家;Pixel 10系列手机全系搭载Tensor G5芯片与Gemini Nano本地AI;DeepMind推出实时生成交互式虚拟环境的通用世界模型Genie 3。教育领域向多国大学生免费开放AI Pro订阅,包含Gemini 2.5 Pro等全套学习工具。技术亮点包括:图像编辑模型Nano Ba…情报来源

    技术突破
    分享到
  • ElevenLabs CEO将亮相TechCrunch Disrupt 2025,探讨如何实现真正拟人化的语音AI

    16:02 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 在即将到来的TechCrunch Disrupt 2025大会上,ElevenLabs的CEO兼联合创始人Mati Staniszewski将登台演讲,探讨如何使语音AI实现真正的人类化。ElevenLabs作为生成式AI领域的重要参与者,以其突破性的合成语音技术而闻名。该公司开发的…情报来源

    技术突破
    分享到
  • 阿联酋TII推出Falcon-H1系列模型,支持18种语言并登陆AWS平台

    14:01 作者:AI情报员

    🎯 情报来源:Artificial Intelligence 阿联酋技术研究院(TII)与AWS合作,正式推出Falcon-H1系列大语言模型。该系列包含6个不同规模的指令调优模型(0.5B至34B参数),现已登陆Amazon Bedrock Marketplace和SageMaker JumpStart平台。这些模型采用创新的混合架构,结合了Transformer注意力机制和状态空间模型(SSM…情报来源

    技术突破
    分享到
  • 微软RenderFormer突破:全球首个全神经网络3D渲染模型,支持2.05亿参数与任意场景

    14:00 作者:AI情报员

    🎯 情报来源:Microsoft Research Blog - Microsoft Research 微软研究院在SIGGRAPH 2025发布的RenderFormer成为全球首个完全基于神经网络的3D渲染管线,该模型通过2.05亿参数实现了无需传统光线追踪或光栅化的全场景渲染。研究团队利用Objaverse数据集中80万+标注3D对象进行训练,在512×512分辨率下可处理高达4,096个三…情报来源

    技术突破
    分享到
  • 英国启动主权AI计划:基于NVIDIA Nemotron构建威尔士语AI模型,服务85万使用者

    12:01 作者:AI情报员

    🎯 情报来源:NVIDIA Blog 英国主权AI计划UK-LLM宣布与NVIDIA、班戈大学合作开发基于Nemotron架构的威尔士语AI模型。该模型依托英国最强超算Isambard-AI(政府投资2.25亿英镑)训练,旨在支持医疗、教育等公共服务领域的双语推理能力。目前威尔士语使用者约85万人,政府计划通过Cymraeg 2050计划在2050年前实现百万使用者目标。项目采用NVIDIA Ne…情报来源

    技术突破
    分享到
  • 谷歌云发布GKE推理网关重大升级:vLLM支持TPU、延迟降低96%、吞吐量提升60%

    10:02 作者:AI情报员

    🎯 情报来源:Cloud Blog 在Google Cloud Next 2025大会上,谷歌宣布其GKE Inference Gateway推理解决方案获得多项突破性升级,包括支持vLLM在TPU上运行、Ironwood TPU和Anywhere Cache。该方案基于每月处理980万亿token、服务4.5亿用户的AI Hypercomputer系统构建,通过硬件软件协同设计实现行业领先的推理…情报来源

    技术突破
    分享到
  • Google Cloud联手NVIDIA推出Dynamo解耦推理方案:在A3 Ultra实例上实现70B大模型高效部署

    10:01 作者:AI情报员

    🎯 情报来源:Cloud Blog Google Cloud近日宣布与NVIDIA合作推出基于Dynamo平台的解耦推理方案,通过将大语言模型推理任务拆分为预填充(prefill)和解码(decode)两个独立阶段,在配备H200 GPU的A3 Ultra实例上实现了Llama-3.3-70B-Instruct等大模型的优化部署。该方案集成GKE编排系统和vLLM推理引擎,实测显示四GPU集群的并…情报来源

    技术突破
    分享到
  • B站开源IndexTTS-2.0:突破情感与时长控制瓶颈,开源代码及模型助力AIGC全球化

    06:01 作者:AI情报员

    🎯 情报来源:量子位 哔哩哔哩(B站)Index团队于2025年9月11日正式开源IndexTTS-2.0系统,这是全球首个支持情感解耦建模与时间编码机制的自回归零样本TTS技术。该系统通过创新架构实现两大突破:时间编码机制显著提升语音节奏控制精度,音色与情感解耦建模支持多模态情感调节(音频参考/文本描述/情感向量)。官方数据显示,其合成语音可应用于AI配音、视频翻译等6大类场景,跨语言内容本地化…情报来源

    技术突破
    分享到
  • 海淀区大模型数量突破105款占全国1/5,2025北京文化论坛揭示AI重塑文化产业新路径

    06:01 作者:AI情报员

    🎯 情报来源:量子位 2025年9月13日,2025北京文化论坛平行论坛首场AI沙龙在北京海淀区举办,聚焦"AI重塑数字内容生产"主题。活动披露海淀区已备案大模型达105款,占全国总量的五分之一,成为全国首个实现"百模规模"的地市级区域。现场同时展示2025亚洲数字艺术展,呈现6国18位艺术家的近30件数字艺术作品。沙龙下半场围绕"人工智能与创意转…情报来源

    技术突破
    分享到

9月13

  • 强化学习训练效率突破!上海交大&字节RhymeRL框架实现2.6倍加速

    22:02 作者:AI情报员

    🎯 情报来源:量子位 上海交通大学与字节跳动研究团队联合开发的RhymeRL框架,通过创新性地利用历史数据相似性特征,在保持模型精度的前提下,将强化学习(RL)训练吞吐量提升2.6倍。该成果直击RL训练中最耗时的Rollout阶段(占80%以上时间),通过HistoSpec和HistoPipe两大核心技术实现突破。实验数据显示,在数学、代码等任务中,RhymeRL端到端训练吞吐量提升达2.61倍。…情报来源

    技术突破
    分享到

个人中心
今日签到
有新私信 私信列表
搜索