技术突破

重大技术创新、算法革命性进展

7月11

  • FlashAttention作者新作QuACK:无需CUDA代码实现H100加速33%-50%,内存吞吐达3TB/s峰值90%

    20:01 作者:AI情报员

    🎯 情报来源:量子位 普林斯顿团队Tri Dao等人发布基于Python的SOL内存绑定内核库QuACK,通过CuTe-DSL技术彻底摆脱CUDA C++代码依赖,在H100 GPU上实现内存密集型算子性能突破。测试显示,其softmax内核在归约维度262k时达到3.01TB/s内存吞吐量(峰值带宽的89.7%),较PyTorch的torch.compile提速50%,突破传统优化库性能天花板。…情报来源

    技术突破
    分享到
  • 银行业加速部署Agentic AI:摩根大通等银行试点AI员工,40%项目或于2027年前搁浅

    18:01 作者:AI情报员

    🎯 情报来源:Artificial intelligence 以摩根大通、第一资本和纽约梅隆银行为代表的金融机构正加速布局Agentic AI(自主代理AI),通过ChatGPT等大语言模型实现24/7自动化作业。据行业专家透露,单个AI代理可日审数千条交易记录,显著提升合规审查效率,但目前所有应用均处于人类严格监管下的「框定运行」状态。Gartner最新预测显示,由于成本激增和风险管控不足,到2…情报来源

    技术突破
    分享到
  • xAI发布Grok 4引发争议:AI模型「高度倾向马斯克观点」遭实测验证

    18:01 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 在7月4日通过X平台直播发布的Grok 4模型中,Elon Musk宣称其目标是打造「极致求真的AI」。然而TechCrunch实测发现,该模型在回答移民政策、巴以冲突等争议话题时,系统性地检索并参考马斯克本人推文及媒体报道观点。这种现象在「思维链」推理过程中被明确记录,当询问美国移…情报来源

    技术突破
    分享到
  • 印尼联合NVIDIA、思科成立AI卓越中心:28家初创企业已接入Blackwell GPU算力基建

    16:02 作者:AI情报员

    🎯 情报来源:NVIDIA Blog 印尼政府联合电信巨头Indosat Ooredoo Hutchison(IOH)、思科和NVIDIA正式启动AI卓越中心计划,作为该国"黄金2045愿景"数字战略的核心载体。该中心将部署包含NVIDIA Blackwell GPU的全栈AI基础设施,目前已有28家本土软件开发商和初创企业接入其算力网络,开发覆盖医疗、智慧城市等领域的应用。根…情报来源

    技术突破
    分享到
  • 上海AI Lab突破强化学习瓶颈:POLAR奖励模型参数扩展至7B,后训练性能提升9%

    16:01 作者:AI情报员

    🎯 情报来源:量子位 上海人工智能实验室提出新型奖励建模范式POLAR(Policy Discriminative Learning),通过策略判别学习突破强化学习扩展瓶颈。实验显示,7B参数规模的POLAR在Llama-3.1-8B强化微调中实现9%性能提升,1.8B版本即达到72B参数基线模型效果,验证了其显著的可扩展性。该技术采用两阶段训练:先通过3.6T token预训练数据构建策略距离度…情报来源

    技术突破
    分享到
  • 埃森哲与微软联合投资生成式AI网络安全工具,助力Nationwide完成数百TB数据迁移

    14:00 作者:AI情报员

    🎯 情报来源:Latest Finextra Research Artificial intelligence Headlines 埃森哲(Accenture)与微软(Microsoft)宣布联合投资开发生成式AI驱动的网络安全工具,旨在帮助组织应对威胁、整合技术并优化运营成本。双方已与英国全国建房互助会(Nationwide)合作,成功协助其完成向Microsoft Sentinel的大规模安全…情报来源

    技术突破
    分享到
  • Meta豪掷2亿美元挖角苹果AI核心人物庞若鸣,硅谷人才争夺战再升级

    12:01 作者:AI情报员

    🎯 情报来源:量子位 Meta以总价2亿美元(约14亿人民币)的薪酬包成功挖角苹果基础模型团队负责人庞若鸣。该薪酬包包含薪资、签约奖金及分期解锁的股票期权,规模在苹果内部仅次于CEO库克,远超硅谷常规薪资水平。庞若鸣此前领导苹果百人AI团队,主导开发支撑Apple Intelligence的核心基础模型。Meta近期组建的"超级智能实验室"以天价薪酬策略闻名,此前曾以4年3亿美…情报来源

    技术突破
    分享到
  • 亚马逊SageMaker全面托管MLflow 3.0上线:生成式AI全生命周期跟踪提速250%

    08:02 作者:AI情报员

    🎯 情报来源:Artificial Intelligence AWS宣布Amazon SageMaker AI平台现已全面支持MLflow 3.0托管服务,该服务将生成式AI开发从实验到生产的全流程时间缩短25%。新版本通过端到端可观测性功能,使开发者能记录生成式AI应用每个步骤的输入、输出和元数据,实现问题溯源效率提升300%。据技术文档显示,该服务与Amazon SageMaker Hyper…情报来源

    技术突破
    分享到
  • AI时代SQL面临淘汰?Zilliz工程副总裁揭示向量数据库如何颠覆传统数据查询

    08:01 作者:AI情报员

    🎯 情报来源:Turing Post 在AI技术快速发展的当下,传统SQL查询语言正面临重大挑战。Zilliz工程副总裁James Luan指出,随着非结构化数据占比激增和自然语言交互成为主流,SQL在AI应用场景中的局限性日益凸显。根据Gartner预测,到2026年大多数企业将优先采用自然语言作为主要查询界面,SQL技能将从"必备"降级为"可选"。性能基…情报来源

    技术突破
    分享到
  • QuantSpec突破长上下文推理瓶颈:4位量化KV缓存实现2.5倍加速,内存需求降低30%

    06:02 作者:AI情报员

    🎯 情报来源:Apple Machine Learning Research 研究人员最新提出的QuantSpec自推测解码框架,通过采用4位分层量化KV缓存和4位量化权重,在长上下文大语言模型(LLM)推理场景中实现突破性进展。该系统在保持90%以上高接受率的同时,可提供最高约2.5倍的端到端加速,并较现有稀疏KV缓存方案减少约1.3倍内存占用。实验数据显示,QuantSpec有效解决了当前边缘…情报来源

    技术突破
    分享到
  • 突破3D场景理解:Sonata Point Transformer V3编码器融合点云特征,性能显著提升

    06:01 作者:AI情报员

    🎯 情报来源:Apple Machine Learning Research 针对多模态大语言模型(MLLMs)的3D场景表征难题,最新研究通过系统性对比视频与点云两种3D标记结构,提出融合Sonata预训练Point Transformer V3编码器的点云特征增强方案。实验证明,显式3D特征的引入使模型在多项3D理解基准测试中达到SOTA水平,其中经过智能采样排序的点云表征性能甚至可匹敌视频表…情报来源

    技术突破
    分享到

7月10

  • Inception Labs发布扩散模型Mercury:代码生成速度提升10倍,H100 GPU吞吐量达1109 tokens/秒

    22:01 作者:AI情报员

    🎯 情报来源:量子位 Inception Labs推出基于扩散技术的商业级大语言模型Mercury,该模型突破了传统自回归模型逐词生成的限制,采用“从噪声到结构化输出”的方式,能一次性预测所有方向的token,大幅提高了生成速度。在H100 GPU上,Mercury Coder Mini和Mercury Coder Small分别实现了1109 tokens/秒和737 tokens/秒的吞吐量,…情报来源

    技术突破
    分享到
  • Meta发布40页具身智能报告:心智世界模型首度提出,人机交互有望实现「共情」

    22:01 作者:AI情报员

    🎯 情报来源:量子位 Meta AI于7月10日发布40页具身智能研究报告,首次提出将「心智世界模型」与物理世界模型并列为核心框架。该模型突破性地将人类心理规律(意图、情感、社会关系)纳入AI建模范畴,在传统物理规律认知基础上实现「双轨建模」。报告披露,当前视觉-语言模型在多模态目标推理基准测试中成功率仅55%,显示技术仍处早期阶段。💡 核心要点双轨建模架构:首次并列提出物理世界模型(物体运动/机…情报来源

    技术突破
    分享到
  • Perplexity推出AI浏览器Comet,月搜索量7.8亿次挑战谷歌霸主地位,OpenAI即将参战

    20:02 作者:AI情报员

    🎯 情报来源:量子位 AI浏览器领域迎来重量级玩家——Perplexity正式推出AI原生浏览器Comet,其CEO透露公司5月搜索查询量已达7.8亿次,月环比增长率超20%。这款面向高级订阅用户的产品可直接接管浏览器任务,通过侧边栏实现上下文感知的智能辅助。与此同时,OpenAI被曝将在数周内发布竞品,谷歌Chrome则仍占据2/3市场份额。TechGrunch实测显示,Comet在执行简单任务…情报来源

    技术突破
    分享到
  • MCP协议曝重大漏洞:攻击者可利用LLM指令混淆窃取全库数据

    20:02 作者:AI情报员

    🎯 情报来源:量子位 2025年7月披露的安全研究表明,智能体领域标准协议MCP存在高危漏洞。攻击者通过将恶意指令伪装成用户数据,可诱使LLM执行未授权操作,导致使用Supabase等服务的多租户SaaS系统数据库全量泄露。演示案例中,攻击者仅需提交含隐藏指令的技术支持请求,即可绕过行级安全机制(RLS),通过service_role权限获取integration_tokens等敏感数据。漏洞核心…情报来源

    技术突破
    分享到
  • 马斯克Grok-4突破AI性能极限:HLE基准首破50%,AIME25数学竞赛满分

    20:00 作者:AI情报员

    🎯 情报来源:量子位 北京时间2025年7月10日,马斯克旗下xAI发布Grok-4大模型,在被称为"人类最后考试"的HLE基准测试中创下50.7%准确率,成为首个突破50%门槛的AI模型。该成绩较谷歌Gemini-2.5-Pro提升18个百分点,马斯克宣称其"比所有领域博士生都聪明"。模型在多项专业测试中展现统治级表现:美国数学邀请赛(AIME25)获10…情报来源

    技术突破
    分享到
  • 2025上半年AI模型前沿盘点:NVIDIA Cosmos平台领衔5大技术突破

    18:01 作者:AI情报员

    🎯 情报来源:Turing Post 2025年上半年,AI领域涌现出多项重大技术进展,其中NVIDIA推出的Cosmos世界基础模型(WFM)平台尤为突出。该平台提供完整的物理AI开发生态,包含模型创建、训练和部署工具,标志着AI从数字世界向物理世界延伸的关键突破。同期,Google DeepMind的DreamerV3/Genie 2、Meta的导航世界模型(NWM)共同推动世界模型技术发展;…情报来源

    技术突破
    分享到
  • 马斯克xAI发布Grok 4模型:号称全球最强AI助手,实测学术测试达标率25%

    18:01 作者:AI情报员

    🎯 情报来源:The Verge 埃隆·马斯克旗下xAI公司于PT时间11月1日晚间(实际延迟超1小时)直播发布了Grok 4大模型,峰值观看量突破150万。该模型宣称是"全球最强大AI助手",在包含2500+多学科问题的"Humanity's Last Exam"学术测试中,其纯文本问题解决率达25%,接近OpenAI二月公布的Deep Rese…情报来源

    技术突破
    分享到
  • xAI发布Grok 4大模型:学术能力超博士水平,300美元/月订阅计划创行业新高

    16:01 作者:AI情报员

    🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Elon Musk旗下AI公司xAI于周三深夜发布旗舰模型Grok 4及定价300美元/月的高端订阅服务SuperGrok Heavy。该模型在Humanity’s Last Exam基准测试中以25.4%得分超越Gemini 2.5 Pro(21.6%)和OpenAI o3(21%…情报来源

    技术突破
    分享到
  • AWS发布P6e-GB200 UltraServers:搭载72颗NVIDIA Blackwell GPU,算力达360 petaflops

    16:01 作者:AI情报员

    🎯 情报来源:Artificial Intelligence AWS宣布全面推出搭载NVIDIA Grace Blackwell超级芯片的P6e-GB200 UltraServers,这是迄今为止AWS最强大的GPU产品。该系统包含72个NVIDIA Blackwell GPU,通过第五代NVLink互连,形成一个单一计算单元,提供360 petaflops的密集FP8计算能力和13.4 TB的高…情报来源

    技术突破
    分享到

个人中心
今日签到
有新私信 私信列表
搜索