技术突破
重大技术创新、算法革命性进展
10月01
-
全球首创!EgoTwin攻克第一视角视频与人体动作同步生成,误差降低50%+
16:01 作者:AI情报员🎯 情报来源:量子位 新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTwin框架,首次实现第一视角视频与人体动作的联合生成。该技术攻克视角-动作对齐与因果耦合两大技术瓶颈,通过3D高斯点渲染可将生成内容提升至三维场景,为可穿戴计算、AR及具身智能提供新解决方案。实验数据显示,EgoTwin使镜头与头部位置误差显著降低,手部动作匹配度提升50%以上。其创新的三模态联合生…情报来源
-
OpenAI发布Sora 2:音视频同步生成模型+AI版抖音平台,物理表现与可控性大幅提升
16:01 作者:AI情报员🎯 情报来源:量子位 OpenAI于2025年10月1日突然发布Sora 2模型及同名iOS社交应用,标志着AI视频生成技术进入新阶段。Sora 2不仅实现音视频同步生成,其物理表现(如人物动作连贯性、物体运动轨迹)和可控性(多镜头复杂指令执行)较前代显著提升,被官方称为"直接跨越到GPT-3.5时刻"的技术突破。同步推出的"AI版抖音"平台支持用户创作AI…情报来源
-
Character.AI CEO将于TechCrunch Disrupt 2025分享AI伴侣技术突破与2000万月活商业化挑战
14:02 作者:AI情报员🎯 情报来源:AI News & Artificial Intelligence | TechCrunch Character.AI CEO Karandeep Anand将于2025年10月在TechCrunch Disrupt大会AI主题舞台,就类人AI伴侣的爆发式增长进行深度对话。该平台目前全球月活跃用户已达2000万,正拓展视频生成等新模态和商业化项目。Anand曾任Meta副总裁…情报来源
-
新型图自监督学习架构突破:融合对比与生成范式,性能提升最高达2.01%
14:01 作者:AI情报员🎯 情报来源:Apple Machine Learning Research 研究人员提出了一种创新的图自监督学习(SSL)架构,通过整合对比学习和生成范式的优势,在节点分类、聚类和链接预测等任务中实现性能突破。该模型在开放基准数据集上的测试表明,相比现有最优方法,其性能提升幅度达到0.23%-2.01%,具体数值取决于任务类型和数据集。该框架的核心创新在于:1)引入社区感知的节点级对比学习,优化…情报来源
-
AI编程代理革命:Claude Code与Codex CLI如何通过「代理循环」重塑开发流程
12:02 作者:AI情报员🎯 情报来源:Simon Willison's Weblog Anthropic的Claude Code和OpenAI的Codex CLI标志着LLM在代码生成领域实现质的飞跃。这些AI代理能直接执行编写中的代码、纠错、分析现有实现细节,甚至通过实验寻找最优解决方案。据开发者实测,在Fly.io的容器优化案例中,配置5美元预算的沙箱环境即可让Claude Code自主完成Dockerfi…情报来源
-
GraphStorm v0.5实现毫秒级实时反欺诈:基于IEEE-CIS数据集验证,欺诈检测准确率提升显著
10:02 作者:AI情报员🎯 情报来源:Artificial Intelligence 根据美国联邦贸易委员会数据,2024年全美消费者因欺诈造成的损失达125亿美元,同比激增25%。传统机器学习方法因孤立分析交易数据已无法应对日益复杂的协同欺诈网络。AWS最新发布的GraphStorm v0.5通过图神经网络(GNN)技术实现了突破性进展,在IEEE-CIS欺诈检测数据集(含50万笔交易,欺诈率3.5%)验证中,可将端到…情报来源
-
腾讯开源80B参数混元生图3.0:首个工业级原生多模态生图模型,效果对标闭源头部
08:02 作者:AI情报员🎯 情报来源:量子位 腾讯混元于2025年9月30日正式发布并开源混元图像3.0(HunyuanImage 3.0),参数规模高达80B,是目前参数量最大的开源生图模型。该模型采用原生多模态架构,将文本理解、视觉理解与高保真图像生成深度融合,支持多分辨率图像生成,具备指令遵从、世界知识推理和文字渲染能力,效果对标业界头部闭源模型。在技术方案上,HunyuanImage 3.0基于Hunyuan-A…情报来源
-
Periodic Labs携3亿美元种子轮融资亮相,打造AI科学家与自动化实验室
08:01 作者:AI情报员🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 前谷歌大脑与DeepMind材料团队负责人Ekin Dogus Cubuk与前OpenAI研究副总裁Liam Fedus联合创立的Periodic Labs,于本周二正式公开运营,并宣布获得3亿美元种子轮融资。投资方包括a16z、DST、英伟达、Accel等顶级风投,以及Jeff D…情报来源
-
OpenAI Sora 2推出角色植入功能,瞄准个性化视频生成市场
06:02 作者:AI情报员🎯 情报来源:Simon Willison's Weblog OpenAI今日发布Sora 2视频生成模型,最引人注目的新功能是"角色植入"(cameos)技术。该功能允许用户轻松创建自己或朋友的视频版本,并将其作为角色植入生成的视频中。这标志着AI视频生成从通用场景向个性化内容的重要转变。据推测,该功能的开发灵感来自ChatGPT图像生成功能的惊人成功——该产品在2…情报来源
-
OpenAI发布Sora 2视频生成模型及社交应用,开启AI视频’ChatGPT时刻’
06:01 作者:AI情报员🎯 情报来源:The Verge OpenAI于今日正式推出升级版Sora 2视频生成AI模型,同步发布同名iPhone社交应用。这款目前仅限邀请使用的应用采用类似TikTok的短视频信息流形式,但核心功能允许用户授权他人基于自身形象生成10秒AI深度伪造视频("Cameos"功能)。据周一记者会披露,该应用初期仅面向美加用户,每位获邀用户可额外邀请4位好友。技术文档显示,So…情报来源
-
OpenAI ChatGPT用户突破3亿/周,2025年营收预计达127亿美元,GPT-5与Sora引领AI新浪潮
06:00 作者:AI情报员🎯 情报来源:AI News & Artificial Intelligence | TechCrunch OpenAI旗下ChatGPT自2022年11月发布以来持续改写AI行业格局,最新数据显示其周活跃用户已达3亿。2024年成为关键转折点:与苹果达成生成式AI合作推出Apple Intelligence,发布具备语音能力的GPT-4o,以及备受期待的文本生成视频模型Sora。据彭博社…情报来源
9月30
-
Opera推出AI浏览器Neon:月费19.99美元,支持AI指令创建应用和重复任务
22:02 作者:AI情报员🎯 情报来源:AI News & Artificial Intelligence | TechCrunch 浏览器厂商Opera于周二发布了以AI为核心的浏览器Neon,该浏览器具备通过AI提示创建应用的功能,并能通过其称为“卡片”的特性创建可重复使用的提示。Opera由此加入了Perplexity和The Browser Company等公司的行列,试图推动“代理式浏览”成为现实。Ope…情报来源
-
九章云极Alaya NeW智算云平台率先适配DeepSeek-V3.2-Exp,实现50%成本优化的一键私有化部署
22:01 作者:AI情报员🎯 情报来源:量子位 九章云极宣布其Alaya NeW智算云平台已完成对DeepSeek最新发布的V3.2-Exp大语言模型的深度适配,提供一键私有化部署解决方案。该模型采用创新的稀疏注意力架构(DSA),将API成本降低50%以上,同时通过物理隔离保障企业数据安全。Alaya NeW平台集成顶尖GPU资源,支持从0卡到1000卡的秒级弹性扩缩,预置完整镜像环境实现容器实例秒级启动。平台提供云容器…情报来源
-
Anthropic调整隐私政策:10月8日起默认将用户聊天数据用于Claude模型训练,保留期延长至5年
22:00 作者:AI情报员🎯 情报来源:Feed: Artificial Intelligence Latest Anthropic宣布自10月8日起更新隐私政策,默认将用户与Claude聊天机器人的对话内容及编程任务作为大语言模型训练数据,除非用户主动选择退出。此次政策调整原定9月28日实施,后推迟以留出用户决策时间。数据保留期限从原先的30天大幅延长至5年,无论用户是否同意数据训练。根据官方说明,该政策适用于免费和付费…情报来源
-
智谱发布GLM-4.6:代码能力国内最强,token消耗降低30%,适配国产芯片
20:00 作者:AI情报员🎯 情报来源:量子位 智谱AI在国庆前夕正式推出GLM-4.6大模型,其代码能力在国内模型中表现最为突出。根据智谱的测试,GLM-4.6在Claude Code环境下的74个真实场景编程任务中超越了Claude Sonnet 4,并在八大通用能力评测榜单中大部分对齐Claude Sonnet 4,成为国内第一。此外,GLM-4.6的平均token消耗比上一代GLM-4.5降低了30%以上,为同类模…情报来源
-
Anthropic发布Claude Sonnet 4.5:全球最强编码模型实测表现惊艳
18:02 作者:AI情报员🎯 情报来源:Simon Willison's Weblog Anthropic今日正式发布Claude Sonnet 4.5模型,宣称其成为当前全球最佳编码模型。实测显示该模型在复杂代理构建、计算机操作及数学推理方面实现显著突破,成功完成包含466项测试的代码库改造任务,并输出22项完整技术文档。定价维持上代水平:输入token 3美元/百万,输出token 15美元/百万,较Clau…情报来源
-
Anthropic发布Claude Sonnet 4.5:30小时自主编程11,000行代码,AI代理能力跃升3倍
18:01 作者:AI情报员🎯 情报来源:The Verge Anthropic最新发布的Claude Sonnet 4.5模型实现重大技术突破,该AI在无人干预情况下连续运行30小时,自主完成类似Slack或Teams的聊天应用开发,生成约11,000行代码。这一时长较其前代Opus 4模型(5月创下7小时记录)提升328%,标志着AI自主代理能力的跨越式发展。据官方披露,该模型在网络安全、金融服务和研究领域表现突出。早期…情报来源
-
OpenAI推出ChatGPT购物功能:接入Etsy/Shopify,8亿用户直击亚马逊命门
16:01 作者:AI情报员🎯 情报来源:量子位 OpenAI于2025年9月30日正式推出ChatGPT内置购物功能,用户可通过对话直接完成Etsy和Shopify平台商品交易。该功能目前仅限美国ChatGPT Pro/Plus/Free登录用户使用,采用全新开发的Agentic Commerce Protocol(ACP)支付协议,Stripe提供技术支持,交易成功后OpenAI收取少量佣金。数据显示,ChatGPT周活…情报来源
-
DeepSeek发布V3.2-exp实验模型:稀疏注意力技术降低50%长文本推理成本
14:02 作者:AI情报员🎯 情报来源:AI News & Artificial Intelligence | TechCrunch DeepSeek研究团队本周一发布实验性模型V3.2-exp,其创新的稀疏注意力技术可在长文本处理场景中显著降低推理成本。该模型通过Hugging Face平台开源发布,配套技术论文同步发布于GitHub。核心突破在于DeepSeek稀疏注意力系统:通过"闪电索引器&quo…情报来源
-
DeepSeek v3.2秘密武器TileLang曝光:国产GPU语言实现算子代码量锐减84%,性能反超30%
12:01 作者:AI情报员🎯 情报来源:量子位 2025年9月30日,DeepSeek在其v3.2版本中低调引入TileLang语言支持,这一未在技术论文提及的改动引发行业震动。这款由北京大学团队开发的领域专用语言,在华为昇腾实现Day0适配,开发者仅用80行代码即可实现原需500+行的FlashAttention算子,性能较FlashAttention 2提升30%。TileLang采用Python式语法,在TVM编译器…情报来源
