研究进展
学术研究成果、论文发表、实验结果
6月18
-
LiveCodeBench Pro揭示:LLM在高难度编程中仍逊色于人类大师
21:39 作者:AI情报员🎯 情报来源:机器之心近期,纽约大学、普林斯顿大学等8家机构联合发布了一项名为LiveCodeBench Pro的研究,评估了当前最先进大语言模型(LLMs)在顶级竞技编程任务中的表现。结果显示,尽管部分模型在辅助工具支持下达到了Codeforces平台2700+的Elo评分,但在无外部工具的情况下,最佳模型在高难度问题上的通过率仅为0%。核心要点:LiveCodeBench Pro包含584道高…情报来源
-
分子之心首创零样本酶设计技术,催化效率超天然酶
21:37 作者:AI情报员🎯 情报来源:机器之心近日,ICML 2025收录了由AI蛋白质设计公司分子之心与香港理工大学联合研发的「SENZ」技术。该技术首次实现了针对自然界未知分子或反应生成专属酶,并在催化效率、稳定性等关键指标上优于天然酶和传统方法设计的酶。研究解决了生物制造领域因缺乏理想催化剂而导致的年产能损失问题(超千亿美元),并验证了其在环保、医药等领域的巨大潜力。例如,SENZ成功设计出一种高效降解甲基膦酸盐污…情报来源
-
AI视频生成研究报告:Sora推动技术出圈,成本降低1-2个数量级
19:01 作者:AI情报员🎯 情报来源:量子位2024年,AI视频生成成为最受关注的领域之一。OpenAI于今年2月发布的Sora标志着视频生成技术从局部生成向全量生成迈进,同时推动了产业快速发展。量子位智库最新发布的《AI视频生成研究报告》指出,视频生成模型的能力将在算力驱动下快速提升,推理成本持续下降,生成速度进一步提高,为应用层和商业化发展铺平道路。核心要点:视频生成技术正从检索生成、局部生成走向基于提示词的全量生成…情报来源
-
量子位智库发布Scaling Laws报告:大模型参数规模已达万亿级
12:41 作者:AI情报员🎯 情报来源:量子位量子位智库最新发布《Scaling Laws尺度定律,如何影响AI研发和产业落地》研究报告,深入解读尺度定律对AI行业的影响。尺度定律揭示了模型性能与模型大小、数据量及计算资源之间的幂律关系,成为当前AI行业的“大模型第一性原理”。这一规律不仅指导着大模型的研发方向,还推动了AI相关行业的快速发展。核心要点:OpenAI的GPT系列参数规模从GPT-2的15亿增长至GPT-4的…情报来源
-
AI安全新框架:Claude 3.7 Sonnet减少45%不必要拒绝,兼顾功能性与安全性
10:25 作者:AI情报员🎯 情报来源:Anthropic随着AI能力的快速发展,全面理解并应对潜在影响变得愈发重要。Anthropic公司近日分享了其评估和缓解AI系统潜在危害的新方法,涵盖从生物威胁到儿童安全、虚假信息和欺诈等多维度问题。这一框架旨在帮助团队清晰沟通、做出合理决策,并针对已知及新兴危害开发针对性解决方案。核心要点:Anthropic开发了一个综合框架,用于评估AI在身体、心理、经济、社会及个人自主性五个…情报来源
6月16
-
谷歌提出“充分上下文”新范式,显著提升RAG系统性能
21:20 作者:AI情报员🎯 情报来源:The latest research from Google在ICLR 2025会议上,谷歌研究团队发布了一项关于检索增强生成(RAG)系统的重要研究成果,提出了一种全新的评估指标——“充分上下文”(Sufficient Context)。该研究聚焦于解决当前RAG系统中常见的两个关键问题:模型幻觉和上下文相关性不足。研究团队通过量化上下文的充分性,分析了影响RAG系统性能的核心因…情报来源
-
哈工大联合度小满发布EFFIVLM-BENCH:首个LVLM高效化评估框架开源
21:12 作者:AI情报员🎯 情报来源:机器之心在金融科技智能化转型进程中,多模态大模型(LVLM)正成为核心技术驱动力。然而,这类模型的部署长期受限于显著的算力瓶颈,例如一次多图推理可能需要100G显存空间,严重制约了产业落地。针对这一痛点,哈尔滨工业大学团队联合度小满金融科技正式发布EFFIVLM-BENCH,这是业界首个支持跨场景统一评估的多模态大模型高效化基准框架,旨在为学术界提供可复现的压缩方案对比基准,并赋能工…情报来源
-
中科大团队突破圆偏振磷光材料设计瓶颈,LLM+迁移学习实现定制化制造
21:07 作者:AI情报员🎯 情报来源:机器之心中国科学技术大学江俊教授、邹纲教授和尚伟伟副教授团队在圆偏振磷光材料(CPP)设计领域取得重要突破。他们提出了一种基于大型语言模型(LLM)和迁移学习的策略,成功实现了用户指定性能的圆偏振荧光/磷光材料的逆向定制设计。这一方法不仅能够高效筛选合适的合成前体,还为实验程序提供了明确参考,显著提升了材料设计效率。该研究以「Design of circularly polarize…情报来源
-
MIT发布SERC种子基金项目:推动计算伦理与社会影响研究
19:31 作者:AI情报员🎯 情报来源:MIT News - Artificial intelligence近日,麻省理工学院(MIT)通过其Schwarzman计算学院的“计算社会与伦理责任”(SERC)项目,为15个跨学科研究项目提供了高达10万美元的种子基金支持。这些项目在技术、伦理和社会影响方面展现了创新性突破。去年夏天的提案征集吸引了近70份申请,最终由来自MIT各学院和学部的评审委员会筛选出获奖项目。在5月1日…情报来源
-
微软研究团队推出ADeLe框架:预测AI模型在陌生任务中的表现并解释原因
17:00 作者:AI情报员🎯 情报来源:Microsoft Research Blog - Microsoft Research微软研究院及其合作机构的研究团队在"加速基础模型研究"(AFMR)资助计划的支持下,开发了一种评估AI模型的新方法。该方法不仅能预测模型在陌生任务中的表现,还能解释原因,解决了当前基准测试难以实现的痛点。相关研究成果发表在论文《通用量表解锁具有解释和预测能力的AI评估》中。 该…情报来源
-
Murakkab系统提升复合AI效率3.4倍,智能因果验证保障CCF框架安全
17:00 作者:AI情报员🎯 情报来源:Microsoft Research Blog - Microsoft Research微软研究院最新发布的两项突破性研究引发行业关注:Murakkab复合AI系统通过重构工作流架构实现资源效率突破,而智能因果验证技术为分布式系统可信度设立新标准。其中Murakkab系统在初步测试中展现出3.4倍的工作流加速和4.5倍的能效提升,标志着AI系统设计进入资源优化新阶段。 在复合AI系统…情报来源
-
微软在CHI 2025和ICLR 2025展示AI前沿研究,涵盖因果推理与LLM安全增强
16:58 作者:AI情报员🎯 情报来源:Microsoft Research Blog - Microsoft Research微软研究院近日公布了其在CHI 2025和ICLR 2025两大顶级学术会议上的研究成果,涉及因果推理与大型语言模型(LLMs)的新研究、LLM越狱能力增强以提升安全性和鲁棒性、人机协作效能分析,以及语音质量评估的Distill-MOS模型。其中,CHI 2025会议将有超过30场微软主持的研讨会…情报来源
-
Anthropic推出AI for Science计划,为生物和生命科学研究提供免费API支持
15:32 作者:AI情报员🎯 情报来源:Anthropic News人工智能研究公司Anthropic今日正式启动"AI for Science"计划,旨在通过提供免费API访问权限,加速科学研究进程,特别是在生物和生命科学领域。该计划将为从事高影响力科学研究项目的研究人员提供API积分支持,重点关注复杂生物系统理解、基因数据分析、药物发现加速以及农业生产力提升等应用方向。 Anthropic表示,先进…情报来源