🎯 情报来源:量子位
《Nature》最新研究发现,2024年PubMed上发表的生物医学论文中,14%的摘要存在LLM(大语言模型)代写特征,涉及至少20万篇论文。研究团队通过分析2010-2024年的1400万篇摘要,发现2024年后出现以”intricate”、”notably”等风格词为主的异常词频现象,其中66%为动词(如delving)、16%为形容词(如crucial)。
数据显示,非英语国家(如中国、韩国)的LLM使用率达15%,计算领域高达20%,开放获取期刊《Sensors》甚至达到24%,而《Nature》《Science》等顶刊仅6%-8%。值得注意的是,作者正通过调整提示词主动规避典型AI特征词,使检测难度增大。
💡 核心要点
- 2024年14%生物医学论文含LLM特征词,20万篇摘要被标记
- 特征词汇中66%为风格性动词(如delving),16%为夸张形容词(如crucial)
- 计算领域使用率20%,非英语国家15%,开放期刊《Sensors》高达24%
- 作者通过提示词工程使典型特征词使用率下降,但无法完全消除痕迹
- 现有检测器对经提示词修改的文本准确率显著降低
📌 情报分析
技术价值:高
词频统计法可量化AI参与度,但面临提示词工程的反检测挑战,需开发更鲁棒的检测算法(基于1400万篇语料验证)。
商业价值:极高
学术诚信检测工具需求激增,MGT检测市场将扩大;期刊需升级审稿系统(顶刊与非顶刊6% vs 24%使用率差异显示质量关联)。
趋势预测:高
2025年非英语国家使用率或突破20%(当前15%),跨学科协作论文或成AI代写重灾区(生物信息学已现苗头)。