康奈尔大学发布PlantCaduceus:跨物种植物基因组建模性能提升7倍

🎯 情报来源:机器之心

康奈尔大学的研究团队推出了一款名为 PlantCaduceus 的 DNA 语言模型,该模型在多种被子植物基因组上进行了预训练,并展现出卓越的跨物种预测能力。即使在拟南芥与玉米之间存在 1.6 亿年的进化差异的情况下,其剪接供体预测性能比现有最佳模型高 1.45 倍,翻译起始位点预测性能高出 7.23 倍。

核心要点:

  • PlantCaduceus 在玉米剪接供体预测中性能比现有最佳模型高 1.45 倍。
  • 在翻译起始位点预测任务中,PlantCaduceus 性能比现有最佳模型高 7.23 倍。
  • 模型通过自监督预训练捕获了广泛的进化保守性和 DNA 序列语法。
  • 研究人员计划扩展模型以支持裸子植物基因组,并探索长距离 DNA 相互作用。

📌 情报分析

技术价值:极高

PlantCaduceus 能够在进化差异极大的物种间实现精准预测,特别是剪接供体和翻译起始位点的显著性能提升,表明其在捕捉跨物种保守序列模式方面具有突破性优势。

商业价值:高

作为一款可加速植物基因组注释和适应度分析的工具,PlantCaduceus 对农业育种和作物改良领域有重要推动作用,尤其是在资源有限的情况下降低研究成本。

趋势预测:

未来 6-12 个月,随着模型对更多植物谱系(如裸子植物)的支持以及上下文窗口的扩展,PlantCaduceus 或将进一步巩固其在植物基因组学领域的基础模型地位,并可能成为千种植物基因组计划的核心工具。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索