🎯 情报来源:机器之心
近日,中山大学施莽团队与阿里云李兆融团队联合开发的开源生物大模型 LucaOne 在《Nature Machine Intelligence》发表。该模型基于「中心法则」,首次将 DNA、RNA 和蛋白质三种生物数据统一建模,参数规模达 1.8B,在中心法则学习任务中预测准确率达到 0.85。
核心要点:
- LucaOne 参数规模为 1.8B,涵盖 169,861 个物种的数据,支持下游任务高效应用。
- 在流感 H3N2 病毒免疫逃逸风险预测任务中,LucaOne 结合感知机模型实现 100% 准确率。
- 模型设计包含 8 个半监督学习任务,以应对生物序列信息密度低和分布不均的问题。
📌 情报分析
技术价值:极高
LucaOne 首次将 DNA、RNA 和蛋白质三类生物数据统一建模,并通过自监督加半监督架构显著提升了对复杂生物系统的表征能力,其 0.85 的预测准确率远超现有模型。
商业价值:高
该模型在流感病毒免疫逃逸预测等公共卫生领域表现优异,具备直接应用于疾病诊断和药物研发的潜力,可推动 AI 技术在生物科学领域的商业化落地。
趋势预测:
随着更多高质量数据的加入及模型优化,LucaOne 或将在未来 6-12 个月内进一步提升性能,尤其是在应对特殊进化适应性生物的规则学习方面,可能成为下一代生物大模型的标准架构。