全球首个分子毒性修复基准ToxiMol发布:近30款多模态大模型评测,成功率普遍偏低

🎯 情报来源:机器之心

澳门科技大学、上海交通大学、中国科学院自动化研究所与上海人工智能实验室联合发布了全球首个面向通用多模态大模型(MLLMs)的分子毒性修复基准任务ToxiMol,并配套提出评估体系ToxiEval。研究团队对近30款主流MLLM进行了系统测评,首次全面验证其在毒性规避与结构优化任务中的能力边界。

新药研发中约九成候选分子因毒性问题失败,传统方法复杂且高成本。虽然通用MLLM展现出跨模态感知与推理能力,但其是否能完成真正意义上的毒性修复仍未知。ToxiMol覆盖11个毒性修复主任务,包含560个真实有毒分子样本,而ToxiEval则从5个维度严格评估修复结果。实验表明,当前模型在该任务中的成功率普遍较低。

核心要点:

  • ToxiMol涵盖11个毒性修复主任务,构建560个真实有毒分子样本,具备高复杂度与机制异质性。
  • ToxiEval综合安全评分、成药性评分、合成可行性等5个关键指标,采用全约束通过策略。
  • 实验显示,GPT-4o、Claude-3等近30款主流MLLM整体成功率低,尤其在复杂机制任务中表现更差。

📌 情报分析

技术价值:高

ToxiMol和ToxiEval为多模态大模型应用于分子毒性修复提供了首个系统性基准和评估框架,填补了领域空白。通过覆盖多种毒性机制和严格评估标准,推动了AI在科学领域的技术迭代。

商业价值:一般

尽管该基准具有学术意义,但当前模型在毒性修复任务中的成功率较低,尚无法直接转化为实际应用,商业化潜力有限。

趋势预测:

未来3-6个月,ToxiMol可能吸引更多科研团队参与改进MLLM的能力,尤其是在毒性机制建模与多属性平衡方向。同时,开源数据集和项目资源将促进相关工具的开发。

原文连接

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
今日签到
有新私信 私信列表
搜索