科研人员通过反应描述语言连接化学与人工智能

中国科学院
167次浏览

近日,中国科学院上海药物研究所郑明月团队报道了名为ReactSeq反应描述语言。该语言可以编码化学反应中的分子编辑操作,使自然语言处理模型在逆合成预测、反应表征和检索方面表现得更为出色。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

以大语言模型为代表的人工智能技术在自然语言处理方面取得了进展,影响了科学研究范式。在生命科学领域,语言模型现已被用于在蛋白质和基因序列中挖掘隐藏信息,并取得了成果。在化学与药物研发领域,处理化学分子与反应的化学语言模型(CLMs)也逐渐兴起。与自然语言、蛋白质和基因不同,化学分子缺乏固有的顺序表示。CLM利用化学家定义的分子线性注释来学习和生成分子结构。常用的分子线性注释是简化分子输入线输入系统(SMILES)。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

近年来,为提升CLMs在特定任务中的表现,有研究设计了一些新的分子线性注释。然而,这些语言都是为了描述化学分子的静态结构,无法明确描述化学反应过程中分子中原子和键的变化过程。这限制了语言模型在化学反应预测和表示中的应用。目前用于化学反应预测的语言模型包括正向和反向合成预测,通常直接将产物和反应物的线性表示相互转换,但在可解释性与交互性方面存在不足。此外,尽管预训练语言模型在多种序列数据的表示学习方面表现出色,但其在化学反应表示方面的进展相对有限。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

受逆合成分析过程的启发,ReactSeq定义了从产物结构出发并将其转化为反应物分子所需的一系列分子编辑操作(MEO)。这些MEO包括化学键的断裂和变化、原子电荷的改变以及离去基团的附着。在基于ReactSeq的逆合成模型中,反应物不是从头开始逐个生成。相反地,它是通过这些MEO从产物分子转化而来。这确保了预测反应物和产物之间的精确原子映射,增强了模型的可解释性。研究显示,利用ReactSeq,只需要简单的Transformer模型便能在逆合成预测中实现先进的性能。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

ReactSeq具有表示MEO的显式令牌,可对人类指令进行编码。结果表明,人类专家的提示可提高模型性能,甚至指导它探索新的反应。同时,这些MEO令牌利于提取反应表示。与聚合整个ReactSeq的嵌入相比,专注于这些MEO令牌的嵌入可以产生更加忠实且具有内在化学意义的反应表示。基于这一策略并结合自监督学习,研究人员构建了通用且可靠的反应表示方法。该方法能够自然区分反应类型并评估其相似性,从而促进相似反应的检索、实验流程的推荐及反应收率的预测。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

该研究通过创新的化学语言设计,为垂直领域的大语言模型赋予了新能力。同时,这一成果提升了自然语言处理模型应对复杂化学问题的能力,为化学人工智能基础模型的发展提供了新方向。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

5月13日,相关研究成果在线发表在《自然-机器智能》(Nature Machine Intelligence)上。研究工作得到国家自然科学基金、国家重点研发计划、中国科学院战略性先导科技专项等的支持。aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

论文链接 aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

基于SMILES的传统反应预测语言模型与基于ReactSeq的方法的对比aV8速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:http://m.sushuapos.com/show-12-1125-0.html科研人员通过反应描述语言连接化学与人工智能

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

两会日程预告丨3月6日:审议和讨论政府工作报告 审查计划报告和预算报告
十四届全国人大二次会议各代表团6日全天举行代表小组会议。上午审议政府工作报告,下午审查计划报告和草案、预算报告和草案。全国政协十四届二次会议6日全天举行界别联组会议和小组会
制造业贷款余额增长17%,力撑佛山贷款余额首破2万亿元
南方财经全媒体记者高慧超 实习生邓菲、卢诗文 佛山报道3月5日,南方财经全媒体记者从人民银行佛山市分行获悉,截至2024年1月末,佛山市本外币贷款余额20466亿元,成为广东省内首个贷款余额
(两会声音)全国人大代表冯兴亚:建议明确智能驾驶法律责任认定
  (两会声音)全国人大代表冯兴亚:建议明确智能驾驶法律责任认定  中新网北京3月4日电 (记者 王华) 全国人大代表、广汽集团总经理冯兴亚建议,修订相关法律法规,明确智能驾驶的法律责任认定。  根据有关规划,2025年
专访全国政协委员、中国科学院院士种康:加快培育耐盐碱饲草品种,以科技创新加速推进盐碱地利用
21世纪经济报道记者李莎 北京报道 粮食安全是“国之大者”,耕地是粮食生产的根基。盐碱地综合改造利用是耕地保护和改良的重要方面,今年中央一号文件指出,要分区分类开展盐碱耕地治理改
专访全国人大代表、天津市滨海新区区长单泽峰:把握新质生产力,加强与北京科技创新体系融合
21世纪经济报道记者周慧 实习生刘龙珠北京报道2024年是京津冀协同发展上升为国家战略十周年,2024年政府工作报告提出,支持京津冀、长三角、粤港澳大湾区等经济发展优势地区更好发挥高
住建部再提“房住不炒” 部长倪虹建议以人定房、以房定地、以房定钱
21世纪经济报道记者 缴翼飞 实习生 潘晓霞 北京报道3月9日,住房和城乡建设部部长倪虹在十四届全国人大二次会议的民生主题记者会上表示,构建房地产发展新模式是破解房地产发展难题、促

热点精选

最新推荐

您可能感兴趣