AI解开有机合成路径

来源:Wikipedia
来源:Wikipedia

继AlphaGo打败世界围棋棋王、攻克堪称全人类最后一座智慧的堡垒后,人工智慧(Artificial Intelligence)的演进未曾停歇。研发人员运用类似的神经网路演算法,在各个专业领域殷勤播种,诸多应用旋即遍地开花——像是新药研制,甚至能自行编写游戏程式的人工智慧等等。如今,人工智慧还坐上化学家的宝座,能解开错综复杂的有机化学反应、探寻有机分子的合成路径。

但是,它没有读过任何有关化学知识的课本,所有规则都是靠自己学习。

  • AI 鱼吃,不如教它「自己做渔竿」

其实早在1960年代,世界第一个专家系统程式诞生——名为Dendral [参2],它能从物质的光谱中推断物质的结构,在当时的化学界蔚为风潮。但所谓的专家系统,是利用人类专家的特定知识和逻辑推理程序,搭建专门的程式,来处理特定领域的问题。换言之,喂给系统大量的规则,在程式码中条列庞杂的「如果…其他…(if…else…)」的判断依循(如果条件A发生,则执行甲动作,发生其他条件就执行乙动作) 。那时的Dendral系统,在辨析某些分子族群时,表现并不准确,因此,它必须仰赖人工编写许多的规则,才得以避免判断出「不存在的分子」。显然,与现今的人工智慧演算法相比,专家系统逊色许多,无法冠冕为真正的人工智慧。

然而,与其喂规则给人工智慧依循,何不让它自己学习规则并加以判断、创造出新的结果呢?最生动活泼的例子,莫过于能自己学习编写游戏程式的人工智慧。乔治亚理工学院研究团队创建的演算法,能在不接触游戏程式码的前提下,仅透过观看影片学习,便能写出相仿于知名游戏《超级玛利》的程式[参3]。在科学应用实例中,也有研究团队写出了具有学习力的人工智慧,能从大量的化学反应式中,自己寻找化学合成的规则,并精准判断出某复杂有机化合物的原始组成分子,并发表在科学研究中最高学术殿堂——《自然(Nature)》期刊[参1]。

  • AI 也能「逆向思考」

有机化学的合成路径是错综复杂的,每一反应步骤的分子群可以是不同组合,有些反应还需要在某些温度、酸碱值范围内才可以顺利进行。因此解出有机化学的原始组成分子是极其困难的。这一次,研究人员以逆合成分析法(Retrosynthetic Analysis)作为核心精神,打造多合一的神经网路演算法,来

探寻有机分子的合成路径。

逆合成分析,一言以蔽之,就是化学合成中的「逆向思考」。从最终产物去分解、反推合成的分子,发想人EJ Corey,还因此得了诺贝尔奖[参5]。而多年后的今天,这个思考脉络套用在人工智慧里,在测试过程中,超过八成的目标分子都在5秒内被解出;若给它更长的时间,每分子60秒,则它能解出的样本比率高达92% [参1]。

演算法的主轴就在于,究团队结合了蒙地卡罗树搜寻法与多个神经网路,先初次选出目标分子前一步反应的可能组成(不一定为最原始的组成分子,因为有机合成可能涉及多个反应步骤)。接着,其中一个神经网路更往前扩展反应路径,再交由下一个神经网路去反覆推演、评估这些路径的可能性,直到路径达到了终点,没有适切的反应路径可以再往前分解,此时最原始的组成分子被找出

这项演算法的概念与AlphaGo异曲同工,工程师并未替AlphaGo键入任何与围棋有关的知识,只给他「看」棋谱来学习下棋方法。同样地,这位人工智慧化学家,未曾学过与化学有关的知识,它仅从大量的化学反应式中自行推敲箇中道理,建构有机合成的规则。有趣的是,在它第二步拓展反应路径时,就已经筛选出符合LUMO(Lowest Unoccupied Molecular Orbital,最低未占分子轨域)的反应规则,亦即处在LUMO的电子最可能与其它高能量的电子形成键结,进而合成出分子。但研究人员从未教过它这些。

  • AI 让化学家无地自容?

近年来人工智慧的突破,在科学研究领域一展长才,开始匹敌具专业素质的人类专家。这项发明将能革新科研发展的节奏,但也动摇了人们「术业有专攻」根深蒂固的思维。既然人工智慧都能辨析复杂的化学难题了,那毕生从业于化学研究的科学家们又将何去何从?

但此一担忧绝非个案。亘古以来,人们总是拥抱着最新科技却又同时心怀疑虑。蒸汽机的改良引领着工业革命,却也让工人们群起抗议、ATM(自动柜员机)的发明普及了金融服务,却让银行柜员忧心忡忡。人们时常恐慌着自己是否将被机器所汰换。然,这些机器真的侵占着人类的岗位,使得人们无所适从吗?

事实上,时过境迁之后,在当今的社会里可以显而易见:蒸汽机把人类从劳动层级中解放了出来,有更多人可以从事动脑的白领工作,而非单调的粗活;ATM的出现不只没有让现今银行柜员的数量减少,这些行员还能有更充裕的时间拓展业务、替客户做金融咨询等更高端的服务[参4]。因此,人工智慧也将腾出化学家们珍贵的时间与智慧,去挖掘更深层的化学新知。

人们在恐慌之余,不妨试着思索出机器的极限,并不断在自我价值的座标里,重新审视自己的位置。电脑可以输入万有引力的公式,精准算出苹果从树下掉下来所需的时间。但把电脑放在苹果树下,给苹果砸一砸,它是绝对想不出万有引力定律的。

编译来源:” AI designs organic syntheses ” Derek Lowe, Nature, 2018.

参考资料:

[1] Marwin h. S et al., “ Planning chemical syntheses with deep neural networks and symbolic AI ,” Nature, 2018. 
[2] Wikipedia  Dendral . 
[3]  不需要程式码!AI靠一支游戏影片就完美复制《超级玛利欧酷跑》  高敬原,数位时代,2017. 
[4]  How Computer Automation Affects Occupations: Technology, Jobs, and Skills  James E. Bessen, Boston Univ. School of Law , 2016. 
[5]Wikipedia Elias James Corey .

本文来自CASE 报科学,本文观点不代表沙鸥科报立场,转载请联系原作者。

相关文章

  • 用科技保护环境!AI 可侦测亚马逊雨林生态中非法道路的增减

    根据Inside Science报导,总部位于巴西的非营利环境保育组织Imazon在绘制亚马逊雨林生态圈里的人工道路时,发现绘制范围含420万平方公里的官方地图上,仅显示联邦与地方政府所建造的道路,并未包含实际上的所有人工…

    2021-01-12
  • OpenAI再现黑科技!发布文字生影片AI“Sora”

    OpenAI今天正式发表文字转影片生成式AI「Sora」!就跟DALL-E一样,只要给出文字叙述(或静态图片也可以),Sora可以自动生成1080p动画,各种不同的角色、动作类型和背景细节全方位配件生成! 经过,Sora 可以生成各…

    2024-02-16
  • Chat with RTX:在本地运行自己的AI聊天机器人

    Chat with RTX现已开放免费下载,这是一款技术演示应用,用户可以使用自己的内容来个性化聊天机器人。在NVIDIA GeForce RTX 30系列GPU(或更高性能版本,至少8GB显存)的支持下,Chat with RTX可提供极速的体验。 …

    2024-02-15
  • 人工智能识别死海古卷并非出自一人之手

    大部份的死海古卷(Dead Sea Scrolls)都没有署名,所以无法知道是由哪位抄写员誊写的,而且学者也很难根据字迹的特徵辨认某份手稿是由一位,还是多位抄写员完成。但是,根据《PLOS ONE》期刊最新发表的文章,大以…

    2021-05-05
  • MIT研究人员找到新方法提升聊天机器人性能

    研究人员发现了一种新的方法,能显著提高像ChatGPT一样的大型语言模型的性能。当人工智能与人之间持续对话时,这些模型常常会出现故障,导致性能急剧下降。研究人员发现,这个问题出在语言模型处理过往“记忆”的方式…

    2024-02-18
  • Google发布新一代 AI 模型Gemma

    Google于2月21日,发布了新一代人工智能 (AI) 模型系列 Gemma,旨在为 AI 领域的研究和开发提供更先进、更易于使用的工具。Gemma 提供了两种参数规模的模型:2B 和 7B。 这两个模型都展现出了各自规模内的顶尖性能…

    2024-02-22