AI解开有机合成路径

来源:Wikipedia
来源:Wikipedia

继AlphaGo打败世界围棋棋王、攻克堪称全人类最后一座智慧的堡垒后,人工智慧(Artificial Intelligence)的演进未曾停歇。研发人员运用类似的神经网路演算法,在各个专业领域殷勤播种,诸多应用旋即遍地开花——像是新药研制,甚至能自行编写游戏程式的人工智慧等等。如今,人工智慧还坐上化学家的宝座,能解开错综复杂的有机化学反应、探寻有机分子的合成路径。

但是,它没有读过任何有关化学知识的课本,所有规则都是靠自己学习。

  • AI 鱼吃,不如教它「自己做渔竿」

其实早在1960年代,世界第一个专家系统程式诞生——名为Dendral [参2],它能从物质的光谱中推断物质的结构,在当时的化学界蔚为风潮。但所谓的专家系统,是利用人类专家的特定知识和逻辑推理程序,搭建专门的程式,来处理特定领域的问题。换言之,喂给系统大量的规则,在程式码中条列庞杂的「如果…其他…(if…else…)」的判断依循(如果条件A发生,则执行甲动作,发生其他条件就执行乙动作) 。那时的Dendral系统,在辨析某些分子族群时,表现并不准确,因此,它必须仰赖人工编写许多的规则,才得以避免判断出「不存在的分子」。显然,与现今的人工智慧演算法相比,专家系统逊色许多,无法冠冕为真正的人工智慧。

然而,与其喂规则给人工智慧依循,何不让它自己学习规则并加以判断、创造出新的结果呢?最生动活泼的例子,莫过于能自己学习编写游戏程式的人工智慧。乔治亚理工学院研究团队创建的演算法,能在不接触游戏程式码的前提下,仅透过观看影片学习,便能写出相仿于知名游戏《超级玛利》的程式[参3]。在科学应用实例中,也有研究团队写出了具有学习力的人工智慧,能从大量的化学反应式中,自己寻找化学合成的规则,并精准判断出某复杂有机化合物的原始组成分子,并发表在科学研究中最高学术殿堂——《自然(Nature)》期刊[参1]。

  • AI 也能「逆向思考」

有机化学的合成路径是错综复杂的,每一反应步骤的分子群可以是不同组合,有些反应还需要在某些温度、酸碱值范围内才可以顺利进行。因此解出有机化学的原始组成分子是极其困难的。这一次,研究人员以逆合成分析法(Retrosynthetic Analysis)作为核心精神,打造多合一的神经网路演算法,来

探寻有机分子的合成路径。

逆合成分析,一言以蔽之,就是化学合成中的「逆向思考」。从最终产物去分解、反推合成的分子,发想人EJ Corey,还因此得了诺贝尔奖[参5]。而多年后的今天,这个思考脉络套用在人工智慧里,在测试过程中,超过八成的目标分子都在5秒内被解出;若给它更长的时间,每分子60秒,则它能解出的样本比率高达92% [参1]。

演算法的主轴就在于,究团队结合了蒙地卡罗树搜寻法与多个神经网路,先初次选出目标分子前一步反应的可能组成(不一定为最原始的组成分子,因为有机合成可能涉及多个反应步骤)。接着,其中一个神经网路更往前扩展反应路径,再交由下一个神经网路去反覆推演、评估这些路径的可能性,直到路径达到了终点,没有适切的反应路径可以再往前分解,此时最原始的组成分子被找出

这项演算法的概念与AlphaGo异曲同工,工程师并未替AlphaGo键入任何与围棋有关的知识,只给他「看」棋谱来学习下棋方法。同样地,这位人工智慧化学家,未曾学过与化学有关的知识,它仅从大量的化学反应式中自行推敲箇中道理,建构有机合成的规则。有趣的是,在它第二步拓展反应路径时,就已经筛选出符合LUMO(Lowest Unoccupied Molecular Orbital,最低未占分子轨域)的反应规则,亦即处在LUMO的电子最可能与其它高能量的电子形成键结,进而合成出分子。但研究人员从未教过它这些。

  • AI 让化学家无地自容?

近年来人工智慧的突破,在科学研究领域一展长才,开始匹敌具专业素质的人类专家。这项发明将能革新科研发展的节奏,但也动摇了人们「术业有专攻」根深蒂固的思维。既然人工智慧都能辨析复杂的化学难题了,那毕生从业于化学研究的科学家们又将何去何从?

但此一担忧绝非个案。亘古以来,人们总是拥抱着最新科技却又同时心怀疑虑。蒸汽机的改良引领着工业革命,却也让工人们群起抗议、ATM(自动柜员机)的发明普及了金融服务,却让银行柜员忧心忡忡。人们时常恐慌着自己是否将被机器所汰换。然,这些机器真的侵占着人类的岗位,使得人们无所适从吗?

事实上,时过境迁之后,在当今的社会里可以显而易见:蒸汽机把人类从劳动层级中解放了出来,有更多人可以从事动脑的白领工作,而非单调的粗活;ATM的出现不只没有让现今银行柜员的数量减少,这些行员还能有更充裕的时间拓展业务、替客户做金融咨询等更高端的服务[参4]。因此,人工智慧也将腾出化学家们珍贵的时间与智慧,去挖掘更深层的化学新知。

人们在恐慌之余,不妨试着思索出机器的极限,并不断在自我价值的座标里,重新审视自己的位置。电脑可以输入万有引力的公式,精准算出苹果从树下掉下来所需的时间。但把电脑放在苹果树下,给苹果砸一砸,它是绝对想不出万有引力定律的。

编译来源:” AI designs organic syntheses ” Derek Lowe, Nature, 2018.

参考资料:

[1] Marwin h. S et al., “ Planning chemical syntheses with deep neural networks and symbolic AI ,” Nature, 2018. 
[2] Wikipedia  Dendral . 
[3]  不需要程式码!AI靠一支游戏影片就完美复制《超级玛利欧酷跑》  高敬原,数位时代,2017. 
[4]  How Computer Automation Affects Occupations: Technology, Jobs, and Skills  James E. Bessen, Boston Univ. School of Law , 2016. 
[5]Wikipedia Elias James Corey .

本文来自CASE 报科学,本文观点不代表沙鸥科报立场,转载请联系原作者。

相关文章

  • Chat With RTX将支持Gemma

    Google 近期推出开放式模型Gemma,NVIDIA 亦宣布与 Google 展开合作,包括关系:在所有 NVIDIA AI 平台上(包括本地端 RTX AI PC、云端、数据中心)针对 Gemma 进行最佳化。同时,NVIDIA 自家Chat With RTX也…

    2024-02-24
  • MIT研究人员找到新方法提升聊天机器人性能

    研究人员发现了一种新的方法,能显著提高像ChatGPT一样的大型语言模型的性能。当人工智能与人之间持续对话时,这些模型常常会出现故障,导致性能急剧下降。研究人员发现,这个问题出在语言模型处理过往“记忆”的方式…

    2024-02-18
  • 在科学出版中如何利用人工智能?

    学术出版领域随着技术进步发生了显著变化。当前围绕生成式人工智能(AI) 或大型语言模型 (LLM) 的讨论尤为热烈。此类工具的功能已远超简单的语法检查或翻译软件,其在出版流程中的介入值得深思。 LLM 是强大的写作辅…

    2024-02-17
  • OpenAI再现黑科技!发布文字生影片AI“Sora”

    OpenAI今天正式发表文字转影片生成式AI「Sora」!就跟DALL-E一样,只要给出文字叙述(或静态图片也可以),Sora可以自动生成1080p动画,各种不同的角色、动作类型和背景细节全方位配件生成! 经过,Sora 可以生成各…

    2024-02-16
  • LPU:比NVIDIA GPU 更快的AI芯片

    这个「Groq」不是马斯克的「Grok」!AI 晶片公司Groq 称创造了「世界上最快的大型语言模型速度」,在社群上示范的影片因极快的生成速度(1 秒内就生成数百字的回覆)而引发关注和讨论。 Groq 其实并非一款全新AI 模…

    2024-02-22
  • DianNaoYu:中国提出的国际上首个深度学习指令集

    2016年3月上旬,中国科学院大学岗位教授、中国科学院计算技术研究所研究员陈云霁与陈天石课题组提出的深度学习处理器指令集DianNaoYu,被计算机体系结构领域顶级国际会议ISCA2016(International Symposium on Comp…

    2016-03-12