MIT研究人员找到新方法提升聊天机器人性能

研究人员发现了一种新的方法,能显著提高像ChatGPT一样的大型语言模型的性能。当人工智能与人之间持续对话时,这些模型常常会出现故障,导致性能急剧下降。研究人员发现,这个问题出在语言模型处理过往“记忆”的方式上。通常,为了避免储存空间不足,一些较早的信息或对话会被模型自动删除。然而,这让模型难以跟上谈话的思路。

来自麻省理工学院(MIT)和其它团队的研究人员发现,只要在存储信息的缓存区始终保留最初的若干条数据,AI在对话过程中就不会崩溃或失去流畅性。这项名为 StreamingLLM 的新技术,即使在处理超过400万字的超长对话时,也能保持模型的计算效率。相比另一种避免崩溃的技术,StreamingLLM要快上22倍多。

这一重大改进能让聊天机器人长时间不间断地工作,不需要反复重启。这将推动新一代AI助手的诞生,在文案撰写、内容编辑、代码撰写等场景发挥更多作用。研究者希望能把 StreamingLLM 与更多AI软件集成,让智能聊天机器人根据最新的对话内容做出判断和回应。

科学家们发现导致崩溃的原因在于模型内部使用的 “注意力机制”。这种机制会给所有词语分配分数,来决定如何关联彼此,进而生成新的文本。但是计算机制要求把遗留的注意力分数集中保存在首个词汇里,导致其起到了 “注意力水槽”的作用。研究者表示,这个槽位至关重要,必须随时留存在对话信息缓存的最前端。

StreamingLLM方法还有一大优势,那就是确保每个词汇的位置信息不变。就算后续词语出现或消失,原先的词语编码也不能变动。这两个机制相结合,能让AI模型始终保持连贯、高效的对话。

目前,StreamingLLM 技术已经被整合进英伟达公司开发的大型语言模型优化库中。

研究论文:Xiao, Guangxuan, et al. “Efficient streaming language models with attention sinks.” arXiv preprint arXiv:2309.17453 (2023). https://doi.org/10.48550/arXiv.2309.17453

本文编译自MIT, 本文观点不代表“沙鸥科报”立场,转载请联系原作者。如有侵权,请联系编辑处理。

相关文章

  • Google发布新一代 AI 模型Gemma

    Google于2月21日,发布了新一代人工智能 (AI) 模型系列 Gemma,旨在为 AI 领域的研究和开发提供更先进、更易于使用的工具。Gemma 提供了两种参数规模的模型:2B 和 7B。 这两个模型都展现出了各自规模内的顶尖性能…

    2024-02-22
  • AI新算法可提高影像的分辨率

    尽管现在还是无法奇迹般地还原影像,但是和过去的尝试相比的确有了可观的成果

    2017-11-03
  • 苹果默默推出自己的动画生成式AI「Keyframer」

    继开源多模态大型语言模型「Ferret」、虚拟分身AI「HUGS」之后,苹果再度一扫掉队AI 的疑虑,默默推出了最新生成式AI 工具「Keyframer」!Keyframer 特别之处是一款融入LLM 功能,可以直接使用自然语言,就能为静态…

    2024-02-15
  • 人工智能 监测肺癌,效果堪比专家诊断结果

    人工智能 在深度学习的帮助下,功能变得相当强大,用在影像辨识上效果非常好,医疗方面Google人工智慧巳经在协助病理学家由组织切片显微影像分辨癌症、协助眼科医师为糖尿病患者看眼疾,不过还有许多限制需要突破。研究团队教电脑辨识不同影像的特征模式,像肺结核、癌症、骨折等。

    2020-03-13
  • AI 决策更具理性 , 但是否更正确呢 ?

    还记得在准备大学入学面试时,老师总会警告:「记得千万不要搞怪!」不要搞怪的意思很简单,将五颜六色的头发染回黑色,或将时下流行的潮T改回西装,总之去回想想阿嬷的乖孙该长怎样,面试那天打扮成那样就对了!如果今天面试官从人类换成无法被窥见喜怒哀乐的 AI ,那又该如何成功达阵呢?

    2020-02-12
  • 莎士比亚的部分戏剧可能有人代笔,机器学习发现了详细证据

    长期以来,文学评论家一直认为莎士比亚的作品《亨利八世》(Henry VIII)可能是由他人代笔。借助机器学习技术,研究人员分析出代笔之人,以及哪些章节别人所写。 莎士比亚大半生都在为伦敦的一家戏剧公司the King’s…

    2019-11-24