MIT研究人员找到新方法提升聊天机器人性能

研究人员发现了一种新的方法,能显著提高像ChatGPT一样的大型语言模型的性能。当人工智能与人之间持续对话时,这些模型常常会出现故障,导致性能急剧下降。研究人员发现,这个问题出在语言模型处理过往“记忆”的方式上。通常,为了避免储存空间不足,一些较早的信息或对话会被模型自动删除。然而,这让模型难以跟上谈话的思路。

来自麻省理工学院(MIT)和其它团队的研究人员发现,只要在存储信息的缓存区始终保留最初的若干条数据,AI在对话过程中就不会崩溃或失去流畅性。这项名为 StreamingLLM 的新技术,即使在处理超过400万字的超长对话时,也能保持模型的计算效率。相比另一种避免崩溃的技术,StreamingLLM要快上22倍多。

这一重大改进能让聊天机器人长时间不间断地工作,不需要反复重启。这将推动新一代AI助手的诞生,在文案撰写、内容编辑、代码撰写等场景发挥更多作用。研究者希望能把 StreamingLLM 与更多AI软件集成,让智能聊天机器人根据最新的对话内容做出判断和回应。

科学家们发现导致崩溃的原因在于模型内部使用的 “注意力机制”。这种机制会给所有词语分配分数,来决定如何关联彼此,进而生成新的文本。但是计算机制要求把遗留的注意力分数集中保存在首个词汇里,导致其起到了 “注意力水槽”的作用。研究者表示,这个槽位至关重要,必须随时留存在对话信息缓存的最前端。

StreamingLLM方法还有一大优势,那就是确保每个词汇的位置信息不变。就算后续词语出现或消失,原先的词语编码也不能变动。这两个机制相结合,能让AI模型始终保持连贯、高效的对话。

目前,StreamingLLM 技术已经被整合进英伟达公司开发的大型语言模型优化库中。

研究论文:Xiao, Guangxuan, et al. “Efficient streaming language models with attention sinks.” arXiv preprint arXiv:2309.17453 (2023). https://doi.org/10.48550/arXiv.2309.17453

本文编译自MIT, 本文观点不代表“沙鸥科报”立场,转载请联系原作者。如有侵权,请联系编辑处理。

相关文章

  • Google发布AI模型Gemini

    2月8日晚间,Google发布了新的AI模型免费版Gemini和收费版的Gemini Advanced,并上线了新的网站和Android移动APP。 Gemini 的前身是Bard,Bard 是 Google AI 开发的大型语言模型 (LLM),于 2023 年 2 月 6 日首次发…

    2024-02-09
  • 当死亡在你我身边—关于复杂性哀恸

    人生在世,难免遇上亲近的人死亡,这时我们会出现哀恸反应。但在人群中,有一定比例的人的反应会特别严重、持续特别久,并且严重影响他们的日常生活。

    2017-10-15
  • 用科技保护环境!AI 可侦测亚马逊雨林生态中非法道路的增减

    根据Inside Science报导,总部位于巴西的非营利环境保育组织Imazon在绘制亚马逊雨林生态圈里的人工道路时,发现绘制范围含420万平方公里的官方地图上,仅显示联邦与地方政府所建造的道路,并未包含实际上的所有人工…

    2021-01-12
  • AI解开有机合成路径

    继AlphaGo打败世界围棋棋王、攻克堪称全人类最后一座智慧的堡垒后,人工智慧(Artificial Intelligence)的演进未曾停歇。研发人员运用类似的神经网路演算法,在各个专业领域殷勤播种,诸多应用旋即遍地开花——像是…

    2018-06-14
  • LPU:比NVIDIA GPU 更快的AI芯片

    这个「Groq」不是马斯克的「Grok」!AI 晶片公司Groq 称创造了「世界上最快的大型语言模型速度」,在社群上示范的影片因极快的生成速度(1 秒内就生成数百字的回覆)而引发关注和讨论。 Groq 其实并非一款全新AI 模…

    2024-02-22
  • 莎士比亚的部分戏剧可能有人代笔,机器学习发现了详细证据

    长期以来,文学评论家一直认为莎士比亚的作品《亨利八世》(Henry VIII)可能是由他人代笔。借助机器学习技术,研究人员分析出代笔之人,以及哪些章节别人所写。 莎士比亚大半生都在为伦敦的一家戏剧公司the King’s…

    2019-11-24