LPU:比NVIDIA GPU 更快的AI芯片

这个「Groq」不是马斯克的「Grok」!AI 晶片公司Groq 称创造了「世界上最快的大型语言模型速度」,在社群上示范的影片因极快的生成速度(1 秒内就生成数百字的回覆)而引发关注和讨论。

LPU:比NVIDIA GPU 更快的AI芯片

Groq 其实并非一款全新AI 模型,而是一种「LPU 推论引擎」,等同用自家晶片来运行其他开源模型(包括Mixtral 8x7b、Llama 2 70B)的AI 语言介面,如同其他聊天机器人Groq 也能生成创意文字、翻译内容、回覆问题等

根据Artificial Analysis 针对AI host 的评比数据,Groq 可每秒产生约247 个token,而微软Azure 则是每秒产生约18 个,因此如果ChatGPT 是在Groq 上运行生成的速度能大幅提升13 倍。

LPU 是什么?

Groq 是在2016 年由Jonathan Ross 创立而成,他过去研发出Google 第一款TPU,在Groq 他和团队打造出一种新AI 晶片「LPU」(Language Processing Unit),是专门用于AI 推论的晶片,据称速度更胜NVIDIA 的GPU。

根据知名电子报作者Ben Thompson 说明,Groq 晶片采用的是静态随机存取记忆体(SRAM),而不是GPU 上常见的HBM 或电脑常用的DRAM 记忆体,后两者都需要时常刷新,导致资料储存位置有不确定性,反观SRAM 资料可以恒常状态储存,Groq 因此能掌握每份资料的位置,加快运算速度。

Thompson 进一步指出,在Transformer 模型上跑推论相当合适,其运算方式也是采确定性的,像GPT-4 就适合在Groq 编译器上运行。

Groq 的优势在于速度够快,这让AI 对话再向人类沟通靠近一步,Ross 在CNN 的采访中让主持人与Groq 用语音对话,展现其速度是可以在新闻直播中沟通。

要体验Groq 可以上到网站:https://groq.com/,选择想要的AI 模型后即可进行问答。据实测,生成中文的速度也的确与社群上广传的影片一样快速。

不过要注意的是,目前LPU 的应用只限语言模型的推理运作上,如果要用于训练,还是需要GPU。

本文来自INSIDE,经授权后发布,本文观点不代表沙鸥科报立场,转载请联系原作者。

相关文章

  • OpenAI再现黑科技!发布文字生影片AI“Sora”

    OpenAI今天正式发表文字转影片生成式AI「Sora」!就跟DALL-E一样,只要给出文字叙述(或静态图片也可以),Sora可以自动生成1080p动画,各种不同的角色、动作类型和背景细节全方位配件生成! 经过,Sora 可以生成各…

    2024-02-16
  • MIT研究人员找到新方法提升聊天机器人性能

    研究人员发现了一种新的方法,能显著提高像ChatGPT一样的大型语言模型的性能。当人工智能与人之间持续对话时,这些模型常常会出现故障,导致性能急剧下降。研究人员发现,这个问题出在语言模型处理过往“记忆”的方式…

    2024-02-18
  • Google发布新一代 AI 模型Gemma

    Google于2月21日,发布了新一代人工智能 (AI) 模型系列 Gemma,旨在为 AI 领域的研究和开发提供更先进、更易于使用的工具。Gemma 提供了两种参数规模的模型:2B 和 7B。 这两个模型都展现出了各自规模内的顶尖性能…

    2024-02-22
  • 科学家成功研发能自行学习的「人工突触」

    人工智慧(AI)的发展,很大程度上都是基于模仿人类大脑的功能。在资讯科学的领域内,这些AI 系统称为人工神经网路(artificial neural network),利用演算法模拟大脑神经运作,能分析数据,学习识别语言和图像。 …

    2017-05-07
  • Chat With RTX将支持Gemma

    Google 近期推出开放式模型Gemma,NVIDIA 亦宣布与 Google 展开合作,包括关系:在所有 NVIDIA AI 平台上(包括本地端 RTX AI PC、云端、数据中心)针对 Gemma 进行最佳化。同时,NVIDIA 自家Chat With RTX也…

    2024-02-24
  • 儿童学习经验对提高人工智能模型学习效率的启示

    AI 能将物体和单词配对的结果,显示了语言中某些部分是可透过少量的经验来学习,不需要某种先天性的能力,团队中的一名心理学家表示这样的结果「动摇了我的世界观」。 生成式AI 的训练资料集是众所皆知的庞大,有时…

    2024-02-08