LPU:比NVIDIA GPU 更快的AI芯片

这个「Groq」不是马斯克的「Grok」!AI 晶片公司Groq 称创造了「世界上最快的大型语言模型速度」,在社群上示范的影片因极快的生成速度(1 秒内就生成数百字的回覆)而引发关注和讨论。

LPU:比NVIDIA GPU 更快的AI芯片

Groq 其实并非一款全新AI 模型,而是一种「LPU 推论引擎」,等同用自家晶片来运行其他开源模型(包括Mixtral 8x7b、Llama 2 70B)的AI 语言介面,如同其他聊天机器人Groq 也能生成创意文字、翻译内容、回覆问题等

根据Artificial Analysis 针对AI host 的评比数据,Groq 可每秒产生约247 个token,而微软Azure 则是每秒产生约18 个,因此如果ChatGPT 是在Groq 上运行生成的速度能大幅提升13 倍。

LPU 是什么?

Groq 是在2016 年由Jonathan Ross 创立而成,他过去研发出Google 第一款TPU,在Groq 他和团队打造出一种新AI 晶片「LPU」(Language Processing Unit),是专门用于AI 推论的晶片,据称速度更胜NVIDIA 的GPU。

根据知名电子报作者Ben Thompson 说明,Groq 晶片采用的是静态随机存取记忆体(SRAM),而不是GPU 上常见的HBM 或电脑常用的DRAM 记忆体,后两者都需要时常刷新,导致资料储存位置有不确定性,反观SRAM 资料可以恒常状态储存,Groq 因此能掌握每份资料的位置,加快运算速度。

Thompson 进一步指出,在Transformer 模型上跑推论相当合适,其运算方式也是采确定性的,像GPT-4 就适合在Groq 编译器上运行。

Groq 的优势在于速度够快,这让AI 对话再向人类沟通靠近一步,Ross 在CNN 的采访中让主持人与Groq 用语音对话,展现其速度是可以在新闻直播中沟通。

要体验Groq 可以上到网站:https://groq.com/,选择想要的AI 模型后即可进行问答。据实测,生成中文的速度也的确与社群上广传的影片一样快速。

不过要注意的是,目前LPU 的应用只限语言模型的推理运作上,如果要用于训练,还是需要GPU。

本文来自INSIDE,经授权后发布,本文观点不代表沙鸥科报立场,转载请联系原作者。

相关文章

  • 即使戴着面具最新的人工智能技术也能识别

    供图:John Powell/REX/Shutterstock 放弃戴帽子和围巾吧!别指望他们!他们欺骗不了任何人!最新的面部识别软件可以看穿你狡猾的伪装,即使你戴着面具也能识别你。 剑桥大学的Amarjot Singh和他的同事们训练了机器…

    2017-09-10
  • 人工智能助力寻找超级细菌的抗生素

    这也是人类史上第一次在未使用任何预先人为设定下,仅仅使用AI 就发现新抗生素的创举

    2020-02-25
  • AI 决策更具理性 , 但是否更正确呢 ?

    还记得在准备大学入学面试时,老师总会警告:「记得千万不要搞怪!」不要搞怪的意思很简单,将五颜六色的头发染回黑色,或将时下流行的潮T改回西装,总之去回想想阿嬷的乖孙该长怎样,面试那天打扮成那样就对了!如果今天面试官从人类换成无法被窥见喜怒哀乐的 AI ,那又该如何成功达阵呢?

    2020-02-12
  • 用科技保护环境!AI 可侦测亚马逊雨林生态中非法道路的增减

    根据Inside Science报导,总部位于巴西的非营利环境保育组织Imazon在绘制亚马逊雨林生态圈里的人工道路时,发现绘制范围含420万平方公里的官方地图上,仅显示联邦与地方政府所建造的道路,并未包含实际上的所有人工…

    2021-01-12
  • 科学家成功研发能自行学习的「人工突触」

    人工智慧(AI)的发展,很大程度上都是基于模仿人类大脑的功能。在资讯科学的领域内,这些AI 系统称为人工神经网路(artificial neural network),利用演算法模拟大脑神经运作,能分析数据,学习识别语言和图像。 …

    2017-05-07
  • Google发布新一代 AI 模型Gemma

    Google于2月21日,发布了新一代人工智能 (AI) 模型系列 Gemma,旨在为 AI 领域的研究和开发提供更先进、更易于使用的工具。Gemma 提供了两种参数规模的模型:2B 和 7B。 这两个模型都展现出了各自规模内的顶尖性能…

    2024-02-22