LPU:比NVIDIA GPU 更快的AI芯片

这个「Groq」不是马斯克的「Grok」!AI 晶片公司Groq 称创造了「世界上最快的大型语言模型速度」,在社群上示范的影片因极快的生成速度(1 秒内就生成数百字的回覆)而引发关注和讨论。

LPU:比NVIDIA GPU 更快的AI芯片

Groq 其实并非一款全新AI 模型,而是一种「LPU 推论引擎」,等同用自家晶片来运行其他开源模型(包括Mixtral 8x7b、Llama 2 70B)的AI 语言介面,如同其他聊天机器人Groq 也能生成创意文字、翻译内容、回覆问题等

根据Artificial Analysis 针对AI host 的评比数据,Groq 可每秒产生约247 个token,而微软Azure 则是每秒产生约18 个,因此如果ChatGPT 是在Groq 上运行生成的速度能大幅提升13 倍。

LPU 是什么?

Groq 是在2016 年由Jonathan Ross 创立而成,他过去研发出Google 第一款TPU,在Groq 他和团队打造出一种新AI 晶片「LPU」(Language Processing Unit),是专门用于AI 推论的晶片,据称速度更胜NVIDIA 的GPU。

根据知名电子报作者Ben Thompson 说明,Groq 晶片采用的是静态随机存取记忆体(SRAM),而不是GPU 上常见的HBM 或电脑常用的DRAM 记忆体,后两者都需要时常刷新,导致资料储存位置有不确定性,反观SRAM 资料可以恒常状态储存,Groq 因此能掌握每份资料的位置,加快运算速度。

Thompson 进一步指出,在Transformer 模型上跑推论相当合适,其运算方式也是采确定性的,像GPT-4 就适合在Groq 编译器上运行。

Groq 的优势在于速度够快,这让AI 对话再向人类沟通靠近一步,Ross 在CNN 的采访中让主持人与Groq 用语音对话,展现其速度是可以在新闻直播中沟通。

要体验Groq 可以上到网站:https://groq.com/,选择想要的AI 模型后即可进行问答。据实测,生成中文的速度也的确与社群上广传的影片一样快速。

不过要注意的是,目前LPU 的应用只限语言模型的推理运作上,如果要用于训练,还是需要GPU。

本文来自INSIDE,经授权后发布,本文观点不代表沙鸥科报立场,转载请联系原作者。

相关文章

  • Google “延时摄影” 影像

    近日Google Earth利用其海量的卫星影像数据,制作并发布地球在过去32年(1984-2016)的“延时摄影” 影像,每一年选取一张无云覆盖的卫星图像。 其实早在2013年Google即与TIME合作,制作了部分地区1984-2012年代延时…

    2016-12-08 图解世界
  • Google发布AI模型Gemini

    2月8日晚间,Google发布了新的AI模型免费版Gemini和收费版的Gemini Advanced,并上线了新的网站和Android移动APP。 Gemini 的前身是Bard,Bard 是 Google AI 开发的大型语言模型 (LLM),于 2023 年 2 月 6 日首次发…

    2024-02-09
  • Google发布新一代 AI 模型Gemma

    Google于2月21日,发布了新一代人工智能 (AI) 模型系列 Gemma,旨在为 AI 领域的研究和开发提供更先进、更易于使用的工具。Gemma 提供了两种参数规模的模型:2B 和 7B。 这两个模型都展现出了各自规模内的顶尖性能…

    2024-02-22
  • 用科技保护环境!AI 可侦测亚马逊雨林生态中非法道路的增减

    根据Inside Science报导,总部位于巴西的非营利环境保育组织Imazon在绘制亚马逊雨林生态圈里的人工道路时,发现绘制范围含420万平方公里的官方地图上,仅显示联邦与地方政府所建造的道路,并未包含实际上的所有人工…

    2021-01-12
  • 人工智能识别死海古卷并非出自一人之手

    大部份的死海古卷(Dead Sea Scrolls)都没有署名,所以无法知道是由哪位抄写员誊写的,而且学者也很难根据字迹的特徵辨认某份手稿是由一位,还是多位抄写员完成。但是,根据《PLOS ONE》期刊最新发表的文章,大以…

    2021-05-05
  • 人工智能游戏升级: 计算机打败围棋大师

    (编译: LinkSea) 2016年,人工智能AlphaGo与世界排名第二的职业围棋手经过五局厮杀,最终获胜。这已经不是人工智能计算机第一次打败人类。20年以前,IBM“深蓝”在象棋比赛中首次打败Garry Kasparov。下一年,“深蓝…

    2017-01-06