(原标题:比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”寰球最快AI推默契决决议) 智通财经APP获悉,东谈主工智能初创公司Cerebras当天告示推出Cerebras Inference,据称是宇宙上最快的东谈主工智能推默契决决议。该公司示意:“Cerebras Inference为Llama 3.18B每秒提供1800个token,为Llama 3.170B每秒提供450个token,比基于英伟达(NVDA.US)GPU的超大领域云快20倍。” Cerebras In

让建站和SEO变得简单

让不懂建站的用户快速建站,让会建站的提高建站效率!

比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”寰球最快AI推默契决决议

(原标题:比英伟达(NVDA.US)GPU快20倍! Cerebras“出炉”寰球最快AI推默契决决议)

智通财经APP获悉,东谈主工智能初创公司Cerebras当天告示推出Cerebras Inference,据称是宇宙上最快的东谈主工智能推默契决决议。该公司示意:“Cerebras Inference为Llama 3.18B每秒提供1800个token,为Llama 3.170B每秒提供450个token,比基于英伟达(NVDA.US)GPU的超大领域云快20倍。”

Cerebras Inference由第三代晶圆级引擎(WaferScaleEngine)提供能源,同期由于摈斥了内存带宽拦阻,速率更快。Cerebras称其GPU处理决议的推理资本是微软Azure云筹画平台的三分之一,而使用的功率是微软Azure云筹画平台的六分之一。

该公司示意:“Cerebras通过制造宇宙上最大的芯片,并将扫数模子存储在芯片上,处理了内存带宽瓶颈。”“凭借咱们特有的晶圆级想象,咱们不祥在单个芯片上集成44GB的SRAM,从而摈斥了对外部存储器和聚合外部存储器和筹画机的慢速通谈的需求。”

提供东谈主工智能模子独处分析的东谈主工智能分析公司(Artificial Analysis)斡旋创举东谈主兼首席施行官MicahHill-Smith示意:“Cerebras在东谈主工智能推理基准方面处于最先地位。Cerebras为Meta的Llama3.18B和70BAI模子提供的速率比基于GPU的处理决议快一个数目级。咱们在Llama3.18B上测量的速率特出每秒1800个输出token,在Llama3.170B上测量的速率特出每秒446个输出token,这是这些基准测试中的新记载。”

他称,“凭借推至性能前沿的速率和具有竞争力的价钱,一鼎盈优配Cerebras Inference对具有及时或大容量需求的东谈主工智能诓骗活动的建造东谈主员相配有眩惑力。”

值得一提的是,这可能会在扫数东谈主工智能生态系统中产生四百四病。跟着推理变得更快、更高效,建造东谈主员将不祥冲破东谈主工智能的极限。仍是因硬件驱散而受阻的诓骗活动现时可能会茁壮发展,并引发出此前被判定为不行能的改革。不外, J. Gold Associates 分析师杰克·戈尔德 (Jack Gold) 也建议,“但在咱们得回更具体的履行基准和大领域运营之前,现时预料它到底有多优胜还为时过早。”

本月早些时辰,Cerebras提交了初次公开募股(IPO)苦求,瞻望将于本年下半年上市。该公司最近还任命了两名新的董事会成员:曾在IBM(IBM.US)、英特尔(INTC.US)和西班牙电信(TEF.US)担任高管的格伦达•多查克;以及VMware和Proofpoint前首席财务官保罗·奥维尔(Paul Auvil)。

这家初创公司还进取市迈出了遑急的一步,本月早些时辰聘用鲍勃•科明(Bob Komin)担任首席财务官。Komin曾在Sunrun担任首席财务官,教唆了该公司的IPO历程。他还曾在被雅虎收购的Flurry和被微软(MSFT,US)收购的TellmeNetworks担任CFO。

Cerebras首席施行官兼斡旋创举东谈主AndrewFeldman说,“鲍勃在他的劳动生计中一直是一个要害的运营教唆者,在几家公司担任创业高管,这些公司发明了要紧的工夫和贸易花式改革,并速即成长为行业教唆者。他在成恒久和上市公司的财务教唆方面的丰富教养对Cerebras来说口角常难得的。”



上一篇:2024年8月26日江苏苏州南环桥农副居品批发商场价钱行情    下一篇:工商银行刊行2亿元同行存单,刊行收益率1.94%    


Powered by 一鼎盈优配 @2013-2022 RSS地图 HTML地图

建站@kebiseo; 2013-2024 万生优配app下载官网 版权所有