EN
long8-龙8(国际)唯一官方网站- 全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限
2026-04-06 19:08:21


导语:进步前辈制程再也不是芯片机能晋升的最优解。

雷峰网(公家号:雷峰网)动静,本周四,总部位在英国的AI芯片公司Graphcore发布了新一代IPU产物Bow,这是其第三代IPU体系,发布即面向客户发货。与上一代IPU比拟,Bow IPU机能晋升40% ,能耗比晋升了16%,电源效率也晋升16%。

值患上留意的是,这一次Bow IPU的机能晋升并不是重要依靠采用更进步前辈的制程,Bow IPU采用了及上一代IPU不异的台积电 7nm,经由过程采用及台积电配合开发的进步前辈硅晶圆重叠技能(3D Wafer-on-Wafer)到达机能及能耗比的晋升。

Bow作为世界首款3D WoW处置惩罚器,证实了芯片机能晋升的范式从进步前辈制程向进步前辈封装转移的可行性。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

新一代 IPU 机能晋升40%,价格连结稳定

2016年,Graphcore建立并创始了全新类型处置惩罚器架构IPU,因其于架构上的立异曾经被英国半导体之父Hermann Hauser称之为是计较机汗青上的第三次革命。

履历6年时间的成长,Graphcore的IPU逐渐于于金融、医疗、电信、呆板人、云及互联网等范畴取患上成效。本周四,Graphcore又推出了第三代产物Bow IPU。

据Graphcore先容,第三代IPU相对于在上一代M2000,机能提高40%,每一瓦机能晋升16%,即能耗比实现16%的晋升。不外,AI芯片的真实机能还有需要放于差别的运用范畴中会商。为此,Graphcore也给出了于差别垂直范畴中Bow的机能体现。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

于图象方面,不管是典型的CNN收集,还有是近期比力热点的Vision Transformer收集,以和深条理的文本到图片的收集,与上一代产物比拟,Bow IPU都有30%到40%的机能晋升,于EfficientNet-B4这一项中,靠近理论上限值。

BERT练习模子是天然语言方面的经典模子,基在BERT,OpenAI提出了GPT-一、GPT-二、GPT-3等纵向扩大或者横向扩大,经由过程更深的收集条理及更宽的收集宽度让模子的机能及精度进一步提高。

“咱们可以看到,这些模子于咱们最新的硬件形态上都有很年夜的机能晋升。”Graphcore中国工程副总裁、AI算法科学家金琛先容道。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

不仅云云,转换到现实模子中的吞吐量,与IPU POD64比拟,于计较机视觉的ResNet50 及 EifficientNet-B4 练习模子中,Bow Pod64的吞吐量可以或许到达34%及39%的机能晋升。天然语言方面, BERT-Large Ph1 预练习模子及语音辨认Conformer Large 练习模子,后者都有36%的吞吐量晋升。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

作为英伟达的竞争敌手,Graphcore天然不忘将 Bow Pod16 与DGX-A100举行对于比,试验数据注解,EfficientNet-B4的backbone的练习于DGX-A100上需要破费70个小时的练习时间,而于Bow Pod16上,只需要14小时摆布。

靠近理论极限的机能晋升,Graphcore Bow IPU是怎样实现的?

5nm再也不是首选,采用进步前辈封装性价比更高

从芯片的规格上看,Bow IPU是世界上第一款基在台积电的 3D Wafer-On-Wafer的处置惩罚器,单个封装中拥有跨越600亿个晶体管,具备350 TeraFLOPS的人工智能计较的机能,是上一代MK2 IPU的1.4倍。片内存储较上一代来看没有变化,依然连结0.9GB的容量,不外吞吐量从47.5TB提高到了65TB。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

“变化重要表现于,它是一个3D封装的处置惩罚器,晶体管的范围有所增长,算力及吞吐量均获得晋升。” Graphcore年夜中华区总裁兼全世界首席营收官卢涛说道。而于各人都存眷的工艺制程上,Bow IPU 延续了上一代台积电 7nm 工艺制程,没有变化。

理论上,一颗芯片的机能晋升很年夜水平上取决在工艺制程上的前进,但跟着工艺制程愈来愈迫近物理极限,摩尔定律逐渐掉效,业界不能不寻觅新的技能标的目的来延续摩尔定律。此中,3D封装就是被业界广泛看好的技能标的目的。

中国工程院院士、浙江年夜学微纳电子学院院长吴汉明就曾经于一次演讲中提到,假如将芯片制造及芯片封装相联合,也能够做到65nm工艺制程实现40nm工艺制程的机能功耗要求。

Bow IPU正好验证了吴院士的不雅点。

卢涛暗示,Bow IPU产物机能的晋升重要来历在3D WoW及新增的Die。

至在为什么选择转变封装方式而不是更进步前辈的工艺,卢涛则暗示MK2 IPU有594亿个晶体管,年夜概823平方毫米,已经经是7nm单个Die可以或许出产的最周详的芯片。

“咱们评估从7nm、5nm,到3nm等差别工艺节点的收益时发明,从7nm到5nm的出产工艺晋升所带来的收益不像之前从28nm到14nm同样,可以或许带来百分之几十的收益,而是降到了20%。这时候候咱们可以经由过程另外手腕及要领得到一样的收益。”

经由过程3D重叠的方式,Bow IPU的两个Die增长了晶体管的数目,此中一个Die(Colossus Die)及上一代同样,另外一个Die重要用在提高跨Colossus Die的电源功率传输,优化Colossus Die的操作节点,从而转化为有用的时钟加快。

于同台积电的互助方面,卢涛告诉雷峰网,Graphcore于一年以前就同台积电互助了一颗测试芯片,与台积电的瓜葛很是慎密,加之AI处置惩罚器自己范围较年夜,需要一些新技能撑持落地,而从台积电的角度而言,新的技能也需要有需求的产物配合推进。

值患上一提的是,虽然封装方式有所变化,但Bow IPU开箱即用,与前一代产物百分之百软件兼容,不消修改任何代码,老用户无需做任何软件适配事情就能得到机能晋升,价格连结稳定。

今朝,美国国度试验室Pacific Northwest已经经基在Bow IPU测验考试做一些基在Transformer的模子以和图神经收集,面向计较化学及收集安全方面的运用,且给出了比力正面的反馈。

延续3D封装,开发逾越人脑的超等智能呆板

Bow IPU利用3D封装只是出发点,面向将来,Graphcore正于开发一款可以用来逾越人脑处置惩罚的超等智能呆板。

Graphcore将这款正于研发的产物定名为Good Computer,一方面但愿计较性能够为这个世界带来正面的影响,另外一方面致敬闻名计较机科学家Good。

全球首款3D晶圆级封装处理器IPU发布,突破7nm制程极限

基在3D WoW,估计将来Good Computer将包罗8192个IPU,提供跨越10 Exa-Flops的AI算力,实现4 PB的存储,可以助力跨越500万亿参数范围的人工智能模子的开发。

取决在差别的配置,Good Computer价格将于100万美元到1.5亿美元之间。

卢涛暗示,开发Good Computer还有是会沿用IPU的系统布局,IPU的存储是于处置惩罚器内里,虽然不叫类脑、内存计较或者存算一体,但从某种水平上而言,IPU的运作机理靠近年夜脑计较的事情道理,只是把计较及存储相联合。

别的,Graphcore也将从软件方面更有用撑持稀少化以到达类脑的计较量。

雷峰网

相干文章:

不是GPU的IPU,为何更值患上英伟达警惕?

逾越全世界最年夜7nm芯片A100!Graphcore第二代IPU晶体管数目高达594亿个

直击CPU、GPU弱项!第三类AI处置惩罚器IPU正于突起

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

-long8-龙8(国际)唯一官方网站

万物互联 long8-龙8智造