阿里首款AI芯片含光800重磅发布全球最强AI推理芯片如何练成?
- 2026-05-01 18:50:00
- aiadmin 原创
- 18
上周,平头哥以产物定名猜念为话题预告本周将揭晓重磅新品。2019年杭州云栖大会上,阿里巴巴集团首席技艺官兼阿里云智能总裁张筑锋揭晓了阿里的首款AI芯片含光800,该芯片是一款云端AI芯片,也是环球最高功能的AI推理芯片。含光800首要操纵于视觉场景,依然正在阿里巴巴集团内众个场景大周围操纵,其它企业可能通过阿里云获取含光NPU的算力。

据悉,含光为上古三大神剑之一,该剑含而不露,光而不耀,正如含光800带来的无形却强劲的算力。
依照张筑锋的说法,正在业界圭臬的ResNet-50测试中,含光800推理功能到达78563 IPS,比目前业界最好的AI芯片功能高4倍;能效比500 IPS/W,是第二名的3.3倍。

含光800不单Resnet50的成就粉碎记载,从计划到商用的速率也很疾。张筑锋外现,平头哥用概略一年半的时期实行了含光800从计划到商用。雷锋网知道到,平头哥用7个月实现了前端计划,之后用3个月就告成流片。仅建立一年的平头哥半导体为何这么疾就能计划出云端AI芯片?
要大白,芯片举动规范的长周期产物,念加快芯片的商用,正在硬件和软件方面都须要有很强的势力,极度是正在AI时间,软硬一体化的紧急性越发突显。平头哥就得益于阿里正在软硬件方面的蕴蓄堆积,算法方面,阿里巴巴达摩院呆板智能实践室过去两年修筑了完全的算法编制,涵盖语音智能、说话技艺、呆板视觉、计划智能等目标,而且博得众个天下领先程度的结果;硬件方面,阿里巴巴此前已正在效劳器、FPGA以及存储等周围具有众年研发经历,别的,平头哥团队正在编制组织、编译技艺等周围具有深重的技艺贮备。

含光800功能的冲破得益于软硬件的协同立异,芯片架构方面,含光800采用立异的架构,针对深度进修中利用的大方权重参数和张量数据,正在支撑零落压缩与量化惩罚的根本上,通过特别计划的数据访存与流水线惩罚技艺,大大减低了I/O需乞降数据的搬移。NPU同时深度优化了卷积,矩阵乘,向量揣度和各样激活函数,通过高有用的硬件资源安排和全并行的数据流惩罚,把AI运算的功能和能效都推向极致。
个中,功能的晋升务必处理内存墙题目。所谓的内存墙,是指采用采用冯诺依曼组织的惩罚器,存储和运算惩罚星散,当举办深度神经搜集惩罚时,算力取得了晋升,但大方读写运转操作会受到带宽束缚,芯片的全体功能晋升也同时受到束缚。
平头哥的做法是通过自研架构大幅淘汰对内存的探访,正在保障功能的环境下,把芯片功耗降到最低程度。详细而言,含光800会依照神经搜集推理运算特质,计划特定的硬件、高速贯穿的存储组织以及专用指令集,对内存和揣度单位实行高效结构约束,实行单条指令实现众个操作,普及揣度效能和内存探访效能。

阿里首款AI芯片揭晓之后,其从云端到终端的产物组织依然异常明了。这些产物也都稠密正在迩来几个月揭晓,本年7月的阿里云上海峰会上,阿里巴巴集团副总裁戚肖宁揭晓了高功能RISC-V架构惩罚器玄铁910。玄铁910集成16个主题,主频2.5GHz,采用12级乱序流水线MB二级缓存,搭载AI巩固的向量揣度引擎,可用正在人工智能加快器、搜集通讯和主动驾驶等周围。现场揭晓的数据显示,玄铁910较业界主流芯片功能普及40%,较圭臬指令功能跨过20%。
8月,平头哥又揭晓SoC芯片平台“无剑”,无剑平台由SoC架构、惩罚器、各种IP、操作体例、软件驱动和斥地器材等模块组成,面向AIoT供给的集芯片架构、根本软件、算法与斥地器材于一体的全体处理计划。依照官方的说法,无剑不妨助助芯片计划企业将计划本钱低落50%,计划周期压缩50%。
须要指出,7月揭晓的玄铁910是根本单位惩罚器IP,无剑是芯片计划平台,因而含光800是阿里的首款AI芯片。这也意味着,阿里的C-Sky系列、玄铁系列AIoT终端芯片IP,一站式芯片计划平台无剑,以及最新揭晓的云端AI芯片修筑了阿里端云一体的芯片生态,平头哥端云一体全栈芯片产物家族雏形已现。
更值得合切的是,端侧的7款C-Sky系列嵌入式CPU IP核已取得大周围量产验证,授权客户超100家,累计出售超十亿颗,操纵于呆板视觉、工业担任、车载终端、转移通讯和消息安然等周围。
RISC-V架构的玄铁惩罚器以及无剑SoC平台也已有客户,包罗人工智能企业云天励飞、老牌芯片公司炬芯科技等。
含光800也依然实行了大周围操纵,操纵于阿里巴巴集团内众个场景,比如视频图像识别/分类/寻求、都邑大脑等,改日还可操纵于医疗影像、主动驾驶等周围。同时,阿里云举动环球前三的云效劳供给商,含光的才具将通过云效劳对外供给。张筑锋现场布告,基于含光800的AI云效劳也正式上线。

不单如斯,平头哥还正在研发用于阿里云神龙效劳器的SoC专用芯片。改日,阿里还将进一步完好产物形式,推出包罗云端AI陶冶芯片和终端AI推理芯片,餍足更众场景的算力需。
阿里从云端到终端AI芯片的组织依然明了,而且也依然有不少客户,这是否意味改日阿里不单不须要置备芯片,还可以替换其它芯片公司?谜底是否认的。正在这一轮的AI海潮中,咱们看到无论是外洋的谷歌、Amazon、Facebook仍是邦内的阿里,这些强于软件的科技巨头们都正在主动研发AI芯片。

至于个中的源由,Cadence首席实行官、华登邦际创始人陈立武此前接收雷锋网采访时外现:“科技巨头主动组织AI是由于他们不期望掉队,由于他们都有大方的数据。当然,科技公司首先做芯片并不料味着古板的芯片厂商会被代替,科技公司期望正在极少操纵上用自立研发的芯片来晋升效能。”

毕竟也确实如斯,就拿阿里来说,其交易横跨电商、金融、物流、云揣度、大数据、环球化等场景,用户周围重大,对算力的需求更高,挑拨也更大。古板CPU、GPU和FPGA难以餍足整个需求,而且面对本钱和功耗挑拨。定制化的ASIC芯片不妨实行更高的功能同时兼具更低功耗,是以科技巨头们基于对本身交易和需求的知道,纷纷首先自立研发AI芯片,期望正在仍旧领先性的同时,低落全体揣度本钱。
从环球畛域看,谷歌TPU是环球科技企业从软变硬的代外。此次含光800的揭晓及商用,解释阿里的上风也不再只是正在软件周围,正在AI芯片的加持下,改日阿里的上风也将是软硬一体的上风。
为了实行这一倾向,阿里几年前就首先了组织。2017年云栖大会上,阿里建立达摩院,这是阿里正在环球众点设立的科研机构,存身根本科学、推倒性技艺和操纵技艺的商量。达摩院由环球创办的自立商量中央、高校说合实践室,环球绽放商量方针三大片面构成,涵盖量子揣度、呆板进修、根本算法、搜集安然、视觉揣度、自然说话惩罚、下一代人机交互、芯片技艺、传感器技艺、嵌入式体例等,涵盖呆板智能、智联网、金融科技等众个家产周围。

平头哥取得达摩院和阿里云的软势力加持,基于达摩院的算法才具,本事粉碎了算法和硬件之间的范围,基于阿里云飞天云平台的上风,得以迅疾造成了端云一体芯片生态。
而今,阿里自立研发芯片的倾向也依然片面杀青。依照云栖大会的现场演示,正在都邑大脑中及时惩罚杭州主城区交通视频,须要40颗古板GPU,延时为300ms,利用含光800仅需4颗,延时降至150ms。拍立淘商品库每天新增10亿商品图片,利用古板GPU算力识别须要1小时,利用含光800后可缩减至5分钟。

明白,平头哥的方针并非是卖芯片,平头哥还会延续了母体阿里巴巴集团“让天地没有难做生意”的愿景,诱导了全新的贸易形式,即平头哥形式(以无剑平台为主题),为企业供给普惠算力。

另据先容,针对AIoT市集有强操纵驱动和场景碎片化等特性,芯片公司服从古板的体例计划芯片很难去符合改日的需求,平头哥期望通过端云一体芯片生态为各行业供给普惠算力。
张筑锋说:“正在环球芯片周围,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,咱们尚有很长的道要走。”

举动科技巨头,阿里此前越发擅长软件,而且具有大方的数据。正在正正在到来的以数据为中央的时间,不妨借助AI更疾发掘出数据的代价将成为科技巨头们不断仍旧领先上风的症结之一。是以,无论是外洋仍是邦内,科技巨头们纷纷首先参加宏伟的资源进入技艺、资金、人才都极端稠密的芯片家产,阿里首款AI芯片的推出,意味着阿里依然不再只擅长软件,正在其普及的操纵场景需求的支持下,阿里将不妨实行硬件的迅疾迭代的完好,正在云端和终端进一步开释出软硬纠合的上风。
| 联系人: | 王先生 |
|---|---|
| 电话: | 15640228768 |
| 微信: | 1735252255 |
| 地址: | 沈阳市铁西区兴华南街58-6号 |
-
思陌产品
深度学习系统产品介绍 -
使用帮助
使用手册 -
关于我们
公司简介 -
资讯反馈
交流论坛 -
联系我们
Tel 15640228768 QQ/WX技术支持 1735252255