阿里平头哥首款AI芯片发布 刷新全球推理性能最高纪录

2019年9月25日      来源: 对面资讯

阿里平头哥首款AI芯片发布 刷新全球推理性能最高纪录

阿里第一颗芯片诞生!

刚刚,云栖大会现场,阿里巴巴集团CTO、达摩院院长张建锋向全场展示了含光800——阿里第一款AI芯片。

image

为了这款芯片,阿里一年前放下狠话,但谁也没想到一年后即亮相:不仅完成流片,还已在阿里云上正式上线。

这也是阿里平头哥成立以来首款硬件产品,是阿里20年发展史上首款自主研发、流片量产的芯片。

在芯片行业时代变革转关之际,阿里好风凭借力、快速取得突破,掌握下一阶段擂台主动权,意义和价值,或许将远超芯片本身。

不过发布现场,张建锋更想强调的是敬畏之心。

他说:“在全球芯片领域,阿里巴巴是一个新人,玄铁和含光800是平头哥的万里长征第一步,我们还有很长的路要走。”

image

含光800究竟如何?

含光之名,依然沿袭平头哥传统,取自神兵宝剑。

“含光”本是上古三大神剑之一,含而不露,光而不耀,正如含光芯片作用方式——无形却强劲的算力。

具体来说,这是一款云端AI芯片,主打推理,重点应用于视觉场景。

性能方面,打破现有AI芯片记录,性能及能效比全球第一。

芯片制程12nm,晶体管数量高达170亿个。

image

在业界标准的ResNet-50测试中,含光800推理性能达到78563 IPS,比目前业界最好的AI芯片性能高4倍。

能效比500 IPS/W,是第二名的3.3倍。

以数据横向对比,含光800展现性能,是英伟达最新T415倍,是应用最广的英伟达P4的46倍——超过去年设计之初吹下的“牛”。

目前,含光800已经率先在阿里内部多个业务场景开启大规模应用。

从视频图像识别、分类、搜索,到城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。

大会现场,张建锋展示了这款芯片的强大性能。

每天新增10亿商品图片的拍立淘商品库,使用含光800识别效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。

还有城市大脑。在城市大脑中实时处理杭州主城区交通视频,需要40颗传统GPU,延时为300ms,使用含光800仅需4颗,延时降至150ms。

阿里方面称,含光800会首先在阿里内部场景业务服役,同时含光800的AI云服务也正式上线,通过阿里云对外提供AI算力,但不会直接以芯片的形式对外售卖。

此前,阿里平头哥连战连捷,过去两个月已经发布了无剑SoC平台和玄铁处理器IP,“让天下没有难造的芯片”,帮助企业降低芯片设计门槛。

现在,作为首款硬件,也是最硬核产品,含光800依然承载平头哥之志,希望通过阿里云AI云服务,让企业随时随地可以享受高性能计算。

而且也意味着阿里平头哥成立一年来,走过了软件架构(处理器IP、SoC平台)到硬件流片的完整流程。

这是阿里造芯,标志性的“交作业”时刻。

NPU:芯片的iPhone时刻

首先,AI时代的专芯专用需求。

顾名思义,NPU——神经网络处理器就是专门处理深度神经网络算法的芯片,而深度神经网络算法,核心是模仿生物神经网络结构特点,并且最基本特征就是模仿大脑神经元之间传递模式,并对输入的信息进行快速处理。

然而传统通用处理器基于冯诺依曼结构,其存储和运算处理相互分离,如果处理深度神经网络,需要大量读写运行操作,会受到带宽限制,效率较低。

因此以含光800为代表的神经网络芯片,根据神经网络推理运算特征,会设计特定的硬件神经元、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

image

简而言之,专芯专用,效率更高、成本更低,相应效益也会更好。

而且另一方面,因为需求明确,应用场景有针对性,相比打造CPU和GPU,打造AI芯片的门槛要低很多。

于是整个行业都在来到一个“iPhone时刻”——软件重新定义硬件,场景需求重新定义芯片。

然后过程中最好还能与应用的业务场景结合,不断验证、反馈,迭代,最后在达到目标效果后流片、完成物理实现。

所以当今之势,不仅AI造芯初创公司形成小高潮,而且互联网巨头也纷纷跨界变硬,启动自主AI芯片打造。

但想不想造、有没有能力造,最后造的结果如何……完全是好几个层次,完全是综合实力的比拼。

这也就是为什么,阿里的业务场景优势,会给平头哥首款AI芯片带来加速,也是阿里手握新时代芯片竞争“天命”的原因。

平头哥下一步

在杭州云栖大会期间,也谈到了阿里芯片的下一步。

随着含光800发布,平头哥已集齐了全栈芯片家族:

基础单元处理器IP,C-Sky系列、玄铁系列,为AIoT终端芯片提供高性价比IP;

一站式芯片设计平台,无剑SoC平台集成CPU、GPU、NPU等,降低芯片设计门槛;

AI芯片,含光800通过AI云服务为AI场景提供高性能算力。

这三大产品系列,初步完成了平头哥端云一体的芯片生态。

而接下来,平头哥产品形态,重点将是云端AI训练芯片、端上推理芯片,以及用于阿里云神龙服务器的SoC专用芯片,以满足更多场景的算力需求。

此外,平头哥芯片初步软硬件闭环实现,阿里巴巴在芯片、云和AI三大业务之间的协同关系,也雏形初现。

从时代趋势而言,三者原本就是三位一体。

AI算法逐渐集成到芯片,集成算法的专用芯片能为云服务提供了更强的性能,而云计算本身则加速了AI应用的大规模落地。

在此次云栖大会,基于RISC-V架构的玄铁处理器、以及无剑SoC平台也有开发者案例——如人工智能独角兽云天励飞、老牌芯片商炬芯科技,以及可重构计算芯片领军企业清微智能,都将现场亮相。

(本文有删减)

x
扫码关注公众号
总编邮箱
lian@dtface.com