展会信息港展会大全

起底华为计算战略:十五年研发下苦功,三年连发10芯加速
来源:互联网   发布日期:2019-09-19   浏览:105次  

导读:乾明发自上海 量子位报道公众号 QbitAI 每一次华为新动作,点赞有之,质疑亦随之。 9 月 18 日刚在全联接大会上发布的 全球最快 AI 产品 就是这样。 但在现场、在华为内部来看,这只不过是 华为计算战略 艰苦奋斗的开花结果,只是这盘芯片和计算 ......

乾明发自上海

量子位报道公众号 QbitAI

每一次华为新动作,点赞有之,质疑亦随之。

9 月 18 日刚在全联接大会上发布的 全球最快 AI 产品 就是这样。

但在现场、在华为内部来看,这只不过是 华为计算战略 艰苦奋斗的开花结果,只是这盘芯片和计算力大棋局里关键一子。

华为 Cloud & AI 产品与服务总裁侯金龙

而且相比 Atlas(古希腊神话里的 大力神 ),实际不到三年时间里,华为已经发布了 10 款商用芯片:

鲲鹏 916、920;麒麟 970、980、810、990、990 5G;腾 310、910;鸿鹄 818。

按外泄的规划,接下来的两年内,至少有 6 款芯片发布落地。

无论是计算领域,还是半导体行业,如此阵仗,势头都异常猛烈。

所以背后原因究竟是什么?华为又究竟想做什么?

计算战略发布后,是时候对这盘大棋来次完整起底,揭秘华为在计算背后的种种规划与布局。

15 年苦功夫,目前投入 2 万名工程师

围绕计算这个产业投资,十几年前已经开始了。

其中最具标志性的事件是 2004 年 4 月,旗下芯片公司海思半导体成立。

华为 Cloud & AI 产品与服务总裁侯金龙透露了这背后的投入:

从 2004 年开始投资研发第一颗嵌入式处理芯片,目前投入超过 2 万名工程师,形成了以 鲲鹏+腾 为核心的基础芯片族。

基础芯片族带来的意义非常直接。华为成为了业界唯一同时拥有计算架构中 CPU,NPU,存储控制,网络互连,智能管理 5 大关键芯片的厂商。

但俱往矣。

从产品发布的节奏来看,华为对芯片投资的力度还在快速加强,迭代也越来越快。

华为投资芯片的策略,此前也有曝光,总结起来就是三个关键词:量产一代、研发一代、规划一代。

以鲲鹏系列处理器为例,从 2007 年走到现在已历时 12 年,现在是第三代芯片。

现在华为释放出的最新信号是:鲲鹏+腾会长期演进,按照每年推出一代的节奏来提升竞争力。

这也是华为在不到 3 年内推出 10 款芯片的直接推动力量之一。

当然,上述种种努力和产品,只是果,细究 因 ,则是华为对于行业变迁趋势的核心判断。

华为芯的机会:趋势变迁下的 2 万亿市场

在华为看来,当前的计算产业正在发生深刻的变化,尤其是整个社会向智能时代的迈进,这带来了变革与挑战,也带来了机会。

全联接大会上,胡厚援引了 Gartner 的数据 全球计算产业总空间为两万亿美元。在他看来,这是一片大蓝海,华为将坚定在计算领域的投入,并推进落地。

侯金龙进一步阐释四大趋势,也可以说是华为投资芯片进入这一蓝海的主要切入点:

首先,数据中心不够用了

对于数据中心来说,以前其承担的职能更多的是存、但未来更重要的是算,数据中心正在逐步演变为计算中心。

最直接的体现就是,大规模数据中心中服务器越来越多。就以华为云的数据中心为例,有 60% 都是用于计算的服务器。

可以说,计算正在成为数据中心的主体,这就是华为推动鲲鹏系列芯片的重要原因之一,也是鲲鹏芯片的使用场景。

与此同时,整个行业对 AI 算力需求也越来越大,而且来得更加汹涌,从 2012 年到 2018 年,AI 算力消耗几乎增长了 30 万倍。

现在每年的增长超过 10 倍,到 2025 年,AI 算力将会占据数据中心算力的 80% 以上。

正是在如此算力需求下,华为推出了腾 910 以及 Altas 900 等 AI 计算产品。

其次,端边芯片与中心芯片还有大差距

在华为看来,Arm 在生态上的优势会逐渐向数据中心延伸。对于华为来说,这是挑战,也是机会。

现场,侯金龙也分享了一组数据:

2018 年,Arm 处理器出货量 230 亿片,主要用于端和边,数据中心侧只有 3000 万片,这是数百倍的差距。

每年十几亿部手机都是 Arm 结构的,2019 年华为智能手机总的算力,将是今年全球数据中心新增算力的 2 倍,而且手机上的几百万应用都是基于 Arm 生态。

以前基于 Arm 的技术,之所以不能在数据中心使用,核心的限制是性能。

但解决问题导向,华为现已找到对策。

其今年发布的鲲鹏 920 是兼容 Arm,多核、高并发,把四颗核心并入了一颗核心,其性能超过业内通用 CPU 20% 的性能。

而且现在的计算,可以让简单的计算在终端进行,复杂的计算可以在云上进。

如果继续用 X86 架构在云上计算终端的任务,效率就会降低 40%,反之如果运用 Arm 架构,则提升 40%。

第三,计算该绿

高性能的计算虽然更有效率,但背后也有大量的碳排放。

美国马萨诸塞大学阿姆赫斯特分校做过研究,训练一个单一 AI 模型,会产生 180 吨的碳排放。

这相当于普通汽车整个服役期排放量的 3 倍,平均地球人 30 年日常生活的碳排放。

算力与效率背后,也需要对能源与环境更友好。从芯片层面上来看,要在更小的功耗下实现更高的性能。

在这方面,华为的底气很足。

侯金龙说,华为的 Atlas 900 AI 训练集群,算力达到 256 PFLOPS 只需要 16 个机柜。

要实现这样的算力,如果用 CPU 需要 6195 个机柜, 用 GPU 需要 208 个机柜,而 NPU 如腾只要 128 个机柜。

这背后,主要归功于腾架构对深度学习业务的优化。

此外,经过华为系统级优化,如板级液冷、柜级密闭绝热等,整个集群的功耗从 4 万 kW 降到 736kW,降低 50 多倍。

最后,摩尔定律放缓已成事实

经过数十年的快速迭代发展,高速的摩尔定律已经难以实现。

过去 5 年,通用 CPU 的发展遇到了许多技术瓶颈,单核性能平均每年提升不足 10%,摩尔定律放缓已经成为事实。

想要进一步实现提高技术能力,在晶体管上打主意太难了,需要寻找其他路径。

这也是华为将基础研究作为整体计算战略关键组成部分的原因,最具代表性的成果,就是华为自研的达芬奇架构。

未来,华为的目标是通过一系列的技术创新,打破能效墙、打破散热墙、打破优化墙、 打破内存墙、打破高速 IO 墙,进一步释放计算潜能。

总之,在华为看来,计算产业已进入架构创新的黄金时代,充裕、高性能、多样性、绿色、触手可及 的算力将是智能社会发展的动力。

这需要更高性能的芯片做支撑,但仅仅依靠芯片还不够。

在整个华为计算战略中,芯片只是一部分。

解读华为计算战略:硬件开放与软件开源

整体来看,华为计算图景可以归为 一云两翼双引擎+开放的生态 。

其中一云,是华为云。

这是华为计算的核心输出途径 芯片不直接对外销售,以云服务和部件的形式面向客户,优先支持合作伙伴发展整机。

双引擎是指 鲲鹏 与 腾 。基于此打造芯片簇,构筑异构的计算,是华为计算战略的基础也是主要动力来源。

两翼则是智能计算业务、智能数据与存储业务,是计算的商业模式和直接应用场景。

开放的生态,则是整个华为计算战略的 点睛之笔 ,也是今年华为全联接大会的重头戏。

这一方面,主要分为硬件开放和软件开源两大部分,目标是使能广大的合作伙伴, 形成一个开放的产业生态。

硬件开放

如何落地?具体到商业模式上,是基于芯片等对外提供主板/SSD/网卡/RAID 卡/Atlas 模组和板卡,优先支持合作伙伴发展服务器和 PC 等计算产品,以及自己的品牌。

华为也在全联接大会上表示,其 TaiShan 服务器以及华为终端的 PC 机,聚焦做高端和内部配套,条件成熟时,将停止 TaiShan 服务器的销售业务。

在全联接大会上,除了 Altas,华为也发布了以下硬件新品:

鲲鹏主板,用于快速开发服务器和台式机产品。采用 xPU 高速互联、多合一 SoC、100GE 高速I/O等关键技术,不仅搭载鲲鹏处理器,还内置 BMC 芯片、BIOS 软件。与此同时,华为也将开放主板接口规范和设备管理规范。

通用服务器 TaiShan 系列,号称 最强算力 的通用服务器。具备至少 64 核、8 个内存通道、PCIe 4.0、多合一 SoC、xPU 高速互联、100GE 高速I/O等六个特征。

而且,面向数据中心分布式演进需求以及边缘计算需求,华为还提供了存储密集型、计算密集型、边缘计算等多款服务器产品。

Atlas 全系列产品,覆盖云、边、端全场景,面向训练和推理提供强劲算力。主要基于腾 910 和 310 AI 处理器,华为推出 Atlas 900、AI 训练服务器 Atlas 800、和 AI 训练卡 Atlas 300。

其中,Atlas 800 在 4U 空间集成了 8 颗腾 910 AI 处理器,可提供 2 PFLOPS 的超强算力,算力密度是业界同类产品的 2.5 倍,内置 32 个硬件解码器,每秒可完成 16384 张 1080P 图片解码,可以与训练并行处理。

8 个 Atlas 800 组成的机柜,内置 64 颗腾 910 芯片,Atlas 900 训练集群最少由 16 个机柜组成。

Atlas 300 可提供 256 TFLOPS 的算力,是当前业界主流训练卡的 2 倍,每秒训练的图片数量从 965 张提升到 1802 张。可实现梯度参数和数据集并行传输,最高可降低 70% 的梯度同步时延。

此外,华为也发布了 112 款基于鲲鹏和腾的云服务,包括 69 款基于鲲鹏的云服务和 43 款基于腾的云服务,让客户和合作伙伴们能更容易的获取鲲鹏和腾的算力。

华为介绍称,基于腾的图像搜索服务、内容审核服务,价格下调 70%。

软件开源

软件开源,与硬件开放相伴而生,是开放硬件能力的放大器。

继 8 月 23 日华为宣布开源 AI 计算框架 MindSpore、8 月 31 日放出方舟编译器框架代码之后,全联接大会上华为又放出多个软件开源计划:

2019 年 12 月 31 日开源服务器操作系统,2020 年 6 月开源可覆盖企业 70% 以上的数据库业务场景的 GaussDB OLTP 单机版数据库。

之后,华为将支持基于 openEuler 的合作伙伴发行商业版操作系统,支持各行业主流应用和软件开发商把软件和应用迁移到基于 openEuler 的操作系统上。

而且,华为也将与深之度、中标麒麟、天津麒麟、中移苏研、普华等伙伴计划联合推出 openEuler 开源社区 (http://openEuler.org)。

怎么理解华为有所为,有所不为?

伴随着华为计算战略的披露, 华为有所为,有所不为 也屡次被摆到台面上。

到底怎么理解华为有所为,有所不为?

侯金龙也进一步给出了解释,华为的聚焦点是重点投资计算架构创新,处理器的研发,以及华为云。

在这之外,华为不做应用,但免费支持主流应用和软件的迁移。

更能体现这一态度的是华为对开发者的支持。

侯金龙表示,开发者是产业的灵魂,未来 5 年培养 500 万开发者,将投入 15 亿美金用于发展产业生态。

那么,华为到底想要做什么?

胡厚也在采访中给出了答案:面向智能时代,华为想要做的是成为数字世界的 底座 。

如此愿景,你怎么看?

赞助本站

人工智能实验室

相关热词:

相关内容
AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港