Facebook透露为AI和VR打造硬件的原因

  次阅读 作者:智能小宝 来源:互联网 2016-04-19 06:56 我要评论(0)

Facebook 正在打造下一代开源硬件,将新技术融入其数据中心平台,Facebook使用大量强大科技——包括固态硬盘(SSDs), 图形处理器(GPUs), 非易失性存储器(NVM)和闪存簇(JBOFs)——以打造新的服务器和存储装置,加速基础设施。

这些升级是Facebook打造强大数据中心网络的一部分,这一网络将扩展互联网服务的边界。

「接下来的十几年,我们的体验将更加依赖于人工智能和虚拟现实这类技术,」Facebook CEO 马克·扎克伯格说。「这对计算性能提出了更高要求,通过开放计算项目(Open Compute Project,以下简称OCP),我们正在开发全球性的基础设施,让人人都能享受互联网服务。」

Facebook在开放计算峰会(Open Compute Summit,以下简称OCS)上公布了项目进展。OCS是不断扩大的开源硬件社区成员的聚会,他们设计的产品在Facebook的数据服务器上焕发活力。峰会展示了许多基础设施的升级。包括:

重新打造的服务器尺度形态来在同等能源消耗数量下提升性能。

新的高性能数据分析服务器,由GPUs驱动,而非CPUs。

改进后的存储设备分隔单位(storage sled),在这里,最初的JBOD(just a bunch of disks)变成快得多的JBOF(just a bunch of flash)。

改进非易失性存储器(NVM)实验,为存储分层提供更多选择。

△ Jason Taylor

此次峰会标志着OCP项目成立五周年,也促使人们反思自2011年Facebook为推动其发布的设计创新而成立该项目以来,OCP 的发展情况。

「我们现在取得的进步是值得关注的,」OCP 项目董事长Jason Taylor 表示,他同时也是Facebook Infrastructure 部门副总裁之一。「OCP就是一个让工程师聚在一起,创造惊艳产品的地方。」

「我感受到了巨大的动力,因为我们超越了超大型主机(hyperscale),还进入了金融和电信领域,」他说。

服务器:下一代设计

Facebook 彻底革新了服务器设计和基础设施,从传统的双服务器处理器转为基于单个英特尔Xeon-D处理器系统芯片(SoC),该处理器耗能更少,还解决了几个架构问题。

The Mono Lacke服务器的主板装入到一个叫Yosemite的组装单位中,Yosemite的每一个滑动单元底架上可以安装4个SoC,即4个Mono Lake。Facebook 工程师Vijay Rao 和Edwin Smith在Facebook 工程博客上描述了这一新设计。

△ 如图

「我们就新处理器的设计与英特尔紧密合作,同时重新设计自家的服务器基础设施以打造一个满足我们需求的系统,也能为行业其他公司所广泛采用。」他们在博客中写道。「结果表明,配备更低功耗的CPUs 的单处理器服务器在网络负载上比双处理器服务器表现更好,也更适合数据中心负载…与此同时,我们重新设计的服务器基础设施,在同等电源基础上,容纳每个机架双倍的CPUs数量。」

新的设计提升了处理器和处理器之间、处理器和内存之间的通信效率。

「我们将CPU简化至正好能满足我们要求,」这两位工程师表示,「我们移除了QPI链接,缩减了英特尔的成本。考虑到我们的服务器将基于同一的插槽,这也解决了我们NUMA问题。我们将其设计为整合芯片集的系统芯片,更加简单。这种接口一致的CPU散热设计功耗(TDP)更低。与此同时,我们重新设计的服务器基础设施,在同等电源条件下,容纳每个机架双倍的CPUs数量。」

这使得Facebook制造出一个可以在每个机架上获得更高性能的服务器体系结构,同时确保每个机柜能量消耗密度保持在11千瓦以下。

强大的人工智能数据分析服务器

Facebook 在会上还分享了GPUs最新进展,近年来,GPU在高性能计算中发挥了重要作用。GPUs 最初是用于提升桌面PC性能,处理图形运算,但是现在却帮助提升全球一些性能最强大的超级计算机。

Facebook 使用GPUs给人工智能机器学习数据分析带来更强大的计算能力。其人工智能实验室训练神经网络去解决新问题。这就需要强大的计算能力。

「我们已经在人工智能技术方面投入了很多。」Facebook 工程和基础设施(Engineering and Infrastructure)部门 全球老大Jay Parikh说,「目前,人工智能应用于Facebook的Newsfeed,帮助我们提供更好的广告服务。也能帮助用户在日常生活中更安全地使用Facebook。」

△ Facebook 的 Big Sur

Big Sur 系统使用了英伟达Tesla 加速计算平台,拥有8个高性能GPUs,每个功率达300瓦特,在多个PCI-e连接之间灵活配置。Facebook已经优化了这些新型服务器的发热和功耗控制,使其可以与数据中心中配备标准CPU的服务器协同工作。

Big Sur 系统优化了性能和反应时间,帮助Facebook处理更多的数据,极大地缩短了其训练神经网络的时间。

「性能有了极大的提升,」Parikh说,「我们在数月间就部署了数千台这种机器。使得我们有能力将该技术应用于公司更多的产品实例。」

存储:Just a buch of Flash

多年来,Facebook已经在用闪存来加速服务器引导驱动,提升缓存效率。随着公司基础设备进一步扩大规模,Facebook创造了一种新型「模块」,在服务器运算中整合更多的闪存。Facebook已经改进了初代开放计算机——即Knox——的存储驱动器,使用固态硬盘(SSDs)取代存储硬盘存储(HDDs),存储单元从磁盘簇(JBOD)转到了闪存簇(JBOF)。

本站文章信息来源于网络以及网友投稿,本站只负责对文章进行整理、排版、编辑,是出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议,请联系QQ28-1688-302!

人工智能实验室
相关文章相关文章
  • 任天堂:Switch不太可能兼容VR内容

    任天堂:Switch不太可能兼容VR内容

  • 别只害怕机器人抢你工作:重新想想做啥比它更好

    别只害怕机器人抢你工作:重新想想做啥比它更好

  • 人类应该居安思危了 AI将大力冲击就业市场

    人类应该居安思危了 AI将大力冲击就业市场

  • 最大的基因检测公司停止研发 为何这事做不成?

    最大的基因检测公司停止研发 为何这事做不成?

网友点评网友点评
阅读推荐阅读推荐

据国外媒体报道,在过去两年内,聊天机器人(chatbot)、人工智能以及机器学习的研发和采用取得了巨大进展。许多初创公司正利用人工智能和...

霍金 视觉中国 图 英国著名物理学家霍金(Stephen Hawking)再次就人工智能(AI)发声,他认为:对于人类来说,强大AI的出现可能是最美妙的...

文|郑娟娟 今年,人工智能(AI) 60岁了。在AI60岁的时候,笔者想要介绍一下AI100,一个刚刚2岁的研究项目,但它的预设寿命是100年,甚至更长...

AlphaGo与李世石的人机大战,为大众迅速普及了人工智能的概念。 但对谷歌而言,除了下围棋,现在的人工智能进展到哪一步了?未来,人工智能...