来自 技术 2019-03-16 00:00 的文章

为人工智能而生 H3C UniServer R5200 G3服务器

  近两年,人工智能无疑是最火的话题,越来越多的企业都开始投身于人工智能软硬件的研发之中。

  人工智能背后,是由深度学习建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,让机器会思考会判断。但是深度学习所需要的并行计算不是CPU的强项,因此高性能的CPU+GPU协处理加速的服务器正成为实现深度学习必不可少的基础硬件。

  随着人工智能时代的到来,传统的硬件已经不能满足AI和云技术的需求。因此,寻找一款具备更高效率的专业AI计算平台就成为了AI领域众多企业的燃眉之急。新华三最新推出的H3C UniServer R5200 G3服务器正是这样一款平台。

  优异的计算性能

  H3C UniServer R5200 G3服务器是新华三针对人工智能和高性能计算领域定制开发的新一代GPU服务器,采用标准的4U机架式设计,支持2颗最新的Intel Xeon Skylake处理器。

  在CPU/GPU架构设计方面,R5200 G3最大特点便是为用户提供了多达10颗双宽GPU或20颗单宽GPU的扩展能力。为了充分发挥GPU数千个计算核心的效率、避免数据IO瓶颈,R5200G3优化设计了CPU/GPU通信链路,采用1:8双链路通信,保证CPU/GPU间以及GPU间的高效数据交换,从而使R5200G3具有业界领先的单机计算能力。

  H3C UniServer R5200 G3内部提供了21个全长PCI-E 3.0扩展接口,能够以x16方式同时安装10块双宽GPU计算卡或以x8方式同时安装20块单宽计算卡(另一个PCI-E 3.0接口用于扩展高速卡)。不同的配置分别对应了机器学习中最主要的训练和推理两大应用场景。

  在搭配目前最顶级的NVIDIA Tesla V100计算卡时,整机可以在4U空间内就提供高达1120 TensorTFLOPS性能。而如果采用普通的2U服务器,用户则需要5台服务器和10U空间才能达到相同理论性能。

  高速网络通信

  R5200 G3可同时支持100Gb高速网卡和Direct RDMA通信,在大规模多机并行计算的深度学习训练场景拥有出色性能表现。在8GPU\16GPU\32GPU多机并行训练时,采用R5200G3及100Gb网络实现了接近线性的性能增长。

  高可扩展性能

  虽然H3C UniServer R5200 G3本身能够提供极强的计算能力,但在更大规模的机器学习、高性能计算等应用场景中,企业通常也会使用更多GPU服务器组成集群来实现更高的性能。为此,新华三为H3C UniServer R5200 G3提供了强大的网络选件,用户可在10Gb以太网及56/100Gb Infiniband网络之间做出选择,从而实现更高的互联能力。

  在磁盘存储方面,H3C UniServer R5200 G3提供14个SAS或SATA SFF硬盘位,可安装HDD或SSD,在满足极致计算的同时提供足够的存储空间。

  可靠高效智能化

  可以说H3C UniServer R5200 G3达到了目前商用产品中单位体积内计算性能的巅峰,能够让用户以最小的空间和硬件开销达到更高的性能,从而免去扩建数据中心、构建大型网络所带来的种种成本。

  当然,为了保证服务器在满配状态下能够持续稳定运行,H3C UniServer R5200 G3也在散热和供电部分采取了冗余设计。

  在散热部分,H3C UniServer R5200 G3采用了支持热插拔的5+1冗余风扇设计,不仅能够为CPU和GPU提供足够的风量满足散热需求,更为可能发生的意外留出了足够的散热余量。

  在供电部分,服务器也标配了4个1600W热插拔80Plus铂金电源,并采用N+N的冗余配置,保证服务器能够在任何情况下都能够获得极高的能源效率与充沛的电力供应。

  在智能管理方面,以GPU为主力计算单元的异构计算环境中,传统的管理工具却很难完美应对,因此新华三还为服务器搭载了专门针对GPU异构计算平台的管理软件——AIOS。

  AIOS不仅能够实现GPU负载、工作状态监控等基础功能,更能够基于主流的云及容器环境实现GPU资源调度功能,让企业可以在多租户环境下更灵活的使用庞大的GPU资源,从而实现更全面的异构计算管理。

  基本参数:

  值得一提的是,这款专为人工智能和高性能计算领域定制开发的新一代GPU服务器产品,获得了金融行业的充分认可。

  某银行全国人工智能平台建设中,计划采购约200台GPU服务器。作为金融行业的大规模人工智能平台项目,吸引了几乎国内所有服务器厂家的积极参与,经过激烈的竞争新华三人工智能解决方案取得成功入围,该银行将采购逾50台R5200G3/R4900G3服务器。

  鉴于人工智能在自动化的经营分析、自动化流程处理等巨大潜力,中国某保险公司不断尝试采用人工智能技术来提高保险行业的经营管理效率,在建设的人工智能平台选择新华三人工智能产品和技术,其中包括8台R5200G3服务器。

  总结

  人工智能是当今计算科学应用的最前沿之一,更是对传统硬件计算平台提出的一次重大挑战。而凭借在服务器硬件设计领域多年的积累以及庞大的投入,新华三针对人工智能应用中要求最高的机器学习场景推出了H3C UniServer R5200 G3服务器。

  该产品不仅代表了当今服务器设计领域的顶尖水平,更是“服务器设计场景化”理念的代表作,通过在内部空间、供电、散热以及管理方面的全维度创新,新华三H3C UniServer R5200 G3完美解决了企业在机器学习应用中的各类问题,使之成为了当今机器学习领域中的理想硬件平台。

  快速了解新华三产品和技术最新动态,敬请关注“新华三商业”公众号!