曙光向HPC服务商转身

中国计算机报 / 2018年08月27日 23:38

互联网+

郭涛

曙光正努力地从一个HPC方案提供商向HPC全生命周期管理服务商转型。已经进入公测阶段的曙光EasyOP在线运维平台是实现这一转变的桥梁,同时又是催化剂,可以进一步推动HPC软件、硬件的融合。

在11月11日公布的2015年中国高性能计算机TOP100排行榜中,曙光公司以34%的市场份额毫无悬念地再次荣登榜首,并且连续7年蝉联中国高性能计算机TOP100排行榜市场份额第一。不过,这“七连冠”的辉煌只能说明过去,曙光公司未来要转型为高性能计算(HPC)服务提供商的新动向更值得关注。

“七连冠”的背后

高性能计算机TOP100排行榜是最能体现HPC厂商硬实力的一份成绩单。每年公布排行榜单的中国高性能计算学术年会现场就像是一个没有硝烟的战场,参与的厂商表面上非常平静,其实都在暗暗较劲。

在今年的高性能计算机TOP100榜单中,曙光公司以34套HPC系统的成绩摘得桂冠,同时以3套HPC系统入围TOP10再次证明了自身在HPC领域的领军地位。从市场占有率来看,今年又出现了曙光与联想并列第一的情况,但是从2015年HPC新增系统数量、过去5年累计入围榜单的HPC系统数量来计算,曙光都是当之无愧的第一,并且与第二名之间有很大的差距。

特别值得关注的是,曙光公司于今年9月发布的“地球数值模拟装置”原型系统首次入榜便取得了第7名的好成绩。该系统也是今年新入围的HPC系统中规模最大的。

据曙光公司高性能产品事业部总经理曹振南介绍,曙光公司本次入选中国高性能计算机TOP100排行榜的HPC系统覆盖的应用领域相比以前又有了更大突破,既有政府、能源、安全等关系国计民生的行业,又有互联网、数据中心等前沿科技领域。

在HPC领域,曙光公司已经深耕细作了25年。从曙光一号、曙光1000、曙光6000再到今天的“地球数值模拟装置”原型系统,曙光在HPC领域不断突破创新,先后研制成功了百万亿次、千万亿次的HPC系统。“时至今日,我们已经研制并成功推出了7代HPC系统,为各行业用户累计交付超过1万套HPC系统,并先后3次入围全球高性能计算机排行榜TOP 10。”曹振南介绍说,“我们在天津有规模庞大的HPC制造工厂,每天都有新的HPC系统下线,源源不断地提供给那些对计算能力有极高要求的行业用户。”

曙光公司如今也是亚洲地区最大的HPC系统生产商。曙光公司今天在HPC领域的领导者地位来之不易,一方面源于其深厚的技术实力和创新能力,另一方面也源于它对用户需求的正确理解与把握。以研发为例,作为中科院先进计算创新与产业化联盟的成员单位,曙光公司是整个中科院技术创新和成果转化的平台,“地球数值模拟装置”原型系统的推出就是最好的例子。在应用方面,曙光公司抓住了云计算、大数据等新技术潮流,将HPC系统与气象、金融、互联网、能源、交通等行业的实际应用需求进行有效结合,逐步实现了从通用HPC系统的研发和生产到定制化系统设计和生产的转变。

从通用型到定制化

以前,一提到HPC,人们最先想到的就是系统的规模、计算性能指标等。但是,随着HPC与应用的深层次结合,用户更关心如何利用HPC为应用服务,给企业带来实实在在的效益。

“以前,HPC的研发和生产厂商与HPC的应用软件厂商各自为战,两者之间的联系与沟通不够。”曹振南表示,“今天,我们看到HPC与应用的结合越来越紧密,根据用户的实际需求定制HPC系统慢慢成了新常态。‘地球数值模拟装置原型系统就是为特定应用需求研发的HPC系统。此外,我们还研发了许多专用的HPC系统,比如深度学习的专用平台、面向气象/环境/海洋业务应用的一体化平台、面向设计和仿真应用的一体化工业云平台等。”

如今,HPC专用化已经成为HPC领域新的发展趋势。曙光凭借大胆的技术创新和协同设计率先在国内HPC领域践行了HPC专用化,并主动向传统HPC的高耗、低效发起挑战。

以“地球数值模拟装置”原型系统为例,它主要应用于地球系统数值模拟和空气质量数值预报,在架构设计上基于“硅立方”的协同设计,其3D-Torus网络架构与地球表面网格划分和通信方式匹配,而分区设计则十分符合软件“多模式+耦合”的特征。“地球数值模拟装置”原型系统已经在中国气象局、国家海洋局、中国水利科学院研究院等单位得到了成功应用,不仅效率和功耗大大优于通用型的HPC系统,而且其性能和稳定性得到了用户的充分肯定。

除了不断提升性能以外,降低能耗也是全球HPC行业面临的一大挑战。液冷技术如今是各高性能计算企业比拼的一个新舞台。曙光TC4600E-LP液冷服务器是中国首款可以量产的冷板式液冷服务器,具有高性能、高密度和高能效比的特点,其PUE值小于1.2。

在HPC领域,让HPC系统变得更大、更快、更强是许多厂商追求的目标。但是曙光的目光更长远,它更愿意在高性能计算应用领域探索新的业态。目前,曙光与合作伙伴成功摸索出的定制化设计、模块化快速部署和深度开发利用液冷技术或将引领未来HPC和大规模数据中心建设的发展。

曹振南表示:“中国在HPC领域与国外的差距主要体现在应用方面,尤其是在核心的HPC应用软件的研发和应用上差距更大。国内虽然有一些非常优秀的HPC应用软件开发商,但是由于种种原因,这些厂商一直‘养在深闺,知道和使用这些应用软件的用户并不多,也导致这些应用软件没有进一步优化的空间。”

2015年,曙光在HPC方面主要做的一项工作就是深化HPC与应用的融合。一方面,曙光狠抓HPC系统针对应用的协同设计,持续推动中国HPC应用的产业化;另一方面,通过发布面向应用软件开发者和供应商的“软件合作伙伴圆桌计划”,促进HPC应用软件的成熟和发展,为HPC应用软件的开发和销售提供市场资源和销售渠道,同时提供测试和认证方面的支持。

HPC迈向服务时代

记者参加2015中国高性能计算学术年会时,在曙光的展位看到了这样一句话:HPC迈向服务时代。随着HPC产业近几年的快速发展,中国的硬件制造水平已经不逊色于发达国家,但是应用的发展较为缓慢。加速HPC应用的普及是改善我国超算现状的关键,同时也是使HPC转化为社会和经济价值的关键所在。未来,HPC拼的不再是规模,而是应用与服务,这才是考验一个国家、一个企业HPC综合实力的新标准。

HPC的服务化趋势可以简化HPC的部署和使用,让用户更快上手,并从HPC的使用中真正获益。另一方面,HPC的服务化趋势也要求那些传统的HPC产品和解决方案提供商重新思考,如何顺利转型为HPC的服务商。

曹振南介绍说,曙光公司HPC向应用和服务转型主要从以下三个方面入手:首先,大力发展HPC专用机和定制机,从通用计算平台到定制化应用一体机是新的发展趋势;其次,提升曙光HPC一站式交付的能力,通过预先配置、测试和调优,可以简化HPC系统的部署难度,并降低风险,帮助用户加快将HPC系统投入使用;最后,推广EasyOP在线运维平台的使用。

在本次中国高性能计算学术年会上,曙光宣布EasyOP在线运维平台进入公测。EasyOP是Easy Operation的简称,它是基于曙光Gridview集群管理体系为HPC量身打造的在线运维平台。曙光EasyOP平台将为用户提供HPC系统7×24小时全生命周期SaaS级服务。“EasyOP的使命是让用户的HPC更易于运维。”曹振南表示。

曙光正努力地从一个HPC方案提供商向HPC全生命周期管理服务商转型。EasyOP在线运维平台是实现这一转变的桥梁,同时又是催化剂,可以进一步推动HPC软件和硬件的融合。

2016年,曙光在HPC领域的一个基本策略是继续深化服务:一方面,简化HPC系统的交付和实施,遵循特定的实施标准,结合用户的实际需求打造定制化的HPC实施方案,在天津工厂完成整机系统的集成和联调;另一方面,大力推动EasyOP在线运维平台的应用,为用户提供HPC全生命周期服务。

无论是HPC的使用者还是管理员、运维工程师,曙光易运维的EasyOP都可以减轻其工作压力。EasyOP还可以支持HPC集群管理者、数据中心管理者、IT中心决策者在HPC建设、使用过程中做出及时正确的决策。

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。