IT运维不容死角

中国计算机报 / 2018年11月25日 18:25

手机

邱燕娜

8月8日,全球各地有很多在登机口等待准点登机的美国达美航空公司乘客被告知航班延误。这让他们一头雾水——此前他们已经得到航班准点起飞的信息。后来他们才得知,达美航空公司位于美国佐治亚州亚特兰大市的总部遭遇断电,引发IT系统连锁瘫痪,达美航空公司在全球待飞的航班因此受到影响。这次事故导致美国达美航空不得不取消400多架次航班、延迟上千架次航班,数以万计的乘客被迫在忙碌的星期一困守在机场,直到6小时后,才解除停飞令。

这次事故让很多达美航空公司的乘客深表不满.甚至有乘客在社交媒体上表示再也不乘坐该航空公司的航班了。

达美航空公司称,停电导致其航班状态信息无法及时、准确更新。达美航空公司此次竟然是因为总部断电导致系统瘫痪,这真是低级错误。恐怕很多IT业界人士都会发出如此感叹。由此可见,IT运维不能有死角,特别是对于航空、金融和电信等对IT系统依赖程度非常高的行业,任何一个死角都可能给业务带来巨大影响,造成巨大损失。

达美航空公司总部所在地供电公司佐治亚电力公司已经宣布此次断电与该公司无关,而且当时没有其他客户出现断电情况,断电可能是由达美航空公司的自身设备故障造成的。

就算是断电真是由供电公司造成的,在当前航空公司的日常运营对IT系统依赖极大的背景下,达美航空公司自身也应该有强大的继电系统以保证不间断供电。值得一提的是,如今航空公司要依靠庞大、交叉和复杂的IT系统安排航班起降、调配员工、出售机票、办理登机,以及运营柜台、网站和手机应用程序。

软件分析公司Cast首席科学家比尔·柯蒂斯就明确指出,因为某个设备故障就造成这种局面,令人有些震惊。

达美航空公司的这次事故影响是较大的。但是事实上,因为IT系统原因导致航班延误的事件在航空领域屡见不鲜:7月20日,美国廉价航空公司西南航空公司因电脑故障取消大约2000架次航班,3天内延误7000多架次航班。去年10月,该航空公司就因为遭遇类似故障,延误800架次航班。7月8日,美国联合大陆航空公司因为路由器故障全球范围停飞两小时。而就在今年6月,该航空公司刚发生过类似故障。今年5月.瑞典民航部门的雷达站发生小故障,擾乱了整个国家的航空交通,进出首都斯德哥尔摩的航班停飞数小时。今年3月,日本全日空航空公司因IT系统故障,取消了100多架次国内航班,影响大约1.6万名旅客出行。去年8月,美国东海岸的地区航空交通管制中心也发生电脑故障,使得华盛顿、纽约等地繁忙的机场数以百计航班延误数小时。去年5月和7月,美国联合航空公司发生电脑故障,停飞航班架次数以百计,影响数以千计乘客。

达美航空公司此次事故发生后,有专家指出,当前航空公司系统因为业务更改和增加而进行升级或者扩展,因此更容易出现系统故障;同时,诸如自动化处理大量航班业务等功能,也为航空公司带来隐患。因此,航空公司应该考虑采用全新的方法来部署系统和进行IT运维,特别是避免因为单点故障而引发系统瘫痪,进而影响全局。

1.环球科技网遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.环球科技网的原创文章,请转载时务必注明文章作者和"来源:环球科技网",不尊重原创的行为环球科技网或将追究责任;3.作者投稿可能会经环球科技网编辑修改或补充。