英国国家航空服务公司(NATS)在去年12月份发生一起严重事故。由于其两条系统航班服务器通道均发生故障,导致数百架航班无法起飞。
据一份内部报告显示,此次混乱共造成120架航班被取消,500架航班被耽搁了45分钟,总共影响约10000万名旅客。
据内部人员透露,此次事故的发生是一台运行航班数据处理系统的IBM S/390主机宕机造成的。内部报告显示,在14点44分,一台为航空指挥控制人员提供数据的计算机发生故障;14点45分,所有离开伦敦机场的航班被叫停;15点整,整个欧洲所有计划经过英国领空的航班被叫停。在当天的20点10分,系统才恢复正常。
所有伦敦区域的操控人员都有着一个唯一的身份标识--原子函数(Atomic Function),其确保航班服务器系统给每个工作站提供正确的信息和通信保障。但系统中某个潜在的漏洞导致原子函数的最大值被错误的设置成151,而正确的数字是193.
报告显示,航班服务器系统认为它有着比原子函数的最大值更大的上限,而这种情况是不允许出现的。当出现这种情况时,航班服务器系统就会自动关闭,以防止提供错误的数据给工作站。当这种情况传送到第二套运行观察模式的航班服务器系统时,触发了同样的错误。
NATS否认对其忽略IT系统投入的指控,该公司于2001年成为与英国政府公私合营伙伴关系的企业。
该起事故的最终报告将会在2015年2月14日前发布。
作者:Recco
来源:51CTO
时间: 2024-09-24 05:52:39