新闻稿
3
阅读时间:X分钟

全球IT系统故障导致世界各地航班停飞

编辑
编辑团队
类别a
新闻稿
日期
2024年7月19日

2024年7月19日发生的全球性IT系统故障,给各行各业造成了严重干扰。此次故障由CrowdStrike的一项有缺陷的软件更新引发,主要影响了Windows系统。 航空业受影响尤为严重,全球各地机场陷入了显而易见的混乱局面。尽管核心事件持续时间较短,但用于售票、值机、登机和航班管理的系统故障引发的全球性混乱导致了广泛的运营中断。此次事件凸显了航空业对技术故障的脆弱性日益加剧,同时也突显了制定完善的灾难恢复计划和建立相应系统的必要性。

机场运营中断的上升趋势

最近发生的IT系统故障,是过去十年间机场运营中断现象日益加剧趋势的一部分。据科技公司Ink Innovation旗下的咨询机构Ink+称,机场运营中断事件的数量逐年显著增加。2015年至2016年间,此类事件增长了50%,这反映出技术漏洞日益加剧的早期迹象。

2017年,局势进一步恶化,导致运营中断的重大事件数量翻了一番。然而,最剧烈的增长发生在2022年,运营中断事件数量激增了333%。这一激增主要归因于新冠疫情的后续影响,疫情给全球航空基础设施带来了前所未有的压力,同时也凸显了建立强大IT系统的迫切需求。

尽管2023年的增长幅度没有那么显著,但这一年仍发生了两起重大的IT系统故障:美国联邦航空管理局(FAA)的全国性计算机系统故障,以及英国国家航空交通服务公司(NATS)空中交通管制中心发生的一起重大计算机故障。这些事件凸显了IT系统容易发生故障,从而可能导致影响深远的运营中断。

2024:延续这一趋势

2024年上半年,系统中断事件的数量已接近2023年全年的总和,整体呈上升趋势。此次最新的全球性IT系统故障凸显了航空业在维护可靠且安全的技术基础设施方面所面临的挑战。

应对挑战

IT故障率的上升凸显了航空业迫切需要投资建设更具韧性、更安全的IT系统和流程。Ink+的管理合伙人兼航空运营专家强调,本地化的替代性值机和登机解决方案必须成为机场认证标准的核心内容,而非可选项。这些替代方案对于保障公众的出行体验至关重要。航空公司必须摒弃手动应急方案,因为这种方案仅适用于当前正在处理的航班,无法长期维持。

马利克指出,航空公司必须提供不依赖机场通用中间件和台式电脑的数字化备选方案,以满足值机和登机需求。如果这些备用系统依赖于相同的底层计算平台,一旦发生故障,备用系统也将随之瘫痪。航空公司的应急预案应与日常运营系统脱钩,以降低主系统故障时的风险。系统间的依赖关系会增加风险,并在重大事故中引发多米诺骨牌效应。

“静待风暴过去”与多云战略

与在同一云服务提供商内采用多区域甚至多区域策略相比,建议采用多云策略,因为它能提供更高的弹性。应将更频繁的桌面系统和模拟IT系统故障演练与测试作为常态,以确保备用流程能够无缝衔接。

由于人们普遍认为事故发生频率较低,因此对风险缓解措施的投资一直较为有限。然而,集中式系统会加剧中断事件的影响。随着以往罕见的停机事件变得越来越频繁,且对高度优化的运营造成越来越大的影响,“静待风暴过去”的策略已不再可行。

为确保航空运营的可靠性和安全性,必须转向制定完善、独立的应急预案并进行频繁测试。

有创新项目要开展吗?

加入我们的团队,共同重塑旅行科技——服务于各类规模的航空公司、机场及地面服务商。无约束性合同。入职流程简便,技术实力过硬。

预订会议
预订会议
预订会议