首页 >> 优秀投稿

民航信息系统运营提升优化的实践与思考
时间:2023-01-10| 编辑:zhangtong|【
自新冠肺炎疫情暴发以来,民航业是受疫情影响最为严重的行业。数据显示,疫情暴发前,民航客票销售量及旅客出行量较为稳定,退票业务量整体平稳。2020年1月底~2月初形势急转直下,甚至出现了从未有过的退票量超越出票量的情况,特别是2月2日退票量创下了历史极值。这样的变化不仅对直面旅客的航空公司产生了重大影响,也给后台运行的民航信息系统带来了冲击。

2022年全国民航工作会议提出,全行业要立足服务构建新发展格局,更好地发挥民航战略产业作用。中国航信作为民航信息系统运营商、民航健康运行的支柱企业,在统筹疫情防控和行业恢复发展、持续提升民航服务品质的过程中承担了重任。

一、存在的挑战与机遇

冷门业务场景访问量激增。疫情暴发前,日退票量与日出票量的比例一般为1:10~1:20。2020年1月23日民航局紧急发布《关于免收民航机票退票费的通知》后,该比例骤增至1.1:1左右,退票业务量增长10倍以上,且存在瞬时爆点集中退票的情况,峰值访问量更是增长百倍,使后台系统不堪负荷。此外,每一个国际入境航班熔断背后都是众多旅客的机票退改需求,叠加航空公司航班调整愈加频繁,旅客退改服务压力加大。2021年1月2日,民航局下发了《关于切实做好疫情常态化防控形势下客票退改服务工作的通知》,再一次强调特殊时期做好旅客服务工作的重要性。

业务量波动巨大。经过2020年上半年武汉疫情防控阻击战的胜利后,国内民航市场逐步回暖,但后续阶段性疫情使国内民航旅客量不时突降,运营数据波动大。对后台信息系统而言,除即时性能业务数据监控外,还应依据历史同比数据、近期环比数据对系统进行分析和评估,如此这般的业务量走势对系统运营监控及预测提出了新要求。

系统硬件资源冗余凸显。国际业务受政府政策管控,航班量极少,国内业务与历史同期相比也处于低位,造成民航信息系统硬件资源冗余。如何提升硬件资源利用率,降低系统运营成本,甚至兼顾后疫情时代业务量恢复的诉求,这些都是待解答的问题。因此,作为系统运营商,需要处理好当下的资源调节和调度,规划好未来能够快速灵活调配资源的方案和路线。

二、采取的方法及措施

突破极端业务场景中的性能瓶颈。自2020年1月20日中央对新冠肺炎疫情防控作出指示当晚退改业务激增起,民航信息系统运营维护部门临时成立退票业务专家团队,在短时间内优化退票业务流程,提升系统数据资源的共享读写效率,随后又在长期客票退改保障工作中,针对非常规场景进行梳理,持续迭代优化,将业务处理效率提升近百倍。此外,运营维护团队也及时总结经验,举一反三,针对旅客变更以外的航班变更业务流程进行再梳理,对疑似瓶颈点位进行了优化,以应对可能发生的大面积航班计划调整。

提升运营监控的精细化和智能化程度。应用监控系统和应用运维系统是民航信息系统运营维护的两大利器。应用监控系统为所有系统提供集中监控管理服务。自疫情发生以来,该系统进行了重构,特别是通过时序数据库部署与应用管理,构建了基于时序数据的数据处理框架,结合历史数据归纳和分析结果,实现对监控对象的规律分析及趋势模型预测,进而提升了提前预警、动态预警效果。应用运维系统则大力推进运维处置工具建设,将处置操作标准化,将处置流程固定化,在更加精细的数据监控基础上,智能关联处置工具的自动化响应,进而提升运营维护的精度及效率。

提高数据统计和数据分析质量。一方面,应用监控系统比对参照的标准来源于采用大数据方法统计分析历史监控数据得出的结果模型;另一方面,疫情发生后,对于疫情相关数据的提取和分析,也依赖系统业务的数据统计和汇总。无论是监控数据还是业务数据,数据的采集和清洗效率更为关键,需要持续强化使用这些数据反哺系统运营。因此,数据团队与运维团队针对数据全流程环节进行梳理改造,提升准确度。对于监控数据的趋势模型,依据疫情发生后波动的增大调高其灵敏度,对之前模型屏蔽掉的一些偶发异常增加了额外报警;对于业务数据的统计分析,则增强了数据筛选的灵活性和适应性,通过统计算法及数据库优化,降低了大批量数据统计的时间成本。

科学优化调配系统硬件资源。运营团队聚焦已有资源,梳理冗余度过高的资源,制订了缩减计划并逐步实施,进而降低运营成本。

加强用户账号配置资源管理。在硬件资源优化的同时,立足民航业信息安全大局,对民航信息系统的用户配置资源进行升级改造,全面提升账号安全管控能力,完成所有接入系统的人工用户账号配置和系统用户账号配置的实名认证。大力推进用户身份管理系统技术升级,通过双因素认证等手段落实账号资源的合理分配和有效回收,进一步降低运营成本。

加速大型主机平台交易向非主机开放平台迁移。除制订合理的硬件资源缩减计划外,提高这些资源的利用率也是民航信息系统特有的降本手段。民航信息系统仍然有大量交易业务运行在国外公司的软硬件一体化主机系统之上,除一次性采购费用外,日常费用支出以系统交易流量计,以外汇结算。大型主机平台交易资源降耗是一项长期工作,疫情防控期间的业务收缩提供了加速向非主机开放平台迁移的特殊窗口期,一来提高开放平台已配备硬件资源的用度;二来减少主机平台流量,进而减少外汇支出。

三、经验总结与思考

增强民航信息系统极端运行状态下的基础运营能力,增强应对突发事件的技术支持能力。民航信息系统已于2021年被列入国家关键信息基础设施,其运营安全、信息安全、数据安全无不与国内民生休戚相关。系统的平稳运行是基础保障要求。但疫情之下,世界有大变革,国内也时有突发事件,这对于长时间安全运行的系统是新课题,需要补齐极端运行状态下基础运营能力的个别短板,如瞬时退票高峰,挑战的是长期稳定的低频业务流程。此外,对于突发事件,也就是临时性紧急需求,无论在技术支持还是数据分析上,都需要长期持续提升和优化,数据只有在具有准确性和实效性的基础上才能体现出最大价值。

加快民航信息系统自主云平台应用,灵活分配资源,降本增效。民航信息系统发展已超过30年,业务功能、资源部署也已迭代数次。面对民航业的新发展以及航空公司代理人等新业务诉求,民航信息系统不断推陈出新,不仅满足需求,更引领行业业务创新,提升我国民航综合实力。疫情发生后,对于行业波动越来越剧烈的现状,需要更加灵活的应对手段,具体到系统资源上亦是如此。业务量的变化对资源匹配度提出了新要求,既需要更加稳定且同质化的运行平台,进而降低运营维护难度与成本,又要求资源分配使用能够更加灵活和及时,云平台则是解决之道。中国航信正在加速自身云平台的应用推广,推进信息系统主营业务向云平台延伸,不仅可以满足当前减少消耗的资源缩减需求,更能够快速适应未来不确定的业务变化,使资源分配及调整更科学、更高效。

加快系统运营的数字化进程,以创新引领后疫情时代民航信息系统高效运营。民航信息系统运营涉及各类业务数据、统计数据、监控数据、预警数据,种类众多、数量庞大。虽然当前这些数据的数字化已颇具成效,但仍然需要增强这些数据的联动整合和分析能力,让这些复合运营数据产生更大价值。数字化进程不仅推动业务创新,更关注如何提升系统运营效率。运营团队也应该开阔眼界、拓展思路,学习借鉴信息系统领域的先进技术与方法,在民航专业领域的智能化分析和自动化运营等方面持续探索,不断提升自身的运营维护效能。

自疫情发生以来,民航信息系统遭到多轮诸如大量客票突发退改的冲击和其他疫情相关事件的挑战。中国航信作为民航信息系统运营商,运营维护工作是持续不停且永不中断的。考虑到新冠肺炎疫情的长期性与复杂性,外不动则修习其内,外有变则应对得法,我们不仅要重视当前的情况,立即解决眼前的突出问题,而且要审视未来的发展,制定后疫情时代系统运营策略,运用运营维护视角下未雨绸缪的前瞻性思维,居“乱”思危,思则有备,有备则无患。(作者:于嘉、任嘉勉,单位:中国民航信息网络股份有限公司研发中心)