首页 >> 1

构建高可信机场数据中台体系 有效打破“数据孤岛”
时间:2023-12-19| 编辑:zhangwei|【

我国信息技术水平不断提升,机场作为综合生态体,也正在享受技术革新带来的红利。综观行业发展,机场正从2.0敏捷型向3.0智慧型迈进。在这一过程中,智慧型应用不断涌现,数据爆发式增长,随之而来的如“数据孤岛”严重、数据质量低、共享差等问题日益凸显。如何让数据真正产生价值成为机场信息化建设的一大难题。

一、数据中台是机场突破数据瓶颈迈向智慧型机场的关键

2022年初,民航局在发布的《智慧民航建设路线图》中提出,要围绕四型机场建设,提升机场协同运行效率,以智慧机场塑造民航业全新未来。在政策的有利支持下,民航业迈向“智慧机场3.0”步伐整体加快。随着智慧型应用不断涌现,各应用联动性差所带来的一系列数据问题对机场数字化转型构成挑战。主要体现在:一是存在“数据孤岛”。技术迭代更新、管理渐次成熟导致机场“烟囱式”IT建设,使机场内外部的航班生产、离港、旅客服务等系统各自为战,给多业态、跨领域数据共享带来挑战。二是数据接入标准不统一。数据接入缺乏统一的标准,且数据质量参差不齐,导致大量数据资产没有产生真正的价值,不仅加大了数据开发和处理的难度,而且很可能出现以错误数据进行分析挖掘、导致结果对指导管理决策意义甚微的现象。三是数据分析需求响应慢且成本高。机场管理者对运行场面态势掌控要求较高,以当前的数据分析模式很难做到快速响应。四是缺乏强大的数据工具支撑。机场缺乏数据接入、数据融合、数据治理、数据加工和预测决策工具,影响了数据处理和高质量共享。

上述问题出现在机场迈向“智慧机场3.0”数据赋能发展过程中,数据中台为解决这些问题提供了很好的思路。作为大数据技术的融合体,数据中台采用一站式、轻量化、松耦合的全栈数据开发工具,能有效助力机场实现统一的数据纳管,对数据标准、质量进行流程化管理,沉淀数据资产,全面对外快速响应赋能,以实现数据服务业务的全流程管理。数据中台以数据“管起来、用起来、活起来”为导向,围绕“数聚、数治、数融、数享”的数据管理思路,实现数据的“接、存、管、用”,为机场提供稳定可靠的数据支撑底座,从而实现以数据中台为核心的业务数据化和数据资产化,系统化构建高可信的数据管理体系,全面助力智慧机场建设。

二、数据中台助力机场构建高可信数据管理体系

数聚:自动汇聚,统一纳管。数聚即数据汇集。机场大量数据分散在不同业务系统和数据库中,这些系统建设的时间大多不同,技术应用水平跨度大,系统接口种类繁杂、差异性较大。通过梳理业务流程、系统及数据源,借助数据中台提供的服务、消息、数据集成能力,能够实现机场生产数据(航班生产、旅客服务等)、行业数据(空管数据、航企数据、局方数据等)、外部数据(气象局、公安部、在线旅游平台等提供的数据)的全面接入、融合与纳管。数据中台还支持批量数据迁移、实时数据集成和数据库实时同步,进行流程图式配置和管理,支持单表、整库、增量、周期性数据集成,丰富而强大的能力为下一阶段数据治理打下了坚实基础。

数治:强化治理,标本兼治。数治即数据治理,可实现数据的高可信。数据治理是让数据具备高可信的前提。数据标准治理是数据治理的核心。如果数据标准不统一,会使机场工作人员在不同业务系统中难以“找到”或“看懂”数据。机场是一个庞大的系统,对于相同意思的字段,在不同系统中采用的名称、定义及属性规范不同,容易造成数据标准不统一,从而影响数据后续融合和加工。针对这一问题,数据中台提供了较好的解决方案。在数据标准制定过程中,可以利用数据运营平台灵活便捷的组件工具,参照如《中国民航运行数据共享协议》等行业标准规范,依据定义标准建立规范的数据库,打好数据开发基础。

由于机场行业数据具备较强的专业性与特殊性,在数据治理实践过程中,还需要从业务侧进行深度思考。

一方面是数据标准的统一。在一些特定情况下,要对业务数据进行一定逻辑的转化。例如,重庆航空虽隶属南航,其IATA代码(航企两字编码)并非CZ而是OQ,在FOMS等生产系统中以OQ呈现,但在离港系统中的代码则为CZ。因此,在数据匹配时,需要进行必要的映射转换以实现关联。再以部分航空专用报文为例,如本站接收的LDM报(配载报),如果航班出发日(T日)和到达本站日(T+1日)存在跨零点情况,则需要对前站发来报文的航班日期进行“+1”处理,否则会出现日期错位的情况。通过对业务数据的标准化转换,确保数据口径一致、增强数据可信性,可有效解决上述问题。

另一方面是基于业务逻辑的深度检核。传统数据治理检核主要围绕完整性、缺失性、及时性、正确性四个方面进行,但此类检核缺乏业务侧检核。基于对业务流程的理解,我们提出业务侧数据治理的思路,即以业务事实为基础的时空逻辑检核,辅以经验及第三方数据进行佐证判断检核。前者重点围绕业务流程时间和业务过程空间的正确性对数据进行检核。以航空器到港时间流程为例,在正常情况下为上轮档时间—靠桥开始时间—开始下客时间。但从实际情况来看,流程时间数据的采集会受到人为、系统接收延时、数据解析有误等情况影响,导致数据存在问题,而通过时序检核可以检查出数据问题。因此,以业务逻辑出发,对数据进行深度检核,可让数据具备高可靠性。

数融:以数为基,响应诉求。数融即数据开发,让数据实现增值。机场是一个复杂的运行生态,业务环境快速变化是其重要特点,且运行决策要基于业务环境变化作出快速响应。这就需要运行管理部门及时掌握尽量多的信息,大量多样化数据分析成为“必需品”。但从实际情况来看,数据开发响应远远无法满足当前诉求。一方面,由于传统数据分析缺乏高效的数据运营工具平台,数据开发周期长、效率低,不能满足业务运营决策人员对数据及时性的诉求;另一方面,数据运营成本高,数据未服务化,数据拷贝多,数据口径不一致,数据重复开发,数据颗粒度不够,不能满足业务运营决策人员对数据有效性的诉求。

针对数据开发问题,数据中台的数据分层加工处理提供了较好的处理思路,即建立贴源层、主题层、专题层。在数据接入时,保持同源系统数据一致,建立贴源层,便于追溯原始数据;对贴源数据进行初加工,按主题归集分类,建立主题层,保留数据间关联关系,建立相对独立的主题库,如航班、人员、交通、安全、货运、事件、资源等主题库,为数据拉通组合提供基础数据;按业务诉求融合跨主题数据,建立业务专题库,这些专题库数据可以作为加工某类指标的数据集,为综合分析提供专项数据基础。专题库可按大类分为查询统计类(如吞吐量、资源用量、资源消耗等)、数据标签类(如航班正常、关舱门正常、车辆到位等)、预测决策类(如未来小时高峰流量、机位占用预测、客流量、薄弱环节分析预测等)。通过逐层建立数据集市,让数据开发全面快速响应业务诉求。

此外,在建立数据集市时,建议重点关注对数据粒度及维度的细化。前者解决的是数据分析深度问题,后者解决的是数据分析精度问题。如果忽略粒度及维度细化,一些深度分析决策实现起来较为困难。以航班正常性分析为例,常规分析粒度及维度较为固定,一般以天、小时、航企等几个维度统计起飞正常、放行正常、进港正常等指标。但如果运行管理部门提出多条件叠加的分析诉求,如分析某类天气下(雨/雪/霜)、具体日期内、具体时间段、空客A320机型、15分钟周期、某进近点、某航企的正常性情况,则无法响应实现。因此,对数据粒度及维度的细化尤为重要。

数享:内外共享,高效协同。数享即数据共享,实现数据资产化管理。目前,机场大多存在无数据资产或数据资产管理混乱的现象,无法进行有效的数据共享,进一步导致部门内、跨部门、跨单位的业务协同出现困难。针对这一问题,数据中台提供了相关组件予以解决。通过数据中台零编码API、简洁接入、安全管控的方式,针对航班、旅客、物流、安保、航班等不同专题库实现多服务集成,类似于打造数据资产“超市”,机场其他部门、不同应用及大屏、移动端、领导驾驶舱等可视化终端可以通过数据中台的资产管理模块申请数据调用、处理和共享。除内部共享外,数据中台还能实现机场与业态公司、航空公司、民航局、民航局空管局等外部单位的精细化数据共享,从而全面反哺业务创新,赋能机场生产运行。可以说,通过数据治理、数据融合打造机场数据资源管理中心,能为上层业务联动、业务创新提供数据支撑,实现数据对外高质量共享,为数据资产增值和交换奠定坚实基础。

三、数据管理体系建设需要持续迭代

从数据中台实践来看,从梳理数据源入手,以数据中台汇聚各类业务数据,制定数据标准,提高数据质量,实现数据治理,最后形成数据服务集市,实现数据统一管理和精细化对外共享。在四大能力中,数聚是基础,可解决“数据孤岛”问题;数治可解决数据质量低下的问题;数融贯穿全过程,可解决开发者多维开发的问题;基于数融,数享可打破机场外部的“数据孤岛”。这四大能力共同构成了机场数据中台体系,助力机场实现以业务为驱动的精细化管理,全面提升机场运行效率。(作者:吴昊,单位:新疆机场集团)