|
中国民航管理干部学院数据治理与决策优化实验室执行主任刘一 演讲
中国民航管理干部学院数据治理与决策优化实验室执行主任刘一 演讲 刘一:尊敬的各位领导、专家和业内外的朋友,下面我和大家做一个分享,这个分享一方面是结合我们重点实验室的工作为大家汇报一下对于智慧民航建设的理解和思考,另外一方面也是按照论坛的要求,就这个智慧民航展望的角度和大家展望一下智慧民航的发展。 我们注意到从2017年开始,业内开始陆续出现了四行机场、四强空管等等概念,后续民航局智慧办又发布了《关于推进新基建智慧民航建设路线图》包括《数据治理规范》等重要的行业文件,在这个过程中,业内在机场、空管等各个领域以及在数据基础设施、人工智能新技术等等方面开展了大量的工作。 从现在行业的发展,我们认为随着数字化建设的推进,当前全行业正处于全业务数字化的刻画到关键业务智能化决策发展的关键阶段。 在智慧民航建设路线图和新基建的规划当中对于创新基础设施包括行业智库,行业重点实验室等方面也做出了相应的要求。这样的背景下我们的数据治理与决策优化的实验室在2021年被认定为民航局重点实验室,实验室目前主要承担着航空公司机场空管等行业各单位的大数据,人工智能信息化规划的相关工作。 下面结合论坛主题从以下三方面给大家汇报思考。首先是民航数据治理方面。民航数据治理是行业数字化转型的重要基础,也是构建行业大模型的技术和创新的基础。我们注意到民航行业数据具有以下几方面特征: 第一、我们行业是多主体运行,并且相应的责任边界区分比较清晰。这样行业数据分散并且标准不一,所以需要制定相应的数据治理规范,从标准上统一并且打通各种主体的数据。 第二、民航的专业繁多复杂,从海量的数据中挖掘出高效的价值是难以捕获的,所以需要针对特定的主题将高价值的数据进行集成融合和知识集群。 第三、民航是一个高复杂度和脆弱性并存的行业,需要我们对数据进行实时的态势感知和预测,对于数据质量和处理性能的要求很高。 第四、行业对于安全性和业务连续性要求很高,所以数据安全问题尤为重要。 第五、民航业对于资源特别是稀缺资源高效科学的利用依赖性很强。宏观上行业资源到微观上运行资源,一个机场各种跑道资源,登机口资源等等,这些都是强资源依赖的行业,所以我们需要对于数据提取出资源优化的关键特点训练相应的模型来辅助决策优化。 在这样的背景下,我们认为民航数据治理它的内涵是以民航行业数据为主要对象,以最大限度地实现数据价值w目标,确保数据安全的情况下通过多方共建,共治,共享的方法,实现面向全行业,全生命周期的优化数据质量,改进数据服务,释放数据价值的全过程。这样的背景下,民航局智慧办的领导下,系统提出了智慧民航数据治理,7+1的规范体系。一方面会给出民航数据治理的完备定义,另外一方面基于数据的一些特点,给出相应的技术路径。比如说针对数据的架构数据治理的技术,数据质量的标准,这些需要针对特定的行业的需求场景来对数据模型,原数据管理,主数据管理,数据的完整性、准确性、一致性、有效性等等方面进行相应的剖析。 比如智慧机场领域,我们针对数据架构和业务架构应用架构影射架构之间的关系形成这样的行标准像5052这个机场数据规范与交互数据指南。通过对于机场的各类数据梳理和信息交互模式的规范,推动机场的各个业务部门和信息系统之间的数据共享。民航运行数据共享领域,实验室也在作为全国民航运行数据共联席会议的秘书处聚焦运行数据共享和关联融合技术方面开展相应的公关。 目前在支撑着超过一百家运行单位的相应的运行数据共享,这是关于民航大数据治理方面的简要思考。第二点也是现在很热的点,就是针对大模型我们简要地谈些想法。如何将数据转化为行业知识是发挥数据价值,促进智慧民航发展的关键问题。特别是近一两年内,智慧界在知识图谱,大语言模型方面取得了飞速的突破。对于我们行业智能化演进提供了重大机遇,同时也提出了很大的挑战,就是如何实现AI技术与行业需求场景的对接。 实际上我们注意到当前通用类的大模型,特别是精简意义上的大语言模型,其底层算法架构基本相通,算力的投入和训练数据的丰富是它快速发展的关键,也是众多科技公司的关键发力点。但是如何应用这种通用大模型对我们行业进行赋能? 我们知道所谓通用大模型垂直领域的应用,它的若干种技术路径,比如说从预训练模型到应用模型经典的微调,还有下游任务到通用模型的靠近,另外一种就是把领域规则和狭义上大模型的结合。这样不同的技术演进的路径关键难点都是高质量的领域级数据以及大量的行业先见知识与规则,特别是后者。比如说针对航班运行、旅客服务等垂直领域,相应问题语义结构更加复杂,通用模型的泛化能力也是比较差的,这就需要我们对于这个问题的需求进行精准理解和刻化,实现领域问题和通用模型的适配。 这样一个工作很可能必须由民航业内主导贯彻,所以目前来说经典意义上的大语言模型在行业内的应用,我个人认为还有很长的一段路要走,当然我们也在做一些探索。比如说我们针对行业的法规知识和数据集成开发了一些智能法规系统,来建立针对民航政策法规的自然语言理解的知识图谱模型,实现基于语义的民航法规的知识集成,快速检索,智能比对等等,这样来提升行业的法规和知识的效能。 再比如说我们针对民航公共信息服务平台的设计,目前正在开展相应的设计工作,也是聚焦各行各业对外提供的政务服务、信息资源、知识服务这样的平台开展研究,相应的设计也是在做好相应的算力数据模型匹配。特别是基于行业内规则模型建立,来实现平台的业务架构数据架构和技术架构的结合。 一些具体领域再比如我们做的自然基金的项目是聚焦民航运行和机场仿真优化的研究,通过实测数据来构建符合机场运行规则,符合旅客以及航空器特征的仿真模型,并且把这样的模型用于机场的规划设计,运行流程以及应急预案的优化和评估,相应的算法也用于ACDM和7CDM等系统当中。 第三部分结合上述的行业大数据和大模型的融合驱动,分享一下对未来智慧民航的一些展望。我们认为未来智慧民航系统会出现一个显著特点,我把它总结为三句话就是信息的一体化、决策的智能化、人机的协同化这么几个特征。为什么从这几个特征来谈呢? 第一个是一体化方面,众所周知我们民用航空运输的系统是一个主体和责任边界众多的体系,一个航班的保障都是由几十家上百家单位参与,涉及到数百个流程。这是我们行业和其他行业相比的一个特点,不能说它是优点或缺点,但是是一个特点。数字化转型为我们这个行业带来新的机遇,就是信息数字空间的一体化,可以让我们众多的利益相关方,众多的业务流程在这样的数字空间实现无缝的信息传递和衔接。这是我们认为智慧民航第一个特点,第二个特点在智能化方面,无论是对于行业稀缺资源分配,还是对运行态势的预测、感知的优化都是非常复杂的行业级的人工智能问题。这样目前更多的算法包括其他行业更多是通用级的智能算法,侧重的是所谓民航+AI。随着各种数字化转型和专有模型的开发,会出现更多的这种AI+民航的特征。 第三个特征是针对目前的深度学习的思考。大家知道深度学习我个人认为它应用于行业有两个必须面对的问题。第一个就是刚才所提的对于行业经验规则和知识的应用,也就是所谓的数据驱动模型和模型驱动的算法,我们叫数据驱动算法和模型驱动算法,这个经典意义上在狭义上是两条路径。当然我们现在所谓的数据驱动和模型驱动,概念都在泛化。 另外一点就是我们行业对于安全性、业务连续性的要求以及深度学习目前所谓的欠可解释性,所以说我认为未来的智慧民航系统的人工智能一定是一个人机互动的系统,一方面是算法将为决策提供自动化的支持,另外一方面我们行业人员也必须要实时的干预并且优化算法,来形成这样一个人机协作化的特点,这是我们认为行业未来智慧民航会体现的三大特点。 举个例子,这是我们做过的一个大型枢纽机场进行相应的智能化运行中心IOC的设计,大家知道大型的枢纽机场目前都有几百个信息系统,如何让这几百个系统做到智能的协同,做个类比需要构建大型机场的运行大脑中枢,需要将各个专用的信息系统作为运行的神经元,这个过程需要对运行的业务和基础的数据要素进行深入的分析,比如说哪些数据是侧重时效性,比如说航班运行的指挥就需要用流计算来处理,哪些侧重数据的挖掘,比如说态势预测,就需要对数据进行相应的批处理和图处理,只有把这些数据和业务流梳理清楚才能做到相应的协同智能。 再比如我们为民航局、公安局做的一个工作,针对民航公安治安数据进行深入的挖掘和定制化的建模,然后形成一系列从经验监管到数据监管的一个方法体系。当前已经应用于民航公安对于全国民航机场治安情况的监察,来实现相应的民航机场违法犯罪案的自动核查、异常甄别、考核评价和科学量化分析,目前已经应用于全国一千万吞吐量以上的机场公安工作。 以上就是我们实验室基于行业大数据和大模型一些工作的汇报,也是我们对智慧民航特征的展望。 最后再补充一点我们实验室另外一项重要的工作就是开展民航业务知识和数字化技术结合的符合人才培养的工作,我们觉得未来智慧民航一个发展的重要指标就是行业内数字化专业人才的水平可以与信息技术行业达到并跑甚至领跑的阶段,以此来真正的实现业务引领技术和技术驱动业务的循环迭代,这也需要业内不断的加强学习和交流,这也是我们智慧民航发展论坛举办的初衷和使命。 最后,我祝愿智慧民航发展论坛越办越好,谢谢大家! |
中国民航报社 版权所有 京ICP备05024158 如有意见和建议,请惠赐E-mail至 news@caacnews.com.cn |