![]() |
中国软件与技术服务股份有限公司政企事业部产品研发部负责人张巍 演讲
中国软件与技术服务股份有限公司政企事业部产品研发部负责人张巍 演讲(记者汪洋/摄) 张巍:各位领导、各位专家,大家下午好!我在中软负责人工智能产品研发工作的,所以今天可能更多从技术的角度来分享一下我们在网信领域人工智能的一些思考和实践。 因为中国软件其实在过去20年里一直在做信创工作,所以今天我花一点点时间给大家分享一下信创工作在现在这个发展阶段,因为我们的民航领域是属于关键技术的行业,其实这个信创工作对于它的发展来讲是非常重要的。 另外一点我们其实在过去几年里面,一方面推进整个信创工作的发展,同时也在持续探索人工智能的发展,所以这点其实在党政机关里面一些实践以及我们参与到智慧民航建设里面的一些思路。 总结一下信创工作,其实用三句话来讲就是关后门、堵漏洞、防断供。刚刚华为的刘总讲了,英伟达的卡最近在美国商业安全局进行了垄断禁止,基本上这个卡涨价涨的非常快,可能年初是100多万的一台服务器到今天是200多万了,相同的产品其实在海外价格远远没有这么贵,我们就可以看到信创这个工作对于整个我们民航的发展其实是非常关键的一点。 我们梳理一下整个信创产业的发展,实际上它最早是从“核高基”这个国家课题发展起来的,经过三个阶段的发展以后,其实今天已经进入到了深化替代的阶段,我刚才在下面看到特别好的一点,我们在民航领域有很多我们自己国产的行业软件其实已经投入了生产,其实对于我们做信创的科技工作者来讲是一件感觉到特别高兴的事情。 看前三个阶段,我们看到整个的信创产业实际上已经形成了这种规模,硬件终端的这种数量其实已经有几百万台了,我们可以看到说不仅仅是在计算、网络、存储、安全,各个方面实际上都有非常大的进步。 到了今天深化替代为主的阶段,从我们的角度来讲是怎么理解整个接下来信创的发展,其实很重要的一点是说整个的政策会更加的开放,原来我们说有一些软硬件的名录,可能就没有了,更多的点可能是集中在整体的解决方案,其实刚才大家谈到的,我看谈到了云、大数据、人工智能。 我们来看过去信创的实践,其实整个给信创产业带来了非常大的进步,到了人工智能这个阶段,大家都已经在谈智能化升级这个阶段,包括今年炒的非常热的大模型,和我们的信创碰撞,是一个什么样的情况呢,我特别荣幸在智慧民航这个论坛来分享我的一些想法。 今年最近各个大的科技公司都在做科技工会,大家谈的最多的点就是大模型,最多的点实际上就是在讲AI原生应用,我理解AI原生应用是一个什么样的应用呢?未来在任何数字化系统里面,当缺少了模型这一层之后,整个系统平台就没有办法再运转,很多系统平台能力是围绕着这个模型来展开的,这是我对于整个的理解。 所以说未来我们可以看到整个数字化系统的结构越来越简单,简单的分成数据层、模型层和交互层,我们看到这个趋势给我们带来一个什么启发呢,过去我们其实在所有建立数字化系统的时候,实际上是以计算机为核心的,实际上是以流程表单为核心的,今天当大模型技术出现以后,进入到通用人工智能阶段的时候,其实我们可以看到很重要的一点是什么呢?就说大家开始围绕着模型来进行不停的迭代,就像大家知道要几万张A100的卡去做这样一个事情,实际上就变成了一个常态,变成了很多科技公司重点来推进的事情。 但是当整个技术的变化已经到了这个阶段,其实我们再看一看整个产业,尤其是信创这个产业有一个什么变化呢,其实它就类似于我们过去比较熟悉的Wentail的联盟,今天实际上是形成了一个英伟达的GPU加上以Open AI为代表的GPT的一种新的商业联盟组合。 现在一个很重要的路径是什么呢?由于GPT技术是用了Attention机制的,它所有数据的关联性是你指数级的量去进行消耗的,意味着什么呢?它对于GPU算力的消耗是非常大的,那么它就形成了一个模型越做越大,由百亿模型变成千亿模型,甚至是万亿模型。同时GPU算力的开销越来越大,整体对于整个人工智能产业形成一种强算力开销的一种态势。 但是对于我们整个国内数字化转型、智能化升级来讲,是不是我们唯一走的一条路,这是我们在过去的两三年里一直在思考的问题。 所以我们是怎么理解这个事情呢?我们现有的国产的软硬件,国产的GPU卡,国产大模型技术能不能跑起来,能不能发挥像GPT相同的这种效果,其实在今年我们也有一个很好的突破我们完全基于国产的飞腾CPU,麒麟的操作系统,国产的GPU,加上我们自己研发的模型,在单一的一台服务器上就能够跑起来,它其实已经能够部分的去达到GPT这种对于自然语言理解的能力。 同时我们会看到说基于整个大模型应用,其实分成两个阶段,训练阶段和推理阶段,当前这个阶段,各个科技厂商都在大量的囤GPU,它其实是解决训练问题的。我基于国产的GPU,然后搭建的并行计算的集群进行训练的时候,我们实际通过软硬件算子调优的话,我们其实能达到A800的50%左右。 意味着说实际上我们已经去解决了一个大模型训练的基本可用的阶段,同时在整个大模型推理上面,其实我们通过并行加速技术或者是量化模型蒸馏技术,实际上也可以在一个非常小的盒子里面就把大模型跑起来。我们现在能做到的是,在A4纸大小的终端上面,我们就能够把大模型跑起来。 在这个过程当中,我们也很自信,实际上大模型这个技术不是说我们只有跟着OpenAI跑才能解决的问题。 同时我们也可以看到在算法上面,从大模型的架构来讲,它实际上是一个多层神经网络构成的,它的浅层神经网络实际上是解决了自然语言的问题,刚刚大家讲到知识的内容,实际上是它通过训练以后压缩进深层神经网络的。 我们从技术工程化研究角度来讲,我们其实在这个阶段,我们的理解是说我们很多文本这样的非结构化数据以及业务上的这种结构化数据,实际上它需要通过这一个虚拟的数据层来解决,就是我们刚刚这个图里面讲到的数据编织技术,同时大模型在这个阶段,尤其是在我们国家关键的基础设施在应用的时候,它的这种自然语言的艺术识别以及逻辑链的能力实际上是很容易被调用起来的。 我们把浅层人工神经网络大模型的能力用起来,深层大量知识的更新和迭代怎么用呢,其实我们用知识图谱,知识图谱这几年的发展非常快,我们可以看到很多行业都已经把构建知识图谱作为已经正在做或者做完的工程,我看很多分享嘉宾在讲DIKW模型,其实我们可以看到知识那一层是最接近人工智能的。所以从我们的角度上来讲,算法和模型这个点在我们信创里面,我们也是可以解决的。 对于数据这样一个点,中国电子实际上是最早成立一个专业的数据子集团的央企,实际上我们在整个数据里面提出来数据要素操作系统,通过数据元件化,把敏感性的信息或者是隐私信息隔离掉,把经过数据元件化以后的数据放到这个模型里面去训练,这条路径我们已经走通了。 在今年我们在两个行业里面做了这样的实验,第一个是我们在税务总局做了一个“税真舟”这个系统,我们可以看到在这个系统里面,我们可以通过自然语言直接把业务数据调取出来,能够形成推理和碰撞。特别有意思的一点,我们当时问了这个系统说五一长假期间哪个行业最火,最火这个词我们是没有做任何训练的,但是通过模型推理,它就推理出来交通、食品这两个企业相关的数据就要抽调出来,这一点实际上当时对于我们来讲也是非常震惊的,我们可以看到在很多场景里面,基于大模型通用人工智能能力其实已经能够给我们数字化的建设以及智能化的升级带来非常好的效果。 我们建议未来在智慧民航里面,其实在构建自己的模型体系的时候,其实要重点考虑三个方面。 第一个方面就是自主化,我们是不是能够基于国产的软硬件搭起来自己的以大模型技术为核心的智能体。 第二个方面是不是能够在自己的数据中心通过小规模的计算集群就能够把我们的模型跑起来。 第三个方面尤其交通在智慧民航里面,其实模型的应用一定是一个高并发的场景,在较小的算力下,能不能通过一种轻量化的技术,让模型在推理阶段有一个很好的应用,这是我们针对于民航业务特点给出的一些思考。 所以是中软在去年其实非常有幸参与到总局的智慧监管建设里面,我们也是想在几个方面进行一些实践和应用。 第一点是对于整个算法模型的理解,我们希望在未来对于监管这个行业,实际上是由于编制比较紧张,我们的监管工作量非常大,能不能快速的把我们民航监管相关的政策、相关的知识用一种智能助手的方式快速地找到,同时在找到这个知识助手其实给这个问题进行回答以后还能够清晰的指出来,这是来源于哪个文件。 我们在自己实践的过程中发现,采用这种大模型技术之后,当我们把不同文件里面的知识点都能够关联到之后,然后由大模型进行数据合成,那么回答的整个结果实际上是条例更加有价值。 第二点就是基于未来建设的系统,我们的理解,未来整个这样一个智慧监管里面,其实应该有一个很重要的模型这一层,这一层实际上是基于底层数据编制以及经过训练以后的L2的任务模型,把这个数据有机的整合起来,同时能够通过这样一个比较小的集群,能够把行业里的模型训练起来,最终实现了更好的数据碰撞、数据推理以及人机交互,这个实际上在我们在智慧监管里面一些想法。 最后给我不到一分钟的时间介绍一下中软,中软一直以来服务于党政信息化的,在公开的一些评测机构,其实中软的解决方案在国内始终是第一的,同时我们有70的操作系统和数据库,我们其实也是希望通过中软软硬件技术能够在智慧民航里面发挥更多的作用。 最后,非常感谢,如果大家后续有什么样的技术问题或者交流欢迎联系我们中国软件,谢谢大家! |
中国民航报社 版权所有 京ICP备05024158 如有意见和建议,请惠赐E-mail至 news@caacnews.com.cn |