第十九届民航信息化发展论坛（IFCA）

北京旷视科技有限公司大交通部技术总监王锐

王锐：各位下午好，差不多晚上了，时间比较长，所以我快速一点尽量讲一点干货的东西。首先讲一下，因为我今天的课题是新一代的AI生产力平台，AI现在来说在国内在各行各业里面都得到了一个很好的应用，特别是列举了一下，这个是目前我们旷视公司基于很多的行业，发现基本上每个行业对AI的诉求就是越来越强烈了，特别是像在金融可能会走的比较先一些，我记得是在2015年的时候已经开使用AI技术了，接下来教育、工业、通讯包括交通其实都在陆续的提出对AI的要求。

下面讲一下每个行业里面对AI一些诉求，这也是我们搜集的一些，哪些行业里面会有一些诉求，这些诉求对于AI公司来说，我们不可能去覆盖每一个行业，因为旷视作为一个中型企业其实是有一千多号的研究员做训练的，但是我们覆盖不了所有的行业，各行各业里面提出很多个性化AI的诉求，基于这些需求跟市场的分析以后我们该怎么办，所以旷视推出了自己一套新的AI生产力平台来解决这个问题。

我们可以看一下这个图，其实AI通俗一点理解其实类似于这张图，我们需要做一顿美食的话，首先需要原材料，其实对标我们现在做AI里面的数据。

第二个需要有好的锅就是工具。第三个就是要有一些能力方面的东西比如说你得有造猛火，这个同时对标到数据算法跟算力这一块。我下面讲的这个平台给大家把整个的一套的东西赋能到各个行业。让大家各个行业自己能够通过这个工具去学习训练自己想要的AI算法。

那么旷视的AI生产力平台我们内部叫Brain++，这个事情也是从旷视是唯一一家，从2020年4月份在全球开源我们整个Brain++系统，其实是分为三个方面：

第一是数据MegData这个没有办法开源，这个是客户自己各行各业自己的。第二个就是MegCompute就是算力，说白了就是服务器，GPU。第三个是核心就是MegEngine整个旷视的深度学习框架，MegEngine针对全球全部开源大家在网上开源了，都可以找得到。

整个的Brain++里面的流程可以跟大家讲一下AI的模型训练怎么来的，第一个说就是一个数据采集，数据采集以后不是所有数据能用，我的系统里面有一个数据预处理，把数据导进去以后，对于有一些有瑕疵的数据不符合想要的模型训练出来的一些数据可能在这个系统里面会帮你进行一个清理，接下来就是数据标注，其实最符合整个行业的一个诉求，因为你想需要什么样的一些视觉的模型，这个只有用户自己知道，这个时候旷视的平台会帮助你去做一个数据标注这么一个工作，标注完以后后面就是自学习训练了。

这个里面加了一个东西就是说哪怕第一次学习训练出来以后这个模型可用，但是由于数据量不够，最终没有达到效果，那么这个模型可以重新输入到我这个Brain++的平台进行二次迭代、三次迭代甚至四次迭代逐步把这个模型进行优化这个是整个训练的过程。

接下来其实也是非常有用的一个部分就是算法的封装，我们这个平台的话基本上你学习训练完以后封装成各种平台可以放在安卓的平台里面，也可以放在其他平台里面，这个在Brain++平台自己选，同时可能跟谷歌的还有百度的有点不一样的地方，我这个里面进行算法封装的过程还做了一个数据对齐，很多通过学习训练的过程当中识别率达到了90%或者95%，当你封装使用的时候你会发现通常会掉点，掉五个点或者十个点，这个问题在Brain++里面完全解决这个问题了。

那么这里会有一个视频大家可以看一下，这个是我们轻量级的Brain++，比方说我现在有一个学习训练摔倒这么一个算法，那么首先你会去搜集类似于摔倒的这些数据集，然后进行标注，告诉我这个Brain++这种所有的行为都属于摔倒，然后搜集完以后，训练的过程交给我这个系统进行一些模型的训练。

训练完以后这个模型就在我这个系统里面了，这个时候要去验证它的话可以直接接入我们感知端的相机，把你训练好的模型把它对应起来，这个时候立马把之前训练的模型使用起来，这里只是打个比方。

这个东西都是目前我们Brain++里面我们自己用的一些，包括旷视现在所有的算法，我们自己的都是通过我这个Brain++平台做的。

我们不同的地方在哪儿，整个平台既然开源了，真正意义上开源，整套系统可以私有化部署，你可以部署到你的自己的那个服务器上。这要解决什么样的问题？大家知道，现在数据特别敏感，你像你去用那个，必须上传到云端做训练这个涉及到数据隐私的问题，这套系统完全部署到你的公司或者说部署到我的机房内网里面做整套的事情，这个是解决这个问题的。

那么它的特点在哪里？其实总结来说我们其实就是开放中把这个平台开放出来，一个目的就是让深度学习变成简单的开发，也就是说拥有这个平台以后，所有拥有一般开发能力的公司都能拥有我这个深度学习的平台训练出属于自己的模型算法。

这也是为什么我们想去真正意义上把AI赋能到各个行业做出一个非常重大的这么一个决定，它有一个轻量级的部署也有重量级的部署，比方说旷视有一千多人的研究人员，我们搭了一个GPU的集群，如果对于一个行业或者对于一个机场可能没有那么多研究人员，用这个平台人可能三五个人，这个时候搭一台到两台的GPU服务器把这个东西运行起来。

下面讲场景，既然是民航，我们通过Brain++在民航里面我们旷视目前做哪些事情，第一个是整个旷视的技术演进，整体的核心所有旷视产品包括平台包括算法都是由Brain++来训的，训出来以后会把我们的算法移植到各种感知端，包括我们的现在所做的边缘盒子或者AI相机，通过边端设备的应用组合成整合解决方案最终输出到各行各业里面，这个是旷视技术的演进的流程。

机场行业旷视做了哪些东西？第一个不多说，ID，我们旷视给航信做算法赋能的，航信做大平台，那么大平台下面的算法各个场景应用的边端算法我们提供这块的东西，然后来实现旅客通关这个是其中一个场景。

第二个场景就是机场里面所做所有的视频结构化，包括现在后疫情时代很多民航局发了一些文，通过视频分析做一些人员的追踪轨迹的还原，同行人的分析，怕有些确诊的人，能不能用AI视频分析技术找出来，这个里面会把旷视基本上关于人、车、物所有的算法放在大的平台里面，然后去帮助机场做一些比如说人流统计、密度统计、轨迹分析还有重点区域。

那接下来讲一下我视频结构化里面有一个很大的特点就是我们旷视自研的智能板卡，市面上都是一芯难求更不要说GPU了，越来越贵。旷视很久之前布局芯片这块的东西了，是今年正好去把自己的智能板卡推出来，对标GPU有哪些不同？首先来说它是算力和算法一体的产品，它能去解决旷视现在所有的算法大概有上百种都全部放在我们的智能板卡里面，这个智能板卡对比GPU，GPU一般解决视频结构化的话，纯视频流大概是到16路或者40路左右，不同厂家解析的能力不一样，远远实际上比应用GPU好很多，里面各种算法可以根据应用自己去选，绝对是目前来说非常的一个爆品在结构化的应用场景里面。

其实大家算笔账，如果用五百或者一千的视频接上来应用传统GPU的模式跟我采用智能板卡模式最终算下来成本可能不到传统GPU三分之一，这个是算过账的，接下来还有一个场景就是区域，这个不讲了，前面已经很多专家讲过了，但是我还是要提到刚刚的板卡，其实我也可以把我这些所有的推行区域保障的算法放在板卡里面，这个场景的优势。

第四个场景也是目前旷视比较看好的，就是关于机场的内部员工通行，因为民航局发布一个标准，意思就是说员工通行肯定除卡以外加一个生物识别技术来一起保障这个通行的安全，旷视基于这个东西结合我们平台以及我们边端设备这个是旷视面板机，旷视做面板机做了几年经验比较丰富，里面支持刷卡、刷脸、刷二维码等等一体化的面板机实现的，这个目前在白云机场那边已经上了几百台了。

最后讲一下旷视可能大家对它的理解，就是一个AI公司，但实际上我们的战略，我们的布局不单单只是做AI，我们把AI跟实际的应用做结合，然后做一个最硬的AI公司，这个是目前旷视基于Brain++训练出来所有算法赋能到我们自研所有的一些硬件产品，包括云端的包括算力端的服务器包括边端的OAR包括最终终端的AI相机包括通行的面板机测温所有的产品做的比较全的这么一个产品体系。

我的分享到这里，谢谢。