扫码关注官方微信公众号

陈思恩:“联邦学习”引爆中国民航产业升级新引擎|《产业转型研究》专刊报道

2021-04-06


导 读

《产业转型研究》专刊创刊刊物在发行后收获了强烈反响,得到了产业界的一致好评。专刊第二期刊物已刊印完成,本期刊物更是邀请了数位研究数字时代产业转型理论和实践的专家学者及企业者们,各抒己见,探索全球经济数字化转型的基础理论,及大量的企业数字化转型实践先进案例,展现最活跃的数字生产力在不同商业环境下的创新应用,在 2021 年这一“十四五”开局之年,更好地为中国经济的数字化转型服务。

本公众号会对《产业转型研究》专刊第二期中所收录文章进行持续报道,以下为厦门大学兼职教授、教授级高级工程师、  中航工业中航联创科技人工智能首席科学家、  中国航天科工集团航天长峰大数据首席科学家陈思恩发表于《产业转型研究》专刊 2020 年第 11 期的文章,特此分享,以飨读者。



 

“联邦学习”引爆中国民航产业升级新引擎  
文/陈思恩
厦门大学兼职教授、教授级高级工程师、
中航工业中航联创科技人工智能首席科学家、

中国航天科工集团航天长峰大数据首席科学家



     
PART1      

     

     
民航产业当前困境及数字化机遇    
民航 安全与旅客服务成为焦点    
随着民航业快速发展,航空安全成为新时代民航建设的焦点。从 2014 年马来西亚波音 777-200 飞机失踪事件到 2018 年 10 月 29 日印尼航班 189 人遇难事件,无不在给航空管理者拉响警钟。资料显示,2019 年全球共发生 86 起航空事故,257 人死亡。2018 年全球年共发生 160 起航空事故,534 人死亡,其中共有 15 起致命的航空事故,造成的死亡总数为 556 人,较 2017 年大幅增长。目前航空业主要安全问题是飞机失控问题,急需利用数字化技术建立一个更加完备的航空监测预警系统,协调航空公司、空管、机场、油料等众多参与方力量,提前预判灾情,避免灾难发生。  
除了航空安全,航空服务也是新时代民航建设的重点。据公开资料显示,10 年来民航旅客维持较快增长,需求年化增速达 14%。2019 年民航旅客量达到 6.6 亿人次,民航旅客周转量在综合交通运输体系中的占比达 32.8%,同比分别增长 7.9%、1.5%。如何更好地满足人民群众日益增长的航空运输需求,增强旅客对航空服务的满意度与幸福感,是航空公司的重要任务。  

民航产业数字化转型势不可挡

伴随着数字化浪潮重塑世界经济格局,数字经济已经成为推动我国经济发展的新动能。根据中国信息通信研究院发布《中国数字经济发展白皮书(2020年)》,提出的“四化”数字经济框架,数字产业化、产业数字化、数字治理化、数据价值化将重塑产业链,提升产业智慧运行管理。《数字时代的竞争》曾描述,“在 21 世纪的数字经济中,全球技术格局正在重建,竞争在各技术领域不断加剧,尤其是在 5G 和人工智能领域”。数字技术的融合应用以及我国供给侧结构性改革的不断深化,加快数字技术与实体经济的融合发展已成为共识。在“新基建”的加持下,中国政府加快 5G 网络、数据中心等新型基础设施建设进度,5G 与大数据、物联网、云计算、AI 等领域将深度融合,为智能经济的发展和产业数字化转型提供新一代信息基础设施的底层支撑,催生出新的经济发展形态。  
中国作为全球第二大航空市场,有望在 2024-2025 年成为全球最大的民航市场,抓住“数字化”这个新价值增长点机遇,抢先利用数据、人工智能技术进行产业转型布局,实现航空产业跨越式发展是航空企业增强核心竞争力的必要抓手。国外航空业数字化转型早于中国,据美国商业资讯报道,Palantir Technologies 已宣布与美国联合航空公司达成长期战略合作关系,利用数字化手段帮助美联航改善客户体验,帮助航空企业提升运营收入,实现数字化转型。中国国内三大航企也逐步推进数字化转型,在民航安全、航空服务上,综合运用大数据、云计算、物联网等颠覆性技术来监测飞行安全,减少安全隐患,打造数据驱动型企业、提升顾客体验。数字化无疑已成为引爆民航产业升级、挖掘新商机的新引擎。

     
PART2      

     

     
民航在数字化产业转型中遇到的瓶颈

字化转型需要通过现代信息化技术优化甚至重构传统流程,完成旧系统的进化和迭代,最终实现管理模式与商业模式的转型,其转型之路任重而道远。当前,传统民航企业在转型中还存在着数据处理效率低、数据隐私泄露、数据孤岛缺少联动等待解决问题。

数据处理

数据是信息的载体,云计算、大数据、移动互联网、物联网、人工智能等新兴信息技术本质都是挖掘数据的价值,新技术在各行业的普及和应用,不仅在不断扩展数据量级,也让数据管理和价值挖掘变得愈加复杂。数字化转型必然要求企业构建统一的数据中心来应对数据爆炸。现阶段民航产业的数据中心仍是“核心-汇聚-接入”这种传统的三层架构为主,仅供支持百兆比特/秒级的并发,单点故障风险高、功耗大,已不具备支持呈指数级增长态势的数据量级处理和存储能力。而且由于框架限制,无法实现横向扩展,只能通过采购新硬件的方式进行纵向的容量扩展,由专业人员进行前期架构调研和匹配专门的存储管理软件,实施安装和配置,不仅需要耗费大量时间资源,多硬件节点间数据传输效率性能瓶颈也日益显现。

数据隐私

随着大数据的进一步发展,重视数据隐私和安全已经成为了世界性的趋势。各国都在加强对数据安全和隐私的保护并颁布相关法规:如欧盟近年来引入的新法案《通用数据保护条例》(General Data Protection Regulation,GDPR)和中国在 2017 年起实施的《中华人民共和国网络安全法》和《中华人民共和国民法总则》,都表明对用户数据隐私和安全管理的日趋严格将是世界趋势。这些法规的建立在不同程度上对传统的数据处理模式提出了新的挑战。航司一方面希望从内部系统积累的大量出行相关数据发现价值,另一方面也在寻求与外部企业或机构进行数据资源整合,实现合作共赢,如何在保护用户数据隐私的前提下整合数据资源,尽可能挖掘数据价值是民航乃至各行各业一个亟待解决的问题。  

数据孤岛

近年来民航产业在数字化、信息化建设上突飞猛进,企业管理职能划分越发精细,而且伴随着市场变化不断发展出新的职能需求。围绕不同的管理职能,在部署基础设施与信息系统时必然有不同的侧重点,如客户关系管理系统、订票系统、出行系统等等。不同部门数据之间互相独立,各自定义,没有统一的数据存储、调用、维护方法,就像一个个孤岛一样难以与其他部门数据进行连接互动。数据孤岛使业务链完整性被破坏,各链条上信息的共享、反馈难以实现,同时并不只存在于航司内部不同部门之间,数据孤岛导致的数据互通难的问题在业界产业链上下游企业信息资源整合、同行业信息共享、异界合作上也造成了很大的阻碍。



     
PART3      

     

     

“联邦学习”打通民航数字化转型任督二脉

联邦学习定义及分类

随着 GDPR 等日益严格的数据隐私法规生效,以及公众数据保密意识的不断提高,联邦学习是建立在各方数据都保留在本地,不泄露隐私也不违反法规的基础上多个参与者联合数据建立虚拟的共有模型,并且共同获益的体系。在该体系下,各个参与者的身份和地位相同,且联邦学习的建模效果和将整个数据集放在一处集中建模的效果相同,或相差不大即联邦学习模型能够充分的逼近理想模型。

如图所示联邦学习分为横向联邦学习、纵向联邦学习及联邦迁移学习三类。

横向联邦学习适用于联邦学习的参与方的用户特征重叠较多而用户重叠较少的情况,把数据集按照横向(即用户维度)切分,并取出双方用户特征相同而用户不完全相同的那部分数据进行训练。例如有两家不同地区的航司,它们的用户群体的相互交集很小。但是,它们的业务很相似,因此,记录的用户特征是大致相同的。此时,就可以使用横向联邦学习来构建联合模型以达到扩大数据量、提高模型精度的效果。

纵向联邦学习适用于在两个数据集的用户重叠较多而用户特征重叠较少的情况,把数据集按照纵向(即特征维度)切分,并取出双方用户相同而用户特征不完全相同的那部分数据进行训练。例如有两个不同机构,一家是某地的运营商,另一家是同一个地方的航司。它们的用户群体很有可能包含该地的大部分居民,因此用户的交集较大。但是,由于运营商记录的都是用户的套餐等级与通话时长等信息,而航司则保有用户的出行记录,因此它们的用户特征交集较小。纵向联邦学习就是将这些不同特征在加密的状态下加以聚合,以增强模型能力的联邦学习。

联邦迁移学习是纵向联邦学习的一种特例,适用于在两个数据集的用户与用户特征重叠都较少的情况,不对数据进行切分,而可以利用迁移学习来克服数据或标签不足的情况。例如智慧机场的模型迁移,我们可以对比不同城市机场之间的相似度来迁移训练好的模型,这样可以使机场在前期省去大量的工作量并且提高模型的准确度。 

联邦学习 保障机场运营安全高效的利剑

机场智能安防的应用主要体现在机场大安防平台构建上,通过整合视频监控、门禁、飞行区周界报警、消防报警、停车场管理等多个安防系统,形成全面的安全防范体系;并深度运用安防智能分析技术,通过图像分析、生物识别等手段,实现安全事件预测和主动预警,提升安全防范能力。如大兴机场的无感通行、刷脸登机、智慧停车等,通过大安防平台,协同合作,保障机场的安全高效运营。

视频监控系统作为安防系统建设中的重要组成部分,其智能化程度在不断提升。在人工智能与人脸识别方面,由于人脸特征信息作为高敏感性信息,存在不法人员企图通过不法手段获取这些信息。因此,在智能人脸、智能视频诊断与分析算法、视频智能结构化处理、视频智能多维算法研究方面,必须重视数据隐私安全,使用联邦学习安全融合多方数据,以提高模型精度,解决敏感信息泄露的问题。将联邦学习应用于机场大安防平台的构建上,解决多个安防子系统的数据孤岛问题,也可将其运用于安防智能分析的模型构建上。 

联邦学习 优化旅客服务的灵丹妙药  

中国航空公司市场营销方式正亟待适应新变化、新要求,进行一次深刻的营销变革与转型。基于数字化背景,在安全合法、保证数据隐私不泄露的前提下融合航司的数据和第三方企业或机构的数据,对海量数据进行分析,构建广告投放、旅客价值分析、旅客用户画像、个性化定制推荐等多个模型,提升模型效果,有效激发旅客出行需求以及提升旅客对航空公司的忠诚度。

利用联邦学习技术,为航空公司旅客定制个性化的营销策略,实现旅客的“拉新”和“引流”。利用联邦广告技术建立转化预估模型,应用于广告投放中,提升广告投放的效果,实现顾客“拉新”的任务。在使用联邦广告技术进行“拉新”之后,将联邦学习和证据推理方法相结合,对潜在顾客进行价值分析,并对其进行分类。对不同类别的顾客,分析群体的特点及其需求,着重分析群体的画像描述,贴合客户的需求,使用联邦推荐算法,量身定做个性化服务方案,进而实现旅客的引流。

 


     
PART4      

     

     

信息安全与数据共享将是未来数字化转型趋势

 

新形势 系统和信息安全将成为航空公司的关键点

ATIT 在 2018 年 11 月 26 日文章《航空公司数字化转型正在引入新的安全风险》中指出,数字化转型的深入使得航空公司对 IT 的依赖性更大。在过去几年,一些航空公司的IT故障导致了巨大的经济损失,而一些航空公司发生的旅客信息泄露让这些航空公司的品牌声誉严重受损。例如,2018 年 10 月,国泰航空公司发布通告称发现该公司及其全资子公司港龙航空有约 940 万旅客的资料被盗取,数据包括旅客姓名、身份证号、护照号、生日、电话号码、电子邮件等重要个人信息,此案被港媒定义为香港历史上最大的个人资料泄露案。又如,2018 年 9 月英国航空公司母公司国际航空集团宣布数以几十万计经由互联网订取英航机票的顾客财务数据近几周遭窃,英航数据泄露发生在 8 月 21 日至 9 月 5 日,大约 38 万笔银行卡网上付款信息“遭受攻击”。据传国内也有航空公司发生数以几十万计的旅客信息泄露案件,但未见到正式报道,不过由于旅客信息泄露而导致旅客被实施短信诈骗的报道倒是屡见不鲜了。而同为旅行行业的国内知名酒店集团华住集团已经确认发生 1.3 亿用户信息泄露。随着欧盟 GDPR、中国网络安全法的实施,航空公司在信息安全方面的形势变得更加严峻。SITA 的研究报告指出航空公司在信息安全方面的IT投资将进一步增长。因此,在未来,系统和信息安全问题将得到更多重视。

新高度 “ABC”将成为航空公司的发力点  

ATIT 在 2018 年 12 月 17 日文章《航空公司数字化转型正在进入“ABC”时代》中描述了人工智能、大数据和云计算的应用正在成为航空公司数字化转型的主旋律。许多研究者认为当前很多企业的转型发展已经进入了 ABC 时代。这里所谓的 ABC 分别是指:人工智能(AI)、大数据(Big Data)、云计算(Cloud)。ABC 被称为是促进当前时代发展的“三架马车”,它们之间并非是相互孤立的关系,而是相互依存、协同发展的关系。首先,从A来看,人工智能在航空公司是大有应用前景的。如利用人脸识别技术来改进旅客登机体验,人工智能客服运用在呼叫中心、网站等;实体机器人指引旅客办理值机业务等。在未来,人工智能无人驾驶将大范围运用在机场摆渡车、舷梯车、加油车、送餐车、行李车等,将极大地提升飞机的运行效率以及地面的安全性。其次,从 B 来看,很多航空公司已经意识到大数据技术带来的极大价值。例如对于飞机 QAR 数据的处理和分析,可以对飞机飞行过程进行多维度的分析,改进飞行操控方式。在营销管理领域,由于围绕旅客行为的大数据汇集成为可能,因此对产品销售的预测除了通过历史数据进行分析之外,还可以通过大数据的关联分析,基于旅客行为进行预测。对大数据的收集、处理、运用能力将成为航空公司营销管理能力的核心,不同航空公司之间即将因此产生营销能力方面的差距。最后,从 C 来看,云计算技术已被航空公司广泛使用。一些航空公司出于成本考虑,正在推行“去数据中心”战略,也就是放弃自有数据中心,而是全面将应用部署到公有云上。更多的航空公司,则在使用公有云来支持其电子商务系统的运行,以获得更高的性能,并解决不同地区访问速度不一致的问题等等。就云供应商而言,仅仅提供运行应用的云环境并不是它们的战略。云供应商正在着力研发人工智能、大数据的开发平台,甚至能提供很多带有业务功能的云端平台,充分低成本地利用这些云端的应用也是航空公司云化的重要方向。

总结而言,航空行业发展到今天,各家航空公司的数字化水平正在逐步趋于统一水平线,而重新让各家航空公司产生差异化的动力,将来自于对 ABC 的应用。因此,航空公司应该意识到其数字化转型正在变为以 ABC 应用为核心,能快速应用 ABC 技术的航空公司将开始在一些特定能力方面处于领先地位。 

新突破数据开放策略将成为航空公司的着重点  

从航空公司与机场运营到旅客服务、市场营销及安全保证领域,数字化转型都将提供前所未有的创新机会和增长红利。航空公司的数字化转型需要大量的 IT 建设,除了必要的基础设施、应用系统之外,航空公司在与 IT 相关的安全方面正在面临很多风险,如何管理这些风险正在成为航空公司管理层面临的严峻挑战。具体而言困难主要聚焦在运营安全风险和信息安全风险。其中,信息安全将是航空公司数字化转型中的重中之重,但这并不意味着航空公司走向信息封闭。相反,数字化转型要求航空公司在安全的环境中开放自己的数据,IATA 也发布了《IATA Aviation Industry DataModel》,航空公司将趋向于建立 Open APIs 体系,以保证自己的产品能够被更多的开发者广泛使用。新一轮科技革命将有效打通产业间的信息不对称问题,为民航业与上下游产业及其他交通方式的深度融合提供便利,形成高效率、现代化的快速交通运输服务体系,实现互相支撑的良性发展新格局。在不远的未来,航空公司将以数据流为载体,形成一个业务流、信息流、资金流、价值流等各类资源要素有机融合的民航生态圈。因此,可以预见在未来,更多航空公司将开放出更多的 APIs,也会催生生态圈中的更多应用,航空公司已迎来数字化转型蓝海,业务格局全方位将重塑。



订购须知:

各位读者如有购买《产业转型研究》专刊第二期需要,可联系以下老师:

朱栩葶老师:

联系电话:010-83021220 

邮箱地址:zhuxt6@sem.tsinghua.edu.cn  

聂方威老师(数据杂志):

联系电话:138 1160 1022 / 010-84277808

   
内容来源|《产业转型研究》专刊 2020 年第 11 期    
编辑、图片|段文秀    
审核、责编|杨帆