Nothing Special   »   [go: up one dir, main page]

CN111985685B - 基于大数据分析的航班计划优化方法、装置及电子设备 - Google Patents

基于大数据分析的航班计划优化方法、装置及电子设备 Download PDF

Info

Publication number
CN111985685B
CN111985685B CN202010675308.1A CN202010675308A CN111985685B CN 111985685 B CN111985685 B CN 111985685B CN 202010675308 A CN202010675308 A CN 202010675308A CN 111985685 B CN111985685 B CN 111985685B
Authority
CN
China
Prior art keywords
flight
delay
historical
data
cancellation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010675308.1A
Other languages
English (en)
Other versions
CN111985685A (zh
Inventor
彭祯珍
李静
刘翱
何龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Second Research Institute of CAAC
Original Assignee
Second Research Institute of CAAC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Second Research Institute of CAAC filed Critical Second Research Institute of CAAC
Priority to CN202010675308.1A priority Critical patent/CN111985685B/zh
Publication of CN111985685A publication Critical patent/CN111985685A/zh
Application granted granted Critical
Publication of CN111985685B publication Critical patent/CN111985685B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • G06Q10/047Optimisation of routes or paths, e.g. travelling salesman problem
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2411Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on the proximity to a decision surface, e.g. support vector machines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Human Resources & Organizations (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Strategic Management (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例中提供了一种基于大数据分析的航班计划优化方法、装置及电子设备。其中的方法包括:接收历史航班运行数据,历史航班运行数据包括历史航班运行时刻表和历史航行情报;基于主成分分析法对历史航班运行数据进行降维,并进行基于属性的分类;根据分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况;获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略。本发明通过大量历史航班数据分析,提出航班计划优化策略,避免了传统依靠人工分析调整航班计划的低效方式,能自动分析规律性的航班取消、延误,通过历史运行数据对比提出优化策略,减少航班取消、延误现象,降低航空公司损失,提高旅客满意度。

Description

基于大数据分析的航班计划优化方法、装置及电子设备
技术领域
本发明涉及民航技术领域,尤其涉及一种基于大数据分析的航班计划优化方法、装置及电子设备。
背景技术
随着现代网络型航空公司迅速扩张,机队规模不断扩大,航班量随之增多,不正常事件发生的概率也越来越大,加上航空公司航段任务编排紧凑,不正常事件导致的航班取消、延误对航空公司造成的影响愈加明显,不仅造成了巨大的经济损失,也降低了旅客的满意度,为航空公司带来隐性成本。为应对不正常事件,减少航班取消、延误导致的损失,航空公司运行控制部门需要对不正常事件进行分析评估,解决航班计划与运力匹配中出现的各种矛盾,为航班计划匹配合适的生产运行资源,实现资源优化配置。
现有技术主要是在不正常事件发生后,通过运筹学等优化技术对航班计划进行调整,以减少不正常航班所导致的损失,而事前主动调整航班计划以避免不正常事件发生的运行分析则主要依靠人工经验判断。根据《民航行业发展统计公报》显示,航班延误主要原因有天气原因、航空公司原因、机场原因、空管原因、旅客原因。航空公司对每个不正常航班的分析都需要参考大量统计报表,而且随着航班量的逐步增多,需要分析的数据更加复杂,空管、机场、航空公司间缺乏数据分享的现状,又进一步增加了不正常航班分析的难度。所以,仅仅依靠人工分析不能达到航空公司精细化管理的要求,同时也极大地增加了分析人员的负担。
发明内容
有鉴于此,本发明实施例提供一种基于大数据分析的航班计划优化方法、装置及电子设备,至少部分解决现有技术中存在的问题。
第一方面,本发明实施例提供了一种基于大数据分析的航班计划优化方法,包括:
步骤1,接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报;
步骤2,基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类;
步骤3,根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况;
步骤4,对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤2包括:
步骤21,对所述历史航班数据进行标准化处理,获得标准化的航班属性参数矩阵;
步骤22,利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性;
步骤23,利用kmeans算法对仅保留主成分的属性数据进行聚类分析,根据航班属性对航班分群聚类,并为航班属性参数矩阵添加类别属性。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤21包括:
步骤211,对接收的所述历史航班运行时刻表和历史航行情报进行整合,并抽取航班信息;
步骤212,对所述航班信息进行数值转化,构建航班对应的多个属性的参数数值,并获得多个航班对应的属性参数矩阵;
步骤213,按照下列公式,对所述属性参数矩阵进行标准化处理,获得标准化的航班属性参数矩阵:
Figure BDA0002583825470000031
其中
Figure BDA0002583825470000032
是属性参数矩阵标准化后第i列属性参数,Xi是属性参数矩阵第i列属性参数,E(Xi)是第i列属性参数Xi的平均值,var(Xi)是第i列属性参数Xi的方差。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤22包括:
步骤221,获取标准化的航班属性参数矩阵所对应的协方差矩阵C;
Figure BDA0002583825470000033
步骤222,设定每一属性参数对应的特征单位向量为V,求解协方差矩阵C对应特征单位向量的特征值D:
D=V-1CV
步骤223,将得到的特征值进行排序,取排序靠前的特征值所对应的特征向量来获得航班分类主要的影响属性。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤23中,所述利用kmeans算法对仅保留主成分的属性数据进行聚类分析包括:
步骤231,对仅保留主成分的属性数据中随机选择k个对象作为初始聚类中心;
步骤232,根据距离优先原则,将航班划分到距离最近的聚类中;
步骤233,重新计划聚类后的中心,如果中心发生变化则转到步骤232重新聚类,否则输出聚类结果。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤3中,每类航班的取消及延误情况包括:取消频次、延误频次和平均延误时长。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤4包括:
步骤41,基于延误或取消频次超过给定频次,以及,延误时长超过给定的航班数据进行分析,通过包括时间集中性、地域性、机型、气候的角度进行分析,得到航班延误/取消的原因;
步骤42,根据航班延误/取消的原因选取相应的对应策略,参考历史航班运行数据,判断是否存在更优策略以减少取消/延误,如有,则输出航班计划优化策略。
第二方面,本发明实施例还提供了一种基于大数据分析的航班计划优化装置,包括:
数据接收单元,用于接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报;
数据处理单元,用于基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类;
数据统计单元,用于根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况;
优化策略输出单元,用于对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略。
第三方面,本发明还提供了一种电子设备的实施例,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一所述的基于大数据分析的航班计划优化方法。
第四方面,本发明还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述任一所述的基于大数据分析的航班计划优化方法。
本发明通过大量历史航班数据分析,提出航班计划优化策略,避免了传统依靠人工分析调整航班计划的低效方式,能自动分析规律性的航班取消、延误,通过历史运行数据对比提出优化策略,减少航班取消、延误现象,降低航空公司损失,提高旅客满意度。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本发明实施例基于大数据分析的航班计划优化方法的步骤流程图;
图2为本发明实施例基于大数据分析的航班计划优化方法中,基于主成分分析法对历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类的步骤流程图;
图3为本发明实施例基于大数据分析的航班计划优化方法中,标准化的航班属性参数矩阵的获得的步骤流程图;
图4为本发明实施例基于大数据分析的航班计划优化方法中,利用主成分分析算法,对标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性的步骤流程图;
图5为本发明实施例基于大数据分析的航班计划优化方法中,利用kmeans算法对仅保留主成分的属性数据进行聚类分析的步骤流程图;
图6为本发明实施例基于大数据分析的航班计划优化装置的结构框图;
图7为本发明实施例基于大数据分析的航班计划优化装置中,数据处理单元的结构框图;
图8为本发明实施例基于大数据分析的航班计划优化装置中,数据处理单元的标准化的航班属性参数矩阵获得模块的结构框图;
图9为本发明实施例基于大数据分析的航班计划优化装置中,数据处理单元的标准化的降维模块的结构框图;
图10为本发明实施例基于大数据分析的航班计划优化装置中,数据处理单元的聚类模块的结构框图。
具体实施方式
下面结合附图对本发明实施例进行详细描述。
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
第一方面,本发明实施例提供了一种基于大数据分析的航班计划优化方法,参照图1,包括如下步骤:
S1,接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报。
S2,基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类。
S3,根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况。
进一步地,根据本发明实施例的一种具体实现方式,所述步骤3中,每类航班的取消及延误情况包括:取消频次、延误频次和平均延误时长。
S4,对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略。
在一个具体的实施例中,步骤S2可以通过如图2所示的流程图进行。
参照图2,图2为本发明基于大数据分析的航班计划优化方法中,基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类的步骤流程图。包括如下步骤:
S21,对所述历史航班数据进行标准化处理,获得标准化的航班属性参数矩阵。
S22,利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性;
S23,利用kmeans算法对仅保留主成分的属性数据进行聚类分析,根据航班属性对航班分群聚类,并为航班属性参数矩阵添加类别属性。
其中,步骤S21可以通过如下方式实现,参照图3,标准化的航班属性参数矩阵的获得包括如下步骤:
S211,对接收的所述历史航班运行时刻表和历史航行情报进行整合,并抽取航班信息。
其中,航班信息包括航班日期、航班号、出发机场、目的站、跑道、经停机场、机型、机号、航班性质、计划起飞时间、计划降落时间、实际起飞时间、实际降落时间、气象数据等。
S212,对所述航班信息进行数值转化,将多个航班信息构建为航班属性参数矩阵。
抽取航班数据后,将起始站、目的站、跑道、航班性质等信息进行数值转化,如北京首都机场为1、上海虹桥机场为2等。将所有属性都转化为数值后,构建航班对应的属性参数数值,得到多个航班对应的属性参数矩阵。
S213,按照下列公式,对所述属性参数矩阵进行标准化处理,获得标准化的航班属性参数矩阵:
Figure BDA0002583825470000071
其中
Figure BDA0002583825470000072
是属性参数矩阵标准化后第i列属性参数,Xi是属性参数矩阵第i列属性参数,E(Xi)是第i列属性参数Xi的平均值,var(Xi)是第i列属性参数Xi的方差。
在一个优选的实施例中,步骤S22的具体实施可以参照图4所示的流程图,图4为利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性的具体实现步骤,包括:
S221,获取标准化的航班属性参数矩阵所对应的协方差矩阵C;
Figure BDA0002583825470000081
S222,设定每一属性参数对应的特征单位向量为V,求解协方差矩阵C对应特征单位向量的特征值D:
D=V-1CV
S223,将得到的特征值进行排序,取排序靠前的特征值所对应的特征向量来获得航班分类主要的影响属性。
优选地,参照图5,在步骤23中,所述利用kmeans算法对仅保留主成分的属性数据进行聚类分析包括:
步骤231,在仅保留主成分的属性数据中,随机选择k个对象作为初始聚类中心;
步骤232,根据距离优先原则,将航班划分到距离最近的聚类中;
步骤233,重新计划聚类后的中心,如果中心发生变化则转到步骤232重新聚类,否则输出聚类结果。
在一个实施例中,所述步骤4可以包括如下两个步骤:
步骤41,基于延误或取消频次超过给定频次,以及,延误时长超过给定的航班数据进行分析,通过包括时间集中性、地域性、机型、气候的角度进行分析,得到航班延误/取消的原因;
步骤42,根据航班延误/取消的原因选取相应的对应策略,参考历史航班运行数据,判断是否存在更优策略以减少取消/延误,如有,则输出航班计划优化策略。
例如,某机场跑道处于维修状态,只能满足窄体机型通过,如果安排宽体机执行该航班,则需要对跑道进行调整,导致航班延误。然而,由于机场与航空公司间缺乏数据分享的现状及复杂的海量数据分析导致航空公司不能及时更换航班计划,该类型航班均产生严重延误现象。根据本专利提供的基于大数据分析的航班计划优化辅助决策系统和方法可以根据历史航班数据,进行主成分分析降维,Kmeans算法聚类来对航班分类,通过分类后的航班进行延误、取消情况对比分析,能够自动判断采取更换窄体机的优化策略能够避免因跑道维修导致的航班延误,提升旅客满意度。
本发明实施例通过大量历史航班数据分析,提出航班计划优化策略,避免了传统依靠人工分析调整航班计划的低效方式,能自动分析规律性的航班取消、延误,提出优化策略,减少航班取消、延误现象,降低航空公司损失,提高旅客满意度。
第二方面,本发明实施例提供了一种基于大数据分析的航班计划优化装置参照图6,包括:
数据接收单元60,用于接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报。
数据处理单元62,用于基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类。
数据统计单元64,用于根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况。
进一步地,根据本发明实施例的一种具体实现方式,优化策略输出单元中,每类航班的取消及延误情况包括:取消频次、延误频次和平均延误时长。
优化策略输出单元66,用于对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略。
在一个具体的实施例中,参照图7,数据处理单元62可以包括:
标准化的航班属性参数矩阵获得模块621,用于对所述历史航班数据进行标准化处理,获得标准化的航班属性参数矩阵。
降维模块622,用于利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性;
聚类模块623,用于利用kmeans算法对仅保留主成分的属性数据进行聚类分析,根据航班属性对航班分群聚类,并为航班属性参数矩阵添加类别属性。
其中,参照图8,标准化的航班属性参数矩阵获得模块621可以包括:
航班信息抽取子模块6211,用于对接收的所述历史航班运行时刻表和历史航行情报进行整合,并抽取航班信息。
其中,航班信息包括航班日期、航班号、出发机场、目的站、跑道、经停机场、机型、机号、航班性质、计划起飞时间、计划降落时间、实际起飞时间、实际降落时间、气象数据等。
属性参数矩阵获取子模块6212,用于对所述航班信息进行数值转化,构建航班对应的多个属性的参数数值,并获得多个航班对应的属性参数矩阵;
抽取航班数据后,将起始站、目的站、跑道、航班性质等信息进行数值转化,如北京首都机场为1、上海虹桥机场为2等。将所有属性都转化为数值后,构建航班对应的属性参数数值,得到多个航班对应的属性参数矩阵。
标准化子模块6213,用于按照下列公式,对所述属性参数矩阵进行标准化处理,获得标准化的航班属性参数矩阵:
Figure BDA0002583825470000101
其中
Figure BDA0002583825470000102
是属性参数矩阵标准化后第i列属性参数,Xi是属性参数矩阵第i列属性参数,E(Xi)是第i列属性参数Xi的平均值,var(Xi)是第i列属性参数Xi的方差。
在一个优选的实施例中,参照图9,降维模块622可以包括:
协方差矩阵获取子模块6221,用于获取标准化的航班属性参数矩阵所对应的协方差矩阵C;
Figure BDA0002583825470000103
特征值计算子模块6222,用于设定每一属性参数对应的特征单位向量为V,求解协方差矩阵C对应特征单位向量的特征值D:
D=V-1CV
排序子模块6223,用于将得到的特征值进行排序,取排序靠前的特征值所对应的特征向量来获得航班分类主要的影响属性。
在一个实施例中,参照图10,在一个实施例中,聚类模块623包括:
聚类中心选择子模块6231,用于对仅保留主成分的属性数据中随机选择k个对象作为初始聚类中心;
划分子模块6232,用于根据距离优先原则,将航班划分到距离最近的聚类中;
聚类中心重新计划子模块6233,用于重新计划聚类后的中心,如果中心发生变化则转到步骤232重新聚类,否则输出聚类结果。
在一个实施例中,数据统计单元64进一步用于:
1)基于延误或取消频次超过给定频次,以及,延误时长超过给定的航班数据进行分析,通过包括时间集中性、地域性、机型、气候的角度进行分析,得到航班延误/取消的原因;
2)根据航班延误/取消的原因选取相应的对应策略,参考历史航班运行数据,判断是否存在更优策略以减少取消/延误,如有,则输出航班计划优化策略。
本发明实施例通过大量历史航班数据分析,提出航班计划优化策略,避免了传统依靠人工分析调整航班计划的低效方式,能自动分析规律性的航班取消、延误,提出优化策略,减少航班取消、延误现象,降低航空公司损失,提高旅客满意度。
第三方面,本发明还提供了一种电子设备的实施例包括:
至少一个处理器,以及,与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一所述的基于大数据分析的航班计划优化方法。
第四方面,本发明还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述任一所述的基于大数据分析的航班计划优化方法。
由于大数据分析的航班计划优化方法已经在前面做了说明,相关之处参照前述说明即可,在此不再赘述。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (8)

1.一种基于大数据分析的航班计划优化方法,其特征在于,包括:
步骤1,接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报;
步骤2,基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类;
步骤3,根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况;
步骤4,对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略;
所述步骤2包括:
步骤21,对所述历史航班运行数据进行标准化处理,获得标准化的航班属性参数矩阵;
步骤22,利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性;
步骤23,利用kmeans算法对仅保留主成分的属性数据进行聚类分析,根据航班属性对航班分群聚类,并为航班属性参数矩阵添加类别属性;
所述步骤22包括:
步骤221,获取标准化的航班属性参数矩阵所对应的协方差矩阵C;
Figure FDA0004096745610000011
步骤222,设定每一属性参数对应的特征单位向量为V,求解协方差矩阵C对应特征单位向量的特征值D:
D=V-1CV
步骤223,将得到的特征值进行排序,取排序靠前的特征值所对应的特征向量来获得航班分类主要的影响属性。
2.根据权利要求1所述的基于大数据分析的航班计划优化方法,其特征在于,所述步骤21包括:
步骤211,对接收的所述历史航班运行时刻表和历史航行情报进行整合,并抽取航班信息;
步骤212,对所述航班信息进行数值转化,构建航班对应的多个属性的参数数值,并获得多个航班对应的属性参数矩阵;
步骤213,按照下列公式,对所述属性参数矩阵进行标准化处理,获得标准化的航班属性参数矩阵:
Figure FDA0004096745610000021
其中
Figure FDA0004096745610000022
是属性参数矩阵标准化后第i列属性参数,Xi是属性参数矩阵第i列属性参数,E(Xi)是第i列属性参数Xi的平均值,var(Xi)是第i列属性参数Xi的方差。
3.根据权利要求2所述的基于大数据分析的航班计划优化方法,其特征在于,所述步骤23中,所述利用kmeans算法对仅保留主成分的属性数据进行聚类分析包括:
步骤231,对仅保留主成分的属性数据中随机选择k个对象作为初始聚类中心;
步骤232,根据距离优先原则,将航班划分到距离最近的聚类中;
步骤233,重新计划聚类后的中心,如果中心发生变化则转到步骤232重新聚类,否则输出聚类结果。
4.根据权利要求3所述的基于大数据分析的航班计划优化方法,其特征在于,所述步骤3中,每类航班的取消及延误情况包括:取消频次、延误频次和平均延误时长。
5.根据权利要求4所述的基于大数据分析的航班计划优化方法,其特征在于,所述步骤4包括:
步骤41,基于延误或取消频次超过给定频次,以及,延误时长超过给定的航班数据进行分析,通过包括时间集中性、地域性、机型、气候的角度进行分析,得到航班延误/取消的原因;
步骤42,根据航班延误/取消的原因选取相应的对应策略,参考对比历史航班运行数据,判断是否存在更优策略以减少取消/延误,如有,则输出航班计划优化策略。
6.一种基于大数据分析的航班计划优化装置,其特征在于,包括:
数据接收单元,用于接收历史航班运行数据,所述历史航班运行数据包括历史航班运行时刻表和历史航行情报;
数据处理单元,用于基于主成分分析法对所述历史航班运行数据进行降维,并基于聚类算法对航班进行基于属性的分类;
数据统计单元,用于根据所述分类,对每一类航班的延误、取消情况进行统计,得到每类航班的取消及延误情况;
优化策略输出单元,用于对于延误/取消频次超过设定频次,和/或,延误时间超过的设定时长的航班数据进行分析,获得导致航班延误及取消的主要因素,通过历史运行数据对比提出优化策略;
所述数据处理单元还用于:
对所述历史航班运行数据进行标准化处理,获得标准化的航班属性参数矩阵;
利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性;
利用kmeans算法对仅保留主成分的属性数据进行聚类分析,根据航班属性对航班分群聚类,并为航班属性参数矩阵添加类别属性;
所述利用主成分分析算法,对所述标准化的航班属性参数矩阵进行特征分解,得出航班参数属性的主成分属性与其对应的特征值,通过所述特征值选择保留的主成分属性,消除参数矩阵中多个维度间的线性相关性,包括:
获取标准化的航班属性参数矩阵所对应的协方差矩阵C;
Figure FDA0004096745610000041
设定每一属性参数对应的特征单位向量为V,求解协方差矩阵C对应特征单位向量的特征值D:
D=V-1CV
将得到的特征值进行排序,取排序靠前的特征值所对应的特征向量来获得航班分类主要的影响属性。
7.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行前述任一权利要求1-5所述的基于大数据分析的航班计划优化方法。
8.一种非暂态计算机可读存储介质,其特征在于,该非暂态计算机可读存储介质存储计算机指令,该计算机指令用于使该计算机执行前述任一权利要求1-5所述的基于大数据分析的航班计划优化方法。
CN202010675308.1A 2020-07-14 2020-07-14 基于大数据分析的航班计划优化方法、装置及电子设备 Active CN111985685B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010675308.1A CN111985685B (zh) 2020-07-14 2020-07-14 基于大数据分析的航班计划优化方法、装置及电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010675308.1A CN111985685B (zh) 2020-07-14 2020-07-14 基于大数据分析的航班计划优化方法、装置及电子设备

Publications (2)

Publication Number Publication Date
CN111985685A CN111985685A (zh) 2020-11-24
CN111985685B true CN111985685B (zh) 2023-05-02

Family

ID=73438358

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010675308.1A Active CN111985685B (zh) 2020-07-14 2020-07-14 基于大数据分析的航班计划优化方法、装置及电子设备

Country Status (1)

Country Link
CN (1) CN111985685B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113313523A (zh) * 2021-06-01 2021-08-27 中国民航信息网络股份有限公司 一种确定可比较航班的方法及系统
CN113420074B (zh) * 2021-06-30 2024-03-01 中国航空油料有限责任公司 航班显示信息的显示方法、装置、电子设备及存储介质
CN113657671B (zh) * 2021-08-18 2024-02-09 北京航空航天大学 一种基于集成学习的航班延误预测方法
CN117745085B (zh) * 2024-02-21 2024-05-31 中国民用航空总局第二研究所 航班保障服务的调整方法、装置、电子设备及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018093403A (ja) * 2016-12-05 2018-06-14 Kddi株式会社 飛行装置及び通信制御方法
CN109448445A (zh) * 2018-09-05 2019-03-08 南京航空航天大学 基于长短期记忆神经网络的航班延误分级预警方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103942623B (zh) * 2014-04-22 2017-01-18 中国民航大学 一种基于需求与容量不确定性的机场拥挤风险预测方法
CN105844346A (zh) * 2016-03-17 2016-08-10 福州大学 基于arima模型的航班延误预测方法
CN110533220A (zh) * 2019-07-29 2019-12-03 南京航空航天大学 一种数据驱动的机场离港延误分布挖掘方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018093403A (ja) * 2016-12-05 2018-06-14 Kddi株式会社 飛行装置及び通信制御方法
CN109448445A (zh) * 2018-09-05 2019-03-08 南京航空航天大学 基于长短期记忆神经网络的航班延误分级预警方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Weinan Wu等.An improved svm model for flight delay prediction.《2019 IEEE/AIAA 38th Digital Avionics Systems Conference》.2020,第1-6页. *
李晓霞 等.基于聚类与贝叶斯网络的航班离港延误预测模型.《哈尔滨商业大学学报(自然科学版)》.2020,第36卷(第1期),第110-113,120页. *

Also Published As

Publication number Publication date
CN111985685A (zh) 2020-11-24

Similar Documents

Publication Publication Date Title
CN111985685B (zh) 基于大数据分析的航班计划优化方法、装置及电子设备
Sheridan et al. An application of dbscan clustering for flight anomaly detection during the approach phase
CN107086935B (zh) 基于wifi ap的人流量分布预测方法
CN111652427B (zh) 一种基于数据挖掘分析的航班到达时刻预测方法及系统
Insua et al. A framework for risk management decisions in aviation safety at state level
CN107818382B (zh) 航班到达时间预测方法
CN111178598A (zh) 铁路客运站客流量预测方法、系统、电子设备及存储介质
CN110675007A (zh) 航班延误预测方法、装置及计算机存储介质
CN111626327A (zh) 飞机重着陆预测方法、装置、计算机设备及存储介质
CN110633875A (zh) 航路流量预测方法、装置及计算机存储介质
Mirmohammadsadeghi et al. Enhancements to the runway capacity simulation model using the asde-x data for estimating airports throughput under various wake separation systems
CN112101779A (zh) 基于主客观结合的结构熵权法机场场面运行综合评价系统
CN118098024A (zh) 基于大数据航空互联网航班流量及带宽监控方法和装置
CN112101780A (zh) 结构熵权法的机场场面运行综合评价方法
Tian et al. Assessment of flight block time reliability under different delay time windows: A case study
CN111652428B (zh) 一种基于历史数据的航班预达时刻估算方法及系统
Mitkas et al. Activity Identification using ADS-B data at General Aviation Airports
US20230150314A1 (en) Wear state prediction method, wear state prediction device, and wear state prediction program
Evangeline et al. Flight Delay Prediction Using Different Regression Algorithms in Machine Learning
CN113723533B (zh) 对流天气影响终端区的模式识别方法及高斯混合聚类模型
CN111090793B (zh) 一种基于平均延误时间序列的机场日延误特征分类方法
Jiang et al. A method for the outlier flights detection of the final approach based on FOQA data
Kuşkapan et al. Classification of aviation accidents using data mining algorithms
Distefano et al. Investigation of the causes of runway excursions
CN118711422B (zh) 跑道换向优化放行方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant