CN116738323B - 铁路信号设备的故障诊断方法、装置、设备及介质 - Google Patents
铁路信号设备的故障诊断方法、装置、设备及介质 Download PDFInfo
- Publication number
- CN116738323B CN116738323B CN202310987783.6A CN202310987783A CN116738323B CN 116738323 B CN116738323 B CN 116738323B CN 202310987783 A CN202310987783 A CN 202310987783A CN 116738323 B CN116738323 B CN 116738323B
- Authority
- CN
- China
- Prior art keywords
- fault
- feature
- level
- determining
- feature word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 75
- 238000003745 diagnosis Methods 0.000 title claims abstract description 72
- 239000011159 matrix material Substances 0.000 claims abstract description 98
- 239000013598 vector Substances 0.000 claims abstract description 93
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims description 51
- 238000004590 computer program Methods 0.000 claims description 16
- 238000002372 labelling Methods 0.000 claims description 12
- 230000011664 signaling Effects 0.000 claims description 11
- 230000009466 transformation Effects 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 238000012423 maintenance Methods 0.000 abstract description 13
- 230000008901 benefit Effects 0.000 abstract description 7
- 238000012545 processing Methods 0.000 description 15
- 238000012549 training Methods 0.000 description 14
- 238000013527 convolutional neural network Methods 0.000 description 12
- 230000008569 process Effects 0.000 description 12
- 238000004422 calculation algorithm Methods 0.000 description 11
- 238000010586 diagram Methods 0.000 description 11
- 230000011218 segmentation Effects 0.000 description 11
- 238000011176 pooling Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 230000006870 function Effects 0.000 description 8
- 230000000694 effects Effects 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 210000002569 neuron Anatomy 0.000 description 4
- 238000002790 cross-validation Methods 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000007547 defect Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- ORILYTVJVMAKLC-UHFFFAOYSA-N Adamantane Natural products C1C(C2)CC3CC1CC2C3 ORILYTVJVMAKLC-UHFFFAOYSA-N 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000007635 classification algorithm Methods 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/40—Handling position reports or trackside vehicle data
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B61—RAILWAYS
- B61L—GUIDING RAILWAY TRAFFIC; ENSURING THE SAFETY OF RAILWAY TRAFFIC
- B61L27/00—Central railway traffic control systems; Trackside control; Communication systems specially adapted therefor
- B61L27/50—Trackside diagnosis or maintenance, e.g. software upgrades
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/213—Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Mechanical Engineering (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Train Traffic Observation, Control, And Security (AREA)
Abstract
本发明公开了一种铁路信号设备的故障诊断方法、装置、设备及介质,该方法包括:获取待诊断铁路信号设备的故障文本数据;对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵;根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。通过两种特征提取方式,确定出两个特征词序列化矩阵,结合建立的可针对不同故障类型问题设定相应权重参数的三级故障识别模型,对故障问题进行逐级划分,确定分类诊断结果。保留更为全面的故障文本数据的特征,实现了基于故障文本数据对故障问题的自动划分,提高了对铁路信号设备的故障分类识别的精度,提高了铁路信号设备运维效率。
Description
技术领域
本发明涉及移动通信技术领域,尤其涉及铁路信号设备的故障诊断方法、装置、设备及介质。
背景技术
随着高速铁路的快速发展,铁路信号设备作为控制列车高速运行的重要基础设施,其故障诊断的时效性和准确性对保障行车安全及运输效率具有重要意义。
现阶段设备故障诊断主要依靠现场维修人员的经验与知识,对故障设备进行诊断与处理。
但该诊断方法依赖于人工经验,对运维人员要求高,由于铁路信号设备多,故障原因复杂,人工很难及时分析出故障原因并定位到故障点,还易导致维修判断失误等问题,严重时将导致设备故障性行车事故。
发明内容
本发明提供了一种铁路信号设备的故障诊断方法、装置、设备及介质,以实现基于故障文本对故障铁路信号设备的自动化诊断。
根据本发明的第一方面,提供了一种铁路信号设备的故障诊断方法,包括:
获取待诊断铁路信号设备的故障文本数据;
对所述故障文本数据进行特征提取,确定所述故障文本数据的特征词权重序列及特征词向量矩阵;
根据所述特征词权重序列、所述特征词向量矩阵及预先训练的三级故障识别模型,确定所述待诊断铁路信号设备的分类诊断结果。
根据本发明的第二方面,提供了一种铁路信号设备的故障诊断装置,包括:
获取模块,用于获取待诊断铁路信号设备的故障文本数据;
特征词序列化模块,用于对所述故障文本数据进行特征提取,确定所述故障文本数据的特征词权重序列及特征词向量矩阵;
结果确定模块,用于根据所述特征词权重序列、所述特征词向量矩阵及预先训练的三级故障识别模型,确定所述待诊断铁路信号设备的分类诊断结果。
根据本发明的第三方面,提供了一种电子设备,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本发明任一实施例所述的铁路信号设备的故障诊断方法。
根据本发明的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本发明任一实施例所述的铁路信号设备的故障诊断方法。
本发明实施例的技术方案,通过获取待诊断铁路信号设备的故障文本数据;对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵;根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。通过两种特征提取方式,确定出两个特征词序列化矩阵,结合建立的可针对不同故障类型问题设定相应权重参数的三级故障识别模型,对故障问题进行逐级划分,确定分类诊断结果。保留更为全面的故障文本数据的特征,实现了基于故障文本数据对故障问题的自动划分,提高了对铁路信号设备的故障分类识别的精度,提高了铁路信号设备运维效率。
应当理解,本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征,也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明实施例一提供的一种铁路信号设备的故障诊断方法的流程图;
图2是根据本发明实施例一提供的一种铁路信号设备的故障诊断方法的故障分类示意图
图3是根据本发明实施例二提供的一种铁路信号设备的故障诊断方法的流程图;
图4是根据本发明实施例二提供的一种铁路信号设备的故障诊断方法中的第一特征分析识别模块结构示意图;
图5是根据本发明实施例二提供的一种铁路信号设备的故障诊断方法中的第二特征分析识别模块结构示意图;
图6是根据本发明实施例二提供的一种铁路信号设备的故障诊断方法的示例流程图;
图7是根据本发明实施例三提供的一种铁路信号设备的故障诊断装置的结构示意图;
图8是实现本发明实施例的铁路信号设备的故障诊断方法的电子设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例一
图1为本发明实施例一提供了一种铁路信号设备的故障诊断方法的流程图,本实施例可适用于基于故障文本对铁路信号设备进行故障诊断的情况,该方法可以由铁路信号设备的故障诊断装置来执行,该铁路信号设备的故障诊断装置可以采用硬件和/或软件的形式实现,该铁路信号设备的故障诊断装置可配置于电子设备中。如图1所示,该方法包括:
S110、获取待诊断铁路信号设备的故障文本数据。
在本实施例中,待诊断铁路信号设备可以理解为出现故障的铁路信号设备。故障文本数据可以理解为电务工作人员以文本的形式记录的现场铁路信号设备发生故障时的现象、描述。
具体的,当有铁路信号设备出现故障时,电务工作人员可以通过输入设备以文本的形式记录待诊断铁路信号设备出现的故障现象等信息,故障诊断设备将故障文本数据传送至处理器。处理器可以获取待诊断铁路信号设备的故障文本数据。
S120、对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵。
需要知道的是,故障文本数据中存在中文一词多义和多词多义等现象,现场记录故障现象的篇幅存在差异、文本存在一定故障冗余信息等问题,如果直接对这样的故障文本数据进行故障诊断,会导致诊断结果不准确,所以需要对故障文本数据进行预处理。
在本实施例中,特征词权重序列可以理解为以一种方式将故障文本数据转换成特征词权重序列形式。特征词向量矩阵可以理解为以另一种方式将故障文本数据转换成特征词向量矩阵形式。
具体的,处理器可以对故障文本数据进行特征提取,处理器可以对故障文本数据中的词语进行筛选及划分,并提取出故障文本数据中的关键词,通过关键词出现的频率确定出其对应的故障主题及权重,进而确定出故障文本数据的特征词权重序列,如某些词在一类故障文本数据中出现的频率高,而在语料库出现范围小、其他类故障文本中出现的频率少,则这些关键词与该类故障主题正相关,可利用这些词将该类故障和其他类型故障有效区分,得出其对应的权重。处理器还可以对故障文本数据的字词间顺序、相关性及词向量的维度,将字词表示成更低维度的向量,同时将上下文特征融入到字词向量中,得到特征词向量。处理器可以将故障文本数据以两种不同的方式向量、矩阵化,以便后续分类算法的识别诊断。
S130、根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。
需要知道的是,铁路信号系统运营维护中保留了大量以文字形式描述的设备故障维修记录可作为信号设备故障诊断参考的重要依据。
在本实施例中,三级故障识别模型可以理解为通过不同权重参数确定三个级别的故障分类结果的集成学习模型。分类诊断结果可以理解为用于表征待诊断铁路信号设备三个级别的故障类型的结果。
其中,本发明涉及到的相关文本内容数据及其格式如下表1所示。其中故障描述列以文本的形式记载了现场设备发生故障时的现象。故障来源、故障类型和故障原因则将故障问题点进行了逐步细化,记录了故障问题的逐层识别与诊断。通过总结归纳故障来源、故障类型和故障原因等信息,可以将故障类型划分为三个级别层次,这样逐层深入的故障划分方式也符合信号设备运维使用习惯。丰富的铁路信号设备维修记录,为铁路信号设备故障诊断模型的学习、训练,提供了强大的数据支撑。
表1 铁路信号设备维修记录示例表
具体的,三级故障识别模型可以集成两个神经网络作为弱监督学习模型,处理器可以将特征词权重序列、特征词向量矩阵分别输入到两个神经网络模型的嵌入层中,两个神经网络通过学习分别在Softmax层分别输出对特征词权重序列及特征词向量矩阵的分类预测概率,通过组合加权集成方法对两个神经网络的预测结果整合计算,最后输出三级故障识别模型对输入数据的分类诊断结果。
示例性的,图2为发明实施例一提供的一种铁路信号设备的故障诊断方法的故障分类示意图,以故障占比最大的道岔故障案例为例介绍设备故障的进一步划分。如图2所示,一级故障类型道岔故障共包含7类二级故障以及62类三级故障。铁路信号设备故障可以按照信号设备功能和故障来源综合划分,可分为9大故障基础类型(包括道岔故障、轨道电路故障、车载设备故障、信号机故障、电源屏故障、CTC设备故障、TDCS设备故障、闭塞设备故障和联锁设备故障),本发明将其定义为一级故障类型。通过对高速铁路道信号设备障数据总结,结合铁路信号专家的经验知识,可将高速铁路信号设备故障继续分层划分为两级。以一级故障类型是道岔故障为例,第二级为道岔故障的设备统称,较为笼统的定位故障设备,第三级将道岔设备统称下的设备细致划分,将故障发生的原因定位到更为具体的故障点或其他因素。各二级故障类别下包含的三级类别个数在二级类别名称下括号中表示。
本发明实施例的技术方案,通过获取待诊断铁路信号设备的故障文本数据;对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵;根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。通过两种特征提取方式,确定出两个特征词序列化矩阵,结合建立的可针对不同故障类型问题设定相应权重参数的三级故障识别模型,对故障问题进行逐级划分,确定分类诊断结果。保留更为全面的故障文本数据的特征,实现了基于故障文本数据对故障问题的自动划分,提高了对铁路信号设备的故障分类识别的精度,提高了铁路信号设备运维效率。
实施例二
图3为本发明实施例二提供的一种铁路信号设备的故障诊断方法的流程图,本实施例是在上述实施例的基础上的进一步细化。如图3所示,该方法包括:
S210、获取待诊断铁路信号设备的故障文本数据。
S220、获取预先构建的铁路信号设备词典及通用词典。
在本实施例中,铁路信号设备词典可以理解为结合铁路信号领域相关词汇构建的铁路信号设备专业领域词典。通用词典可以理解为收录语言中常用的主要词汇的词典。
具体的,处理器可以获取储存的预先构建的铁路信号设备词典及通用词典。
S230、根据铁路信号设备词典及通用词典对故障文本数据进行分词,确定故障文本数据对应的原始特征词集。
在本实施例中,原始特征词集可以理解为对故障文本数据进行分词后得到的词集。
需要知道的是,故障文本数据中包括了故障特征词,通常这些故障特征词隐含着关键的铁路信号设备故障类别信息,因此在分词处理中应当做一个词项。
具体的,处理器可以首先对故障文本数据进行分词,将故障文本数据中的词汇进行拆分,如可以采用 jieba库中的精确模式完成自动分词。再利用通用词典和铁路信号设备词典对故障文本数据进行分词,区分出铁路信号设备领域专业词汇及通用词汇,并对其词性进行标注,保存关键名词和动词等,去掉其中包括的结构助词和语气词,形成原始特征词集。
示例性的,处理器可以利用铁路信号设备词典对故障文本数据进行分词,得到了词汇:电源屏、红光带、轨道电路、转辙机、定位无表示、解锁困难、接点不良、挤岔及尖轨等词汇。处理器可以利用通用词典对故障文本数据进行分词,确定其中的通用描述、组织机构、停用词等词汇,再对这些词汇进行文本分词、词汇标注及去停用词处理,得到只包括有用词汇的原始特征词集。
S240、对原始特征词集进行特征提取及转化,确定特征词权重序列及特征词向量矩阵。
需要知道的是,使用一种方法进行特征提取及转化时,由于方法的局限性可能有考虑不全面的问题,如可以通过TF-IDF方法进行特征提取及转化,但TF-IDF方法未考虑字词间顺序和相关性,需要结合Word2vec模型来弥补这个问题,则可以通过两种方法对原始特征词集进行特征提取及转化,以实现优势互补的效果。
具体的,处理器可以通过两种方式对原始特征词集进行特征提取及转化,确定特征词权重序列及特征词向量矩阵。
进一步地,在上述实施例的基础上,对原始特征词集进行特征提取及转化,确定特征词权重序列及特征词向量矩阵的步骤可以包括:
a1、通过对原始特征词集进行词向量提取,获得特征词向量矩阵。
具体的,处理器可以对原始特征词集进行词向量提取,获得特征词向量矩阵。
示例性的,词向量提取的方式可以采用Word2vec模型,可以把对文本内容的处理简化为K维向量空间中的向量运算,向量空间上的相似度可以用来表示文本语义上的相似度。 Word2vec通常采用一个3层的神经网络,输入层-隐藏层-输出层。Word2Vec一般分为CBOW(Continuous Bag-of-Words)与Skip-gram2种模型,一般来说,CBOW模型算法效率高,而Skip-gram模型训练词向量准确率高。可以采用Skip-gram模型是利用中心词来预测上下文词。假设原始特征词集中包括多个词,词以A(1),A(2),…,A(n)表示。Skip-gram模型的目的就是以中心词汇为输入,并度量与上下文词汇的相似度,其用来训练词向量输入中心词,训练模型使输出向量对应上下文词语的维度的概率最大。优化时使似然函数最大化,可以通过公式(1)得到最大化似然函数L:
(1)
其中,C表示窗口的长度,即当前词W(t)的前面的C个词和后面的C个词。P(Context(w))为词概率。词向量矩阵的生成将句子经过jieba分词后,就形成了一个由多个词按顺序所构成的集合,即原始特征词集可以用A表示,其中,m表示词的个数,即故障文本数据中某个语句的长度为m,/>,n 代表词向量维数)为语句中第i个词的词向量,则特征词向量矩阵X可以表示为:
(2)
其中,代表串接操作。
使用Skip-gram网络模型训练出特征词向量矩阵X。根据句子的最大长度,若为m则组合成一个m*n的二维矩阵,n为词向量维数。一般维度高的词向量可以更好地对语义特征进行描述,但同时也增大了过拟合的风险,由于本发明数据都是以短文本为主,所以可以采用300维。
b1、针对原始特征词集中的特征项,判断在原始特征词集中特征项是否包括有同义关系的同义特征项。
在本实施例中,特征项可以理解为分词后原始特征词集中包括的各词汇。同义关系可以理解为词义相同或相近的关系,如同义词、近义词之间的关系。同义特征项可以理解为与特征项词义相同的特征项,即同义词、近义词。
具体的,针对原始特征词集中的特征项,处理器可以根据预先设定的同义关系表,判断在原始特征词集中特征项是否包括有同义关系的同义特征项。
c1、若是,根据特征项及同义特征项,确定特征项的最终权重。
在本实施例中,最终权重可以理解为特征项占原始特征词集中的权重。
具体的,处理器可以根据特征项及同义特征项的综合权重,确定特征项的最终权重。
进一步地,根据特征项及同义特征项,确定特征项的最终权重的步骤可以包括:
c11、根据原始特征词集,确定特征项的词频。
在本实施例中,词频可以理解为特征项在原始特征词集中出现的频率。
具体的,可以根据特征项在原始特征词集中出现次数及原始特征词集中每个词语出现的次数总和,确定出词频。如可以将出现次数除以次数总和,得到词频。
c12、确定预设文本库中包含的文本总数,以及包含特征项和同义特征项的文本个数和。
在本实施例中,预设文本库可以理解为包括原始特征词集及多个历史原始特征词集的文本库。文本总数可以理解为预设文本库中的词汇总数。文本个数和可以理解为特征项和同义特征项在预设文本库中出现的次数之和。
具体的,处理器可以首先获取预设文本库,并确定出预设文本库中包括的文本总数,以及包含特征项和同义特征项的文本个数和。
c13、根据文本总数、文本个数和及词频,确定最终权重。
具体的,处理器可以根据文本总数、文本个数和及词频,确定特征项的最终权重。
示例性的,当特征项和特征项/>互为同义词时,则可以采用公式(3)确定最终权重:
(3)
其中,为特征项在原始特征词集j中的最终权重,为特征项的词频,是特征项的逆文档频率,表示为原始特征词集中含有特征项和的文本个数之和,为原始特征词集中的文本数量。
d1、若否,则根据特征项对于原始特征词集的重要程度,确定特征项的最终权重。
具体的,若特征项没有同义特征项,则可以根据特征项对于原始特征词集的重要程度,如通过TF-IDF算法确定特征项的最终权重。
示例性的,可以采用TF-IDF算法确定特征项的最终权重,其中TF为词频,IDF为逆向文档频率。TF-IDF中词频(TF)指的是特征项在文档中出现的频率,对于特征项t,在原始特征词集d中的重要程度可以表示为:
(4)
其中,为原始特征词集/>中第i个特征项出现的次数,/>为文档/>中每个特征项出现的次数总和。
逆向文件频率IDF是一个词语普遍重要程度的度量,IDF值越大,说明该词语对故
障类型有很好的类别区分能力,可以通过下述公式确定原始特征词集中第i各特征项的
逆向文件频率:
(5)
其中,为原始特征词集总数,/>为包含该词语的原始特征词集数量。如果该词语不在原始特征词集中,就会导致分母为零,公式中的分母加1即为避免分母为0的情况。
可以通过下述公式,根据逆向文件频率及原始特征词集d中的重要程度/>确定出最终权重/>:
(6)
e1、根据各最终权重,确定特征词权重序列。
具体的,处理器可以将各最终权重确定为特征词权重序列。
需要知道的是,在三级故障识别模型训练过程中,选用改进后的SVM-SMOTE算法。SMOTE是一种常用的合成少数类样本数据以达到训练集数据的类别平衡的过采样技术,其可以使得分类器的学习能力得到显著提高 。但传统SMOTE插值生成样本时,没有考虑其邻近样本的分布特点 ,生成的样本可能在类别间发生重复,这种生成的无效数据不利于后续故障识别模型的分类识别。改进后的SVM-SMOTE算法根据不同类别样本邻近比例,通过SVM构造分类边界,利用SVM对不平衡数据分类不太敏感的特性,能够根据实际的样本数据分布进行插值,使得类别之间区分更为明显,生成的数据更为有效。
S250、将特征词权重序列及特征词向量矩阵分别输入三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息。
其中,第一一级故障类别信息中包括特征词向量矩阵及一级类别特征矩阵,第二一级故障类别信息中包括特征词权重序列及一级类别特征序列。其中,三级故障识别模型包括第一特征分析识别模块、第二特征分析识别模块及组合加权模块。
具体的,处理器可以将特征词权重序列及特征词向量矩阵分别输入三级故障识别模型中,通过三级故障识别模型中含有一级权重参数的第一特征分析识别模块、含有一级权重参数的第二特征分析识别模块及组合加权模块以一级权重参数进行处理,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息。
进一步地,将特征词权重序列及特征词向量矩阵分别输入三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息的步骤可以包括:
a2、将特征词向量矩阵输入第一特征分析识别模块,确定第一预测概率。
在本实施例中,第一特征分析识别模块可以理解为进行卷积处理的模块,优选为CNN模块。第一预测概率可以理解为经过第一特征分析识别模块得出的一级预测结果。
具体的,处理器可以将特征词向量矩阵输入第一特征分析识别模块,经过卷积层、池化层和全连接层得到输出结果,即输出第一预测概率。
示例性的,第一特征分析识别模块可以优选为CNN模块,CNN模块主要由卷积层、池
化层和全连接层构成。卷积层将X经卷积核(其中,R表示实数集,h 为卷积核窗
口高度,宽度与词向量维数n一致)卷积运算后的结果作为非线性激活函数f的输入,通过f
提取局部上下文高层特征,其中,*为卷积操作,为偏置项,它是一个常数,其数值可随模
型训练而自动调整。此外,在卷积核滑动时若越过文本矩阵边界,需采取补零方式以防边缘
信息丢失。最后通过下述公式输出特征图M:
(7)
具体的,处理器可以将特征词向量矩阵输入第一特征分析识别模块,经过卷积层、池化层和全连接层得到输出结果,即输出第一预测概率。
卷积层仅提取了故障文本特征矩阵的局部特征,还需经过池化层来深度挖掘故障文本特征,对卷积后的数据实现进一步降维。池化方式主要有最大池化和均值池化,本发明采用前者,即对每个特征图取一个最大值,池化后的特征图可表示为:
(8)
设k种不同维度的卷积核在之前两步操作后的输出为,则全连接层的输入S为:
(9)
最后由softmax函数转换为0到1之间的概率数值所体现,第一预测概率具体表达式如下:
(10)
式中,为属于第z类故障的概率,为故障类别数量,W和B分别为全连接层的权
重矩阵和偏置项。
图4为本发明实施例二提供的一种铁路信号设备的故障诊断方法中的第一特征分析识别模块结构示意图,将交叉熵损失函数作为误差代价,执行梯度下降使误差代价最小化训练CNN,使用AdamOptimizer更新学习速率。关于卷积神经网络相关参数的设定,由于在多尺寸卷积核的相互作用下能提取出更多的文本特征,因此选用窗口高度为3、4、5的3种卷积核(其宽度与词向量维数相同为300)进行卷积;将ReLU作为卷积后的激活函数;此外,为了增强CNN模块的泛化效果,在模型训练过程中添加 Dropout层,如此可在每次迭代中随机让一部分神经元停止参与运算,避免在隐层神经元权重更新时产生过拟合情况;将批处理参数,Batch设为64,学习率和Dropout率的取值分别是0.001和0.5。
b2、将特征词权重序列输入第二特征分析识别模块,确定第二预测概率。
在本实施例中,第二特征分析识别模块可以理解为根据特征进行识别的模块,优选为BILSTM模块。第二预测概率可以理解为经过第二特征分析识别模块得出的一级预测结果。
具体的,处理器可以将特征词权重序列输入第二特征分析识别模块的嵌入层,该特征分析识别模块可以通过在神经元中设计门控单元来有效计算与控制信息的输入和输出,这种门控单元的设计解决了序列长依赖问题,通过学习在Softmax层输出对数据的预测结果,即输出第二预测概率。
图5为本发明实施例二提供的一种铁路信号设备的故障诊断方法中的第二特征分析识别模块结构示意图,如图5所示,在对BiLSTM模型进行训练时,可分别利用了前向传播算法和反向传播算法,前者以从底向上的方式计算梯度和输出结构,一步步求得误差损失;后者用自顶向下的方式,利用梯度下降法进行一轮轮迭代,最终找到最优的BiLSTM模型参数。BiLSTM通过引入控制门的概念,能够对网络中的信息进行有效的取舍,使有效信息不仅局限于前一时刻,解决了长距离信息依赖的问题,同时也避免了陷入梯度消失或爆炸的情况。BiLSTM综合考虑了故障数据前后的故障关键词特征信息对此刻的综合影响,在序列分类上有较强的优越性。将数据输入到BiLSTM网络中进行特征深层分析识别,再在Softmax层输出对数据的第二预测概率。BiLSTM的网络参数如下,其中嵌入层维度为100,隐藏层维度为512,K折交叉验证 K=5,迭代次数为50,批处理大小为256。
c2、将第一预测概率及第二预测概率输入组合加权模块,确定一级分类结果。
在本实施例中,组合加权模块可以理解为将两个预测概率通过分配权重的方式进行结合的模块。
具体的,可以预先设定组合加权模块,处理器可以将第一预测概率、第二预测概率输入组合加权模块,确定一级分类结果。
为提高深度学习集成模型的泛化能力,同样采用K折交叉验证训练模型。K折交叉验证是将整个训练样本随机地分为K份,其中一份作为验证集,其他K-1份作为训练集,循环K次,直到所有的数据都被选择一遍为止。最终选用准确率、召回率和值作为算法优化和调节三级故障识别模型结构中组合加权模块各项参数的重要参考依据。进一步优化模型结构,使模型的故障识别诊断效果达到最优。
示例性的,可以采用下述方法进行一级分类结果的确定:首先可以通过公式和分别确定在第一特征分析识别模块(CNN网络模块)和第二特征分
析识别模块(BiLSTM网络模块)识别出的概率值P为最大值时的铁路信号设备故障种类和。
其中,为CNN网络模块输出的每个类别下的概率值,为BiLSTM网络模块输出的每个类
别下的概率值。也即CNN网络模块将故障类型判定为,BiLSTM网络模块将故障类型判定为。
当和为同一类型,则最终判定识别该故障种类为。
当和为不同类型,则通过公式判定识别该故障
种类。其中,a和b为调参系数,由于CNN网络模块和BiLSTM网络模块识别在对某些特定类型
的识别效果有一定差别,故根据模型训练时对特定类型的效果可以综合调整特定a,b大小
来决定对CNN模型和BiLSTM网络模块信任度的大小,一般的a和b的取值为1。
若则最终判定识别该故障种类为。
若则最终判定识别该故障种类为/>。该过程最终确定了一级分类结果。
d2、根据一级分类结果分别对特征词权重序列及特征词向量矩阵进行标签化,确定第一一级故障类别信息及第二一级故障类别信息。
在本实施例中,第一一级故障类别信息可以理解为包括特征词向量矩阵及一级类别特征矩阵的一级故障类别对应的信息。第二一级故障类别信息可以理解为包括特征词权重序列及一级类别特征序列的一级故障类别对应的信息。
具体的,处理器可以通过设定的一级类别特征特征词向量矩阵及特征词权重序列进行一级标签化,得到一级类别特征矩阵及一级类别特征序列,进而确定第一一级故障类别信息及第二一级故障类别信息。
示例性的,在一、二级不同级别下,依据类别数量的不同可用One-Hot编码向量化将其标记为类别特征信息序列。可以采用One-Hot编码向量化表示为矩阵/>、/>。特征词向量矩阵可以表示为/>,m为样本长度,矩阵中每个序列x的维数为n;特征词权重序列可以表示为/>,k为样本的长度,则第一一级故障类别信息/>及第二一级故障类别信息/>可以分别表示为/>及/>,其中/>表示n个类别特征序列/>组成的矩阵,n的取值由序列x的维数决定。
S260、将第一一级故障类别信息及第二一级故障类别信息分别输入三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息。
其中,第一二级故障类别信息中包括特征词向量矩阵、一级类别特征矩阵及二级类别特征矩阵,第二二级故障类别信息中包括特征词权重序列、一级类别特征序列及二级类别特征序列。
具体的,处理器可以将第一一级故障类别信息及第二一级故障类别信息分别输入三级故障识别模型中,通过三级故障识别模型中含有二级权重参数的第一特征分析识别模块、含有二级权重参数的第二特征分析识别模块及组合加权模块以二级权重参数进行处理,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息。
进一步地,将第一一级故障类别信息及第二一级故障类别信息分别输入三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息的步骤可以包括:
a3、将第一一级故障类别信息输入第一特征分析识别模块,确定第三预测概率。
在本实施例中,第三预测概率可以理解为经过第一特征分析识别模块得出的二级预测结果,其中,在确定一级、二级预测结果时,第一特征分析识别模块的网络结构相同,只是训练后保存的参数不同。
具体的,处理器可以将第一一级故障类别信息输入第一特征分析识别模块,经过卷积层、池化层和全连接层得到输出结果,即输出第三预测概率。处理过程可以参考步骤a2中的示例性描述。
b3、将第二一级故障类别信息输入第二特征分析识别模块,确定第四预测概率。
在本实施例中,第四预测概率可以理解为经过第二特征分析识别模块得出的二级预测结果,其中,在确定一级、二级预测结果时,第二特征分析识别模块的网络结构相同,只是训练后保存的参数不同。
具体的,处理器可以将第二一级故障类别信息输入第二特征分析识别模块的嵌入层,该特征分析识别模块可以通过在神经元中设计门控单元来有效计算与控制信息的输入和输出,这种门控单元的设计解决了文本序列长依赖问题,通过学习在Softmax层输出对数据的预测结果,即输出第四预测概率。处理过程可以参考步骤b2中的示例性描述。
c3、将第三预测概率及第四预测概率输入组合加权模块,确定二级分类结果。
具体的,可以预先设定组合加权模块,处理器可以将第三预测概率、第四预测概率输入组合加权模块,确定二级分类结果。处理过程可以参考步骤c2中的示例性描述。
d3、根据二级分类结果分别对第一一级故障类别信息及第二一级故障类别信息进行标签化,确定第一二级故障类别信息及第二二级故障类别信息。
具体的,处理器可以通过设定的一级类别特征、二级类别特征对特征词向量矩阵及特征词权重序列进行二级标签化,得到二级类别特征矩阵及二级类别特征序列,进而确定第一二级故障类别信息及第二二级故障类别信息。
示例性的,沿用上述一级类别特征的符号,则第一二级故障类别信息及第二二级故障类别信息/>可以分别表示为/>及/>,其中/>表示n个类别特征序列/>组成的矩阵,/>表示n个类别特征序列/>组成的矩阵,n的取值由序列x的维数决定。
S270、将第一二级故障类别信息及第二二级故障类别信息分别输入三级故障识别模型,确定三级分类结果。
具体的,处理器可以将第一二级故障类别信息及第二二级故障类别信息分别输入三级故障识别模型中,通过三级故障识别模型中含有三级权重参数的第一特征分析识别模块、含有三级权重参数的第二特征分析识别模块及组合加权模块以及三级权重参数进行处理,确定三级分类结果。处理过程可以参考步骤a2-c2中的示例性描述。
S280、将一级分类结果、二级分类结果及三级分类结果作为分类诊断结果。
具体的,处理器可以将得出的三个级别的分类结果作为分类诊断结果。
本实施例二提供的一种铁路信号设备的故障诊断方法,通过铁路信号设备词典及通用词典对故障文本数据进行分词处理得到原始特征词集,保证了分词的准确性,为后续进行特征提取的准确性提供了保证。通过两种特征提取方式对原始特征词集进行特征提取及向量化,使特征提取更为全面,弥补了单一方式的缺陷,实现了优势的互补。在训练三级故障识别模型时,对不同类别的数据进行了类别平衡处理,自动生成了部分少数据量类型的数据,弥补了数据的不平衡性,使后续识别诊断更为精准。划分了三级故障类型,并构建了一个可针对不同故障类型问题设定相应权重参数三级故障识别模型,运用第一特征分析识别模块和第二特征分析识别模块,并在此基础上通过组合加权模块,避免少数值和极端值对分类结果的影响,提高了分类结果的准确性。保留了更为全面的故障文本数据的特征,实现了基于故障文本数据对故障问题的各级划分,提高了对铁路信号设备的故障分类识别的精度,提高了铁路信号设备运维效率。
示例性的,为了便于理解本发明,以CNN模块作为第一特征分析识别模块及BILSTM模块作为第二特征分析识别模块为示例,图6为本发明实施例二提供的一种铁路信号设备的故障诊断方法的示例流程图,如图6,可以通过下述步骤对铁路信号设备进行故障诊断:
S401、获取故障文本数据;
S402、根据铁路信号设备词典及通用词典对故障文本数据进行分词,确定故障文本数据对应的原始特征词集;
S403、基于Word2vec算法对原始特征词集进行特征提取,确定特征词向量矩阵;
S404、基于改进后的TF-IDF算法对原始特征词集进行特征提取,确定特征词权重序列;
S405、将特征词向量矩阵输入至CNN模块,确定第一预测概率;
S406、将特征词权重序列输入至BILSTM模块,确定第二预测概率;
S407、将第一预测概率及第二预测概率输入组合加权模块,得到一级分类结果;
S408、根据一级分类结果对特征词向量矩阵进行标签化,确定第一一级故障类别信息,其中,第一一级故障类别信息中包括特征词向量矩阵及一级类别特征矩阵;
S409、将第一一级故障类别信息输入至CNN模块,确定第三预测概率;
S410、根据一级分类结果对特征词权重序列进行标签化,确定第二一级故障类别信息,其中,第二一级故障类别信息中包括特征词权重序列及一级类别特征序列;
S411、将第二一级故障类别信息输入至BILSTM模块,确定第四预测概率;
S412、将第三预测概率及第四预测概率输入组合加权模块,得到二级分类结果;
S413、根据二级分类结果对第一一级故障类别信息进行标签化,确定第一二级故障类别信息,其中,第一二级故障类别信息中包括特征词向量矩阵、一级类别特征矩阵及二级类别特征矩阵;
S414、根据二级分类结果对第二一级故障类别信息进行标签化,确定第二二级故障类别信息,其中,第二二级故障类别信息中包括特征词权重序列、一级类别特征序列及二级类别特征序列;
S415、将第一二级故障类别信息输入至CNN模块,确定第五预测概率;
S416、将第二二级故障类别信息输入至BILSTM模块,确定第六预测概率;
S417、将第五预测概率及第六预测概率输入组合加权模块,得到三级分类结果;
S418、将一级分类结果、二级分类结果及三级分类结果作为分类诊断结果。
实施例三
图7为本发明实施例三提供的一种铁路信号设备的故障诊断装置的结构示意图。如图7所示,该装置包括:获取模块71、特征词序列化模块72及结果确定模块73。其中,
获取模块71,用于获取待诊断铁路信号设备的故障文本数据;
特征词序列化模块72,用于对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵;
结果确定模块73,用于根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。
本发明实施例的技术方案,通过获取待诊断铁路信号设备的故障文本数据;对故障文本数据进行特征提取,确定故障文本数据的特征词权重序列及特征词向量矩阵;根据特征词权重序列、特征词向量矩阵及预先训练的三级故障识别模型,确定待诊断铁路信号设备的分类诊断结果。通过两种特征提取方式,确定出两个特征词序列化矩阵,结合建立的可针对不同故障类型问题设定相应权重参数的三级故障识别模型,对故障问题进行逐级划分,确定分类诊断结果。保留更为全面的故障文本数据的特征,实现了基于故障文本数据对故障问题的自动划分,提高了对铁路信号设备的故障分类识别的精度,提高了铁路信号设备运维效率。
可选的,特征词序列化模块72,包括:
获取单元,用于获取预先构建的铁路信号设备词典及通用词典;
第一确定单元,用于根据铁路信号设备词典及通用词典对故障文本数据进行分词,确定故障文本数据对应的原始特征词集;
第二确定单元,用于对原始特征词集进行特征提取及转化,确定特征词权重序列及特征词向量矩阵。
进一步地,第二确定单元,包括:
获得子单元,用于通过对原始特征词集进行词向量提取,获得特征词向量矩阵;
判断子单元,用于针对原始特征词集中的特征项,判断在原始特征词集中特征项是否包括有同义关系的同义特征项;
第一确定子单元,用于若是,根据特征项及同义特征项,确定特征项的最终权重;
第二确定子单元,用于若否,则根据特征项对于原始特征词集的重要程度,确定特征项的最终权重;
第三确定子单元,用于根据各最终权重,确定特征词权重序列。
其中,第一确定子单元,具体用于:
根据原始特征词集,确定特征项的词频;
确定预设文本库中包含的文本总数,以及包含特征项和同义特征项的文本个数和;
根据文本总数、文本个数和及词频,确定最终权重。
可选的,三级故障识别模型包括特征分析识别模块、第一特征分析识别模块及组合加权模块,结果确定模块73,包括:
第三确定单元,用于将特征词权重序列及特征词向量矩阵分别输入三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息,其中,第一一级故障类别信息中包括特征词向量矩阵及一级类别特征矩阵,第二一级故障类别信息中包括特征词权重序列及一级类别特征序列。
第四确定单元,用于将第一一级故障类别信息及第二一级故障类别信息分别输入三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息,其中,第一二级故障类别信息中包括特征词向量矩阵、一级类别特征矩阵及二级类别特征矩阵,第二二级故障类别信息中包括特征词权重序列、一级类别特征序列及二级类别特征序列。
第五确定单元,用于将第一二级故障类别信息及第二二级故障类别信息分别输入三级故障识别模型,确定三级分类结果。
结果确定单元,用于将一级分类结果、二级分类结果及三级分类结果作为分类诊断结果。
进一步地,第三确定单元具体用于:
将特征词向量矩阵输入第一特征分析识别模块,确定第一预测概率;
将特征词权重序列输入第二特征分析识别模块,确定第二预测概率;
将第一预测概率及第二预测概率输入组合加权模块,确定一级分类结果;
根据一级分类结果分别对特征词权重序列及特征词向量矩阵进行标签化,确定第一一级故障类别信息及第二一级故障类别信息。
进一步地,第四确定单元具体用于:
将第一一级故障类别信息输入第一特征分析识别模块,确定第三预测概率;
将第二一级故障类别信息输入第二特征分析识别模块,确定第四预测概率;
将第三预测概率及第四预测概率输入组合加权模块,确定二级分类结果;
根据二级分类结果分别对第一一级故障类别信息及第二一级故障类别信息进行标签化,确定第一二级故障类别信息及第二二级故障类别信息。
本发明实施例所提供的铁路信号设备的故障诊断装置可执行本发明任意实施例所提供的铁路信号设备的故障诊断方法,具备执行方法相应的功能模块和有益效果。
实施例四
图8示出了可以用来实施本发明的实施例的电子设备10的结构示意图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备(如头盔、眼镜、手表等)和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本发明的实现。
如图8所示,电子设备10包括至少一个处理器11,以及与至少一个处理器11通信连接的存储器,如只读存储器(ROM)12、随机访问存储器(RAM)13等,其中,存储器存储有可被至少一个处理器执行的计算机程序,处理器11可以根据存储在只读存储器(ROM)12中的计算机程序或者从存储单元18加载到随机访问存储器(RAM)13中的计算机程序,来执行各种适当的动作和处理。在RAM 13中,还可存储电子设备10操作所需的各种程序和数据。处理器11、ROM 12以及RAM 13通过总线14彼此相连。输入/输出(I/O)接口15也连接至总线14。
电子设备10中的多个部件连接至I/O接口15,包括:输入单元16,例如键盘、鼠标等;输出单元17,例如各种类型的显示器、扬声器等;存储单元18,例如磁盘、光盘等;以及通信单元19,例如网卡、调制解调器、无线通信收发机等。通信单元19允许电子设备10通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
处理器11可以是各种具有处理和计算能力的通用和/或专用处理组件。处理器11的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的处理器、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。处理器11执行上文所描述的各个方法和处理,例如铁路信号设备的故障诊断方法。
在一些实施例中,铁路信号设备的故障诊断方法可被实现为计算机程序,其被有形地包含于计算机可读存储介质,例如存储单元18。在一些实施例中,计算机程序的部分或者全部可以经由ROM 12和/或通信单元19而被载入和/或安装到电子设备10上。当计算机程序加载到RAM 13并由处理器11执行时,可以执行上文描述的铁路信号设备的故障诊断方法的一个或多个步骤。备选地,在其他实施例中,处理器11可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行铁路信号设备的故障诊断方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本发明的方法的计算机程序可以采用一个或多个编程语言的任何组合来编写。这些计算机程序可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器,使得计算机程序当由处理器执行时使流程图和/或框图中所规定的功能/操作被实施。计算机程序可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本发明的上下文中,计算机可读存储介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的计算机程序。计算机可读存储介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。备选地,计算机可读存储介质可以是机器可读信号介质。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在电子设备上实施此处描述的系统和技术,该电子设备具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给电子设备。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括第一件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、第一件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发明中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本发明的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。
Claims (9)
1.一种铁路信号设备的故障诊断方法,其特征在于,包括:
获取待诊断铁路信号设备的故障文本数据;
对所述故障文本数据进行特征提取,确定所述故障文本数据的特征词权重序列及特征词向量矩阵;
根据所述特征词权重序列、所述特征词向量矩阵及预先训练的三级故障识别模型,确定所述待诊断铁路信号设备的分类诊断结果;
所述三级故障识别模型包括第一特征分析识别模块、第二特征分析识别模块及组合加权模块;
其中,所述根据所述特征词权重序列、所述特征词向量矩阵及预先训练的三级故障识别模型,确定所述待诊断铁路信号设备的分类诊断结果,包括:
将所述特征词权重序列及所述特征词向量矩阵分别输入所述三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息,其中,所述第一一级故障类别信息中包括所述特征词向量矩阵及一级类别特征矩阵,所述第二一级故障类别信息中包括所述特征词权重序列及一级类别特征序列;
将所述第一一级故障类别信息及所述第二一级故障类别信息分别输入所述三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息,其中,所述第一二级故障类别信息中包括所述特征词向量矩阵、所述一级类别特征矩阵及二级类别特征矩阵,所述第二二级故障类别信息中包括所述特征词权重序列、所述一级类别特征序列及二级类别特征序列;
将所述第一二级故障类别信息及所述第二二级故障类别信息分别输入所述三级故障识别模型,确定三级分类结果;
将所述一级分类结果、所述二级分类结果及所述三级分类结果作为所述分类诊断结果。
2.根据权利要求1所述的方法,其特征在于,所述对所述故障文本数据进行特征提取,确定所述故障文本数据的特征词权重序列及特征词向量矩阵,包括:
获取预先构建的铁路信号设备词典及通用词典;
根据所述铁路信号设备词典及通用词典对所述故障文本数据进行分词,确定所述故障文本数据对应的原始特征词集;
对所述原始特征词集进行特征提取及转化,确定所述特征词权重序列及所述特征词向量矩阵。
3.根据权利要求2所述的方法,其特征在于,所述对所述原始特征词集进行特征提取及转化,确定所述特征词权重序列及所述特征词向量矩阵,包括:
通过对所述原始特征词集进行词向量提取,获得所述特征词向量矩阵;
针对所述原始特征词集中的特征项,判断在所述原始特征词集中所述特征项是否包括有同义关系的同义特征项;
若是,根据所述特征项及所述同义特征项,确定所述特征项的最终权重;
若否,则根据所述特征项对于所述原始特征词集的重要程度,确定所述特征项的最终权重;
根据各所述最终权重,确定所述特征词权重序列。
4.根据权利要求3所述的方法,其特征在于,所述根据所述特征项及所述同义特征项,确定所述特征项的最终权重,包括:
根据所述原始特征词集,确定所述特征项的词频;
确定预设文本库中包含的文本总数,以及包含所述特征项和所述同义特征项的文本个数和;
根据所述文本总数、所述文本个数和及所述词频,确定所述最终权重。
5.根据权利要求1所述的方法,其特征在于,所述将所述特征词权重序列及所述特征词向量矩阵分别输入所述三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息,包括:
将所述特征词向量矩阵输入所述第一特征分析识别模块,确定第一预测概率;
将所述特征词权重序列输入所述第二特征分析识别模块,确定第二预测概率;
将所述第一预测概率及所述第二预测概率输入所述组合加权模块,确定所述一级分类结果;
根据一级分类结果分别对所述特征词权重序列及所述特征词向量矩阵进行标签化,确定所述第一一级故障类别信息及所述第二一级故障类别信息。
6.根据权利要求1所述的方法,其特征在于,所述将所述第一一级故障类别信息及所述第二一级故障类别信息输入所述三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息,包括:
将所述第一一级故障类别信息输入所述第一特征分析识别模块,确定第三预测概率;
将所述第二一级故障类别信息输入所述第二特征分析识别模块,确定第四预测概率;
将所述第三预测概率及所述第四预测概率输入所述组合加权模块,确定所述二级分类结果;
根据二级分类结果分别对所述第一一级故障类别信息及所述第二一级故障类别信息进行标签化,确定所述第一二级故障类别信息及所述第二二级故障类别信息。
7.一种铁路信号设备的故障诊断装置,其特征在于,包括:
获取模块,用于获取待诊断铁路信号设备的故障文本数据;
特征词序列化模块,用于对所述故障文本数据进行特征提取,确定所述故障文本数据的特征词权重序列及特征词向量矩阵;
结果确定模块,用于根据所述特征词权重序列、所述特征词向量矩阵及预先训练的三级故障识别模型,确定所述待诊断铁路信号设备的分类诊断结果;
其中,所述三级故障识别模型包括特征分析识别模块、第一特征分析识别模块及组合加权模块,所述结果确定模块,包括:
第三确定单元,用于将所述特征词权重序列及所述特征词向量矩阵分别输入所述三级故障识别模型,确定一级分类结果、第一一级故障类别信息及第二一级故障类别信息,其中,所述第一一级故障类别信息中包括所述特征词向量矩阵及一级类别特征矩阵,所述第二一级故障类别信息中包括所述特征词权重序列及一级类别特征序列;
第四确定单元,用于将所述第一一级故障类别信息及所述第二一级故障类别信息分别输入所述三级故障识别模型,确定二级分类结果、第一二级故障类别信息及第二二级故障类别信息,其中,所述第一二级故障类别信息中包括所述特征词向量矩阵、所述一级类别特征矩阵及二级类别特征矩阵,所述第二二级故障类别信息中包括所述特征词权重序列、所述一级类别特征序列及二级类别特征序列;
第五确定单元,用于将所述第一二级故障类别信息及所述第二二级故障类别信息分别输入所述三级故障识别模型,确定三级分类结果;
结果确定单元,用于将所述一级分类结果、所述二级分类结果及所述三级分类结果作为所述分类诊断结果。
8.一种电子设备,其特征在于,所述电子设备包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-6中任一项所述的铁路信号设备的故障诊断方法。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的铁路信号设备的故障诊断方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310987783.6A CN116738323B (zh) | 2023-08-08 | 2023-08-08 | 铁路信号设备的故障诊断方法、装置、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310987783.6A CN116738323B (zh) | 2023-08-08 | 2023-08-08 | 铁路信号设备的故障诊断方法、装置、设备及介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116738323A CN116738323A (zh) | 2023-09-12 |
CN116738323B true CN116738323B (zh) | 2023-10-27 |
Family
ID=87901470
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310987783.6A Active CN116738323B (zh) | 2023-08-08 | 2023-08-08 | 铁路信号设备的故障诊断方法、装置、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116738323B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117591876A (zh) * | 2023-11-17 | 2024-02-23 | 广东电网有限责任公司 | 一种断路器故障诊断方法、装置、设备及存储介质 |
CN118332413B (zh) * | 2024-06-12 | 2024-10-22 | 无锡学院 | 机电故障智能分析方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108647716A (zh) * | 2018-05-09 | 2018-10-12 | 北京理工大学 | 一种基于复合信息的光伏阵列故障诊断方法 |
CN109034368A (zh) * | 2018-06-22 | 2018-12-18 | 北京航空航天大学 | 一种基于dnn的复杂设备多重故障诊断方法 |
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN111192680A (zh) * | 2019-12-25 | 2020-05-22 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和集成分类的智能辅助诊断方法 |
CN111767398A (zh) * | 2020-06-30 | 2020-10-13 | 国网新疆电力有限公司电力科学研究院 | 基于卷积神经网络的二次设备故障短文本数据分类方法 |
CN113626586A (zh) * | 2021-08-02 | 2021-11-09 | 中车大连电力牵引研发中心有限公司 | 一种磁浮列车的故障文本分析处理方法 |
CN115408190A (zh) * | 2022-08-31 | 2022-11-29 | 北京理工大学 | 故障诊断方法和装置 |
CN115455194A (zh) * | 2022-08-23 | 2022-12-09 | 中国铁道科学研究院集团有限公司 | 铁路故障的知识抽取分析方法及装置 |
CN115544265A (zh) * | 2022-09-13 | 2022-12-30 | 南京航空航天大学 | 一种基于轴承故障知识图谱的轴承故障诊断方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11423538B2 (en) * | 2019-04-16 | 2022-08-23 | Covera Health | Computer-implemented machine learning for detection and statistical analysis of errors by healthcare providers |
-
2023
- 2023-08-08 CN CN202310987783.6A patent/CN116738323B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019210820A1 (zh) * | 2018-05-03 | 2019-11-07 | 华为技术有限公司 | 一种信息输出方法及装置 |
CN108647716A (zh) * | 2018-05-09 | 2018-10-12 | 北京理工大学 | 一种基于复合信息的光伏阵列故障诊断方法 |
CN109034368A (zh) * | 2018-06-22 | 2018-12-18 | 北京航空航天大学 | 一种基于dnn的复杂设备多重故障诊断方法 |
CN111192680A (zh) * | 2019-12-25 | 2020-05-22 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和集成分类的智能辅助诊断方法 |
CN111767398A (zh) * | 2020-06-30 | 2020-10-13 | 国网新疆电力有限公司电力科学研究院 | 基于卷积神经网络的二次设备故障短文本数据分类方法 |
CN113626586A (zh) * | 2021-08-02 | 2021-11-09 | 中车大连电力牵引研发中心有限公司 | 一种磁浮列车的故障文本分析处理方法 |
CN115455194A (zh) * | 2022-08-23 | 2022-12-09 | 中国铁道科学研究院集团有限公司 | 铁路故障的知识抽取分析方法及装置 |
CN115408190A (zh) * | 2022-08-31 | 2022-11-29 | 北京理工大学 | 故障诊断方法和装置 |
CN115544265A (zh) * | 2022-09-13 | 2022-12-30 | 南京航空航天大学 | 一种基于轴承故障知识图谱的轴承故障诊断方法 |
Non-Patent Citations (2)
Title |
---|
"Fault Diagnosis in Railway Track Circuits Using Support Vector Machines";Shangpeng Sun 等;2013 12th International Conference on Machine Learning and Applications;全文 * |
"基于迁移学习的旋转机械故障诊断方法研究";陈超;《中国博士学位论文全文数据库 (工程科技Ⅱ辑)》;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116738323A (zh) | 2023-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116738323B (zh) | 铁路信号设备的故障诊断方法、装置、设备及介质 | |
CN107992597B (zh) | 一种面向电网故障案例的文本结构化方法 | |
CN110245229B (zh) | 一种基于数据增强的深度学习主题情感分类方法 | |
CN104699763B (zh) | 多特征融合的文本相似性度量系统 | |
CN110968699A (zh) | 一种基于事理推荐的逻辑图谱构建及预警方法和装置 | |
CN110968695A (zh) | 基于弱监督技术主动学习的智能标注方法、装置及平台 | |
CN113553412B (zh) | 问答处理方法、装置、电子设备和存储介质 | |
CN111858843B (zh) | 一种文本分类方法及装置 | |
CN110334186B (zh) | 数据查询方法、装置、计算机设备及计算机可读存储介质 | |
CN111339260A (zh) | 一种基于bert和qa思想的细粒度情感分析方法 | |
CN109933792A (zh) | 基于多层双向lstm和验证模型的观点型问题阅读理解方法 | |
CN117312372B (zh) | 基于背景知识增强的sql生成方法、装置、设备及介质 | |
CN110874536A (zh) | 语料质量评估模型生成方法和双语句对互译质量评估方法 | |
CN116401345A (zh) | 智能问答方法、装置、存储介质和设备 | |
CN115659244A (zh) | 故障预测方法、装置及存储介质 | |
CN115757775A (zh) | 基于文本蕴含的无触发词文本事件检测方法及系统 | |
CN113642727B (zh) | 神经网络模型的训练方法和多媒体信息的处理方法、装置 | |
CN117688946A (zh) | 基于大模型的意图识别方法、装置、电子设备和存储介质 | |
CN117745482A (zh) | 合同条款的确定方法、装置、设备和介质 | |
CN116991252A (zh) | 一种输入文本的预测方法、装置、电子设备以及存储介质 | |
CN113869065B (zh) | 一种基于“单词-短语”注意力机制的情感分类方法和系统 | |
CN117153142A (zh) | 一种语音信号合成方法、装置、电子设备及存储介质 | |
CN108733702B (zh) | 用户查询上下位关系提取的方法、装置、电子设备和介质 | |
CN113157914B (zh) | 一种基于多层循环神经网络的文档摘要提取方法及系统 | |
CN115577109A (zh) | 文本分类方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |