CN113080993B - 一种基于改进多基分类器集成的自动心律失常分析方法 - Google Patents
一种基于改进多基分类器集成的自动心律失常分析方法 Download PDFInfo
- Publication number
- CN113080993B CN113080993B CN202110343071.1A CN202110343071A CN113080993B CN 113080993 B CN113080993 B CN 113080993B CN 202110343071 A CN202110343071 A CN 202110343071A CN 113080993 B CN113080993 B CN 113080993B
- Authority
- CN
- China
- Prior art keywords
- classification
- data
- arrhythmia
- xgboost
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 206010003119 arrhythmia Diseases 0.000 title claims abstract description 58
- 230000006793 arrhythmia Effects 0.000 title claims abstract description 58
- 230000010354 integration Effects 0.000 title claims abstract description 25
- 238000004458 analytical method Methods 0.000 title claims abstract description 8
- 238000013528 artificial neural network Methods 0.000 claims abstract description 31
- 238000000034 method Methods 0.000 claims abstract description 25
- 230000004927 fusion Effects 0.000 claims abstract description 15
- 238000007781 pre-processing Methods 0.000 claims abstract description 4
- 230000009467 reduction Effects 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 64
- 230000006870 function Effects 0.000 claims description 43
- 210000002569 neuron Anatomy 0.000 claims description 21
- 238000012360 testing method Methods 0.000 claims description 19
- 238000002790 cross-validation Methods 0.000 claims description 12
- 238000010586 diagram Methods 0.000 claims description 12
- 238000001914 filtration Methods 0.000 claims description 12
- 230000004913 activation Effects 0.000 claims description 9
- 230000005284 excitation Effects 0.000 claims description 9
- 230000008569 process Effects 0.000 claims description 8
- 238000010276 construction Methods 0.000 claims description 7
- 229910052731 fluorine Inorganic materials 0.000 claims description 5
- 230000009466 transformation Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 3
- 230000003183 myoelectrical effect Effects 0.000 claims description 3
- 238000010200 validation analysis Methods 0.000 claims description 3
- 238000013145 classification model Methods 0.000 claims description 2
- 238000013136 deep learning model Methods 0.000 abstract description 2
- 238000010801 machine learning Methods 0.000 abstract description 2
- 238000001514 detection method Methods 0.000 description 19
- 230000009471 action Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 230000000747 cardiac effect Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000003745 diagnosis Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000033764 rhythmic process Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 125000001153 fluoro group Chemical group F* 0.000 description 2
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- UFHFLCQGNIYNRP-UHFFFAOYSA-N Hydrogen Chemical compound [H][H] UFHFLCQGNIYNRP-UHFFFAOYSA-N 0.000 description 1
- 206010042434 Sudden death Diseases 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000001121 heart beat frequency Effects 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明公开了一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:预处理模块,包括心电信号降噪、心拍识别及截取;分类模块,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;融合模块,用以依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据;然后利用浅层神经网络对心律失常集成数据进行分类,得到最终的心率失常分类融合结果。如此,本发明将XGBoost、GBDT、BiGRU三种基分类器的分类结果利用Stacking集成规则进行融合,采用机器学习模型与深度学习模型相结合的方法,提升了心律失常整体分类性能及准确率。
Description
技术领域
本发明涉及医学信号处理技术领域,具体为一种基于改进多基分类器集成的自动心律失常分析方法。
背景技术
心律指心跳的节奏。正常人的心脏跳动频率每分钟约为60~100次,并且健康的心律应该是十分均匀的,心脏病或心脏神经调节功能不正常时,可出现心律不齐或心律失常。心律失常是心血管疾病常见且最为严重的病症之一,可导致患者突然死亡,严重威胁人类健康。
如今,随着人工智能技术的发展,智能辅助诊断系统因其快速、可靠的特点已成为最具前景的临床诊断解决方案。由于心电远程监护技术的迅速发展和普及,以及当下可穿戴设备的流行我们可以很容易地得到病人的心电信号以及其他生理特征。传统上,医生可以通过观察心电信号中蕴含的信息来判断病人是否患心律失常,然而仅通过观察变化微弱的心电信号来推断病人状态的过程是费力的,并且容易因复杂的心电变化而产生错误的判断。因此,利用计算机来进行智能辅助的诊断系统可以克服对心电信号的评估限制,从而更好的辅助医生对病人心律失常的患病情况进行推断。
发明内容
(一)解决的技术问题
针对现有技术的不足,本发明提供了一种基于改进多基分类器集成的自动心律失常分析方法,提升心律失常的检测效果。
(二)技术方案
为实现以上目的,本发明通过以下技术方案予以实现:一种基于改进多基分类器集成的自动心律失常分析方法,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;
S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;
S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类;
S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存;
S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果。
优选的,步骤S2具体包括:
读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。
优选的,步骤S3具体包括:
XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost;
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Ne wton-Raphson近似:
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT;
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
其中,表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵。过上述步骤完成BiGRU模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU。
优选的,步骤S4,包括:
依据模型集成规则—Stacking,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1;
所述全连接神经网络采用的公式如下:
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数。
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数。
优选的,步骤S5具体包括:
初始化所述宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块。每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息。
优选的,步骤S6具体包括:将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
(三)有益效果
本发明提供了一种基于改进多基分类器集成的自动心律失常分析方法。具备以下有益效果:
本发明提出了基于改进多基分类器集成的自动心律失常分类方法,适用于临床上辅助医生进行心律失常的检测。传统的心律失常的检测方法仅仅利用了单一的检测模型,并没有利用Stacking策略集成其他模型一同进行检测,本发明提出的方法基于基于改进多基分类器集成的检测模型,通过对病人心电信号特征进行提取,缓解了心律失常检测难度,使得检测过程中可以利用诸多模型的优势,从而让心律失常检测变得更加准确。
附图说明
图1为基于改进多基分类器集成及诊断规则的自动心律失常分类系统及方法的总体示意图;
图2为Stacking模型集成策略原理示意图;
图3为浅层神经网络示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-3,本发明提供一种技术方案:如附图1所示,一种基于改进多基分类器集成及诊断规则的自动心律失常分类系统及方法,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为宽深神经网络模型的输入数据X;
S3:基分类器模型构建,XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果。其中,对每个心电样本的预测表示为:
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式8可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost;
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Newton-Raphson近似:
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT;
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
其中,表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵。过上述步骤完成BiGRU模型的构建。并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU;
S4:模型融合,依据模型集成规则—Stacking,如附图2,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1。
所述全连接神经网络采用的公式如下:
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数。
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数;
S5:训练模型参数,初始化所述宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块。每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息;
S6:模型预测,将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
通过上述方法步骤,本发明实施例具有以下有益效果:
1、本发明实施例改进了现有的单一模型在心律失常检测中的应用方法,适用于在临床上辅助心律失常的检测。传统的心律失常检测方法仅仅利用了单一的检测模型,并没有融合其他模型的有益信息,本发明提出的方法基于Stacking策略,通过对病人心电信号特征进行提取,充分利用三个基分类器模型的优点,缓解了心律失常检测难度,使得算法更贴近临床检测实际,从而让心律失常检测变得更加准确。
2、本发明实施例使用Stacking策略作为模型的融合策略,相对于传统的心律失常检测算法中仅单一检测,可以多角度的得挖掘心电信号特征,将深度学习模型与机器学习模型相结合,对于因心电信号变化复杂而导致准确度达不到临床要求的检测可以提供更为可靠的实施效果。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个......”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
Claims (3)
1.一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,包括以下步骤:
S1:数据预处理,读入12导联的心电信号的数据,采用小波变换滤除原始心电信号中的工频干扰,采用巴特沃斯带阻滤波器滤除肌电干扰,采用中值滤波滤除原始心电信号中的基线漂移;
S2:心拍数据提取,通过小波变换检测R波位置,进而对R波前后数据点进行固定长度截取,从而完成对心拍数据提取;
S3:基分类器模型构建,包括用以对心电图数据进行心律失常自动分类的XGBoost分类模块、GBDT分类模块、BiGRU分类模块;其中,XGBoost作为第一基分类模块、GBDT作为第二基分类模块、GRU作为第三基分类模块,通过对训练数据进行K折交叉的划分,使得XGBoost输出K个第一分类结果,GBDT输出K个第二分类结果,BiGRU输出K个第三分类结果;
S4:模型融合,依据模型集成规则—Stacking,将分类模块产生的第一分类结果、第二分类结果及第三分类结果进行集成,得到集成数据,然后搭建好浅层神经网络以对心律失常集成数据进行分类;
S5:训练模型参数,初始化所述集成模型的参数,将构建好的数据集拆分为训练集和测试集;利用训练集样本对集成模型进行训练,生成所述集成模型的参数并保存;
S6:模型预测,对测试集样本进行自动识别,获得心律失常的二分类结果;
XGBoost分类模块,其作为第一分类模快,通过对训练数据进行3折交叉的划分,使得XGBoost输出3个第一分类结果,其中,对每个心电样本的预测表示为:
其中,gi、hi表示在第i个样本下泰勒展开式的一阶导数、二阶导数,通过公式可以得到Objt关于wj的一元二次方程,由此找到使Objt取值最小的wj,表示为:
其中,Gj=∑gi;Hj=∑hi,通过上述步骤完成第t棵树的建立,从而完成XGBoost模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 XGBoost、A2 XGBoost、A3 XGBoost和对应的针对测试集的预测结果B1 XGBoost、B2 XGBoost、B3 XGBoost;
GBDT分类模块,其作为第二分类模块,通过对训练数据进行3折交叉的划分,使得GBDT输出3个第二分类结果,表示为:
使用负二项对数似然作为损失函数,表示为:
L(y,F)=ylog(P(y=1|x))+(1-y)log(1-P(y=1|x)),y∈{0,1} (5)
计算第m-1棵树的预测函数的当前梯度值:
将回归树作为基学习器,进行线性搜索以得到最优叶子节点值,使用Newton-Raphson近似:
其中Rm,j为第m棵树对应的叶子结点区域,第m棵树的预测概率函数如下:
Fm(x)为第m棵树的预测概率函数,预测样本的正分类概率为:
通过上述步骤完成第m棵树的建立,从而完成GBDT模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 GBDT、A2 GBDT、A3 GBDT和对应的针对测试集的预测结果B1 GBDT、B2 GBDT、B3 GBDT;
BiGRU分类模块,其作为第三分类模块,通过对训练数据进行3折交叉的划分,使得BiGRU输出3个第三分类结果,具体的,所BiGRU深度神经网络采用的公式如下:
zt=σ(Wz·[ht-1,xt]) (10)
rt=σ(Wr·[ht-1,xt]) (11)
所述公式10-13中:
ht-1表示上一个神经元的输出;xt表示本次神经元的输入;Wz表示更新门的权重;σ表示sigmoid函数;zt表示更新门;rt表示重置门;wr表示重置门的权重;表示当前神经元的候选输出值;w表示输出状态的权重,tanh表示双曲正切函数;表示本次神经元的输出值,采用上述公式1-4分别计算t时刻BiGRU所对应的前向隐层状态ht,和反向隐层状态ht',然后对ht和ht'加权求和得到t时刻的隐层状态ht”,表示为:
ht”=wtht+vtht'+bj (14)
其中,wt、vt分别表示t时刻ht、ht'对应的权重,bj表示待训练的偏置,最后计算心律失常二分类结果,表示为:
其中,表示为输出的心律失常预测概率,wi表示为待训练的权重系数矩阵;过上述步骤完成BiGRU模型的构建,并通过3折交叉验证的方式,分别产生针对训练集的预测结果A1 BiGRU、A2 BiGRU、A3 BiGRU和对应的针对测试集的预测结果B1 BiGRU、B2 BiGRU、B3 BiGRU;
步骤S4中,依据模型集成规则—Stacking,将各个分类模块产生的针对训练集上的第一分类结果、第二分类结果及第三分类结果进行行级别上的联结,得到集成数据,表示为:
XI=[A1 I,A2 I,A3 I]∈R1,I={XGBoost,GBDT,BiLSTM} (15)
然后对三个分类模块预测结果的行级拼接数据进行列级别上的再次拼接,作为三个数据特征,表示为:
X′=[XXGBoost,XGBDT,XBiLSTM]∈R3 (16)
再把上述得到的三个数据特征,拼接真实的心律失常标签,作为之后的浅层神经网络的输入,表示为:
第一个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第二个全连接层单元的神经元个数为5个,全连接层单元后的激励单元为Relu函数,经过第一层全连接层单元后的特征图维度为5;
第三个全连接层单元的神经元个数为1个,全连接层单元后的激励单元为Sigmoid函数,经过第一层全连接层单元后的特征图维度为1;
所述全连接神经网络采用的公式如下:
其中al是第l-1层的输出,al-1,bl-1,Wl-1,f是第l-1层的激活值、偏置、权重和激活函数;
将12导联信号进行上述集成模型的操作后,输出心律失常的预测结果,输出结果的最终表示为:
其中,a3,b3,W3,f是第三层神经网络的输入特征、偏置、权重和激活函数;
步骤S5中,初始化宽深神经网络的参数,将构建好的数据集随机抽取70%数目的样本当作训练集,其他30%的样本视为测试集;利用三个基分类器,对训练集中的样本继续进行3折交叉验证,并将验证的结果作为融合模块的输入,训练融合模块;每迭代一次更新一次训练参数,直至最后三个基模型及最终的集成模型的损失函数稳定在某一数值附近,停止训练并保存当前网络的训练参数和模型结构信息。
2.如权利要求1所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S2,具体包括:
读取降噪后12导联的心电信号数据,对每个导联心电信号根据同一时刻R波峰值处的位置固定向前截取200个样本点,向后截取400个样本点,使得每个导联的每个心拍固定截取600个点的数据,对相同时刻R波顶点每个导联所截取的600个点的心电信号进行行级上的拼接,此时原始每个心拍的心电信号的数据形成12*600维的样本,作为基分类模型的输入数据X。
3.如权利要求1所述的一种基于改进多基分类器集成的自动心律失常分析方法,其特征在于,步骤S6,具体包括:将测试集样本输入到已训练好的集成模型中,进行自动识别,获得心律失常的二分类预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110343071.1A CN113080993B (zh) | 2021-03-30 | 2021-03-30 | 一种基于改进多基分类器集成的自动心律失常分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110343071.1A CN113080993B (zh) | 2021-03-30 | 2021-03-30 | 一种基于改进多基分类器集成的自动心律失常分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113080993A CN113080993A (zh) | 2021-07-09 |
CN113080993B true CN113080993B (zh) | 2023-02-03 |
Family
ID=76671400
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110343071.1A Active CN113080993B (zh) | 2021-03-30 | 2021-03-30 | 一种基于改进多基分类器集成的自动心律失常分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113080993B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230238134A1 (en) * | 2022-01-25 | 2023-07-27 | GE Precision Healthcare LLC | Methods and system for cardiac arrhythmia prediction using transformer-based neural networks |
CN114711781A (zh) * | 2022-03-30 | 2022-07-08 | 上海夏先机电科技发展有限公司 | 基于深度学习和专家特征融合的心律失常检测方法及系统 |
CN114869259A (zh) * | 2022-05-12 | 2022-08-09 | 长春理工大学 | 一种基于GP-XGBoost的非接触式心率测量方法 |
CN115281662B (zh) * | 2022-09-26 | 2023-01-17 | 北京科技大学 | 一种慢性踝关节不稳智能辅助诊断系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110507315A (zh) * | 2019-09-26 | 2019-11-29 | 杭州电子科技大学 | 一种高效的心电图诊断系统 |
CN110881969A (zh) * | 2019-11-27 | 2020-03-17 | 太原理工大学 | 一种基于Stacking集成学习的心力衰竭预警方法 |
CN111192680A (zh) * | 2019-12-25 | 2020-05-22 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和集成分类的智能辅助诊断方法 |
CN111329469A (zh) * | 2020-03-05 | 2020-06-26 | 广州天嵌计算机科技有限公司 | 一种心律异常预测方法 |
CN111557659A (zh) * | 2020-05-22 | 2020-08-21 | 郑州大学 | 基于多特征融合与Stacking-DWKNN的心律失常分类方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10869610B2 (en) * | 2018-12-05 | 2020-12-22 | General Electric Company | System and method for identifying cardiac arrhythmias with deep neural networks |
-
2021
- 2021-03-30 CN CN202110343071.1A patent/CN113080993B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110507315A (zh) * | 2019-09-26 | 2019-11-29 | 杭州电子科技大学 | 一种高效的心电图诊断系统 |
CN110881969A (zh) * | 2019-11-27 | 2020-03-17 | 太原理工大学 | 一种基于Stacking集成学习的心力衰竭预警方法 |
CN111192680A (zh) * | 2019-12-25 | 2020-05-22 | 山东众阳健康科技集团有限公司 | 一种基于深度学习和集成分类的智能辅助诊断方法 |
CN111329469A (zh) * | 2020-03-05 | 2020-06-26 | 广州天嵌计算机科技有限公司 | 一种心律异常预测方法 |
CN111557659A (zh) * | 2020-05-22 | 2020-08-21 | 郑州大学 | 基于多特征融合与Stacking-DWKNN的心律失常分类方法 |
Non-Patent Citations (1)
Title |
---|
DB-SMOTE及多层堆叠用于心律失常识别;王波等;《西安电子科技大学学报》;20210226;第48卷(第4期);第136-143页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113080993A (zh) | 2021-07-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wu et al. | A study on arrhythmia via ECG signal classification using the convolutional neural network | |
CN113080993B (zh) | 一种基于改进多基分类器集成的自动心律失常分析方法 | |
Jahmunah et al. | Automated detection of coronary artery disease, myocardial infarction and congestive heart failure using GaborCNN model with ECG signals | |
Houssein et al. | An automatic arrhythmia classification model based on improved marine predators algorithm and convolutions neural networks | |
Pourbabaee et al. | Deep convolutional neural networks and learning ECG features for screening paroxysmal atrial fibrillation patients | |
Malik et al. | Real-time patient-specific ECG classification by 1D self-operational neural networks | |
CN109998525B (zh) | 一种基于判别式深度置信网络的心律失常自动分类方法 | |
Pourbabaee et al. | Feature leaning with deep convolutional neural networks for screening patients with paroxysmal atrial fibrillation | |
Wu et al. | A novel method for classification of ECG arrhythmias using deep belief networks | |
CN111990989A (zh) | 一种基于生成对抗及卷积循环网络的心电信号识别方法 | |
Luo et al. | Multi-classification of arrhythmias using a HCRNet on imbalanced ECG datasets | |
Javadi et al. | Improving ECG classification accuracy using an ensemble of neural network modules | |
CN110522444B (zh) | 一种基于Kernel-CNN的心电信号识别分类方法 | |
CN110619322A (zh) | 一种基于多流态卷积循环神经网络的多导联心电异常信号识别方法及系统 | |
Dhull et al. | ECG beat classifiers: A journey from ANN to DNN | |
Feng et al. | Unsupervised semantic-aware adaptive feature fusion network for arrhythmia detection | |
Patra et al. | Integration of FCM, PCA and neural networks for classification of ECG arrhythmias | |
CN113095302A (zh) | 用于心律失常分类的深度模型、利用该模型的方法及装置 | |
Qiao et al. | A fast and accurate recognition of ECG signals based on ELM-LRF and BLSTM algorithm | |
CN115281688A (zh) | 一种基于多模态深度学习的心脏肥大多标签检测系统 | |
CN114847905B (zh) | 一种心率失常数据检测识别方法及系统 | |
Golrizkhatami et al. | Multi-scale features for heartbeat classification using directed acyclic graph CNN | |
CN116432070A (zh) | 一种基于深度学习神经网络的ecg信号分类系统和方法 | |
Dambal et al. | Premature Ventricular Contraction Classification Based on Spiral Search-Manta Ray Foraging and Bi-LSTM | |
CN115329929A (zh) | 一种大脑功能网络的超图表示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |