ECG分类简要介绍
本篇内容属于ECG(心电图)分类方法的整理,用于了解ECG分类的流程。传统的时间序列分类方法高度依赖于提取的特征。深度学习算法对ECG信号的检测一般分为三个步骤:信号预处理,特征学习,ECG分类。本篇内容重点关注不同网络架构的性能表现,比如准确度,特异性和敏感性等性能指标。
基于专家知识的特征提取是耗费时间且容易出错的,并且提取的特征在许多变化方面(平移,噪声,缩放和位移)是不鲁棒的。为了自动检测心电图中的心律失常,算法应该隐式识别不同的波形并推断它们之间的关系。
下面介绍ECG分类的评价指标,通常使用准确率,灵敏度,特异性,阳性预测性,F-score。首先了解一些对象:
- TP(True Postive):实际为正样本,预测为正样本;
- FN(False Negative):实际为正样本,预测为负样本;
- FP(False Postive):实际为负样本,预测为正样本;
- TN(True Negative):实际为负样本,预测为负样本;
准确率(Accuracy)用于测量整体预测性能:
A
c
c
=
T
P
+
T
N
T
P
+
T
N
+
F
P
+
F
N
A_{cc}=\frac{TP+TN}{TP+TN+FP+FN}
Acc?=TP+TN+FP+FNTP+TN?灵敏度(Sensitivity)也称为召回率,是所有正例事件中被正确分类为正例的占比,Recall可以衡量模型对正例事件的识别能力:
S
e
n
=
T
P
T
P
+
F
N
S_{en}=\frac{TP}{TP+FN}
Sen?=TP+FNTP?特异性(Specificity)是所有负例事件中被正确分类为负例事件的占比,衡量模型对负例事件的识别能力:
S
p
e
=
T
N
T
N
+
F
P
S_{pe}=\frac{TN}{TN+FP}
Spe?=TN+FPTN?阳性预测性(Postive Predictive Value,PPV)也称为精确率(Precision),是在所有预测为正例事件中正确分类为正例事件的占比:
P
p
v
=
T
P
T
P
+
F
P
P_{pv}=\frac{TP}{TP+FP}
Ppv?=TP+FPTP?F-score综合考虑阳性预测性(精确率)与灵敏度(召回率)的调和:
F
s
c
o
r
e
=
(
1
+
β
2
)
P
p
v
S
e
n
β
2
P
p
v
+
S
e
n
F_{score}=(1+\beta^{2})\frac{P_{pv}S_{en}}{\beta^{2}P_{pv}+S_{en}}
Fscore?=(1+β2)β2Ppv?+Sen?Ppv?Sen??
F
1
=
2
T
P
2
T
P
+
F
P
+
F
N
F_{1}=\frac{2TP}{2TP+FP+FN}
F1?=2TP+FP+FN2TP?当
β
=
1
\beta=1
β=1时,称为F-1,此时表明,精确率和召回率都很重要,若精确率更重要则调整
β
<
1
\beta<1
β<1,若召回率更重要则调整
β
>
1
\beta>1
β>1。
鲁棒性指的是控制系统在一定结构,大小的参数变动下,维持它某些性能的度量。在异常或危险情况下,该性能是确保系统安全的关键。
鲁棒性是控制论中的词语,主要是指在某些参数略微改变时,系统仍然具有稳定性和有效性;(关于模型参数的鲁棒性)
如果模型具有鲁棒性,则当我们微调其参数时,也可以确保模型性能不会产生过度的变化;
模型的鲁棒性也包括输入数据的微小改变:对输入信号增加微小的噪声,模型性能不会出现太大偏差;(关于输入信号的鲁棒)
泛化性是指根据有限样本训练的系统,对其他变量域也具有良好的预测能力,此处注意,其他变量域通常要求和训练样本具有近似的分布。
ECG分类过程
数据预处理
常用的数据集有PhysioNet和MIT-BIH,PhysioNet是一个不断扩充,免费提供大量生理信号以及相关处理工具的资源网站。数据来源于正常人以及一些病人(心脏猝死,心力衰竭,心律失常等)。其拥有50个心电信号的数据库,共10,000个心电信号数据。PhysioNet
/
/
/Computing in Cardiology Challenge 2017(CinC17)使用广泛,共包含8528个心电信号用于训练和3658个信号用于测试。
MIT-BIH是国际公认的标准心电数据集。包含了48条记录,每条记录包含半小时的通道持续时间的双通道ECG信号。下面是每种心电节拍的数量: 另外,CCDD(Chinese Cardiovascular Disease Database)被用于研究面向临床的ECG分析。
对于数据处理,ECG信号预处理包括消除噪声,基线漂移和数据增强。对于输入到模型的信息还需要进行处理,ECG分类的基础是检测R波峰,因此,定位心跳节拍,心跳周期如下图所示: 心脏电活动的去极化表现为P波和QRS波,心脏电活动的复极化表现为心电图上的T波,其中,PR,ST分别表示心电图上的P-R波段和S-T段。通常使用小波变换提取ECG的QRS波。
ECG特征提取
特征提取即从波形信号提取其中的特征。基于小波变换提取的特征通常和SVM,KNN等分类器联合使用。在深度学习中,特征提取和分类器在同一个网络中执行,网络既要学习特征,又要学会分类特征。用于网络中的经过预处理的信号,有两种方式作为输入信息:
- 一种是将分割后的节拍信息输入到网络中;
- 另一种是将信号转换到频域,再进行特征提取;
在目前关于多网络架构的研究中,常使用卷积网络作为特征提取器,将长短期记忆模型用于学习心律节拍信息。大部分经过训练的网络都已表现出良好的性能。
目前ECG还存在的问题有:
- 心电信号预处理方面,对是否需要处理存在一定的争论,有的研究表明未处理的信号因为噪声存在一定的失真。有的研究表明,通过小波变换等处理后的信号特征有缺失,不能完全表达原始信号。
- 有的网络表现仅限于部分心电信号的异常分类,没有结合临床数据训练网络而不具备泛化性。
- 有的网络虽然表现良好,但缺乏计算效率。
- 有的网络表现良好,但不能完全代替医生的操作,缺乏特征上的可解释性。
Reference
Tang Jianjun, Li Xingxiu, Hua Jing, Yang Fuhao. A review of electrocardiogram detection and classification based on neural network [J]. Computer Applications and Software, 2021, 38(05): 1-9+41.
|