IT数码 购物 网址 头条 软件 日历 阅读 图书馆
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
图片批量下载器
↓批量下载图片,美女图库↓
图片自动播放器
↓图片自动播放器↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁
 
   -> 人工智能 -> [文献翻译]Video-based AI for beat-to-beat assessment of cardiac function -> 正文阅读

[人工智能][文献翻译]Video-based AI for beat-to-beat assessment of cardiac function

【文献翻译】Video-based AI for beat-to-beat assessment of cardiac function

摘要

准确的心功能评估对于1心血管疾病的诊断、2心脏毒性的筛查和3危重患者的临床管理决策至关重要。然而,人类对心脏功能的评估只关注有限的心脏周期采样,尽管经过多年的训练,但观察者之间的差异还是相当大的。在这里,为了克服这一挑战,我们提出了一种基于视频的深度学习算法EchoNet - Dynamic,它在分割左心室、估计射血分数和评估心肌病等关键任务中的表现超过了人类专家。在超声心动图视频的训练下,我们的模型准确分割左心室,Dice相似系数为0.92,预测射血分数的平均绝对误差为4.1%,并使用减小的射血分数(曲线下面积为0.97)对心力衰竭进行可靠分类。在另一个医疗系统的外部数据集中,EchoNet-Dynamic预测了射血分数,平均绝对误差为6.0%,并通过曲线下面积为0.96的降低的射血分数对心力衰竭进行了分类。通过重复人体测量进行的前瞻性评估证实,该模型的方差与人类专家的方差相当或更小。通过利用多个心动周期的信息,我们的模型可以快速识别射血分数的细微变化,比人类评估更具重复性,为实时准确诊断心血管疾病奠定基础。作为促进进一步创新的资源,我们还公开了10,030个带注释的超声心动图视频的大型数据集。

引言

心脏功能对于维持正常的全身组织灌注至关重要;心脏功能障碍表现为呼吸困难、疲劳、运动不耐受、液体滞留和死亡风险增加[1–3,5–8]。心脏功能受损被描述为心肌病或心力衰竭,是美国住院的主要原因,也是日益严重的全球健康问题[1,9,10]。多种方法已被用于量化心脏功能和诊断功能障碍。特别是,测量左心室射血分数,即左心室收缩末期和舒张末期容积的变化比率,是衡量心脏功能的最重要指标之一,因为它可以确定哪些患者有资格接受延长生命的治疗[7,11]。然而,射血分数的评估与可观的观察者间变异性以及基于方法学和模态的模态间不一致性相关[2、4、5、11–14]。

人类对射血分数的评估存在差异,部分原因是心率不规则的普遍发现以及计算的费力性(计算需要手动追踪心室大小以量化每一次搏动)[4、5]。尽管美国超声心动图学会和欧洲心血管成像协会的指南建议,如果发现变异,最多可追踪和平均五个连续心动周期,但射血分数通常仅根据一个代表性搏动的轨迹进行评估,或者如果追踪被认为不准确,则进行视觉近似[5,15]。这导致了高方差和有限的精度,观测者间方差[4,12–15]在7.6%到13.9%之间。更精确的心功能评估是必要的,因为即使是射血分数临界降低的患者也显示出发病率和死亡率的显著增加[16–18]。

超声心动图图像采集速度快,成本相对较低,没有电离辐射,是最广泛使用的心血管成像方式[19,20]。人们对使用超声心动图的深度学习技术来确定射血分数很感兴趣[21–23]。用深度学习模型算法评估心脏功能的过往尝试依赖于心脏收缩期和心脏舒张期手动精选的静态图像,而不是使用实际的超声心动图视频,这些模型与人类心脏功能评估相比有很大误差[21、22],R^2在0.33和0.50之间。人工翻译的局限性(包括费力的手工分割和和不能进行逐拍量化),可以通过复杂的自动化方法来克服[5、22、23]。深度学习的最新进展表明,它可以准确、可重复地识别人类可识别的表型以及人类专家无法识别的特征[24–28]。

为了克服目前人类心脏功能评估的局限性,我们提出了EchoNet-Dynamic,一种端到端的深度学习方法,用于标记左心室和仅从输入超声心动图视频中估计射血分数。我们首先使用来自临床专家标记的弱监督学习来执行左心室的帧级(frame-level)语义分割。然后,一个具有残差连接的三维卷积神经网络(CNN)从原始的超声心动图视频中预测片段级(clip-level)的射血分数。最后,将分割结果与片段级(clip-level)预测相结合,以产生射血分数的逐拍评估。这种方法提供了可解释的心室轨迹,便于人类评估和下游分析,同时利用CNN完全捕捉视频中的时空模式[5,29,30]。

基于视频的深度学习模型

EchoNet-Dynamic有三个关键组件(图1)。首先,我们构建了一个具有空洞卷积的CNN模型,用于左心室的帧级语义分割。空洞卷积技术使模型能够捕捉更大的模式,并且之前已经证明在非医学成像数据集上表现良好[29]。用于估计射血分数的标准人类临床工作流程需要在收缩末期和舒张末期对左心室进行手动分割。我们用空洞卷积的弱监督方法概括这些标签,以1:1的比例与原始视频中的帧配对,生成整个心动周期的帧级语义分割。自动分割用于识别心室收缩,并提供模拟临床工作流程的临床医生可解释的中介。

其次,我们训练了一个具有残留连接和跨帧时空卷积的CNN模型来预测射血分数。与以前用于医学图像机器学习的CNN体系结构相反,我们的方法在我们的网络卷积中集成了空间和时间信息25、29、30。时空卷积结合了二维的空间信息和三维的时间信息,以前已经用于非医学视频分类任务29、30。然而,这种方法以前没有用于医学数据,因为标记的医学视频相对较少。我们还执行了模型架构搜索,以确定最佳基础架构(扩展数据图1)。

最后,我们对射血分数进行视频级(video-level)预测,用于心脏功能的逐搏估计。考虑到心脏功能的变化可能由负荷条件以及各种心脏条件下心率的变化引起,建议对最多五个心动周期的射血分数进行估计;然而,考虑到计算的繁琐和费力性质,在临床实践中并不总是这样做。我们的模型识别每个心动周期,生成一个32帧的片段( a clip of 32 frames),并平均每个心跳的射血分数的片段级估计作为测试时间增加。EchoNet-Dynamic是使用在斯坦福医学中心常规临床实践过程中获得的10,030个心尖四腔超声心动图视频开发的。扩展数据表1包含患者群体的汇总统计数据。模型和超参数搜索的细节将在方法和扩展数据表2中进一步描述。

模型性能评估

对于之前在模型训练中没有看到的来自斯坦福医学的测试数据集,与人类专家的注释相比,通过EchoNet-Dynamic对射血分数的预测具有4.1%的平均绝对误差、5.3%的均方根误差和0.81的R^2。这完全在不同临床医生之间的典型测量变化范围内,通常被描述为观察者间变化5,13–16,最高可达13.9%(图2a)。使用射血分数小于50%的共同阈值来分类心肌病,EchoNet-Dynamic预测的曲线下面积为0.97(图2b)。我们将EchoNet-Dynamic的性能与我们在该数据集上训练的几个额外深度学习架构的性能进行了比较,EchoNet-Dynamic始终更准确,这表明了其特定架构的力量(扩展数据表2)。此外,在EchoNet-Dynamic预测射血分数与原始人类注释差异最大的情况下,我们由盲法临床医生对视频进行了重新评估。这些视频中的许多具有不准确的初始人类标签(在43%的视频中,被蒙蔽的临床医生更喜欢模型的预测)、较差的图像质量或心律失常和心率变化(扩展数据表3)。

表明有分歧的视频通常是质量不佳的视频,并且对于质量不佳的视频,通常算法比人工准确

推广到不同的医院

(用一个来自其他医院的外部数据集进行测试以评估EchoNet-Dynamic的可靠性)
…其他忽略

讨论

EchoNet-Dynamic是一种基于视频的深度学习算法,可实现最先进的心功能评估。它使用专业的人体跟踪对视频数据进行左心室分割和时空卷积的弱监督学习,以获得整个视频射血分数的逐拍累积评估。据我们所知,EchoNet-Dynamic是第一个基于视频的超声心动图深度学习模型,其在评估射血分数方面的表现明显优于以前基于图像的深度学习尝试20、22。EchoNet-Dynamic预测的差异相当于或小于人类专家对心脏功能的测量5。此外,当用于独立医疗中心的超声心动图视频验证数据集时,其预测射血分数的性能非常准确,无需额外的模型训练。只有一个GPU,EchoNet-Dynamic实时完成这些任务;每次预测任务每帧只需0.05 s,比人类评估射血分数要快得多。EchoNet-Dynamic可能有助于临床医生对心脏功能进行更精确和可再现的评估,并且可以检测超出人类读者精度的射血分数亚临床变化。

模型和人类评估之间的一些差异,部分是由于EchoNet-Dynamic对整个视频中射血分数的逐拍评估与人类仅评估一个“代表性”拍而忽略其他拍。选择有代表性的节拍可能是主观的,会导致人的观察者内可变性,并且忽略了指导原则建议的平均5个连续节拍。这种五拍的工作流程很少完成,部分原因是人工追踪任务的费力和耗时。EchoNet-Dynamic通过自动化分割任务大大减少了心脏功能评估的工作量,并为更频繁、更快速的心脏功能评估提供了机会。我们的端到端方法生成射血分数的逐跳(beat)级和片段(clip)级预测以及整个心动周期的左心室分割,以直观地解释建模结果。在心功能变化的敏感检测至关重要的情况下,早期检测变化可以极大地影响临床护理2,3。

我们与斯坦福医学院的利益相关者合作,发布了我们的10030个去身份的超声心动图视频的完整数据集作为医疗机器学习社区的资源,用于未来对深度学习模型的比较和验证。据我们所知,这是将公开的最大的有标签的医疗视频数据集之一,也是第一次大规模发布带有人类专家跟踪、容积估计和左心室射血分数计算的匹配标签的超声心动图数据。我们期望该数据集将极大地促进新的超声心动图和基于医疗视频的机器学习方法。我们还发布了算法和数据处理工作流的完整代码。

我们的模型是在一个学术医疗中心的训练有素的超声技师获得的视频上进行训练的,这些视频反映了临床实践中的变化。随着非心脏病专家使用现场超声评估心脏功能的扩大,需要做进一步的工作来了解具有更多可变质量和采集专业知识的输入视频的模型性能,以及与其他成像模式的比较。我们模拟降级视频质量的实验和跨健康系统的分析表明,EchoNet-Dynamic对视频采集的变化具有鲁棒性;然而,不同临床环境下的进一步分析仍有待完成。

我们的结果代表了通过深度学习从超声心动图视频中自动评估心功能的重要一步。EchoNet-Dynamic可以提高现有方法的精度,使亚临床心功能障碍的早期检测成为可能,并且底层的开放数据集可以用于推进基于医学视频的深度学习方面的未来工作,并为医学深度学习的进一步应用奠定基础。

  人工智能 最新文章
2022吴恩达机器学习课程——第二课(神经网
第十五章 规则学习
FixMatch: Simplifying Semi-Supervised Le
数据挖掘Java——Kmeans算法的实现
大脑皮层的分割方法
【翻译】GPT-3是如何工作的
论文笔记:TEACHTEXT: CrossModal Generaliz
python从零学(六)
详解Python 3.x 导入(import)
【答读者问27】backtrader不支持最新版本的
上一篇文章      下一篇文章      查看所有文章
加:2021-12-09 11:39:17  更:2021-12-09 11:39:45 
 
开发: C++知识库 Java知识库 JavaScript Python PHP知识库 人工智能 区块链 大数据 移动开发 嵌入式 开发工具 数据结构与算法 开发测试 游戏开发 网络协议 系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程
数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁

360图书馆 购物 三丰科技 阅读网 日历 万年历 2024年11日历 -2024/11/27 1:27:08-

图片自动播放器
↓图片自动播放器↓
TxT小说阅读器
↓语音阅读,小说下载,古典文学↓
一键清除垃圾
↓轻轻一点,清除系统垃圾↓
图片批量下载器
↓批量下载图片,美女图库↓
  网站联系: qq:121756557 email:121756557@qq.com  IT数码