基于深度学习的阻塞性睡眠呼吸暂停检测工具

admin 46 2025-01-11 编辑

 

今天介绍近期在Nature Communication上关于阻塞性睡眠呼吸暂停,也就是俗称的打鼾的研究,该研究开发了一个基于深度学习的单一通道血氧饱和度分析的阻塞性睡眠呼吸暂停诊断算法,称为OxiNet。该方法使用单一通道的血氧饱和度分析进行阻塞性睡眠呼吸暂停诊断,从而为远程诊断和监测阻塞性睡眠呼吸暂停提供了一个令人兴奋的前景。

论文链接:https://doi.org/10.1038/s41467-023-40604-3

1 背景

阻塞性睡眠呼吸暂停(OSA)是一种严重的医学状况,它是由睡眠时上呼吸道部分或完全阻塞引起的反复缺氧和觉醒事件,如果不治疗,会增加心血管疾病、中风、死亡、癌症和其他疾病的风险。现有诊断方法的主要的家庭自我睡眠监控:尽管家庭睡眠监控可以提供可接受的诊断性能,但它们存在一些限制。最近的一项荟萃分析显示,家庭睡眠测试的诊断错误率高达39%,这突显了这些成本效益解决方案与更昂贵的实验室标准之间的差距。

由于阻塞性睡眠呼吸暂停的高患病率、大量未确诊个体以及对多导睡眠图(PSG)时间和成本的考虑,推动了基于单通道血氧饱和度分析的便携式诊断技术的发展。大多数先前的研究集中在开发阻塞性睡眠呼吸暂停筛查测试的二元分类任务(阻塞性睡眠呼吸暂停与非阻塞性睡眠呼吸暂停),而忽视了评估模型诊断用途的能力。而新研究利用来自六个独立数据库的12,923个多导睡眠图(polysomnography)记录,总计115,866小时的连续数据,来开发和评估名为OxiNet的深度学习方法。这个深度学习模型用于从血氧饱和度信号中估计呼吸暂停低通气指数(AHI)。

表1,模型所用数据及及过滤后剩下的数据

2 结果

根据表2,在测试集上,OxiNet的性能显著优于两个最先进的经典机器学习基准算法(ODI与OBM)。OxiNet是一种用于估计AHI的鲁棒深度学习算法。OxiNet在所有外部测试数据集上的表现都优于基于特征工程的算法使用氧饱和度下降指数(ODI)和数字血氧生物标志物(OBM)作为输入的基准模型。表中ICC(Intraclass Correlation Coefficient)即内相关系数,是衡量观察者间一致性的统计指标,常用于评价诊断测试的一致性和可靠性。在本研究中,ICC值用来衡量OxiNet预测的AHI与实际AHI之间的一致性。根据,可看出真实的与预测的呼吸暂停低通气指数之间的相关性,通过下侧的Bland–Altman 图,可看出预测值与真实值在各个数据集上的差异及一致性情况。

表2:模型在外部数据集上测试并于基准算法的对比

:真实与预测的OxiNet相关性及Bland–Altman 图

ODI一直是历史上研究和使用最多的基于单一血氧测定的阻塞性睡眠呼吸暂停筛查功能。基于ODI的模型在SHHS 1测试集上的性能很差(ICC = 0.89,F1 = 0.69,),并且会导致漏诊55例中度至重度阻塞性睡眠呼吸暂停(所有中度和重度的21%)。这表明使用ODI作为唯一的血氧测定特征,即仅考虑每小时去饱和的平均次数不足以实现鲁棒的AHI估计并因此实现阻塞性睡眠呼吸暂停诊断。而新方法OxiNet在SHHS 1上的表现明显更好(ICC = 0.96,F 1 = 0.84),只导致所有数据库中遗漏了11例中重度阻塞性睡眠呼吸暂停患者。

:不同模型在多个测试集上的性能

根据展示的在多数据集上的表现,可以看出OxiNet在大部分情况下不会漏诊中度和重度呼吸障碍患者,从而可说明 OxiNet具有可用于医疗诊断用途的性能。

:每个外部数据库测试集的OxiNet混淆矩阵

OxiNet在外部测试集上的主要性能下降是由于种族分布偏移(例如黑人和非洲裔美国人参与者)以及伴随慢性阻塞性肺疾病(COPD)的共病情况。研究结果显示,OxiNet在白人和华裔美国参与者中的表现较好,而在西班牙裔、黑人和非洲裔美国人参与者中的表现较差。使用用外部测试集时,各模型的性能下降:相对于种族 (CFS) 的分布变化,性能下降显着,黑人和非裔美国人参与者亚组的 F 1 = 0.66,而 F 1 得分为 0.75,但不同种族之间存在很大差异,西班牙裔参与者为 0.72,黑人和非裔美国人参与者为 0.71,白人参与者为 0.78。这是由于用于训练深度学习算法的数据集中缺乏此类少数群体的包容性或患病率较低,这不可避免地导致这些群体的嵌入偏差和较差的诊断性能。而最近的研究表明,脉搏血氧计性能差异已被证明受到不同种族和民族患者的影响,导致临床管理较差。这可能解释了该模型在黑人和非裔美国人参与者身上表现较差的原因。

为了模型的可解释性,OxiNet的检测窗口被设置为 120 秒,这是一数次呼吸暂停事件持续时间。图 4 显示了三种不同录音的示例。图 4a 显示了夜间信号,其中 OxiNet 利用夜间时间序列中去饱和事件的时间背景。这与基于规则的 ODI 检测器相反,ODI检测器将去饱和作为孤立事件进行搜索,即独立于其时间背景。图 4b 显示了包含多个呼吸暂停事件的信号段。尽管 OxiNet 给出了相对较高的分数,但基于规则的去饱和检测器没有检测到去饱和。这反映出去饱和检测器过于受限,而 OxiNet 可以学习与呼吸暂停和呼吸不足事件相关模式。通过特征遮蔽(Feature Occlusion)方法对OxiNet的解释性进行了分析,揭示了模型对于血氧饱和度事件的时间上下文的学习能力,并表明了OxiNet相较于基于规则的氧饱和度下降检测器提供了额外的价值。

例如通过图 4c可观察到一段没有呼吸暂停或呼吸不足的呼吸事件,并且 OxiNet 得分相对较低。然而,基于规则的 ODI 检测器检测到与呼吸事件无关的饱和度降低。总体而言,可解释性数据表明,OxiNet 比更简单的基于规则的去饱和检测器提供了附加价值。 这是因为数据驱动的方法能够更好地了解用于训练 OxiNet 的数千名个体在呼吸暂停和呼吸不足期间的血氧浓度低事件的高生理变异性。 OxiNet 还考虑了事件的时间上下文,而基于经典规则的 ODI 检测器以孤立的方式查看事件。

:OxiNet模型的可解释性。

3 总结

本研究提出了一种深度学习算法,用于根据血氧饱和度时间序列估计 AHI 并诊断阻塞性睡眠呼吸暂停。 OxiNet 模型在所有测试数据库中均优于基线模型。这项大型回顾性多中心研究强烈支持单通道血氧饱和度分析用于稳健 阻塞性睡眠呼吸暂停诊断的可行性。使用来自单个脉搏血氧饱和度传感器的输入的稳健数据驱动模型的可用性可以实现阻塞性睡眠呼吸暂停的大规模诊断,同时降低成本和等待时间。它还可以实现多个夜间测试,从而甚至改善阻塞性睡眠呼吸暂停诊断。自 2017 年起,AASM 指南建议通过单次夜间睡眠研究来诊断无并发症的阻塞性睡眠呼吸暂停 ,这需要很高的测试准确性。此外,测试必须成本低廉,几乎完全自动化,并且由于医院床位短缺,必须能够在家庭环境中支持测试。在此背景下,OxiNet 的高性能为实现阻塞性睡眠呼吸暂停远程诊断和监控提供了令人兴奋的前景。此外,它还提出了一种分析机器学习模型对特定人群样本性能的方法。最后,这项研究提供了一个独特的例子,说明大型开放访问数据库如何能够跨种族、年龄、性别和合并症评估机器学习算法的鲁棒性性能,以确保创建鲁棒且公平的机器学习模型。

基于深度学习的阻塞性睡眠呼吸暂停检测工具

上一篇: 质粒构建工具推荐,实验室必备的分子克隆利器
下一篇: 三代测序+光学图谱组装篇:扁形虫基因组组装
相关文章