使用数学分析和机器学习来诊断疾病的方法和系统.pdf

上传人:r7 文档编号:8162242 上传时间:2020-01-28 格式:PDF 页数:32 大小:2.54MB
返回 下载 相关 举报
摘要
申请专利号:

CN201680037157.9

申请日:

20160624

公开号:

CN108024730A

公开日:

20180511

当前法律状态:

有效性:

审查中

法律详情:

IPC分类号:

A61B5/02,A61B90/00,G06F15/18,G06F19/00

主分类号:

A61B5/02,A61B90/00,G06F15/18,G06F19/00

申请人:

生命解析公司

发明人:

T·布尔顿,S·拉姆钱达尼,S·古普塔

地址:

加拿大安大略省

优先权:

62/184,796

专利代理机构:

北京三友知识产权代理有限公司

代理人:

吕俊刚;杨薇

PDF下载: PDF下载
内容摘要

所示例的方法和系统使用对从单个电极采集的生物电势信号的数学分析和机器学习分析来辅助对疾病或生理状态的监测和/或评估。所示例的方法和系统根据经单独测量的生物电势信号的数据通过数学运算(即,通过在频域中对信号进行数值分数导数计算)创建一个或更多个数学导出的生物电势信号(例如,虚拟生物电势信号),该数学导出的生物电势信号与测量的生物电势信号结合使用以生成身体(例如,心脏)的多维相空间表示。通过在频域中以数学方式调制(例如,通过扩大或缩小)给定生物电势信号的部分,基于数值的运算对生物电势信号的某些测量的频率给予加重或去加重,当与机器学习相结合时,有助于改进对某些病症的诊断。

权利要求书

1.一种预处理数据以提取用于机器学习的变量来诊断病症的方法,所述方法包括:接收与对象相关联的生物电势信号数据,所述生物电势信号数据与从一个或更多个电导联采集的生物电势信号相关联;通过在频域中对所述生物电势信号数据数值地执行一个或更多个分数导数运算并将所述一个或更多个分数导数运算的结果转换为时域信号数据,经由处理器生成第一分数导数信号数据和第二分数导数信号数据,其中,所生成的第一分数导数信号数据和第二分数导数信号数据中的每一个都包括与所述生物电势信号数据相同的长度和相同的采样频率;以及经由所述处理器生成三维空间,其中,所述生物电势信号数据、所述第一分数导数信号数据、以及所述第二分数导数信号数据的每个对应值在所述空间中形成三维点,其中,所述三维空间的几何特征和动力学特性被用作代表机器学习中的对象的变量以检测所述对象的一个或更多个可诊断病症。 2.根据权利要求1所述的方法,其中,通过在频域中对所述生物电势信号数据执行一阶值的第一数值分数导数并且通过对经分数导数的信号数据执行逆变换以将所述经分数导数的信号数据转换为时域信号数据来生成所述第一分数导数信号数据,所述逆变换例如是逆FFT。 3.根据权利要求2所述的方法,其中,所述逆变换包括逆快速傅立叶变换(逆FFT)运算。 4.根据权利要求1至3中任一项所述的方法,其中,通过对所述生物电势信号数据执行二阶值的第二数值分数导数并且通过对经分数导数的信号数据执行逆变换以将所述经分数导数的信号数据转换为时域信号数据来生成所述第二分数导数信号数据,所述逆变换例如是逆FFT。 5.根据权利要求1至4中任一项所述的方法,其中,所述第一分数导数信号数据和所述第二分数导数信号数据中的每一个都包括时域信号数据。 6.根据权利要求1至5中任一项所述的方法,其中,所述第一分数导数信号数据由pi/2阶的分数导数生成。 7.根据权利要求1至6中任一项所述的方法,其中,所述第二分数导数信号数据由0.5阶的分数导数生成。 8.根据权利要求1至7中任一项所述的方法,其中,所述三维空间的所述几何特征和所述动力学特性通过对所述空间中的所述三维点执行改进的匹配追踪MMP算法来生成。 9.根据权利要求1至8中任一项所述的方法,其中,所述生物电势信号数据与从单个电导联采集的生物电势信号相关联。 10.根据权利要求1-9中的任一项所述的方法,其中,所述单个电导联在从由所述对象的胸部线、所述对象的腰围线、所述对象的腕部、所述对象的骨盆线、所述对象的颈部、所述对象的脚踝、所述对象的额头以及所述对象的手臂线构成的组中选择的位置处采集所述生物电势信号的测量值。 11.根据权利要求1至10中任一项所述的方法,该方法包括:经由处理器生成所述空间中的所述三维点的alphashape,其中,所述三维空间的所述几何特征和所述动力学特性包括所述alphashape的所述几何特征。 12.根据权利要求1至11中任一项所述的方法,该方法包括:生成所述空间中的所述三维点的Delaunay三角形网格,其中,所述三维空间的所述几何特征和所述动力学特性包括所述Delaunay三角形网格的所述几何特征。 13.根据权利要求1至12中任一项所述的方法,其中,所述生物电势信号数据包括心电图ECG数据。 14.根据权利要求1至13中任一项所述的方法,其中,所述机器学习包括人工神经网络算法或回归随机森林算法。 15.一种预处理数据以提取用于机器学习的变量来诊断病症的方法,所述方法包括:接收与对象相关联的生物电势信号数据,所述生物电势信号数据与从两个或更多个电导联采集的生物电势信号相关联;通过在频域中对所述生物电势信号数据中的至少一个数值地执行一个或更多个分数导数运算并将所述一个或更多个分数导数运算的结果转换为时域信号数据,经由处理器生成分数导数信号数据,其中,所生成的分数导数信号数据包括与所述生物电势信号数据中的所述至少一个相同的长度和相同的采样频率;以及经由所述处理器生成三维空间,其中,所述生物电势信号数据和所述分数导数信号数据中的每一个的每个对应值在所述空间中形成三维点,其中,所述三维空间的几何特征和动力学特性被用作代表机器学习中的对象的变量以检测所述对象的一个或更多个可诊断病症。 16.根据权利要求15所述的方法,其中,所述两个或更多个电导联中的每一个在从由所述对象的胸部线、所述对象的腰围线、所述对象的腕部、所述对象的骨盆线、所述对象的颈部、所述对象的脚踝、所述对象的额头以及所述对象的手臂线构成的组中选择的位置处采集所述生物电势信号的测量值。 17.一种确定哺乳动物中的先天性心脏缺陷CHD的方法,该方法包括:接收与所述哺乳动物相关联的生物电势记录,所述生物电势记录以预定间隔进行记录;发展与所述生物电势记录相关联的变量以创建数据集;以及分析所述数据集以确定所述哺乳动物是否具有CHD。 18.根据权利要求17所述的方法,其中,使用包括单个表面导联的测量设备来记录与所述哺乳动物相关联的所述生物电势记录。 19.根据权利要求17或18所述的方法,其中,测量设备包括心内电图仪。 20.根据权利要求17至19中任一项所述的方法,其中,测量设备包括智能手表或健身心带。 21.一种系统,该系统包括:存储装置,该存储装置被配置为从网络连接的生物电势测量设备接收生物电势数据;一个或更多个处理器;其上存储有指令的存储器,其中,所述指令在由所述处理器执行时使所述处理器:生成与所述生物电势数据相关联的相空间变量;分析所述相空间变量以确定所述哺乳动物是否具有CHD。

说明书

相关申请的交叉引用

本申请要求于2015年6月25日提交的标题为“Latent Teratogen-Induced Heart Deficits Are Unmasked Postnatally with Mathematical Analysis and Machine Learning on ECG Signals”的美国临时申请No.62/184,796的优先权和权益,其全部内容通过引用并入本文。

技术领域

本公开涉及通过对生物电势信号进行数学和机器学习分析来诊断心脏病症的方法和系统。

背景技术

先天性心脏缺陷(CHD)是最常见的出生异常,其中室间隔缺损(VSD)是最普遍的先天性心脏缺陷(CHD)类别。临床上,大约80%的室间隔缺损(VSD)在第一年内自发消除,但对于这些消除的VSD对出生后心脏功能的长期后果知之甚少。

所需要的是克服现有技术中的挑战(其中一些如上所述)的装置、系统和方法。

发明内容

所示例的方法和系统使用对从单个电极采集的生物电势信号的数学分析和机器学习分析来辅助对疾病或生理状态的监测和/或评估。所示例的方法和系统根据经单独测量的生物电势信号的数据通过数学运算(即,通过分数导数计算)创建一个或更多个数学导出的生物电势信号(例如,虚拟生物电势信号),该数学导出的生物电势信号与测量的生物电势信号结合使用以生成身体(例如,心脏)的多维相空间表示。在一些实施方式中,在频域中,将实数的分数的分数导数或整数的分数的分数导数数值地应用于测量的生物电势信号或其一部分,以增加测量的信号数据的维度。在一些实施方式中,在频域中,将整数的分数导数数值地应用于测量的生物电势信号或其一部分,以增加测量的信号数据的维度。通过在频域中以数学方式调制(例如,通过扩大或缩小)给定生物电势信号的部分,基于数值的运算对生物电势信号的某些测量的频率给予加重或去加重,当与机器学习相结合时,有助于改进对某些病症的诊断并有助于进行实时(或接近实时)诊断。

为此,所示例的方法和系统使用单个电极导联(lead)来辅助对生物电势信号的测量以获得诊断结果。另外,可以使用所示例的方法和系统来增强由多个物理导联采集的测量,实际上,利用虚拟导联倍增物理效应,从而提供与原始物理测量不同的有利的观点或视角,从而改善随后的分析。

进行了临床动物模型研究,该研究表明,所示例的方法和系统有助于临床上相关的生理状况的诊断。具体地,临床动物模型研究表明,使用所示例的方法和系统可以检测到隐藏心血管功能障碍的消除的先天性心脏缺陷。

在一个方面,公开了一种预处理数据以提取用于机器学习中的变量来诊断病症的方法。该方法包括:接收与对象相关联的生物电势信号数据,所述生物电势信号数据与从一个或更多个电导联采集的生物电势信号相关联;通过在频域中数值地执行所述生物电势信号数据的一个或更多个分数导数运算(例如,数值分数导数运算)并且将所述一个或更多个分数导数运算的结果转换成时域信号数据(经由处理器)生成第一分数导数信号数据和第二分数导数信号数据,其中,生成的所述第一分数导数信号数据和第二分数导数信号数据中的每一个都包括与所述生物电势信号数据相同的长度和相同的采样频率;以及经由处理器生成三维空间,其中,生物电势信号数据、第一分数导数信号数据和第二分数导数信号数据的每个对应值在所述空间中形成三维点,其中,三维空间的几何特征和动力学特性被用作代表机器学习中的对象的变量以检测该对象的一个或更多个可诊断病症。

在一些实施方式中,通过在频域中对生物电势信号数据执行一阶值的第一数值分数导数并且通过对经分数导数的信号执行逆变换(例如,逆FFT)以将经分数导数的信号数据转换成时域信号数据来生成第一分数导数信号数据。

在一些实施方式中,逆变换包括逆快速傅里叶变换(逆FFT)运算。

在一些实施方式中,通过在频域中对生物电势信号数据执行二阶值的第二数值分数导数并且通过对经分数导数的信号执行逆变换(例如,逆FFT)以将经分数导数的信号数据转换成时域信号数据来生成第二分数导数信号数据。

在一些实施方式中,第一分数导数信号数据和第二分数导数信号数据中的每一个都包括时域信号数据。

在一些实施方式中,第一分数导数信号数据由pi/2阶的分数导数生成。

在一些实施方式中,第二分数导数信号数据由0.5阶的分数导数生成。

在一些实施方式中,通过执行三维空间中的三维点的MMP(改进的匹配追踪)算法来生成所述三维空间的几何特征和动力学特性。

在一些实施方式中,生物电势信号数据与从单个电导联采集的生物电势信号相关联。

在一些实施方式中,单个电导联在从由对象的胸部线、对象的腰部、对象的腕部、对象的骨盆线、对象的颈部、对象的脚踝、对象的额头以及对象的手臂线构成的组中选择的位置处采集生物电势信号的测量值。

在一些实施方式中,该方法包括经由处理器生成所述空间中的三维点的alpha shape,其中,三维空间的几何特征和动力学特性包括alpha shape的几何特征。

在一些实施方式中,该方法包括生成所述空间中的三维点的Delaunay三角形网格,其中,所述三维空间的几何特征和动力学特性包括Delaunay三角形网格的几何特征。

在一些实施方式中,生物电势信号数据包括心电图(ECG)数据。

在一些实施方式中,机器学习分析包括使用人工神经网络算法或回归随机森林算法。

另一方面,公开了一种预处理数据以提取用于机器学习中的变量来诊断病症的方法。该方法包括:接收与对象相关联的生物电势信号数据,所述生物电势信号数据与从两个或更多个电导联采集的生物电势信号相关联;通过在频域中数值地执行所述生物电势信号数据的至少一个的一个或更多个分数导数运算并且将所述一个或更多个分数导数运算的结果转换成时域信号数据(经由处理器)生成分数导数信号数据,其中,所生成的分数导数信号数据包括与所述生物电势信号数据中的至少一个相同的长度和相同的采样频率;以及经由处理器生成三维空间,其中,生物电势信号数据和分数导数信号数据中的每一个的每个对应值在所述空间中形成三维点,其中,三维空间的几何特征和动力学特性被用作代表机器学习中的对象的变量以检测该对象的一个或更多个可诊断病症。

在一些实施方式中,两个或更多个电导联中的每一个在从由对象的胸部线、对象的腰部、对象的腕部、对象的骨盆线、对象的颈部、对象的脚踝、对象的额头以及对象的手臂线构成的组中选择的位置处采集生物电势信号的测量值。

另一方面,公开了一种确定哺乳动物先天性心脏缺陷(CHD)的方法。该方法包括:接收与哺乳动物相关联的生物电势记录、以预定间隔记录的生物电势记录;发展与生物电势记录相关联的变量以创建数据集;以及分析该数据集以确定该哺乳动物是否具有CHD。

在一些实施方式中,使用包括单个表面导联的测量设备来记录与哺乳动物相关联的生物电势记录。

在一些实施方式中,测量设备包括心内电图仪。

在一些实施方式中,测量设备包括智能手表或健身心带(fitness heart band)。

另一方面,公开了一种系统,该系统包括:远程存储装置(例如,存储区域网络),该远程存储装置被配置为从网络连接的生物电势测量设备接收生物电势数据;一个或更多个处理器;以及其上存储有指令的存储器,其中,所述指令在由所述处理器执行时使所述处理器:生成与生物电势数据相关联的相空间变量;分析该相空间变量以确定哺乳动物是否具有CHD。

附图说明

图1是根据说明性实施方式的用于预处理数据以提取用于机器学习的变量来诊断病症的系统的图。

图2是根据说明性实施方式的用于处理数据以诊断病症的方法的图。

图3是根据说明性实施方式的如图2所示的预处理数据的方法的详细图。

图4是根据说明性实施方式的如图3所示的信号数据标准化方法的详细图。

图5是根据说明性实施方式的如图3所示的虚拟信号生成方法的详细图。

图6是根据说明性实施方式的如图2所示的执行相空间分析的方法的详细图。

图7是示出根据实施方式的根据实施方式的根据说明性实施方式的出生后VSD分辨率的图。

图8是示出根据实施方式的临床研究的假设的图。

图9是示出根据实施方式的关于图8描述的用于临床研究的实验设计的图。

图10是示出根据实施方式的用于使用机器学习过程进行关于图9描述的临床研究的实验的方法的图。

图11是示出根据实施方式的包括从示例的分数导数运算生成的虚拟生物电势信号的矢量心电图的图。

图12是示出根据实施方式的关于图10描述的机器学习过程的示例性输入的图。

图13是示出具有可诊断疾病的样本的矢量心电图的相空间模型的图。

图14是示出对照(CONTROL)样本的矢量心电图的alpha-shape相空间模型的图。

图15和图16是示出根据说明性实施方式的关于图7至图10描述的临床研究的结果的图。

图17A和图17B示出了使用标准偏差方法或者Poincare Pearson相关性方法,在暴露于DMO或化学天然状态的预测中使用接受者-操作者特性曲线评估的心率变异性的表现。

图18示出了如使用接受者-操作者特性曲线评估的人工神经网络在区分暴露于DMO的数据和化学天然数据方面的表现。

图19示出了如通过接受者操作者特性曲线评估的随机森林在“留一法(leave-one-out)”验证范例内区分暴露于DMO的数据和化学天然数据方面的表现。

具体实施方式

附图中的组件不一定相对于彼此按比例绘制,并且贯穿几个视图,相同的附图标记表示相应的部件:

图1是根据说明性实施方式的用于预处理数据以提取用于机器学习的变量来诊断病症的系统100的图。如图1所示,系统100包括生物电势测量设备102和分析子系统104。生物电势测量设备102经由附接到对象108的表面(例如,测试动物或人的皮肤)的单导联电极106(和相应的接地(GND)导联124)来采集生物电势信号。生物电势测量设备可以是被配置为捕获电生理信号的任何装置。在一些实施方式中,使用Holter ECG监视器作为用于测量和记录生物电势信号的生物电势测量设备102。

在一些实施方式中,单导联电极106包括直接或间接放置在皮肤或身体组织的表面上以记录电活动的表面电极。在一些实施方式中,单导联电极106包括集成到可穿戴装置中以在可穿戴装置穿戴或附接到患者或对象时接触皮肤的电极。

应当理解,在不脱离本公开的精神的情况下,可以使用其它布线拓扑。在一些实施方式中,GND导联是共模回路(common-mode return)。在其它实施方式中,GND导联可以用作导联106的差模信号。在其它实施方式中,GND导联参考地球、底架或屏蔽件(或通过地球、底架或屏蔽件返回)。

在一些实施方式中,生物电势信号是在组织上的点之间测得的电势。生物电势信号的示例包括用于评估心脏的电功能和肌肉功能的ECG(心电图)信号。

在一些实施方式中,生物电势测量设备是被配置为测量和记录生物电势信号的可穿戴装置。在一些实施方式中,可穿戴装置被配置为放置在对象的胸部线、对象的腰部、对象的腕部、对象的骨盆线、对象的颈部、对象的踝部、对象的前额和对象的手臂线处,并且具有定位成与穿戴者的皮肤或表面接触的电极。可穿戴装置可以具有手表形式的壳体、臂带、颈带、腿带、胸带、头带等。在其它实施方式中,生物电势测量设备是接触人的皮肤或表面的训练设备的一部分(例如,手柄)、体重秤、垫子或任何类似装置。

仍然参照图1,生物电势信号110被存储为生物电势信号数据112。分析系统104在一些实施方式中通过网络从生物电势测量设备102接收生物电势信号数据112。在一些实施方式中,分析系统104从存储区域网络(SAN)接收生物电势信号数据112。在其它实施方式中,分析系统104和生物电势测量设备102位于单个装置,例如可穿戴装置。可以使用其它配置。

仍然参照图1,分析系统104被配置为从单个信号的源生物电势信号数据112生成源生物电势信号数据112的(经由分数微积分运算116)一个或更多个附加的生物电势信号数据(示出为第一分数导数信号数据114a和第二分数导数信号数据),其中第一和第二生成的分数导数信号数据114a、114b中的每一个都包括与生物电势信号数据相同的长度和相同的采样频率。在一些实施方式中,执行数值分数导数运算以加重或去加重某些频率分量,并且使得在所得到的向量中不存在正交性。附加的生物电势信号数据与源生物电势信号数据结合使用以生成将在稍后本文描述的后续相空间分析118中使用的相空间映射。然后使用人工神经网络120估计相空间分析的输出以评估与疾病或生理特征的存在相关联的参数122。然后将处理器的输出发送到图形用户界面进行可视化。在一些实施方式中,图形用户界面被包括在被配置为显示参数122的显示单元中。在一些实施方式中,图形用户界面显示中间参数,诸如生物电势信号数据和虚拟生物电势信号数据的3D相空间图表示。

图2是根据说明性实施方式的用于处理数据以诊断病症的图1的方法200的图。如图2所示,方法200包括采集200信号数据并预处理204信号数据以生成要在相分析206中使用的相空间数据集,由此经由人工神经网络分析208提取和估计相空间数据集的特征。

图3是根据说明性实施方式的如图2所示的数据的预处理204的详细图。在一些实施方式中,预处理204包括信号数据标准化302和虚拟信号生成304。

图4是根据说明性实施方式的如图3所示的信号数据标准化方法的详细图。如图4所示,信号标准化302包括源生物电势信号数据112的数据通道移除402和Hurst指数过滤404的初始步骤。在Matteo等人的“Scaling behaviors in different developed markets”,Physica A,324,pg.183-188(2003)中描述了数据通道移除和Hurst指数过滤的进一步细节。在一些实施方式中,信号标准化302还包括选择406经过滤的信号的最干净的区段,该区段具有信号的被设计用于检测非生物噪声的存在的小波模型与信号本身之间的最小化残差。例如,可以选择包括10秒记录间隔的最干净的5秒窗口的区段。在一些实施方式中,小波模型被配置为将信号分解成时间级,其中时间级的最高级别的分解中的一个或更多个被用于从信号中减去小波模型以确定残差。在一些实施方式中,信号标准化302还包括使用第二小波模型进行过滤408以去除所选的干净区段中的不期望的噪声(例如,任何剩余噪声)。第二小波模型被配置为将信号分解成多个时间级,并且维持最高级别的分解中的一个或更多个。本领域技术人员应当理解,可以使用其它信号数据标准化。

图5是根据说明性实施方式的如图3所示的虚拟信号生成方法的详细图。如图5所示,虚拟信号生成304包括创建一个或更多个虚拟信号数据,使得数据与原始信号数据交互以创建有效相空间肖像(portrait),其中输入生物电势信号(例如,心动周期)的极限周期被覆盖在三维空间中并且在得到的向量中没有正交性。例如,在单个源生物电势信号数据可用的情况下,虚拟信号生成304可用于生成两个虚拟生物电势信号,其中,有效的相空间肖像在三维空间中。在另一个示例中,在两个源生物电势信号数据可用的情况下,虚拟信号生成304可以用于生成虚拟生物电势信号,其中,有效的相空间肖像在三维空间中。在一些实施方式中,有效的相空间肖像可以在大于3的维度空间中,诸如4、5、6、7、8、9、10或更大。

在一些实施方式中,通过对标准化的信号数据执行快速傅里叶变换502来生成一个或更多个虚拟信号数据中的每一个。然后对FFT信号数据中的每一个执行504数值分数导数,并且对该输出执行506逆快速傅里叶变换(逆FFT)。分数导数的阶数的示例包括pi/2或0.5。在一些实施方式中,分数导数的阶数是实数或复数的分数。在一些实施方式中,分数导数的阶数是整数的分数。在一些实施方式中,逆FFT的输出被进一步处理以去除508基线漂移。

在一些实施方式中,一个或更多个虚拟信号数据中的每一个通过对标准化的信号数据执行数值分数差分(通过使用卷积来实现)来生成。合理的传递函数被限定为对应于分数导数的特定阶数,然后通过使用被配置为接受这种输入的数值过滤器将该传递函数应用于输入数据。分数导数的阶数的示例包括pi/2或0.5。在一些实施方式中,分数导数的阶数是实数或复数的分数。在一些实施方式中,分数导数的阶数是整数的分数。在一些实施方式中,卷积的输出被进一步处理以去除508基线漂移。

图6是根据说明性实施方式的如图2所示的执行相空间分析的方法的详细图。在一些实施方式中,相空间分析的输入是作为矢量心电图的生物电势信号数据和对应的虚拟信号数据的点云相空间映射601。在一些实施方式中,相空间分析包括执行改进的匹配追踪(MMP)算法602。MPP算法602可被用于生成稀疏数学模型604。在Mallat等人的“Matching Pursuits with Time-Frequency Dictionaries”,IEEE Transactions on Signal Processing,Vol.41(12),Pages 3397-2415(1993)中提供了MMP算法的细节。

可以在特征提取操作606中提取该模型的特征以确定模型的几何和动态特性。

在一些实施方式中,点云相空间映射601由alpha shape或Delaunay三角剖分封装。可以经由特征提取610来提取alpha shape和/或三角剖分的特征以确定模型的附加几何和动态特性。

在一些实施方式中,将alpha shape和改进的匹配追踪运算的所提取的几何和动态特性用作人工神经网络分析、回归随机森林分析或其它机器学习分析的变量。

实验-潜在的致畸剂诱发心脏缺陷

使用下面描述的动物模型,示出了使用数学分析和机器学习来诊断疾病的示例系统和方法。具体地,所例示的系统和方法采用分数微积分来通过利用将在后续相空间分析中使用的逆FFT的数值方法来增加单导联ECG的维度。

所示例的系统和方法显示在动物模型中成功地从生物电势信号中提取有意义的变量,特别是在暴露于致畸剂的测试动物在临床上与对照组没有区别时从植入的无线电测量仪采集的心电图数据中的那些变量。然后利用机器学习在鲁棒的验证框架内预测潜在的心血管功能障碍的存在。该测试示出了可以使用所示例的系统和方法来分析来自单导联测量的数据(例如,单个时间序列数据)并且在随后的相空间分析中生成更高级别维度的相空间数据。

在动物模型中,以这样的方式对试验大鼠进行处理,以便在后代中诱发CHD(先天性心脏缺陷)的高发生率。在自然出生的母兽中,使用超声心电图在出生后第4天(PND)4、PND 21和PND 56中评估雌性幼崽的心脏结构和功能。在出生后第56天(PND)56,将无线电遥测单元植入9只经处理的大鼠和8只对照大鼠中。手术后两周,遥测仪被激活,在两周内每隔10秒和每隔12秒不断采集ECG记录。将每只大鼠的50,000个采集的数据点从单个ECG记录转换成唯一的三维相空间数据集,并且机器学习用于创建预测算法,该预测算法能够识别对照大鼠和经处理的大鼠以及其它哺乳动物之间心脏功能的差异。

如下面更详细描述的,结果表明,通过常规措施产后消除并得到显现正常的心脏的致畸剂诱发CHD实际上不同于致畸剂天然心脏。同样重要的是,结果显示可以使用分数微积分来增加用于相空间分析的单导联生物电势信号的维度。

实验设置

图7是示出根据说明性实施方式的出生后室间隔缺损(VSD)分辨率的图。如图7所示,选择具有显著心血管差异的两组动物,所述差异在出生后8-10周时降至绝对最小值,此时这些动物的差异在临床上不可区分。使用动物来验证所示例的系统和方法可以用于识别哪些动物受到药物施用的影响(即,在动物中的心血管差异在临床上是不可区分的这出生后的8-10周期间)。

图8是示出根据实施方式的临床研究的假设的图。如图8所示,假设所示例的数学分析和机器学习将在传统分析无法检测的时间(在8-10周内)揭示具有经处理的母兽的后代群体与具有未经处理的母兽的后代群体之间的功能性缺陷,而不需要传统的应激源。

图9是示出根据实施方式的关于图8描述的用于临床研究的实验设计的图。如图9所示,将测试大鼠分成两组:暴露于二甲双酮(DMO)和未暴露于二甲双酮。测试大鼠允许自然分娩;使用超声心电图评估幼崽生命的前8周。然后,在8周时,将无线电测量仪手术植入到测试大鼠中以测量包括ECG信号的若干生理信号。然后将ECG信号用于机器学习以创建区分这两个群体的预测器。

图10是示出根据实施方式的用于使用机器学习过程进行关于图9描述的临床研究的实验的方法的图。如图10所示,所示例的实验从具有与ECG数据配对的已知暴露的测试大鼠开始。随后从ECG数据发展变量,并输入到机器学习过程。所示例的方法和系统用于预测生成心电图的大鼠是否暴露于或未暴露于二甲双酮(DMO)。

图11是示出根据实施方式的包括从示例的分数导数运算生成的虚拟生物电势信号的矢量心电图的图。如图11所示,示例性输入包括原始测量的ECG信号数据112和虚拟ECG信号数据114a,114b。

图12是示出根据实施方式的关于图11描述的机器学习过程的示例性输入的图。如图12所示,示出了矢量心电图(VCG)的相空间数据集1202,其包括测得的生物电势信号112和从示例的分数导数运算生成的虚拟生物电势信号114a、114b。在点云相空间映射1202中示出了矢量心电图(VCG),其中,在三轴坐标系中无时间地示出测得的生物电势信号112和虚拟生物电势信号114a、114b。相空间数据集1202通过被包裹成几何形状(例如,alpha shape或Delaunay三角形)而被量化。在Edelsbrunner等人的“Three-dimensional alpha shapes”ACM Transactions on Graphics,Vol.13(1):43-72(1994)中描述了alpha shape运算的细节。

图13是示出具有可诊断疾病的样本的矢量心电图的alpha-shape相空间模型的图。图14是示出对照样本的矢量心电图的alpha-shape相空间模型的图。如图13和图14所示,暴露的和未暴露的测试大鼠的数据集之间存在视觉差异,但是这些差异是微妙的,并且更有利于通过机器学习来分析这些差异。

在一些实施方式中,机器学习分析使用包括数据形状变量、分数导数、使用MMP的信号建模、相空间建模和动态系统变量的变量族。在所示例的实验中,对于各自具有50,000个ECG信号(其中每个ECG信号具有250个变量)的17个测试大鼠的数据,在包括人工神经网络的分析中使用了约20亿个数据点。

讨论

先天性心脏缺陷(CHD)是最常见的一类先天性异常,发生率约为活胎的1.9-7.5%。最常见的出生缺陷是占所有CHD的25-40%的室间隔缺损(VSD),其中隔膜未能在左心室和右心室之间闭合。VSD或其它CHD的产后持续存在或手术修复相对于未受影响的群体显著增加了这些患者的终生心脏病风险,因此需要一个专门护理CHD的心脏病专家的观察和潜在干预的警惕的一生。有趣的是,大约80%的VSD在临床上在生命的第一年内自发消除。虽然临床上消除结构性损伤是一个有利的结果,但是关于消除的VSD的长期功能性后果缺乏信息。

为了探索已消除的CHD潜在的有害的长期后果,开发了示例的大鼠模型,其概括了许多CHD的临床表现。为了生成这样的模型,用化学致畸剂处理怀孕的大鼠。据估计,80%的宫内三甲双酮暴露导致胚胎/胎儿丧失,或导致包括CHD高发生率的畸形。不受特定理论的束缚,认为DMO致畸性是由氧化应激介导的,这可能是由于胚胎肌细胞中钙离子和钾离子通道破坏导致的心动过缓引起的缺氧再灌注损伤的结果。已经在远交的怀孕Sprague-Dawley大鼠中证实,后代中CHD的发生率和严重程度高度依赖于妊娠窗和总体暴露于DMO。如果在自然分娩前一天在GD21上检查胎儿,从妊娠日(GD)9的早晨起每12小时施用四个300mg/kg剂量产生约50%的CHD发生率(参见例如,Weston等人的“Co-variation in frequency and severity of cardiovascular and skeletal defects in Sprague-Dawley rats after maternal administration of dimethadione,the N-demethylated metabolite of trimethadione.Birth defects research Part B,”Developmental and reproductive toxicology,Vol.92,Pages 206-15(2011))。当经同样处理的母兽被允许自然地分娩他们的后代,并且通过高分辨率超声心动描记术纵向评估幼崽的心脏结构和功能时,揭示了CHD临床表现的情景。例如,在婴儿中,大约80%的VSD在一岁时消除,并且在暴露于DMO后的测试大鼠中,约80%的VSD通过断奶自发消除。其它结构元素(诸如左心室(LV)质量、LV收缩期前壁厚度(LVAW;s)和舒张期LVAW(LVAW;d))在接近分娩时间的对照组和暴露于DMO的幼崽之间都显著不同,但随着时间的推移而消除,使得10周龄的对照组和DMO动物是难以区分的。在暴露于DMO的大鼠幼崽中,心脏功能障碍接近分娩时很明显,但逐渐消除,使得在10周龄在无应激条件下,心输出量(CO)、每搏输出量(SV)、射血分数(EF)、分数缩短(FS)和肺动脉返流PA(mm/s)全部标准化。此时,能够测量连续单通道心电图(ECG)的无线电测量仪被手术植入大鼠中。在两周的手术恢复后,获得基线心脏功能,并将动物交配。怀孕是对孕妇心血管系统的生理挑战,临床上被称为心血管“应激测试”。怀孕引发的哺乳动物孕产妇心血管系统改变包括血容量增加30-40%、心输出量(CO)增加30-60%、一过性心脏肥大和子宫螺旋动脉(SA)重塑。正常怀孕中发生的心脏肥大是生理的和可逆的,类似于运动引发的肥大。

令人不安的是,暴露于DMO的测试大鼠子宫内的心血管系统对怀孕的负担适应性不佳。表现包括螺旋动脉重塑时改变的CO、SV、径向和纵向应变、以及平均动脉压升高。因此,具有消除的CHD的心脏的功能在基础无应激的条件下与对照心脏无法区分;然而,在怀孕的应激下,出现了严重的心脏和血液动力缺陷。

在所示例的实验中,宫内暴露于心脏致畸剂DMO用于生成具有消除的CHD的大鼠群,它们在怀孕负担期间仅表现出心脏功能障碍。在没有使用心血管应激测试的情况下,使用所示例的方法和系统来预测怀孕前潜在的致畸剂诱发心脏功能缺陷的存在,并使用经由遥测仪在十至十二周(先前描述的研究周期)内采集的ECG数据。在这十至十二周期间,这些群体之间没有明显的差异。

实验结果

图15和图16是示出根据说明性实施方式的关于图7至图10描述的临床研究的结果的图。具体地,图15是通过常规测量无法区分的两个测试动物群体的神经网络分析的预测输出的图。该图示出了对经处理的群体和对照群体测试数据(撤回(recall)85%)的所有预测,其中在基线之间存在明显的视觉分离。为了进行比较,运行心率变异性(HRV)分析,其使用ECG信号数据中的界标来自动检测高含量数据。如图所示,HRV在识别群体方面没有成功,而所示例的方法和系统(使用机器学习预测器)被发现显著更好,表明可以区分这两个群体,并因此它们是不同的。

具体地,所示例的实验利用两个群体进行,其中五只测试大鼠宫内暴露于DMO(群体#1),并且八只对照大鼠是化学天然的(群体#2)。原始的ECG信号以1000Hz的采样频率从单个通道记录。数据采集从测试大鼠十一至十四周龄之间的两周周期(此时两个群体是临床上使用超声心动描记术或心率变异性(HRV)难以区分的)被阻断为十秒间隔。预测器的统计评估被用于区分不同群体(诸如HRV)接受者操作者特性曲线(AUC)下主要使用的区域。AUC检查针对二元目标变量的预测器的性能,在这种情况下,该变量是大鼠的暴露于DMO的状态或化学天然状态。0.5的AUC值表示随机预测,1的AUC是完美的预测,0的AUC是完美的,但倒置的预测(其中一类的所有数据点被预测为另一类,反之亦然)。

HRV逐拍反映心率变化,该心率变化反映自主神经张力的动态变化。HRV是临床上有用的电生理学终点,并且是风险分层策略的基础,诸如REFINE,其试图确定在心肌梗塞(MI)发生之后收集的非侵入性生理参数是否预测随后的心脏死亡或心脏复苏的发生率。在REFINE研究中,HRV在MI后10-14周中具有0.62的AUC和2.15的风险比,这对于风险分层是一种有用的技术,这使我们相信它可能提供用于识别暴露于DMO的大鼠。

图17A和图17B示出了使用标准偏差方法(图17A)或者Poincare Pearson相关性方法(图17B),在暴露于DMO或化学天然状态的预测中使用接受者-操作者特性曲线评估的心率变异性的表现。如下生成图17A和图17B。在给定测试大鼠的十秒钟记录间隔中识别出使非生物噪声最小化的五秒钟窗口。在这个五秒钟窗口中识别出心跳,并且确定置信度(CS);具有大于0.7的CS的占五秒钟窗口识别出的心跳被包括在统计评估中。在心跳识别之后,使用最广泛接受的方法来计算HRV,其中针对每五秒钟窗口计算R-R间隔的标准偏差(参考代表心动周期中的五个波形的标准PQRST符号)。此外,创建Poincaré图,其中R-R间隔的长度和下一个R-R间隔的长度在二维散点图中创建一个点,并且计算该数据的Pearson相关性。表1中报告了这两种HRV技术的性能统计,其中应用了用于统计的阈值,并且在图17A和图17B中绘制了相应的接受者操作者特性曲线。

表1示出暴露于DMO或化学天然状态预测中心率变异性的统计表现。这两个预测器的AUC表明,使用任何一种方法量化HRV的预测能力都很低或没有预测能力。差的表现还反映在诊断比值比(DOR)上,其仅略高于1(其中1表示在测试结果为阳性的情况下,大鼠被暴露于DMO的相对几率没有变化)。

表1

图18示出了在将15%的数据分配给训练集并将剩余的85%分配给验证集的验证数据中,所示例的使用人工神经网络的方法在区分暴露于DMO的数据和化学天然数据方面的表现,如由接受者操作者特性曲线可视化的。另外,表2示出了在将15%的数据分配给训练集并将剩余的85%分配给验证集的验证数据中,人造神经网络在区分暴露于DMO数据和化学天然数据方面的统计表现。

表2

ANN广泛用于机器学习,因为它们能够实现迄今为止无法实现的人工智能基准。受监督的ANN学习以模拟人类神经处理的方式使用输入的向量来预测目标。ANN包含以一系列相连的层布置的神经元;首先是接受特征的输入层,然后是用来捕捉被建模的函数的非线性的一个或更多个隐藏层,接着是预测与输入向量对应的目标的值的输出层。ANN中的神经元受到输入向量的刺激,并根据特征的值,神经元之间的连接强度以及神经元内发现的激活函数将下游的刺激传送到下一层。ANN可以用作通用函数逼近器。

为了探索建立更鲁棒的预测模型的可能性,使用了基于随机森林的集成机器学习算法,其依赖于一系列弱学习者或简单算法描述数据的有限复杂度的原理,当组合使用时具有强大的泛化特性。随机森林是由决策树组成的弱学习者。决策树是指节点是决策(或者是特定于这个应用的特征的阈值)的树结构,并且在做出决策之后连接到该子节点,这揭示了以原始子节点作为根的子决策树。该过程一直持续到到达叶节点,这是对数据的最终预测。每个决策树都暴露于记录间隔和特征矢量二者的不同分区,因此倾向于学习问题的不同方面。使用刚描述的验证策略训练具有100个决策树的回归随机森林算法,其结果在表3中示出,并且在图19中可视化。

图19示出了如通过接受者操作者特性曲线评估的随机森林在“留一法(leave-one-out)”验证范例内区分暴露于DMO的数据和化学天然数据方面的表现。如图19所示,与参照图18描述的第一验证策略的表现相比,其表现略有下降,但在这个强大的验证策略的背景下,其仍然是具有高度预测性的。所述表现是分析13个随机森林(每十三个测试动物各一个)的融合产生的预测结果,每个预测只在训练阶段没有接收的单个大鼠的间隔上进行。阈值对于那些需要它的统计使用提供最大分类准确度的边界来设定。当保留暴露于DMO的大鼠进行测试时,训练组由8只化学天然大鼠和剩余的4只暴露于DMO的大鼠组成,导致比例为2:1。

表3示出了随机森林在“留一法(leave-one-out)”验证范例内区分暴露于DMO的数据和化学天然数据方面的统计表现。

表3

实验-材料和方法

本文所描述的分析方法在从数据采集到特征提取的过渡中使用了预处理。数据通道移除和Hurst指数过滤是初始操作。通过视觉检查ECG信号的代表性子集以及计算出的这些信号的指数,观察性地将接受数据的指数的理想阈值确定为0.7,该指数范围从0到1。其次,通过选择使信号的小波模型(设计用于检测非生物噪声的存在)和信号本身之间的残差最小化的区段,找出10秒钟记录间隔中最干净的5秒钟窗口。使用MATLABTM(MATHWORKS;Natick,MA)小波工具箱的功能来计算小波模型。该5秒区段之外的数据被丢弃。

在一些实施方式中,过滤提供了对数值运算符(例如,数值分数导数运算)更好的干净信号。本领域技术人员应当理解,可以使用其它的过滤和信号清洁运算。

在此之后,使用第二个小波模型去除在这5秒间隔内的任何剩余噪声,该第二个小波模型被设计用于噪声去除而不是噪声检测,但在其它方面类似于用于选择5秒区段的模型。两个小波模型都将信号分解成八个时间级,但噪声检测模型只保留两个最高级别的分解(从信号中减去小波模型时导致有效地捕获噪声),而噪声去除模型至少部分维持四个最高级别的分解。然后通过创建两个虚拟信号来执行相空间重建,并因此创建vVCG。选择用于创建两个虚拟信号的转换,使得信号与原始信号相互作用以创建有效的相空间肖像,其中心动周期的极限周期在三维空间中被覆盖,并且在得到的矢量中没有正交性。这些虚拟导联是通过采集所获得的导联的衍生物而创建的,以便创建有效的相空间肖像,或者三维空间中的形状,其中三个导联的每一个在给定时间的值形成所述空间中的三维点。如通过使用快速傅里叶变换(FFT)将信号转换到频域中、在频域内计算所需的导数、以及使用逆FFT将该导数转换回时域所数值地计算的,pi/2和0.5阶的分数导数被发现是合适的。然后通过使用1500ms的阶数的中值过滤器从三个维度中的每一个提取基线漂移,用1Hz低通理想过滤器对其进行平滑,并且从信号中减去。然后通过使用用内核平滑函数计算出的概率密度的最大值减去信号模式的估计,从所得信号中去除偏差。最后,将所有信号除以其四分位差来完成标准化过程。

三维空间结构随后用于研究系统的几何和动力学特性。预处理的信号经过特征提取处理。该信号用改进的匹配追踪(MMP)算法建模以创建稀疏数学模型。包括残差量化在内的模型特征包括在特征集中。通过创建封装的alpha shape或特定的Delaunay三角剖分进一步量化vVCG。该三角剖分具有组成表示记录间隔的特征矢量的相关联的特性。

Delaunay三角剖分是在一组点上的三角剖分,使得三角剖分中的任何三角形的外接圆内没有点,并且三角剖分中的每个三角形中的所有角的最小角度被最大化。

alpha shape增加了进一步的约束;该三角剖分需要规定一个alpha半径,并且只有距离小于alpha半径的点对可以通过边缘连接。该特征提取过程中的alpha半径被观察性地确定为0.6,这允许vVCG的充分封装,同时在点密度降低的区域中的三角剖分中仍然产生适当的稀疏性。

使用SHARCNET(加拿大安大略省西南部、中部和北部的高性能计算机网络组成的高校和研究机构联盟)进行这项特征提取。

在特征创建过程结束时,有250个特征来表示10秒的记录间隔。

特征提取后,调用ANN和随机森林算法来创建预测。使用从记录间隔的15%标记的特征矢量对ANN进行训练,其中选择相对小的训练百分比以最小化过度训练的可能性并允许普遍性。选择相对较小的可用数据的区段进行训练,并在较大的测试集上表现良好,要求ANN利用数据中的总体签名而不是训练集独有的模式。ANN具有如下输入维度:250个神经元;单个隐藏层,其将维度扩展了三倍,到总共750个神经元;以及然后输出层中的用来表示暴露于DMO或化学天然的预测的单个神经元。ANN中的每个神经元都包含双曲正切激活函数。ANN试图使用随机梯度下降将训练数据上的预测和记录间隔类别之间的均方根误差最小化。使用低学习速率和动量参数来使得ANN能够逐渐演变,并且使用输入讹误(corruption)(在输入特征上添加噪声)以及退出(dropout)(ANN内部噪声)来控制过度拟合,该过度拟合在ANN对训练数据高度特异性并且不可能推广到新颖数据时发生。ANN是用MATLAB语言自定义实现的。当ANN被应用于85%的数据(总共351,520个数据点)时,其表现如下表2所示,在图18中绘出了相应的ROC曲线。

对于随机森林,使用MATLAB函数TreeBagger,其中从所有特征中选择在树中的每个节点处采样的特征的数量的指定,从而利用特征内存在的不同级别的信息,并且从随机森林的每个成员的训练数据的随机采样中获得泛化益处。

还对预处理的信号计算心率变异性。R峰的检测是通过鉴定高置信度的R峰或存在于信号的最高十分位的R峰来进行的,并且基于这些高置信度的峰来创建模板。然后对信号执行模板匹配程序,以与模板具有高度相似性的方式识别信号区段的峰,从而导致R峰的扩展集合。然后通过计算最大R-R间隔和最小R-R间隔之间的绝对差值,并除以最大R-R间隔来量化这些R峰值的置信度,以便创建标准化峰值置信度分数。关于分数的阈值设置为0.7(不要与也设为0.7的广义Hurst指数阈值相混淆),以便考虑在任何哺乳动物心血管系统中预期的心率变异性,峰值检测可能已经错过了峰值或者确定了一个附加的峰值,从而降低了置信度。然后可以使用已经描述的方法在从所识别出的峰得到的R-R间隔上计算HRV。

尽管根据特定实施方式和应用描述了本发明,但是本领域普通技术人员根据该教导可以在不脱离本发明范围的精神或超出范围的情况下产生另外的实施方式和修改。因此,应当理解的是,这里的附图和描述是通过举例的方式提供的,以便于理解本发明,而不应该被解释为限制其范围。

例如,鉴于所示例的方法和系统,可以在分析中使用单个电极导联测量,其通常使用来自多个导联测量的数据,例如以评估某些生理特征或疾病。

此外,如果大鼠目前的观察结果在临床上是可转移的,那么CHD自发性产后消除对于长期心脏健康有重要意义。例如,仅使用ECG信号识别未来心脏功能障碍的潜在标志物的能力将是识别通常不显示心脏内在风险的有风险个体的显著有效成本步骤。

此外,这些示例的实验所依据的动物模型表明,CHD自发性产后消除对于长期心脏健康有重要意义。

使用数学分析和机器学习来诊断疾病的方法和系统.pdf_第1页
第1页 / 共32页
使用数学分析和机器学习来诊断疾病的方法和系统.pdf_第2页
第2页 / 共32页
使用数学分析和机器学习来诊断疾病的方法和系统.pdf_第3页
第3页 / 共32页
点击查看更多>>
资源描述

《使用数学分析和机器学习来诊断疾病的方法和系统.pdf》由会员分享,可在线阅读,更多相关《使用数学分析和机器学习来诊断疾病的方法和系统.pdf(32页珍藏版)》请在专利查询网上搜索。

1、(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 201680037157.9 (22)申请日 2016.06.24 (30)优先权数据 62/184,796 2015.06.25 US (85)PCT国际申请进入国家阶段日 2017.12.25 (86)PCT国际申请的申请数据 PCT/IB2016/053797 2016.06.24 (87)PCT国际申请的公布数据 WO2016/207862 EN 2016.12.29 (71)申请人 生命解析公司 地址 加拿大安大略省 (72)发明人 T布尔顿 S拉姆钱达尼 S古普塔 (。

2、74)专利代理机构 北京三友知识产权代理有限 公司 11127 代理人 吕俊刚 杨薇 (51)Int.Cl. A61B 5/02(2006.01) A61B 90/00(2016.01) G06F 15/18(2006.01) G06F 19/00(2018.01) (54)发明名称 使用数学分析和机器学习来诊断疾病的方 法和系统 (57)摘要 所示例的方法和系统使用对从单个电极采 集的生物电势信号的数学分析和机器学习分析 来辅助对疾病或生理状态的监测和/或评估。 所 示例的方法和系统根据经单独测量的生物电势 信号的数据通过数学运算(即, 通过在频域中对 信号进行数值分数导数计算)创建一个或更。

3、多个 数学导出的生物电势信号(例如, 虚拟生物电势 信号), 该数学导出的生物电势信号与测量的生 物电势信号结合使用以生成身体(例如, 心脏)的 多维相空间表示。 通过在频域中以数学方式调制 (例如, 通过扩大或缩小)给定生物电势信号的部 分, 基于数值的运算对生物电势信号的某些测量 的频率给予加重或去加重, 当与机器学习相结合 时, 有助于改进对某些病症的诊断。 权利要求书2页 说明书13页 附图16页 CN 108024730 A 2018.05.11 CN 108024730 A 1.一种预处理数据以提取用于机器学习的变量来诊断病症的方法, 所述方法包括: 接收与对象相关联的生物电势信号。

4、数据, 所述生物电势信号数据与从一个或更多个电 导联采集的生物电势信号相关联; 通过在频域中对所述生物电势信号数据数值地执行一个或更多个分数导数运算并将 所述一个或更多个分数导数运算的结果转换为时域信号数据, 经由处理器生成第一分数导 数信号数据和第二分数导数信号数据, 其中, 所生成的第一分数导数信号数据和第二分数 导数信号数据中的每一个都包括与所述生物电势信号数据相同的长度和相同的采样频率; 以及 经由所述处理器生成三维空间, 其中, 所述生物电势信号数据、 所述第一分数导数信号 数据、 以及所述第二分数导数信号数据的每个对应值在所述空间中形成三维点, 其中, 所述 三维空间的几何特征和动。

5、力学特性被用作代表机器学习中的对象的变量以检测所述对象 的一个或更多个可诊断病症。 2.根据权利要求1所述的方法, 其中, 通过在频域中对所述生物电势信号数据执行一阶 值的第一数值分数导数并且通过对经分数导数的信号数据执行逆变换以将所述经分数导 数的信号数据转换为时域信号数据来生成所述第一分数导数信号数据, 所述逆变换例如是 逆FFT。 3.根据权利要求2所述的方法, 其中, 所述逆变换包括逆快速傅立叶变换(逆FFT)运算。 4.根据权利要求1至3中任一项所述的方法, 其中, 通过对所述生物电势信号数据执行 二阶值的第二数值分数导数并且通过对经分数导数的信号数据执行逆变换以将所述经分 数导数的。

6、信号数据转换为时域信号数据来生成所述第二分数导数信号数据, 所述逆变换例 如是逆FFT。 5.根据权利要求1至4中任一项所述的方法, 其中, 所述第一分数导数信号数据和所述 第二分数导数信号数据中的每一个都包括时域信号数据。 6.根据权利要求1至5中任一项所述的方法, 其中, 所述第一分数导数信号数据由pi/2 阶的分数导数生成。 7.根据权利要求1至6中任一项所述的方法, 其中, 所述第二分数导数信号数据由0.5阶 的分数导数生成。 8.根据权利要求1至7中任一项所述的方法, 其中, 所述三维空间的所述几何特征和所 述动力学特性通过对所述空间中的所述三维点执行改进的匹配追踪MMP算法来生成。。

7、 9.根据权利要求1至8中任一项所述的方法, 其中, 所述生物电势信号数据与从单个电 导联采集的生物电势信号相关联。 10.根据权利要求1-9中的任一项所述的方法, 其中, 所述单个电导联在从由所述对象 的胸部线、 所述对象的腰围线、 所述对象的腕部、 所述对象的骨盆线、 所述对象的颈部、 所述 对象的脚踝、 所述对象的额头以及所述对象的手臂线构成的组中选择的位置处采集所述生 物电势信号的测量值。 11.根据权利要求1至10中任一项所述的方法, 该方法包括: 经由处理器生成所述空间中的所述三维点的alpha shape, 其中, 所述三维空间的所述 几何特征和所述动力学特性包括所述alpha 。

8、shape的所述几何特征。 12.根据权利要求1至11中任一项所述的方法, 该方法包括: 权 利 要 求 书 1/2 页 2 CN 108024730 A 2 生成所述空间中的所述三维点的Delaunay三角形网格, 其中, 所述三维空间的所述几 何特征和所述动力学特性包括所述Delaunay三角形网格的所述几何特征。 13.根据权利要求1至12中任一项所述的方法, 其中, 所述生物电势信号数据包括心电 图ECG数据。 14.根据权利要求1至13中任一项所述的方法, 其中, 所述机器学习包括人工神经网络 算法或回归随机森林算法。 15.一种预处理数据以提取用于机器学习的变量来诊断病症的方法, 。

9、所述方法包括: 接收与对象相关联的生物电势信号数据, 所述生物电势信号数据与从两个或更多个电 导联采集的生物电势信号相关联; 通过在频域中对所述生物电势信号数据中的至少一个数值地执行一个或更多个分数 导数运算并将所述一个或更多个分数导数运算的结果转换为时域信号数据, 经由处理器生 成分数导数信号数据, 其中, 所生成的分数导数信号数据包括与所述生物电势信号数据中 的所述至少一个相同的长度和相同的采样频率; 以及 经由所述处理器生成三维空间, 其中, 所述生物电势信号数据和所述分数导数信号数 据中的每一个的每个对应值在所述空间中形成三维点, 其中, 所述三维空间的几何特征和 动力学特性被用作代表。

10、机器学习中的对象的变量以检测所述对象的一个或更多个可诊断 病症。 16.根据权利要求15所述的方法, 其中, 所述两个或更多个电导联中的每一个在从由所 述对象的胸部线、 所述对象的腰围线、 所述对象的腕部、 所述对象的骨盆线、 所述对象的颈 部、 所述对象的脚踝、 所述对象的额头以及所述对象的手臂线构成的组中选择的位置处采 集所述生物电势信号的测量值。 17.一种确定哺乳动物中的先天性心脏缺陷CHD的方法, 该方法包括: 接收与所述哺乳动物相关联的生物电势记录, 所述生物电势记录以预定间隔进行记 录; 发展与所述生物电势记录相关联的变量以创建数据集; 以及 分析所述数据集以确定所述哺乳动物是否。

11、具有CHD。 18.根据权利要求17所述的方法, 其中, 使用包括单个表面导联的测量设备来记录与所 述哺乳动物相关联的所述生物电势记录。 19.根据权利要求17或18所述的方法, 其中, 测量设备包括心内电图仪。 20.根据权利要求17至19中任一项所述的方法, 其中, 测量设备包括智能手表或健身心 带。 21.一种系统, 该系统包括: 存储装置, 该存储装置被配置为从网络连接的生物电势测量设备接收生物电势数据; 一个或更多个处理器; 其上存储有指令的存储器, 其中, 所述指令在由所述处理器执行时使所述处理器: 生成与所述生物电势数据相关联的相空间变量; 分析所述相空间变量以确定所述哺乳动物是。

12、否具有CHD。 权 利 要 求 书 2/2 页 3 CN 108024730 A 3 使用数学分析和机器学习来诊断疾病的方法和系统 0001 相关申请的交叉引用 0002 本申请要求于2015年6月25日提交的标题为 “Latent Teratogen-Induced Heart Deficits Are Unmasked Postnatally with Mathematical Analysis and Machine Learning on ECG Signals” 的美国临时申请No.62/184,796的优先权和权益, 其全部内容 通过引用并入本文。 技术领域 0003 本公开涉及通。

13、过对生物电势信号进行数学和机器学习分析来诊断心脏病症的方 法和系统。 背景技术 0004 先天性心脏缺陷(CHD)是最常见的出生异常, 其中室间隔缺损(VSD)是最普遍的先 天性心脏缺陷(CHD)类别。 临床上, 大约80的室间隔缺损(VSD)在第一年内自发消除, 但对 于这些消除的VSD对出生后心脏功能的长期后果知之甚少。 0005 所需要的是克服现有技术中的挑战(其中一些如上所述)的装置、 系统和方法。 发明内容 0006 所示例的方法和系统使用对从单个电极采集的生物电势信号的数学分析和机器 学习分析来辅助对疾病或生理状态的监测和/或评估。 所示例的方法和系统根据经单独测 量的生物电势信号。

14、的数据通过数学运算(即, 通过分数导数计算)创建一个或更多个数学导 出的生物电势信号(例如, 虚拟生物电势信号), 该数学导出的生物电势信号与测量的生物 电势信号结合使用以生成身体(例如, 心脏)的多维相空间表示。 在一些实施方式中, 在频域 中, 将实数的分数的分数导数或整数的分数的分数导数数值地应用于测量的生物电势信号 或其一部分, 以增加测量的信号数据的维度。 在一些实施方式中, 在频域中, 将整数的分数 导数数值地应用于测量的生物电势信号或其一部分, 以增加测量的信号数据的维度。 通过 在频域中以数学方式调制(例如, 通过扩大或缩小)给定生物电势信号的部分, 基于数值的 运算对生物电势。

15、信号的某些测量的频率给予加重或去加重, 当与机器学习相结合时, 有助 于改进对某些病症的诊断并有助于进行实时(或接近实时)诊断。 0007 为此, 所示例的方法和系统使用单个电极导联(lead)来辅助对生物电势信号的测 量以获得诊断结果。 另外, 可以使用所示例的方法和系统来增强由多个物理导联采集的测 量, 实际上, 利用虚拟导联倍增物理效应, 从而提供与原始物理测量不同的有利的观点或视 角, 从而改善随后的分析。 0008 进行了临床动物模型研究, 该研究表明, 所示例的方法和系统有助于临床上相关 的生理状况的诊断。 具体地, 临床动物模型研究表明, 使用所示例的方法和系统可以检测到 隐藏心。

16、血管功能障碍的消除的先天性心脏缺陷。 0009 在一个方面, 公开了一种预处理数据以提取用于机器学习中的变量来诊断病症的 说 明 书 1/13 页 4 CN 108024730 A 4 方法。 该方法包括: 接收与对象相关联的生物电势信号数据, 所述生物电势信号数据与从一 个或更多个电导联采集的生物电势信号相关联; 通过在频域中数值地执行所述生物电势信 号数据的一个或更多个分数导数运算(例如, 数值分数导数运算)并且将所述一个或更多个 分数导数运算的结果转换成时域信号数据(经由处理器)生成第一分数导数信号数据和第 二分数导数信号数据, 其中, 生成的所述第一分数导数信号数据和第二分数导数信号数。

17、据 中的每一个都包括与所述生物电势信号数据相同的长度和相同的采样频率; 以及经由处理 器生成三维空间, 其中, 生物电势信号数据、 第一分数导数信号数据和第二分数导数信号数 据的每个对应值在所述空间中形成三维点, 其中, 三维空间的几何特征和动力学特性被用 作代表机器学习中的对象的变量以检测该对象的一个或更多个可诊断病症。 0010 在一些实施方式中, 通过在频域中对生物电势信号数据执行一阶值的第一数值分 数导数并且通过对经分数导数的信号执行逆变换(例如, 逆FFT)以将经分数导数的信号数 据转换成时域信号数据来生成第一分数导数信号数据。 0011 在一些实施方式中, 逆变换包括逆快速傅里叶变。

18、换(逆FFT)运算。 0012 在一些实施方式中, 通过在频域中对生物电势信号数据执行二阶值的第二数值分 数导数并且通过对经分数导数的信号执行逆变换(例如, 逆FFT)以将经分数导数的信号数 据转换成时域信号数据来生成第二分数导数信号数据。 0013 在一些实施方式中, 第一分数导数信号数据和第二分数导数信号数据中的每一个 都包括时域信号数据。 0014 在一些实施方式中, 第一分数导数信号数据由pi/2阶的分数导数生成。 0015 在一些实施方式中, 第二分数导数信号数据由0.5阶的分数导数生成。 0016 在一些实施方式中, 通过执行三维空间中的三维点的MMP(改进的匹配追踪)算法 来生成。

19、所述三维空间的几何特征和动力学特性。 0017 在一些实施方式中, 生物电势信号数据与从单个电导联采集的生物电势信号相关 联。 0018 在一些实施方式中, 单个电导联在从由对象的胸部线、 对象的腰部、 对象的腕部、 对象的骨盆线、 对象的颈部、 对象的脚踝、 对象的额头以及对象的手臂线构成的组中选择的 位置处采集生物电势信号的测量值。 0019 在一些实施方式中, 该方法包括经由处理器生成所述空间中的三维点的alpha shape, 其中, 三维空间的几何特征和动力学特性包括alpha shape的几何特征。 0020 在一些实施方式中, 该方法包括生成所述空间中的三维点的Delaunay三。

20、角形网 格, 其中, 所述三维空间的几何特征和动力学特性包括Delaunay三角形网格的几何特征。 0021 在一些实施方式中, 生物电势信号数据包括心电图(ECG)数据。 0022 在一些实施方式中, 机器学习分析包括使用人工神经网络算法或回归随机森林算 法。 0023 另一方面, 公开了一种预处理数据以提取用于机器学习中的变量来诊断病症的方 法。 该方法包括: 接收与对象相关联的生物电势信号数据, 所述生物电势信号数据与从两个 或更多个电导联采集的生物电势信号相关联; 通过在频域中数值地执行所述生物电势信号 数据的至少一个的一个或更多个分数导数运算并且将所述一个或更多个分数导数运算的 结果。

21、转换成时域信号数据(经由处理器)生成分数导数信号数据, 其中, 所生成的分数导数 说 明 书 2/13 页 5 CN 108024730 A 5 信号数据包括与所述生物电势信号数据中的至少一个相同的长度和相同的采样频率; 以及 经由处理器生成三维空间, 其中, 生物电势信号数据和分数导数信号数据中的每一个的每 个对应值在所述空间中形成三维点, 其中, 三维空间的几何特征和动力学特性被用作代表 机器学习中的对象的变量以检测该对象的一个或更多个可诊断病症。 0024 在一些实施方式中, 两个或更多个电导联中的每一个在从由对象的胸部线、 对象 的腰部、 对象的腕部、 对象的骨盆线、 对象的颈部、 对。

22、象的脚踝、 对象的额头以及对象的手臂 线构成的组中选择的位置处采集生物电势信号的测量值。 0025 另一方面, 公开了一种确定哺乳动物先天性心脏缺陷(CHD)的方法。 该方法包括: 接收与哺乳动物相关联的生物电势记录、 以预定间隔记录的生物电势记录; 发展与生物电 势记录相关联的变量以创建数据集; 以及分析该数据集以确定该哺乳动物是否具有CHD。 0026 在一些实施方式中, 使用包括单个表面导联的测量设备来记录与哺乳动物相关联 的生物电势记录。 0027 在一些实施方式中, 测量设备包括心内电图仪。 0028 在一些实施方式中, 测量设备包括智能手表或健身心带(fitness heart b。

23、and)。 0029 另一方面, 公开了一种系统, 该系统包括: 远程存储装置(例如, 存储区域网络), 该 远程存储装置被配置为从网络连接的生物电势测量设备接收生物电势数据; 一个或更多个 处理器; 以及其上存储有指令的存储器, 其中, 所述指令在由所述处理器执行时使所述处理 器: 生成与生物电势数据相关联的相空间变量; 分析该相空间变量以确定哺乳动物是否具 有CHD。 附图说明 0030 图1是根据说明性实施方式的用于预处理数据以提取用于机器学习的变量来诊断 病症的系统的图。 0031 图2是根据说明性实施方式的用于处理数据以诊断病症的方法的图。 0032 图3是根据说明性实施方式的如图2。

24、所示的预处理数据的方法的详细图。 0033 图4是根据说明性实施方式的如图3所示的信号数据标准化方法的详细图。 0034 图5是根据说明性实施方式的如图3所示的虚拟信号生成方法的详细图。 0035 图6是根据说明性实施方式的如图2所示的执行相空间分析的方法的详细图。 0036 图7是示出根据实施方式的根据实施方式的根据说明性实施方式的出生后VSD分 辨率的图。 0037 图8是示出根据实施方式的临床研究的假设的图。 0038 图9是示出根据实施方式的关于图8描述的用于临床研究的实验设计的图。 0039 图10是示出根据实施方式的用于使用机器学习过程进行关于图9描述的临床研究 的实验的方法的图。。

25、 0040 图11是示出根据实施方式的包括从示例的分数导数运算生成的虚拟生物电势信 号的矢量心电图的图。 0041 图12是示出根据实施方式的关于图10描述的机器学习过程的示例性输入的图。 0042 图13是示出具有可诊断疾病的样本的矢量心电图的相空间模型的图。 0043 图14是示出对照(CONTROL)样本的矢量心电图的alpha-shape相空间模型的图。 说 明 书 3/13 页 6 CN 108024730 A 6 0044 图15和图16是示出根据说明性实施方式的关于图7至图10描述的临床研究的结果 的图。 0045 图17A和图17B示出了使用标准偏差方法或者Poincare P。

26、earson相关性方法, 在暴 露于DMO或化学天然状态的预测中使用接受者-操作者特性曲线评估的心率变异性 的表现。 0046 图18示出了如使用接受者-操作者特性曲线评估的人工神经网络在区分暴露于 DMO的数据和化学天然数据方面的表现。 0047 图19示出了如通过接受者操作者特性曲线评估的随机森林在 “留一法(leave- one-out)” 验证范例内区分暴露于DMO的数据和化学天然数据方面的表现。 具体实施方式 0048 附图中的组件不一定相对于彼此按比例绘制, 并且贯穿几个视图, 相同的附图标 记表示相应的部件: 0049 图1是根据说明性实施方式的用于预处理数据以提取用于机器学习的。

27、变量来诊断 病症的系统100的图。 如图1所示, 系统100包括生物电势测量设备102和分析子系统104。 生 物电势测量设备102经由附接到对象108的表面(例如, 测试动物或人的皮肤)的单导联电极 106(和相应的接地(GND)导联124)来采集生物电势信号。 生物电势测量设备可以是被配置 为捕获电生理信号的任何装置。 在一些实施方式中, 使用Holter ECG监视器作为用于测量 和记录生物电势信号的生物电势测量设备102。 0050 在一些实施方式中, 单导联电极106包括直接或间接放置在皮肤或身体组织的表 面上以记录电活动的表面电极。 在一些实施方式中, 单导联电极106包括集成到可。

28、穿戴装置 中以在可穿戴装置穿戴或附接到患者或对象时接触皮肤的电极。 0051 应当理解, 在不脱离本公开的精神的情况下, 可以使用其它布线拓扑。 在一些实施 方式中, GND导联是共模回路(common-mode return)。 在其它实施方式中, GND导联可以用作 导联106的差模信号。 在其它实施方式中, GND导联参考地球、 底架或屏蔽件(或通过地球、 底 架或屏蔽件返回)。 0052 在一些实施方式中, 生物电势信号是在组织上的点之间测得的电势。 生物电势信 号的示例包括用于评估心脏的电功能和肌肉功能的ECG(心电图)信号。 0053 在一些实施方式中, 生物电势测量设备是被配置为。

29、测量和记录生物电势信号的可 穿戴装置。 在一些实施方式中, 可穿戴装置被配置为放置在对象的胸部线、 对象的腰部、 对 象的腕部、 对象的骨盆线、 对象的颈部、 对象的踝部、 对象的前额和对象的手臂线处, 并且具 有定位成与穿戴者的皮肤或表面接触的电极。 可穿戴装置可以具有手表形式的壳体、 臂带、 颈带、 腿带、 胸带、 头带等。 在其它实施方式中, 生物电势测量设备是接触人的皮肤或表面的 训练设备的一部分(例如, 手柄)、 体重秤、 垫子或任何类似装置。 0054 仍然参照图1, 生物电势信号110被存储为生物电势信号数据112。 分析系统104在 一些实施方式中通过网络从生物电势测量设备10。

30、2接收生物电势信号数据112。 在一些实施 方式中, 分析系统104从存储区域网络(SAN)接收生物电势信号数据112。 在其它实施方式 中, 分析系统104和生物电势测量设备102位于单个装置, 例如可穿戴装置。 可以使用其它配 置。 说 明 书 4/13 页 7 CN 108024730 A 7 0055 仍然参照图1, 分析系统104被配置为从单个信号的源生物电势信号数据112生成 源生物电势信号数据112的(经由分数微积分运算116)一个或更多个附加的生物电势信号 数据(示出为第一分数导数信号数据114a和第二分数导数信号数据), 其中第一和第二生成 的分数导数信号数据114a、 11。

31、4b中的每一个都包括与生物电势信号数据相同的长度和相同 的采样频率。 在一些实施方式中, 执行数值分数导数运算以加重或去加重某些频率分量, 并 且使得在所得到的向量中不存在正交性。 附加的生物电势信号数据与源生物电势信号数据 结合使用以生成将在稍后本文描述的后续相空间分析118中使用的相空间映射。 然后使用 人工神经网络120估计相空间分析的输出以评估与疾病或生理特征的存在相关联的参数 122。 然后将处理器的输出发送到图形用户界面进行可视化。 在一些实施方式中, 图形用户 界面被包括在被配置为显示参数122的显示单元中。 在一些实施方式中, 图形用户界面显示 中间参数, 诸如生物电势信号数据。

32、和虚拟生物电势信号数据的3D相空间图表示。 0056 图2是根据说明性实施方式的用于处理数据以诊断病症的图1的方法200的图。 如 图2所示, 方法200包括采集200信号数据并预处理204信号数据以生成要在相分析206中使 用的相空间数据集, 由此经由人工神经网络分析208提取和估计相空间数据集的特征。 0057 图3是根据说明性实施方式的如图2所示的数据的预处理204的详细图。 在一些实 施方式中, 预处理204包括信号数据标准化302和虚拟信号生成304。 0058 图4是根据说明性实施方式的如图3所示的信号数据标准化方法的详细图。 如图4 所示, 信号标准化302包括源生物电势信号数据。

33、112的数据通道移除402和Hurst指数过滤 404的初始步骤。 在Matteo等人的 “Scaling behaviors in different developed markets” , Physica A, 324, pg.183-188(2003)中描述了数据通道移除和Hurst指数过滤的 进一步细节。 在一些实施方式中, 信号标准化302还包括选择406经过滤的信号的最干净的 区段, 该区段具有信号的被设计用于检测非生物噪声的存在的小波模型与信号本身之间的 最小化残差。 例如, 可以选择包括10秒记录间隔的最干净的5秒窗口的区段。 在一些实施方 式中, 小波模型被配置为将信号分解。

34、成时间级, 其中时间级的最高级别的分解中的一个或 更多个被用于从信号中减去小波模型以确定残差。 在一些实施方式中, 信号标准化302还包 括使用第二小波模型进行过滤408以去除所选的干净区段中的不期望的噪声(例如, 任何剩 余噪声)。 第二小波模型被配置为将信号分解成多个时间级, 并且维持最高级别的分解中的 一个或更多个。 本领域技术人员应当理解, 可以使用其它信号数据标准化。 0059 图5是根据说明性实施方式的如图3所示的虚拟信号生成方法的详细图。 如图5所 示, 虚拟信号生成304包括创建一个或更多个虚拟信号数据, 使得数据与原始信号数据交互 以创建有效相空间肖像(portrait), 。

35、其中输入生物电势信号(例如, 心动周期)的极限周期 被覆盖在三维空间中并且在得到的向量中没有正交性。 例如, 在单个源生物电势信号数据 可用的情况下, 虚拟信号生成304可用于生成两个虚拟生物电势信号, 其中, 有效的相空间 肖像在三维空间中。 在另一个示例中, 在两个源生物电势信号数据可用的情况下, 虚拟信号 生成304可以用于生成虚拟生物电势信号, 其中, 有效的相空间肖像在三维空间中。 在一些 实施方式中, 有效的相空间肖像可以在大于3的维度空间中, 诸如4、 5、 6、 7、 8、 9、 10或更大。 0060 在一些实施方式中, 通过对标准化的信号数据执行快速傅里叶变换502来生成一。

36、 个或更多个虚拟信号数据中的每一个。 然后对FFT信号数据中的每一个执行504数值分数导 数, 并且对该输出执行506逆快速傅里叶变换(逆FFT)。 分数导数的阶数的示例包括pi/2或 说 明 书 5/13 页 8 CN 108024730 A 8 0.5。 在一些实施方式中, 分数导数的阶数是实数或复数的分数。 在一些实施方式中, 分数导 数的阶数是整数的分数。 在一些实施方式中, 逆FFT的输出被进一步处理以去除508基线漂 移。 0061 在一些实施方式中, 一个或更多个虚拟信号数据中的每一个通过对标准化的信号 数据执行数值分数差分(通过使用卷积来实现)来生成。 合理的传递函数被限定为对。

37、应于分 数导数的特定阶数, 然后通过使用被配置为接受这种输入的数值过滤器将该传递函数应用 于输入数据。 分数导数的阶数的示例包括pi/2或0.5。 在一些实施方式中, 分数导数的阶数 是实数或复数的分数。 在一些实施方式中, 分数导数的阶数是整数的分数。 在一些实施方式 中, 卷积的输出被进一步处理以去除508基线漂移。 0062 图6是根据说明性实施方式的如图2所示的执行相空间分析的方法的详细图。 在一 些实施方式中, 相空间分析的输入是作为矢量心电图的生物电势信号数据和对应的虚拟信 号数据的点云相空间映射601。 在一些实施方式中, 相空间分析包括执行改进的匹配追踪 (MMP)算法602。。

38、 MPP算法602可被用于生成稀疏数学模型604。 在Mallat等人的 “Matching Pursuits with Time-Frequency Dictionaries” , IEEE Transactions on Signal Processing,Vol.41(12),Pages 3397-2415(1993)中提供了MMP算法的细节。 0063 可以在特征提取操作606中提取该模型的特征以确定模型的几何和动态特性。 0064 在一些实施方式中, 点云相空间映射601由alpha shape或Delaunay三角剖分封 装。 可以经由特征提取610来提取alpha shape和/。

39、或三角剖分的特征以确定模型的附加几 何和动态特性。 0065 在一些实施方式中, 将alpha shape和改进的匹配追踪运算的所提取的几何和动 态特性用作人工神经网络分析、 回归随机森林分析或其它机器学习分析的变量。 0066 实验-潜在的致畸剂诱发心脏缺陷 0067 使用下面描述的动物模型, 示出了使用数学分析和机器学习来诊断疾病的示例系 统和方法。 具体地, 所例示的系统和方法采用分数微积分来通过利用将在后续相空间分析 中使用的逆FFT的数值方法来增加单导联ECG的维度。 0068 所示例的系统和方法显示在动物模型中成功地从生物电势信号中提取有意义的 变量, 特别是在暴露于致畸剂的测试动。

40、物在临床上与对照组没有区别时从植入的无线电测 量仪采集的心电图数据中的那些变量。 然后利用机器学习在鲁棒的验证框架内预测潜在的 心血管功能障碍的存在。 该测试示出了可以使用所示例的系统和方法来分析来自单导联测 量的数据(例如, 单个时间序列数据)并且在随后的相空间分析中生成更高级别维度的相空 间数据。 0069 在动物模型中, 以这样的方式对试验大鼠进行处理, 以便在后代中诱发CHD(先天 性心脏缺陷)的高发生率。 在自然出生的母兽中, 使用超声心电图在出生后第4天(PND)4、 PND 21和PND 56中评估雌性幼崽的心脏结构和功能。 在出生后第56天(PND)56, 将无线电遥 测单元植。

41、入9只经处理的大鼠和8只对照大鼠中。 手术后两周, 遥测仪被激活, 在两周内每隔 10秒和每隔12秒不断采集ECG记录。 将每只大鼠的50,000个采集的数据点从单个ECG记录转 换成唯一的三维相空间数据集, 并且机器学习用于创建预测算法, 该预测算法能够识别对 照大鼠和经处理的大鼠以及其它哺乳动物之间心脏功能的差异。 0070 如下面更详细描述的, 结果表明, 通过常规措施产后消除并得到显现正常的心脏 说 明 书 6/13 页 9 CN 108024730 A 9 的致畸剂诱发CHD实际上不同于致畸剂天然心脏。 同样重要的是, 结果显示可以使用分数微 积分来增加用于相空间分析的单导联生物电势。

42、信号的维度。 0071 实验设置 0072 图7是示出根据说明性实施方式的出生后室间隔缺损(VSD)分辨率的图。 如图7所 示, 选择具有显著心血管差异的两组动物, 所述差异在出生后8-10周时降至绝对最小值, 此 时这些动物的差异在临床上不可区分。 使用动物来验证所示例的系统和方法可以用于识别 哪些动物受到药物施用的影响(即, 在动物中的心血管差异在临床上是不可区分的这出生 后的8-10周期间)。 0073 图8是示出根据实施方式的临床研究的假设的图。 如图8所示, 假设所示例的数学 分析和机器学习将在传统分析无法检测的时间(在8-10周内)揭示具有经处理的母兽的后 代群体与具有未经处理的母。

43、兽的后代群体之间的功能性缺陷, 而不需要传统的应激源。 0074 图9是示出根据实施方式的关于图8描述的用于临床研究的实验设计的图。 如图9 所示, 将测试大鼠分成两组: 暴露于二甲双酮(DMO)和未暴露于二甲双酮。 测试大鼠允许自 然分娩; 使用超声心电图评估幼崽生命的前8周。 然后, 在8周时, 将无线电测量仪手术植入 到测试大鼠中以测量包括ECG信号的若干生理信号。 然后将ECG信号用于机器学习以创建区 分这两个群体的预测器。 0075 图10是示出根据实施方式的用于使用机器学习过程进行关于图9描述的临床研究 的实验的方法的图。 如图10所示, 所示例的实验从具有与ECG数据配对的已知暴。

44、露的测试大 鼠开始。 随后从ECG数据发展变量, 并输入到机器学习过程。 所示例的方法和系统用于预测 生成心电图的大鼠是否暴露于或未暴露于二甲双酮(DMO)。 0076 图11是示出根据实施方式的包括从示例的分数导数运算生成的虚拟生物电势信 号的矢量心电图的图。 如图11所示, 示例性输入包括原始测量的ECG信号数据112和虚拟ECG 信号数据114a, 114b。 0077 图12是示出根据实施方式的关于图11描述的机器学习过程的示例性输入的图。 如 图12所示, 示出了矢量心电图(VCG)的相空间数据集1202, 其包括测得的生物电势信号112 和从示例的分数导数运算生成的虚拟生物电势信号。

45、114a、 114b。 在点云相空间映射1202中 示出了矢量心电图(VCG), 其中, 在三轴坐标系中无时间地示出测得的生物电势信号112和 虚拟生物电势信号114a、 114b。 相空间数据集1202通过被包裹成几何形状(例如, alpha shape或Delaunay三角形)而被量化。 在Edelsbrunner等人的 “Three-dimensional alpha shapes” ACM Transactions on Graphics,Vol.13(1):43-72(1994)中描述了alpha shape 运算的细节。 0078 图13是示出具有可诊断疾病的样本的矢量心电图的al。

46、pha-shape相空间模型的 图。 图14是示出对照样本的矢量心电图的alpha-shape相空间模型的图。 如图13和图14所 示, 暴露的和未暴露的测试大鼠的数据集之间存在视觉差异, 但是这些差异是微妙的, 并且 更有利于通过机器学习来分析这些差异。 0079 在一些实施方式中, 机器学习分析使用包括数据形状变量、 分数导数、 使用MMP的 信号建模、 相空间建模和动态系统变量的变量族。 在所示例的实验中, 对于各自具有50,000 个ECG信号(其中每个ECG信号具有250个变量)的17个测试大鼠的数据, 在包括人工神经网 络的分析中使用了约20亿个数据点。 说 明 书 7/13 页 。

47、10 CN 108024730 A 10 0080 讨论 0081 先天性心脏缺陷(CHD)是最常见的一类先天性异常, 发生率约为活胎的1 .9- 7.5。 最常见的出生缺陷是占所有CHD的25-40的室间隔缺损(VSD), 其中隔膜未能在左 心室和右心室之间闭合。 VSD或其它CHD的产后持续存在或手术修复相对于未受影响的群体 显著增加了这些患者的终生心脏病风险, 因此需要一个专门护理CHD的心脏病专家的观察 和潜在干预的警惕的一生。 有趣的是, 大约80的VSD在临床上在生命的第一年内自发消 除。 虽然临床上消除结构性损伤是一个有利的结果, 但是关于消除的VSD的长期功能性后果 缺乏信息。。

48、 0082 为了探索已消除的CHD潜在的有害的长期后果, 开发了示例的大鼠模型, 其概括了 许多CHD的临床表现。 为了生成这样的模型, 用化学致畸剂处理怀孕的大鼠。 据估计, 80的 宫内三甲双酮暴露导致胚胎/胎儿丧失, 或导致包括CHD高发生率的畸形。 不受特定理论的 束缚, 认为DMO致畸性是由氧化应激介导的, 这可能是由于胚胎肌细胞中钙离子和钾离子通 道破坏导致的心动过缓引起的缺氧再灌注损伤的结果。 已经在远交的怀孕Sprague-Dawley 大鼠中证实, 后代中CHD的发生率和严重程度高度依赖于妊娠窗和总体暴露于DMO。 如果在 自然分娩前一天在GD21上检查胎儿, 从妊娠日(GD。

49、)9的早晨起每12小时施用四个300mg/kg 剂量产生约50的CHD发生率(参见例如, Weston等人的 “Co-variation in frequency and severity of cardiovascular and skeletal defects in Sprague-Dawley rats after maternal administration of dimethadione,the N-demethylated metabolite of trimethadione.Birth defects research Part B,” Developmental and reproductive toxicology,Vol.92,Pages 206-15(2011)。 当经同样处理的母兽。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 >


copyright@ 2017-2020 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备2021068784号-1