技术领域
本发明涉及一种使用脑功能成像法的脑活动分析装置、脑活动分析方法以及生物标记物装置。
背景技术
(生物标记物(Biomarker))
将为了定量地掌握生物体内的生物学变化而将生物体信息数值化、定量化得到的指标称为“生物标记物”。
FDA(美国食品药品局)将生物标记物定位为“作为正常生理、病理生理或者对治疗的药理学反应的指标来客观地测定、评价的项目”。另外,对疾病的状态、变化、治愈的程度赋予特征的生物标记物被用作用于确认新药在临床试验中的有效性的替代标记物(surrogate marker)。血糖值和胆固醇值等是作为生活习惯病的指标而具有代表性的生物标记物。不仅包括尿、血液中包含的来自生物体的物质,还包括心电图、血压、PET图像、骨密度、肺功能等。另外,通过基因组分析(genomic analysis)和蛋白质组分析(proteome analysis)的不断进步,发现了与DNA、RNA、生物体蛋白等相关联的各种生物标记物。
关于生物标记物,不仅期待其应用于患病后的治疗效果的测定,还期待其作为用于防疾病于未然的日常指标来应用于疾病的预防,并且期待其在选择避免副作用的有效的治疗方法的个别化医疗中的应用。
但是,在神经/精神疾病的情况下,尽管还对从生物化学或分子遗传学的观点来看能够用作客观指标的分子标记物等进行了研究,但是处于应该称为探讨阶段的状况。
另一方面,也有对如下的疾病判定系统等的报告:使用NIRS(Near-InfraRed Spectroscopy:近红外光谱)技术,根据通过生物体光测量而测量出的血红蛋白信号的特征量,来对精神分裂症(schizophrenia)、抑郁症等精神疾病进行分类(专利文献1)。
(实时神经反馈(Real Time Neurofeedback))
例如,以往对于作为神经症的一个类型的强迫性障碍(Obsessive-Compulsive Disorder:OCD),作为其治疗方法,已知药物疗法、行为疗法。作为药物疗法,例如使用选择性血清素再摄取抑制剂,作为行为疗法,已知将暴露法与反应阻止法结合而成的暴露反应阻止法等。
另一方面,作为神经/精神疾病的情况下的一种可能的治疗方法,探讨了实时神经反馈法。
以利用核磁共振成像法(MRI:Magnetic Resonance Imaging)将与人脑的活动相关联的血流动态反应视觉化的方法、即功能性磁共振成像法(fMRI:functinal Magnetic Resonance Imaging)为首的脑功能成像法用于检测因感觉刺激、执行认知任务引起的脑活动与静息态、因执行对照任务引起的脑活动之间的不同来确定与所关心的脑功能的构成要素对应的脑活化区域、即明确脑的功能定位。
近年来,有对使用功能性磁共振成像法(fMRI)等脑功能成像法的实时神经反馈技术的报告(非专利文献1)。实时神经反馈技术作为神经疾病、精神疾病的治疗方法开始受到关注。
神经反馈是生物反馈的一种,受验者通过接受与自身的脑活动有关的反馈来学习操作脑活动的方法。
例如有以下报告:当利用fMRI测量前扣带回的活动并将其实时地作为火焰的大小反馈给患者来使患者努力减小火焰时,中枢性的慢性疼痛既实时地得到改善而且也长期地得到改善(参照非专利文献2)。
(静息态fMRI)
另外,在最近的研究中,获知了静息态的脑也在活跃地进行活动。也就是说,脑内存在一种在脑的主动活动时镇静化、在脑休息时活跃地兴奋的神经细胞群。该神经细胞群在解剖学上主要位于左右的大脑相接合的内侧面、即前额叶内侧面、后扣带回、楔前叶、顶叶联合区的后半部、颞中回等。表示该静息态的基线脑活动的区域被命名为默认模式网络(Default Mode Network;DMN),作为一个网络而同步地活动(参照非专利文献3)。
例如,作为正常人与精神疾病患者的脑活动不同的例子,能够列举出默认模式网络中的脑活动。默认模式网络是指在静息状态下能够观察到比正在执行目标指向性的任务时更活跃的脑活动的部位。做出过以下报告:与正常人相比,在精神分裂症、老年痴呆症等疾病的患者的该默认模式网络中能够观察到异常。例如,有以下报告等:在静息状态下,精神分裂症患者的属于默认模式网络的后扣带回皮质与外侧顶叶皮质、内侧前额叶皮质、小脑皮质的活动的相关性下降。
但是,处于以下状况:这种默认模式网络与认知功能的关系如何以及这种脑区域之间的功能性连接的相关性与上述的神经反馈之间的关联等未必明确。
另一方面,通过观察多个脑区域之间因任务等的不同引起的活动的相关关系的变化,来评价这些脑区域间的功能性连接(functional connectivity)。特别是,静息态下的通过fMRI得到的功能性连接的评价也被称为静息态功能连接MRI(rs-fcMRI:resting-state functional connectivity MRI),也逐渐进行以各种神经/精神疾病为对象的临床研究。但是,以往的rs-fcMRI法用于观察如上所述那样的默认模式网络之类的全局性神经网络的活动,处于不能说对更详细的功能性连接进行了充分研究的状况。
(核磁共振成像法)
简单地说明这种核磁共振成像法则如下。
即,以往,在人的临床成像诊断等中使用利用对于生物体中的原子、特别是氢原子的原子核的核磁共振现象的核磁共振成像法来作为对生物体的脑、全身的断面进行成像的方法。
核磁共振成像法在应用于人体的情况下,与同样是人体内断层成像法的“X射线CT”相比,例如存在如下的特征。
(1)能够得到与氢原子的分布及其信号弛豫时间(反映原子结合的强度)对应的浓度的图像。因此,呈现出与组织的特性差异相应的浓淡,从而易于观察组织的不同。
(2)磁场不会被骨骼吸收。因此,易于观察被骨骼包围的部位(头颅内、脊髓等)。
(3)不会像X射线那样对人体有害,因此能够广泛地有效利用。
这种核磁共振成像法利用人体的各细胞中含有量最多的、且具有最大磁性的氢原子核(质子)的磁特性。承担氢原子核的磁性的自旋角动量的磁场内的运动在古典意义上被比喻为陀螺的进动。
下面,为了说明本发明的背景,以该直观的古典模型(classical model)来简单地总结核磁共振的原理。
如上所述的氢原子核的自旋角动量的方向(陀螺的自转轴的方向)在没有磁场的环境中朝向随机的方向,但是若施加静磁场,则会朝向磁力线的方向。
当在该状态下进一步叠加振动磁场时,若该振动磁场的频率是根据静磁场的强度决定的共振频率f0=γB0/2π(γ:物质所固有的系数),则通过共振而在原子核侧能量发生移动,磁化向量的方向发生变化(进动变大)。当在该状态下切断振动磁场时,进动退回倾斜角度来逐渐恢复为在静磁场中的方向。通过从外部利用天线线圈探测该过程,能够得到NMR信号。“NMR”是核磁共振现象(Nuclear Magnetic Resonance)的简称。
在静磁场的强度为B0(T)时,在氢原子的情况下这种共振频率f0为42.6×B0(MHz)。
并且,在核磁共振成像法中,还能够利用与血流量的变化相应地在被检测的信号中出现变化这一情况,来将对于外部刺激等的脑的活动部位视觉化。将这种核磁共振成像法特别称为fMRI(functional MRI)。
在fMRI中,作为装置,使用在通常的MRI装置中进一步配备fMRI测量所需的硬件和软件的装置。
在此,血流量的变化对NMR信号强度带来变化是利用了血液中的氧合血红蛋白与脱氧血红蛋白的磁特性不同。氧合血红蛋白有抗磁性体的特性,对周围存在的水的氢原子的弛豫时间没有影响,与此相对,脱氧血红蛋白是顺磁性体,改变周围的磁场。因而,当脑受到刺激而局部血流增大、氧合血红蛋白增加时,能够检测其变化量来作为MRI信号。作为对受验者的刺激,例如使用视觉上的刺激或听觉上的刺激、或者规定的任务(task)的执行等(例如专利文献2)。
在此,在脑功能研究中,通过测定与微小静脉和毛细血管中的红细胞中的脱氧血红蛋白的浓度减少的现象(BOLD效应)对应的、氢原子的核磁共振信号(MRI信号)的上升,来进行脑的活动的测定。
特别是,在关于人的运动功能的研究中,一边使受验者进行某些运动,一边通过上述MRI装置测定脑的活动。
另外,在人的情况下,需要无创性的脑活动测量,在该情况下,能够从fMRI数据中提取出更详细的信息的解码技术发展起来(例如非专利文献4)。特别是,fMRI以脑中的体素(volumetric pixel:voxel)为单位对脑活动进行分析,由此能够根据脑活动的空间图案来估计刺激输入、识别状态。
并且,作为使这种解码技术发展而得到的技术,在专利文献3中公开了一种用于针对神经/精神疾病实现基于脑功能成像法的生物标记物的脑活动分析方法。在该方法中,根据在健康组和患者组中测定出的静息态功能连接的MRI的数据,来针对各个受验者导出规定的脑区域间的活动度的相关矩阵。对于包括受验者的疾病/健康标签在内的受验者的属性和相关矩阵,通过正则化典型相关分析来进行特征提取。基于正则化典型相关分析的结果,通过利用稀疏逻辑回归(Sparse Logistic Regression:SLR)的判别分析来生成作为生物标记物发挥功能的判别器。示出了:通过这种机器学习的技术,能够基于根据静息态的fMRI数据导出的脑区域间的连接来预测神经疾病的诊断结果。而且示出了:该预测性能的验证不仅针对在一个设施中测量出的脑活动,还能够在某种程度上泛化到在其它设施中测量出的脑活动。
专利文献1:日本再表2006-132313号公报
专利文献2:日本特开2011-000184号公报
专利文献3:日本特开2015-62817号公报
非专利文献1:Nikolaus Weiskopf,“Real-time fMRI and its application toneurofeedback”,NeuroImage 62(2012)682-692
非专利文献2:deCharms RC,Maeda F,Glover GHet al,“Control over brain activation and painlearned by using real-time functional MRI”,Proc Natl Acad Sci USA 102(51),18626-18631,2005
非专利文献3:Raichle ME,Macleod AM,Snyder AZ.et.al.“A default mode of brain function”,Proc NatlAcad Sci USA 98(2),676-682,2001
非专利文献4:Kamitani Y,Tong F.Decoding thevisual and subjective contents of the human brain.Nat Neurosci.2005;8:679-85.
发明内容
发明要解决的问题
在如以上那样考虑将利用功能性磁共振成像法等脑功能成像法进行的脑活动的分析应用于神经/精神疾病的治疗的情况下,例如,作为如上所述的生物标记物,利用脑功能成像法进行的脑活动的分析作为无创性功能标记物还被期待应用于诊断法的开发、面向用于实现根本治疗的药物研发的靶分子的搜索和识别等。
例如,到目前为止,对于自闭症等精神疾病,使用基因的实用性的生物标记物尚未完成,因此,药物的效果判定等是困难的,因此治疗药物的开发也是困难的。
为了基于脑活动的测量数据通过机器学习来生成判别器、并将该判别器实际应用为生物标记物,需要提高针对在一个设施中测量出的脑活动通过机器学习生成的生物标记物的预测精度。另外,这样生成的生物标记物需要也能够泛化到在其它设施中测量出的脑活动。
即,在基于脑活动的测量数据、通过机器学习来构建判别器时,存在主要的2个问题。
第一问题是小标本大小的问题。
作为受验者的人数的数据量N远小于测量出的脑活动测量数据的维数M,因此判别器的参数容易与训练数据过拟合。
由于该过拟合,所构建出的判别器对于新采样的测试数据示出非常逊色的性能。这是由于这些测试数据并未使用于对判别器进行训练。
因而,需要适当地引入正则化以仅识别出对于判别器的期望的泛化而言本质性的特征量来利用该特征量。
第二问题是:只有在所构建出的判别器对于在与收集训练数据的地点不同的拍摄地点扫描得到的MRI数据也维持高性能的情况下,判别器才在临床上有用,能够在科学上信任。
这是遍及多个拍摄地点的所谓的泛化能力。
然而,在临床应用中,经常观测到以下情况:无法将使用在特定的地点获取到的数据来训练出的判别器泛化于在不同的地点扫描得到的数据。
本发明是为了解决如上所述的问题而完成的,其目的在于实现一种能够提供用于客观地判断脑的活动状态是健康状态还是疾病状态的数据的脑活动分析装置和脑活动分析方法。
本发明的其它目的在于提供一种用于实现用于辅助针对神经/精神疾病的诊断的利用脑功能成像法的判别处理的脑活动分析装置和脑活动分析方法。
本发明的其它目的在于提供一种用于实现利用脑功能成像法的生物标记物的脑活动分析装置、脑活动分析方法以及生物标记物装置。
用于解决问题的方案
按照本发明的一个方面,一种脑活动分析装置具备判别器生成单元,该判别器生成单元用于根据由脑活动探测单元按时间序列对表示多个受验者各自的脑内的多个规定区域中的脑活动的信号进行预先测定所得到的信号来生成判别器,对各受验者关联有多个属性信息,判别器生成单元包括:i)相关矩阵计算单元,其根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)第一特征量提取单元,其对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的特定的属性信息对应的典型变量连接的相关矩阵的元素;iii)第一并集提取单元,其获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)判别器计算单元,其用于根据第一并集的元素生成用于估计特定的属性信息的判别器,脑活动分析装置还具备:存储单元,其用于存储用于确定所计算出的判别器的信息;以及判别单元,其基于根据存储单元中存储的信息来确定的判别器,来对输入数据进行判别处理。
优选的是,判别器计算单元根据第一并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的判别器。
优选的是,判别器生成单元还包括:在将多个受验者中的除M个子集以外的其余的受验者作为测试集并将测试集分为不同的N个(N:2以上的自然数)组时,第二特征量提取单元,其从多个受验者以N个组中的除选择出的1个组以外的受验者的集为对象,基于第一并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的测试判别器,伴随稀疏化来提取作为测试判别器的解释变量的相关矩阵的元素;以及第二并集提取单元,其从N个组中依次选择1个组,来重复由第二特征量提取单元进行的特征提取,获取作为测试判别器的解释变量来提取出的相关矩阵的元素的并集即第二并集,判别器计算单元根据第二并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的判别器。
优选的是,判别器生成单元还包括交叉验证单元,交叉验证单元从N个组中依次选择被去除的1个组,利用由第二特征量提取单元计算出的测试判别器,将被去除的组作为测试样本来计算判别结果,由此进行交叉验证。
优选的是,特定的属性信息是受验者的诊断标签。
按照本发明的其它方面,一种程序用于使具有运算装置和存储装置的计算机基于来自用于针对多个受验者测量脑活动的脑活动探测装置的信息来执行脑活动的分析,对各受验者关联有多个属性信息,程序使计算机执行以下步骤:运算装置根据由脑活动探测装置测定出的、按时间序列对多个受验者各自的脑内的多个规定区域中的脑活动进行预先测定所得到的信息来生成判别器,生成判别器的步骤包括以下步骤:i)根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的特定的属性信息对应的典型变量连接的相关矩阵的元素;iii)获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)根据第一并集的元素计算用于估计特定的属性信息的判别器,程序还使计算机执行以下步骤:将用于确定所计算出的判别器的信息存储到存储装置;以及基于根据存储装置中存储的信息来确定的判别器,来对输入数据进行判别处理。
优选的是,计算判别器的步骤包括以下步骤:根据第一并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的判别器。
优选的是,生成判别器的步骤还包括以下步骤:在将多个受验者中的除M个子集以外的其余的受验者作为测试集并将测试集分为不同的N个(N:2以上的自然数)组时,从多个受验者以N个组中的除选择出的1个组以外的受验者的集为对象,基于第一并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的测试判别器,伴随稀疏化来提取作为测试判别器的解释变量的相关矩阵的元素;以及从N个组中依次选择1个组,来重复进行通过提取元素的步骤进行的特征提取,获取作为测试判别器的解释变量来提取出的相关矩阵的元素的并集即第二并集,计算判别器的步骤根据第二并集,通过稀疏逻辑回归来计算用于估计特定的属性信息的判别器。
优选的是,生成判别器的步骤还包括以下步骤:从N个组中依次选择被去除的1个组,利用通过提取元素的步骤计算出的测试判别器,将被去除的组作为测试样本来计算判别结果,由此进行交叉验证。
优选的是,特定的属性信息是受验者的诊断标签。
本发明的另一方面所涉及的脑活动分析装置包括判别器生成装置,该判别器生成装置用于根据由脑活动探测装置按时间序列对表示多个受验者各自的脑内的多个规定区域中的脑活动的信号进行预先测定所得到的信号来生成判别器,对各受验者关联有多个属性信息,判别器是用于估计受验者的特定的属性信息的判别器,脑活动分析装置还包括:存储装置,其与判别器生成装置连接,用于存储信息,该信息是用于确定由判别器生成装置计算出的判别器的信息;以及判别装置,其基于根据存储装置中存储的信息来确定的判别器,来对输入数据进行判别处理,判别器生成装置包括处理器,该处理器被编程为:i)根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的特定的属性信息对应的典型变量连接的相关矩阵的元素;iii)获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)根据第一并集的元素生成用于估计特定的属性信息的判别器。
按照本发明的另一方面,一种脑活动分析方法用于使具有运算装置和存储装置的计算机基于来自用于针对多个受验者测量脑活动的脑活动探测装置的信息来执行脑活动的分析,对各受验者关联有多个属性信息,脑活动分析方法具有以下步骤:运算装置根据由脑活动探测装置测定出的、按时间序列对多个受验者各自的脑内的多个规定区域中的脑活动进行预先测定所得到的信息来生成判别器,生成判别器的步骤包括以下步骤:i)根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的特定的属性信息对应的典型变量连接的相关矩阵的元素;iii)获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)根据第一并集的元素计算用于估计特定的属性信息的判别器,脑活动分析方法还具备以下步骤:将用于确定所计算出的判别器的信息存储到存储装置;以及基于根据存储装置中存储的信息来确定的判别器,来对输入数据进行判别处理。
按照本发明的另一方面,一种生物标记物装置具备:存储装置,其用于存储用于确定判别器的信息,该判别器是由判别器生成单元根据由脑活动探测单元按时间序列对表示多个受验者各自的脑内的多个规定区域中的脑活动的信号进行预先测定所得到的信号来生成的;以及判别单元,其基于根据存储装置中存储的信息来确定的判别器,来对输入数据进行判别处理,对各受验者关联有多个属性信息,判别器生成单元包括:i)相关矩阵计算单元,其根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)第一特征量提取单元,其对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的受验者的诊断标签对应的典型变量连接的相关矩阵的元素;iii)第一并集提取单元,其获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)判别器计算单元,其用于根据第一并集的元素生成用于估计受验者的诊断标签的判别器。
优选的是,判别器计算单元根据第一并集,通过稀疏逻辑回归来计算用于估计受验者的诊断标签的判别器。
优选的是,判别器生成单元还包括:在将多个受验者中的除M个子集以外的其余的受验者作为测试集并将测试集分为不同的N个(N:2以上的自然数)组时,第二特征量提取单元,其从多个受验者以N个组中的除选择出的1个组以外的受验者的集为对象,基于第一并集,通过稀疏逻辑回归来计算用于估计受验者的诊断标签的测试判别器,伴随稀疏化来提取作为测试判别器的解释变量的相关矩阵的元素;以及第二并集提取单元,其从N个组中依次选择1个组,来重复由第二特征量提取单元进行的特征提取,获取作为测试判别器的解释变量来提取出的相关矩阵的元素的并集即第二并集,判别器计算单元根据第二并集,通过稀疏逻辑回归来计算用于估计受验者的诊断标签的判别器。
另一方面所涉及的生物标记物装置,具备:存储装置,其用于存储用于确定判别器的信息,该判别器是由判别器生成装置根据由脑活动探测单元按时间序列对表示多个受验者各自的脑内的多个规定区域中的脑活动的信号进行预先测定所得到的信号来生成的;以及判别装置,其基于根据存储装置中存储的信息来确定的判别器,来对输入数据进行判别处理,对各受验者关联有多个属性信息,判别器是用于基于输入数据来估计受验者的诊断标签的判别器,判别器生成单元包括处理器,该处理器被编程为:i)根据测定出的信号,按每个受验者来计算多个规定区域间的脑活动的相关矩阵;ii)对于从多个受验者中提取出的M个(M:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(M-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个属性信息中的受验者的诊断标签对应的典型变量连接的相关矩阵的元素;iii)获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集;以及iv)根据第一并集的元素生成用于估计受验者的诊断标签的判别器。
本发明的另一方面所涉及的计算机程序使计算机执行上述的生物标记物装置中的任一个生物标记物装置的各功能。
本发明的另一方面所涉及的存储介质是存储有上述的任一个程序的计算机所能够读取的存储介质。
发明的效果
根据本发明,能够实现能够提供用于客观地判断脑的活动状态是健康状态还是疾病状态的数据的脑活动分析装置以及脑活动分析方法。
或者,根据本发明,能够针对神经/精神疾病通过脑功能成像法来实现生物标记物装置、生物标记物装置的程序。
附图说明
图1是表示MRI装置10的整体结构的示意图。
图2是数据处理部32的硬件框图。
图3是表示通过本实施方式的rs-fcMRI法拍摄的脑的关注区域(ROI:Region of Interest)的图。
图4是表示针对ROI提取表示静息态的功能连接的相关性的相关矩阵的过程的概念图。
图5是说明根据相关矩阵来生成成为生物标记物的判别器的过程的概念图。
图6是用于进行如图5中说明那样的判别器的生成处理以及利用所生成的判别器的判别处理的功能框图。
图7是用于说明为了生成成为生物标记物的判别器而由数据处理部32进行的处理的流程图。
图8是用于说明内环特征选择的概念图。
图9是用于说明内环特征选择处理的概念的图。
图10是表示作为一例、进行了内环特征选择时的反复处理中的对于特定的超参数λ1及λ2的结果的图。
图11是用于更详细地说明内环特征选择的处理的流程图。
图12是用于说明外环特征选择的概念图。
图13是用于更详细地说明外环特征选择的处理的流程图。
图14是表示步骤S108中的判别器的生成处理的概念的图。
图15是表示针对181个日本人受验者(ASD患者组74人、正常发育组107人)最终选择出的功能连接的相关矩阵的元素的图。
图16是从与图15对应的侧分别观察全部9730个功能性连接的相关矩阵的元素(FC)的图。
图17是表示48个非零的cik的大小的分布的图。
图18是表示所生成的生物标记物的验证过程的概念图。
图19是表示地点A~C的受验者的属性的数据的图。
图20是表示生物标记物的泛化性能的图。
图21是表示在美国的受验者的属性的图。
图22是表示将数据收集、估计处理以及对象者的脑活动测量分散地进行处理的情况下的一例的功能框图。
具体实施方式
下面,按图来说明本发明的实施方式的MRI系统的结构。此外,在下面的实施方式中,标注了相同标记的结构要素和处理步骤是相同或相当的,在不必要的情况下不重复其说明。
[实施方式1]
图1是表示MRI装置10的整体结构的示意图。
如图1所示,MRI装置10具备:磁场施加机构11,其向受验者2的ROI赋予受控制的磁场并照射RF(Radio Frequency:射频)波;接收线圈20,其接收来自该受验者2的响应波(NMR信号)并输出模拟信号;驱动部21,其对向该受验者2赋予的磁场进行控制,并且对RF波的发送接收进行控制;以及数据处理部32,其设定该驱动部21的控制时序,并且对各种数据信号进行处理来生成图像。
此外,在此,取载置受验者2的圆筒形状的孔(Bore)的中心轴为Z轴,将与Z轴正交的水平方向定义为X轴,将与Z轴正交的垂直方向定义为Y轴。
由于MRI装置10是这样的结构,因此通过由磁场施加机构11施加的静磁场,构成受验者2的原子核的核自旋顺着磁场方向(Z轴)取向,并且以该原子核所固有的拉莫尔频率(Larmor frequency)进行以该磁场方向为轴的进动。
而且,当照射与该拉莫尔频率相同频率的RF脉冲时,原子发生共振并吸收能量而被激励,从而产生核磁共振现象(NMR现象)。在该共振后若停止RF脉冲照射则原子放出能量来恢复为原来的稳定状态的弛豫过程中,原子输出与拉莫尔频率相同的频率的电磁波(NMR信号)。
利用接收线圈20接收所输出的该NMR信号来作为来自受验者2的响应波,在数据处理部32中,受验者2的ROI被图像化。
磁场施加机构11具备静磁场发生线圈12、倾斜磁场发生线圈14、RF照射部16以及在孔中载置受验者2的床18。
受验者2在床18上例如仰卧。虽未特别限定,但受验者2例如能够通过棱镜眼镜4看到与Z轴垂直地设置的显示器6上显示的画面。通过该显示器6的图像来对受验者2施加视觉刺激。此外,对受验者2的视觉刺激也可以是通过投影仪将图像投影到受验者2的眼前的结构。
这种视觉刺激在上述的神经反馈中相当于反馈信息的呈现。
驱动部21具备静磁场电源22、倾斜磁场电源24、信号发送部26、信号接收部28以及使床18移动到Z轴方向上的任意位置的床驱动部30。
数据处理部32具备:输入部40,其从操作者(省略图示)受理各种操作、信息输入;显示部38,其对与受验者2的ROI有关的各种图像和各种信息进行画面显示;显示控制部34,其控制显示部38;存储部36,其存储用于执行各种处理的程序、控制参数、图像数据(构造图像等)以及其它电子数据;控制部42,其对产生使驱动部21驱动的控制时序等的各功能部的动作进行控制;接口部44,其与驱动部21之间执行各种信号的发送接收;数据收集部46,其收集包括源于ROI的一组NMR信号的数据;图像处理部48,其基于该NMR信号的数据来形成图像;以及网络接口50,其用于执行与网络之间的通信。
数据处理部32既可以是专用计算机,也可以是执行使各功能部动作的功能的通用计算机,该通用计算机基于安装于存储部36的程序来进行所指定的运算、数据处理、产生控制时序。下面,设数据处理部32是通用计算机来进行说明。
静磁场发生线圈12向绕Z轴卷绕的螺旋线圈流通从静磁场电源22提供的电流来使螺旋线圈产生感应磁场,使得在孔中产生Z轴方向的静磁场。将受验者2的ROI设定在形成于该孔的静磁场的均匀性高的区域。在此,更为详细地说,静磁场发生线圈12例如包括四个空心线圈,利用其组合来在内部生成均匀的磁场,对受验者2的体内的规定的原子核、更特定地说是对氢原子核的自旋(spin)赋予取向性。
倾斜磁场发生线圈14包括X线圈、Y线圈以及Z线圈(省略图示),设置在呈圆筒形状的静磁场发生线圈12的内周面。
这些X线圈、Y线圈以及Z线圈分别顺次地切换X轴方向、Y轴方向以及Z轴方向,来对孔内的均匀磁场叠加倾斜磁场,以对静磁场赋予强度梯度。在Z线圈激励时,使磁场强度向Z方向倾斜来限定共振面,在施加Z方向的磁场之后Y线圈紧接着加以短时间的倾斜地向检测信号施加与Y坐标成比例的相位调制(相位编码),接着在数据采集时X线圈加以倾斜地向检测信号施加与X坐标成比例的频率调制(频率编码)。
该叠加的倾斜磁场的切换是通过按照控制时序从倾斜磁场电源24向X线圈、Y线圈以及Z线圈分别输出不同的脉冲信号来实现的。由此,能够确定NMR现象所表现的受验者2的位置,能够提供形成受验者2的图像所需的三维坐标上的位置信息。
在此,如上所述,使用三组正交的倾斜磁场,对这些倾斜磁场分别分配切片方向、相位编码方向以及频率编码方向,利用其组合来能够从各种角度进行拍摄。例如,除了能够拍摄与通过X射线CT装置拍摄的方向相同的方向的横向切片(transverse slice)以外,还能够拍摄与其正交的矢状切片(sagittal slice)和冠状切片(coronal slice)、以及垂直于面的方向不与三组正交的倾斜磁场的轴平行的斜切片(oblique slice)等。
RF照射部16用于基于按照控制时序从信号发送部26发送的高频信号,来向受验者2的ROI照射RF脉冲。
此外,在图1中,RF照射部16内置于磁场施加机构11,但也可以设置于床18,或者与接收线圈20一体化。
接收线圈20用于检测来自受验者2的响应波(NMR信号),为了高灵敏度地检测该NMR信号,接近受验者2地配置该接收线圈20。
在此,在接收线圈20中,当NMR信号的电磁波切割其线圈线材时基于电磁感应而产生微弱电流。该微弱电流在信号接收部28中被放大,进一步从模拟信号变换为数字信号后被送至数据处理部32。
即,当通过RF照射部16向处于在静磁场上加上Z轴倾斜磁场的状态的受验者2施加共振频率的高频电磁场时,磁场的强度满足共振条件的部分的规定的原子核、例如氢原子核被选择性地激励而开始共振。处于符合共振条件的部分(例如,受验者2的规定厚度的断层)的规定的原子核被激励,自旋一齐旋转。当停止激励脉冲时,在接收线圈20中,本次是正在旋转的自旋所放射的电磁波感应出信号,在一段时间内检测出该信号。根据该信号,来观察受验者2的体内的包含规定的原子的组织。而且,构成为如下结构:为了获知信号的发送位置,加上X和Y的倾斜磁场来探测信号。
图像处理部48基于存储部36中构建的数据,一边重复施加激励信号一边测定检测信号,通过第一次傅立叶变换计算来将共振的频率还原为X坐标,通过第二次傅立叶变换来还原Y坐标,从而得到图像,并在显示部38上显示对应的图像。
例如,通过这种MRI系统,实时地拍摄与上述的BOLD效应对应的NMR信号,通过控制部42对按时间序列拍摄的图像进行如后面说明那样的分析处理,由此能够进行静息态功能连接MRI(rs-fcMRI)的拍摄。
图2是数据处理部32的硬件框图。
作为数据处理部32的硬件,如上所述那样不特别限定,能够使用通用计算机。
在图2中,数据处理部32的计算机主体2010除了存储器驱动器2020、盘驱动器2030以外,还包括:运算装置(CPU)2040;总线2050,其连接在盘驱动器2030和存储器驱动器2020上;连接的ROM 2060,其用于存储启动程序等程序;RAM 2070,其用于临时存储应用程序的命令并且提供临时存储空间;非易失性存储装置2080,其用于存储应用程序、系统程序以及数据;以及通信接口2090。通信接口2090相当于用于与驱动部21等进行信号的发送接收的接口部44以及用于经由未图示的网络而与其它计算机进行通信的网络接口50。此外,作为非易失性存储装置2080,能够使用硬盘(HDD)或固态硬盘(Solid State Drive)等。非易失性存储装置2080相当于图1所示的存储部36。
CPU 2040通过基于程序而执行的运算处理来实现数据处理部32的各功能、例如控制部42、数据收集部46、图像处理部48的各功能。
使数据处理部32执行上述实施方式的功能的程序也可以被存储在CD-ROM 2200或存储器介质2210中并被插入到盘驱动器2030或存储器驱动器2020并进一步被传输至非易失性存储装置2080。程序在执行时被加载至RAM 2070。
数据处理部32还具备作为输入装置的键盘2100和鼠标2110以及作为输出装置的显示器2120。键盘2100和鼠标2110相当于输入部40,显示器2120相当于显示部38。
用于作为如上所述的数据处理部32而发挥功能的程序也可以未必包括使计算机主体2010执行信息处理装置等的功能的操作系统(OS)。程序只要仅包括用于在受控制的方式下调用适当的功能(模块)从而得到期望的结果的命令的部分即可。数据处理部32如何动作这是众所周知的,因此省略详细的说明。
另外,执行上述程序的计算机既可以是单个也可以是多个。即,可以进行集中处理,也可以进行分散处理。
图3表示通过本实施方式的rs-fcMRI法拍摄的脑的ROI。
在此,设以针对自闭症谱系(Autistic Spectrum Disorder:ASD)的生物标记物为例,采用140个区域作为ROI。
作为这种ROI,例如是如以下那样的区域。
背内侧前额叶皮质(DMPFC:Dorsomedial Prefrontal Cortex)
腹内侧前额叶皮质(VMPFC:Ventromedial Prefrontal Cortex)
前扣带回皮质(ACC:Anterior Cingulate Cortex)
小脑蚓部(Cerebellar Vermis),
左侧丘脑(Left Thalamus),
右下顶叶(Right Inferior Parietal Lobe),
右侧尾状核(Right Caudate Nucleus),
右中枕叶(Right Middle Occipital Lobe),
右中扣带回皮质(Right Middle Cingulate Cortex)
但是,所采用的脑区并不限定于这样的区域。
例如,也可以根据作为对象的神经/精神疾病来变更所选择的区域。
图4是表示针对如图3所示的ROI提取表示静息态的功能连接的相关性的相关矩阵(correlation matrix)的过程的概念图。
如图4所示,根据实时地测定出的静息态的fMRI的n个(n:自然数)时刻的fMRI数据,计算各ROI的平均的“活动度”,计算脑区域间(ROI间)的活动度的相关值。
在此,作为ROI,如上述那样考虑140个区域,因此,当考虑对称性时,相关矩阵中的独立的非对角元素为:
(140×140-140)/2=9730(个)
此外,在图4中,在图上仅示出34×34的相关性。
这种相关矩阵的元素的计算没有特别限定,例如能够如以下那样执行。
根据静息态脑活动数据,针对各受验者来计算不同的ROI间的功能性连接(Functional connectivity,FC)。FC是在静息态脑活动分析中一般利用的特征量,由不同的ROI的时间序列信号间的皮尔逊相关系数来定义。
首先,提取各ROI所包含的全部体素的平均信号的时间序列。
接着,为了从信号值去除噪声而使用带通滤波器,之后,进行基于9个解释变量(全脑、白质、脑脊髓液的平均信号以及6个身体动作校正参数)的回归。
将回归后的残差序列认为是与功能性连接关联的时间序列信号值,在不同的ROI的时间序列之间计算皮尔逊相关系数。
关于ROI,除了脑沟图谱(Brain Sulci Atlas:BAL)所包含的137个ROI以外,还使用自动解剖标记图谱(Automated Anatomical Labeling Atlas)的小脑(左右)和蚓部的ROI。将这总计140个ROI间的功能性连接FC用作特征量。
在此,关于脑沟图谱(BAL)和自动解剖标记图谱,有以下的公开。
文献:Perrot et al.,Med Image Anal,15(4),2011
文献:Tzourio-Mazoyer et al.,Neuroimage,15(1),2002
图5是说明根据如图4中说明那样的相关矩阵来生成成为生物标记物的判别器的过程的概念图。
如图5所示,数据处理部32根据在健康组、患者组中测定出的静息态功能连接MRI的数据,针对各个受验者通过后面说明那样的过程来导出脑区域间(ROI间)的活动度的相关矩阵。
接着,由数据处理部32通过正则化典型相关分析对包括受验者的疾病/健康标签在内的受验者的属性以及相关矩阵进行特征提取。“正则化”一般是指如下方法:在机器学习和统计学中,对误差函数追加利用超参数进行了加权的正则化项来对模型的复杂度和自由度加以抑制,从而防止过学习。此外,在正则化典型相关分析的结果、对于解释变量还同时实现了稀疏化的情况下,特别地称为稀疏典型相关分析(Sparse Canonical Correlation Analysis:SCCA)。下面,作为具体例,设进行稀疏典型相关分析来进行说明。
而且,在这种稀疏典型相关分析中,如后所述,在通过调节超参数的值来使得存在仅与“诊断标签”连接的典型变量时,提取出与其对应的典型变量所连接的功能性连接FC。当在规定范围内改变超参数时,在存在满足这种条件的典型变量的范围内提取出的功能性连接FC的并集被称为“第一并集”。
并且,通过数据处理部32,将进行稀疏正则化典型相关分析所得到的“第一并集”作为解释变量,例如进行留一法交叉验证(Leave-One-Out Cross Validation:LOOCV)来在各交叉验证的步骤中进行利用稀疏逻辑回归的判别分析,遍及全部交叉验证地作为解释变量而提取出的功能性连接FC的并集被称为“第二并集”。
最后,对于全部受验者的数据,将“第二并集”作为解释变量,对作为目的变量的“诊断标签”进行利用稀疏逻辑回归的判别分析,来生成判别器。
此外,如后面说明的那样,健康组和患者组的数据不限于由MRI装置10本身来测定的情况,也可以将在其它MRI装置中测定出的数据也合并来进行判别器的生成。另外,更一般地说,数据处理部32无需一定是用于执行MRI装置的控制的计算机,也可以是专用于接收来自多个MRI装置的测定数据来进行判别器的生成处理并通过所生成的判别器进行判别处理的计算机。
图6是用于进行如图5中说明那样的判别器的生成处理以及利用所生成的判别器进行的判别处理的功能框图。
首先,在非易失性存储装置2080中保存有MRI测定数据3102和多个人属性信息3104,该MRI测定数据3102是由MRI装置按时间序列对表示多个受验者各自的脑内的多个规定区域中的脑活动的信号进行预先测定所得到的信号的信息,该多个人属性信息3104与被测量出MRI测定数据的各受验者相关联。
在此,“人属性信息”包括用于确定受验者个人的“人特性信息”以及用于确定针对各受验者的测定条件的“测定条件信息”。
“人特性信息”是指针对受验者的诊断标签、年龄、性别、给药史等信息。
“测定条件信息”是指用于确定对受验者进行测定的测定地点信息(包括确定进行测定的设施和/或进行测定的装置的信息)以及在测定中是睁眼还是闭眼进行测量及测定磁场强度等测定条件的条件。
运算装置2040基于MRI测定数据3102以及对应的人属性信息3104来进行生成针对诊断标签的判别器的处理。
相关矩阵计算部3002根据MRI测定数据3102,按每个受验者来计算多个规定区域间的脑活动的功能性连接的相关矩阵。计算出的功能性连接的相关矩阵的数据作为功能连接的相关矩阵的数据3106来按每个受验者地保存在非易失性存储装置2080中。
第一特征选择部3004对于从多个受验者提取出的K个(K:2以上的自然数)不同的子集,依次选择1个子集,对于除选择出的子集以外的(K-1)个子集,通过对多个属性信息和相关矩阵的元素的稀疏典型相关分析,来提取与仅同多个人属性信息中的特定的属性信息、例如诊断标签对应的典型变量连接的相关矩阵的元素。并且,第一特征选择部3004获取遍及被依次选择的子集地提取出的相关矩阵的元素的并集即第一并集,将该第一并集作为第一功能连接并集数据3108保存到非易失性存储装置2080。此外,“第一功能连接并集数据”也可以是用于确定功能连接的相关矩阵的数据3106中的与第一并集对应的元素的索引。
在将多个受验者中的除上述K个子集以外的其余的受验者作为测试集并将测试集分为不同的N个组时,第二特征选择部3006以从多个受验者将N个组中的选择出的1个组去除的受验者的集为对象,基于第一并集,通过稀疏逻辑回归来计算用于估计上述特定的属性信息(例如,诊断标签)的测试判别器,伴随稀疏化来提取作为测试判别器的解释变量的相关矩阵的元素。第二特征选择部3006还从N个组中依次选择1个组,来重复特征提取,获取作为测试判别器的解释变量而提取出的相关矩阵的元素的并集即第二并集,将该第二并集作为第二功能连接并集数据3110保存到非易失性存储装置2080。此外,“第二功能连接并集数据”同样也可以是用于确定功能连接的相关矩阵的数据3106中的与第二并集对应的元素的索引。
此外,N个组各自的元素的个数也可以是1个。
判别器生成部3008将第二并集作为解释变量,通过稀疏逻辑回归来计算用于估计特定的属性信息(例如,诊断标签)的判别器。判别器生成部3008将用于确定所生成的判别器的信息作为判别器数据3112保存到非易失性存储装置2080。
判别处理部3010基于根据判别器数据3112确定的判别器来对输入数据进行判别处理。
此外,在上述的说明中,设判别器生成部3008将第二并集作为解释变量来生成判别器来进行说明,但是,例如,判别器生成部3008也可以直接将第一并集作为解释变量来生成判别器。但是,如后面说明的那样,从维数的减少以及泛化性能的观点出发,期望将第二并集作为解释变量。
此外,在生成判别器时,能够使用利用了正则化法(例如,L1正则化或L2正则化)的逻辑回归即正则化逻辑回归,更具体地说,例如也能够使用上述的“稀疏逻辑回归”。另外,在判别器的生成中,也可以使用支持向量机或LDA(Linear discriminant analysis:线性判别分析)等。下面,取稀疏逻辑回归为例来进行说明。
如后面说明的那样,也可以与第二特征选择部3006的特征选择处理并行地进行交叉验证,该交叉验证是通过以下方式进行的:从N个组中依次选择被去除的1个组,通过由第二特征选择部3006计算出的测试判别器,将被去除的组作为测试样本来计算判别结果。
通过像这样利用成为嵌套结构的特征选择过程来进行解释变量的维数的缩小,能够在第二特征选择部3006所进行的处理中使用几乎所有受验者的数据,另一方面,能够执行在时间上高效的维数的数量的缩小。
并且,通过使第二特征选择部3006的处理中的测试集相对于为了缩小维数的数量而使用的数据组而言独立,能够避免得到极度乐观的结果。
图7是用于说明为了生成成为生物标记物的判别器而由数据处理部32进行的处理的流程图。
下面,参照图7来更详细地说明图5中说明的处理。
基于根据静息态的fMRI数据导出的脑区之间的连接以及受验者的疾病的判别标签(诊断标签)来制作生物标记物时的最大问题在于,与数据的数量相比,数据的维数压倒性地多。因此,若不进行正则化而使用该数据组来进行用于预测诊断标签(在此,将表示受验者是患有疾病还是健康的标签称为“诊断标签”)的判别器的学习,则判别器过拟合(over-fit),对于未知数据的预测性能显著下降。
在此,一般在机器学习中,将以用更少数量的解释变量来解释观测数据的方式进行的处理称为“特征选择(或特征提取)”。在本实施方式中,将以下处理称为“提取缩略表达”:从“脑区域间(ROI间)的活动度的多个相关值(多个连接)”中进行特征选择(特征提取)使得在用于预测作为对象的诊断标签的判别器的机器学习中能够以更少的相关值来构成判别器,即,选择更重要的相关值来作为解释变量。
而且,在本实施方式中,作为特征提取法,使用正则化法。这样,在典型相关分析中,执行正则化并且执行稀疏化,来留下更重要的变量来作为解释变量,在以这种方式进行处理的意义上,将这种处理称为“稀疏典型相关分析”。更具体地说,例如,作为用于同时实现稀疏化的正则化法,能够使用如以下说明那样的称为“L1正则化”的、对典型相关分析的参数的绝对值的大小加以惩罚(penalty)的方法。
即,参照图7,当开始判别器生成的处理时(S100),数据处理部32从存储部36读出各受验者的MRI测定数据(S102),通过稀疏典型相关分析来进行第一特征提取的处理(S104)。
下面,将步骤S104的处理称为“内环特征选择”。
在此,下面针对“稀疏典型相关分析”和“内环特征选择”分别进行说明,以对步骤S104中的内环特征选择的处理进行说明。
(稀疏典型相关分析)
下面,作为稀疏典型相关分析,对L1正则化典型相关分析进行说明。在以下的文献中公开了该L1正则化典型相关分析。
文献:Witten DM,Tibshirani R,and T Hastie.A penalized matrix decomposition,with applications to sparse principal components and canonical correlation analysis.Biostatistics,Vol.10,No.3,pp.515-534,2009.
首先,在一般的典型相关分析(Canonical Correlation Analysis:CCA)中,在考虑变量对x1和x2时,设各个变量x1和x2被标准化成具有平均值0、标准偏差1。
一般来说,通过使用典型相关分析,能够识别成对的观测量之间的潜在的关系。
具体地说,在典型相关分析中,找出投影向量使得成对的被投影的变量(典型变量)具有最大的相关性。
与此相对,在对典型相关分析导入L1正则化的情况下、即在使用利用L1范数标准化的稀疏CCA、即L1-SCCA的情况下,对如以下那样的优化问题进行求解。
考虑如以下那样的变量的组。
[数1]
设在存在变量和变量的N个组的观测量的情况下,
表示由第一变量的组形成的N×p1矩阵,
表示由第二变量的组形成的N×p2矩阵。
在此也设构成矩阵X1和X2的列分别被标准化成平均值为0、方差为1。
这样一来,L1-SCCA能够公式化为下面的式(1)那样。
[数2]
在此,超参数λ1及λ2分别表示权重参数w1及w2的(利用w1及w2,对应的变量被稀疏化,因此称为“稀疏投影向量”)稀疏化的程度。
具体地说,作为本实施方式的例子,设构建相当于上述的变量的2个数据矩阵,以识别人属性信息和功能性连接FC的潜在的关系。
下面,设受验者包括自闭症的患者组(将诊断标签表示为“ASD(Autism Spectrum Disorder:自闭症谱系障碍)”)和正常发育组(将诊断标签表示为“TD(Typically Developing:典型发展)”)。第一数据矩阵X1的行表示1个受验者的人属性信息(人特性信息和测定条件信息),例如,该特性信息、测定条件信息包含以下的内容:
i)诊断标签(ASD或TD),
ii)地点信息(在哪里测量出受验者的脑活动,地点A、B、C)
iii)年龄
iv)性别
v)拍摄条件(睁眼或闭眼)
vi)给药的状态1(抗精神病药)
vii)给药的状态2(抗抑郁药)
viii)给药的状态3(精神稳定剂)
具体地说,人属性信息数据矩阵X1的列数是10,也就是说p1=10。
最初的列包含1(=ASD)或0(=TD)。
接下来的3个列表示测量脑活动的设施(场所),在该情况下,相当于在3个不同的地点进行了测量,包含[100](地点A)、[010](地点B)或[001](地点C)中的任一个。
第五列包含受验者的年龄的值,第六列包含受验者的性别的信息、即1(男性)或0(女性)中的任一个值,第七列包含测定条件中的表示在测定中受验者是睁开眼睛还是闭上眼睛的1(睁眼)或0(闭眼)的值。另外,最后的3个列包含与3个药剂的给药史有关的状态信息,各个列包含1(存在药物治疗)或0(没有药物治疗历史)的值。
此外,人特性信息和测定条件信息不限定于如上所述的内容,例如也可以包含受验者的其它药剂的给药史的信息等其它特性、其它测定条件、例如MRI装置的施加磁场的大小等条件的信息。
设第二数据矩阵X2将表示受验者的功能性连接的相关性(FC)的相关矩阵的非对角的下三角的部分的元素表达为行向量形式。
而且,L1-SCCA被应用于矩阵的对X1及X2,然后导出稀疏投影向量w1及w2。
而且,如上所述,设为满足如下条件:在将超参数λ1及λ2设定为规定的值时,通过稀疏化利用稀疏投影向量w1使第一数据矩阵X1投影到仅作为特定的人属性信息、在该情况下为“诊断标签”的典型变量。在该情况下,在对应的第二数据矩阵X2中,使用稀疏投影向量w2以确定索引(元素),该索引用于确定仅与诊断标签关联的功能性连接的相关矩阵元素。
即,在内环特征选择中,L1-SCCA的超参数λ1及λ2例如能够以0.1的大小的步长在0.1与0.9之间独立地变更。
但是,使超参数λ1及λ2可变的范围以及改变的步长的大小不限定于这种例子。
对于L1-SCCA的处理,找出使得存在仅与“诊断”标签连接的典型变量的超参数λ1及λ2的范围。
在之后说明的实验条件中,平均来说,在上述的例子中,满足该约束条件的λ的组合的量为整体为45个可能的组合中的17.6±5.0%。
如以下那样表达将原本的相关矩阵元素投影到由所导出的稀疏投影向量w2的不是零的元素规定的部分空间。
在此,为了表示稀疏投影向量w2的第k个不是零的元素的索引,定义变量ik。在此,1≤k≤m,m表示不是零的元素的数量。
然后,考虑在如以下那样的向部分空间投影的投影矩阵E。
[数3]
在此,是在第ik个要素处包含“1”、在其它要素处包含“0”的标准基向量。
最后,通过如以下那样对原本的相关矩阵元素向量x2进行投影,能够导出向部分空间z∈Rm的向量。
[数4]
z=Ex2 (2)
作为结果,能够选择与诊断标签(ASD/TD)关联的特定的数量的特征量(相关矩阵元素)。
通过选择与仅同诊断的标签有关系的典型变量相当的相关矩阵元素,能够选择对于分类而言根本性的相关矩阵元素。
(内环特征提取)
图8是用于说明内环特征选择的概念图。
在图7的步骤S104的内环特征选择中,如图8中说明的那样,将受验者的集分割为K个(K:2以上的自然数),针对(K-1)个子集中的除1个集以外的其余的子集来执行上述的L1-SCCA,将这种处理重复(K-1)次。
即,如图8的(a)所示,与受验者的集中的(K-1)/K(例如,若K=9则为8/9)相当的子集(下面将其称为“内环训练数据”)被使用于这种内环特征选择。K个子集中的其余的1个在之后说明的外环特征选择中被用作包含作为训练对象的测试数据的“测试池”,因此在内环特征选择中不被使用。
如图8的(b)所示,以使超参数λ1及λ2在规定的范围内每次变化规定步长的方式,针对(K-1)个子集中的除1个集(在图8的(b)中以斜线表示)以外的其余的子集执行L1-SCCA。在特定的超参数λ1及λ2的范围内,提取与仅同“诊断”标签有关联的典型变量有关系的功能性连接元素FC来作为特征量。
针对(K-1)个子集中的依次改变要去除的1个集所得到的子集,来反复进行这种提取处理。
在各反复中,将提取出的功能性连接的相关矩阵的元素FC的并集作为“在内环中选择出的功能性连接元素FC的并集”(第一并集)。
通过进行这种处理,相当于干扰变量NV的、不同的拍摄地点处的人属性信息和不同的拍摄地点处的拍摄条件的不同所引起的不适当的影响被缩小。
如后面说明的那样,该过程例如有助于将基于来自日本内的多个拍摄地点的MRI测量数据生成的判别器鲁棒地泛化至外国、例如美国。
再次返回到图7,接着,数据处理部32基于内环特征选择的结果,使用稀疏逻辑回归来执行第二特征提取的处理(S106)。
下面,将步骤S106的处理称为“外环特征选择”。
在此,下面对“稀疏逻辑回归”和“外环特征选择”分别进行说明,以对步骤S106中的外环特征选择的处理进行说明。
(稀疏逻辑回归)
稀疏逻辑回归是将逻辑回归分析扩展到贝叶斯估计的框架内的方法,是将特征向量的维数压缩与用于判别的权重估计同时进行的方法。稀疏逻辑回归在数据的特征向量的维数非常高、包含大量不需要的特征量的情况下有用。针对不需要的特征量,将线性判别分析中的权重参数设为零(即进行特征选择),仅取出与判别相关联的极少数的特征量(稀疏性)。
针对通过稀疏逻辑回归得到的特征数据,按分出的每个类别求出该特征数据属于该类别的概率p,将该特征数据分配到输出了最大值的类别。p是通过逻辑回归式来输出的。权重的估计是通过ARD(Automatic Relevance determination:自动相关性确定)来进行的,通过使对类别判别的贡献少的特征量的权重接近0来将该特征量从计算中排除。
即,将使用上述的L1正则化CCA提取出的特征量的第一并集作为输入,使用基于接下来的分层贝叶斯估计的判别器,来进行诊断标签的预测。
在此,为了根据利用上述的式(2)提取出的特征输入z(选择出的FC)来预测诊断的标签为疾病(在此,诊断为自闭症)的概率,将逻辑回归用作判别器。
[数5]
在此,y表示诊断类别/标签,也就是说,y=1表示ASD类别,y=0表示TD类别。
另外,以下的z帽(将在字符的顶部标有^的字符称为“帽”)是具备扩展输入的特征向量。
[数6]
在此,根据1个受验者的静息态MRI样本的连接相关矩阵,按照式(2)来提取特征向量z。
使用扩展输入“1”是用于导入针对判别器的固定的(偏置)输入的标准方法。
如以下那样的θ是逻辑函数的参数向量。
[数7]
θ∈Rm+1
将此时的参数θ的分布设定为如以下那样的正态分布。
[数8]
p(θ|α)=N(θ|0,diag(α))
并且,如以下那样设定参数w的分布的超参数α的分布,由此通过进行分层贝叶斯估计来估计各个参数的分布。
[数9]
在此,a0、b0是决定超参数的伽玛分布的参数。α是表达向量θ的正态分布的方差的参数向量,该向量的第i个元素是αi。
此外,在以下的文献中公开了这种稀疏逻辑回归。
文献:Okito Yamashita,Masa aki Sato,Taku Yoshioka,Frank Tong,and Yukiyasu Kamitani.“Sparse Estimation automatically selects voxels relevant for the decoding of fMRI activity patterns.”NeuroImage,Vol.42,No.4,pp.1414-1429,2008.
(外环特征选择)
图12是用于说明外环特征选择的概念图。
在图7的步骤S106的外环特征选择中,如图12中说明的那样,将在进行内环特征选择时将受验者的集分割为K个(K:2以上的自然数)后的在内环特征选择中使用的(K-1)个子集去除后剩余的1个子集用作包含作为训练对象的测试数据的“测试池”。
即,如图12所示,例如,将该测试池分割为L个组,从该L个组依次选择1个组(在图12的虚线方框内以斜线表示),针对受验者的集的除被选择的组以外的受验者,将作为第一并集的功能性连接的相关矩阵的元素FC作为解释变量,通过稀疏逻辑回归来生成预测诊断标签的判别器。此时,通过稀疏逻辑回归,还选择“功能性连接的相关矩阵的元素FC”。将其称为“在外环中选择出的功能性连接的相关矩阵的元素FC”。
将像这样从L个组依次选择1个组来将这种处理反复L次、由此提取出的功能性连接的相关矩阵的元素FC的并集作为“在外环中选择出的功能性连接元素FC的并集”(第二并集)。
这样,在外环特征提取中使用的测试集始终独立于在内环特征提取中为了缩小维数而使用的数据组。
此外,在此,作为一例,特别地设为L个组中的各个组包含1个受验者。在该情况下,在上述反复处理中,利用所生成的判别器来针对被去除的1个受验者进行预测处理,对针对该被去除的1个受验者的诊断标签与预测结果之间的误差进行累积处理相当于进行所谓的留一法交叉验证(Leave-One-Out Cross Validation:LOOCV)。因而,在图12的处理中,也能够在各反复处理中计算上述的误差,对该误差进行累积并针对L次进行平均,由此进行所生成的判别器的交叉验证、换言之泛化能力的评价。
(判别器的生成)
再次返回到图7,接着,数据处理部32基于外环特征选择的结果(第二并集),通过稀疏逻辑回归来执行判别器的生成处理(S108)。
图14是表示步骤S108中的判别器的生成处理的概念的图。
如图14所示,在步骤S108中,将从第一并集通过外环特征选择而提取出的第二并集作为解释变量,通过针对全部受验者的稀疏逻辑回归来生成判别器。
用于确定所生成的判别器的判别器数据(与函数形式和参数有关的数据)3112被保存到非易失性存储装置2080,在之后被输入与在如以上那样的训练中使用的数据不同的MRI测定数据(测试数据)时,该判别器数据使用于执行对于测试数据的诊断标签的估计时的判别处理。
即,测定基于事前的医师的诊断被分为健康组、患者组的受验者的脑区域间(ROI间)的活动度的相关性(连接),通过对测定结果的机器学习,来生成判别器以判别与不同于这些受验者的新的受验者有关的测试数据是相当于疾病还是相当于健康,该判别器作为精神疾病的生物标记物发挥功能。
此时,由于判别器是通过逻辑回归来生成的,因此作为生物标记物的输出的“诊断标签”也可以包含有疾病的概率(或者健康的概率)。例如,作为“疾病的概率为○○%”这样的显示来输出。能够将这种概率用作“诊断标记物”。
另外,成为判别器的输出的属性不一定限于疾病的判别,也可以是与其它属性有关的输出。在该情况下也是,既可以输出该属性属于哪一个类别这样的离散性的判别结果,也可以输出该属性属于某个类别的连续性的值、例如概率。
即,在生物标记物的学习(制作)中,为了制作精神疾病的生物标记物,将静息态功能性连接MRI(rs-fcMRI)数据作为输入,通过上述的内环特征选择和外环特征选择来进行特征提取,通过将提取出的特征量作为解释变量而生成的判别器来进行疾病、健康标签判别。
(内环特征选择中的处理)
图9是用于说明内环特征选择处理的概念的图。
图10是表示作为一例进行了内环特征选择时的反复处理中的对于特定的超参数λ1及λ2的结果的图。
参照图9,在成为嵌套结构的特征选择中,表示L1-SCCA的反复中的1个,在此,典型变量仅与“诊断标签”连接。
在图9中,将典型变量仅与“诊断标签”连接表示为利用实线将诊断标签与仅1个典型变量w1Tx1连接。
另外,将典型变量w1Tx1与典型变量w2Tx2连接的虚线的上的记号cj表示各个典型变量间的相关系数。
在典型变量w1Tx1仅与“诊断标签”连接时,与对应的典型变量w2Tx2连接的功能连接的相关矩阵的非对角的下三角矩阵的元素被选作特征量。
在图10中,作为例子,在最初的外环之中,示出针对各人属性信息生成至少1个典型相关的最小的超参数的组合(在此,λ1=0.4,λ2=0.2)。
利用圆来表示典型变量。
左列的圆表示源自人特性信息和测定条件的典型变量w1Tx1。另一方面,右列的圆表示源自功能性连接(FC)的典型变量w2Tx2。
如上所述,连接典型变量的虚线的上的数字表示典型变量w1Tx1与w2Tx2之间的相关系数。
人属性信息的标签和典型变量w2Tx2之间的连接表示为实线或虚线。
在该例子中,尝试关注分别表示“诊断”标签及“性别”和“睁眼/闭眼条件”的第1个典型变量与第6个典型变量之间的重叠(overlap)。
与第一个典型变量关联的功能连接的相关矩阵的元素的数量为745个,与第六个典型变量关联的功能连接的相关矩阵的元素的数量为659个,功能连接的相关矩阵的元素的重叠的数量为141。
并且,通过外环特征选择进行选择,与第6个典型变量重叠的功能连接的相关矩阵的元素的数量变为仅1个。
另外,使典型变量具有与“诊断”标签的仅1个连接的λ的组合的平均值为组合的整体的17.6±5.0%。
作为平均值,与“诊断”标签的典型变量关联的功能连接的相关矩阵的元素的数量为925±798。
(内环特征选择中的处理)
图11是用于更详细地说明内环特征选择的处理的流程图。
在内环特征选择时,如图8的(a)所示,受验者的集被分为K个子集,除其中的特定的1个子集以外的(K-1)个子集被使用。
参照图11,当开始内环特征选择的处理时,运算处理装置(CPU)2040将超参数λ1及λ2设定为作为初始值的(λ1,λ2)=(0.1,0.1)(S200)。
接着,变量i的值被设定为1(S202),在i的值不超过内环特征选择的反复次数(K-1)的情况下(S204中“否”),CPU 2040去除内环训练数据中的第i个数据块,基于非易失性存储装置2080中保存的受验者的人属性信息3104和功能连接的相关矩阵数据3106来执行稀疏典型相关分析(S206)。
在当前的(λ1,λ2)的值的组存在仅与诊断标签连接的典型变量的情况下(S208中“是”),CPU 2040提取与仅同诊断标签连接的典型变量对应的功能性连接的相关矩阵的元素(FC),存储到非易失性存储装置2080(S210)。在步骤S210的处理之后或者当前的(λ1,λ2)的值的组不存在仅与诊断标签连接的典型变量的情况下(S208中“否”),使i的值增加1,处理恢复为步骤S204。
因而,CPU 2040将步骤S206~S212的处理重复(K-1)次。
在步骤S204中,在i的值超过内环特征选择的反复次数(K-1)的情况下(S204中“是”),CPU 2040针对(λ1,λ2),按照规定的规则将λ1及λ2中的任一方改变规定的步长量(S214)。在步骤S216中,在(λ1,λ2)的值处于可变范围内时(S216中“是”),CPU 2040使处理恢复为步骤S202。
当针对(λ1,λ2)的可能的全部值的组的处理结束时(S216中“否”),CPU 2040求出在至此为止的处理中提取出的功能性连接的相关矩阵的元素(FC)的并集,将该并集作为第一功能连接并集数据3108保存到非易失性存储装置2080,由此处理结束。
(外环特征选择中的处理)
图13是用于更详细地说明外环特征选择的处理的流程图。
在外环特征选择时,如图12所示,受验者的集被分为K个子集,其中的在内环特征选择中未被使用的1个子集被用作测试池。设该测试池所包含的受验者的人数为NT人。
另外,下面,作为一例,设进行留一法交叉验证(LOOCV)处理来进行说明。
参照图13,当开始外环特征选择的处理时,运算处理装置(CPU)2040将变量i的值设定为1(S300),在i的值不超过外环特征选择的反复次数NT的情况下(S302中“否”),CPU 2040去除测试池中的第i个数据,基于非易失性存储装置2080中保存的受验者的人属性信息3104和功能连接的相关矩阵数据3106来执行稀疏逻辑回归(SLR),生成测试判别器(S304)。
接着,CPU 2040通过所生成的测试判别器来计算对于被去除的第i个数据的利用SLR得到的预测值(S306)。
并且,CPU 2040将通过生成测试判别器时的稀疏化而提取出的功能性连接FC作为所选择出的特征量来保存到非易失性存储装置2080,使变量i的值增加1(S310)。
在S304~S308的处理被重复NT次之后,当变量i的值超过NT时(S302中“是”),CPU 2040计算作为LOOCV的平方误差估计值(S312)。
接着,CPU 2040通过NT次的重复处理,求出所提取出的功能性连接FC的并集(第二并集),将该并集作为第二功能连接并集数据3110来保存到非易失性存储装置2080,处理结束。
(判别器的生成处理)
图14是用于说明最终生成判别器的过程的概念图。
如图14所示,在判别器生成处理中,通过内环特征选择处理和外环特征选择处理,将最终提取出的第二功能连接并集数据3110作为解释变量,针对受验者全员,通过稀疏逻辑回归来生成判别器。
(最终选择出的功能连接的相关矩阵的元素)
图15是表示针对181个日本人受验者(ASD患者组74人、正常发育组107人)最终选择出的功能连接的相关矩阵的元素的图。
在上述的例子中,为了ASD/TD判别器,选择出16个功能性连接的相关矩阵的元素(FC)。
图15的(a)是从头顶部侧观察到的图,图15的(b)是从后头部侧观察到的图,另外,图15的(c)是从左侧头部侧进行观察时的图。
另外,图16是从与图15对应的侧分别观察全部9730个功能性连接的相关矩阵的元素(FC)的图。
在图15中,如下面那样对由16个FC连接的29个末端区域标注编号:
在前额叶,额上回(1)、额中回(2)、额下回(3左以及4-7、右)以及直回(8);
在颞叶,颞上回(9)、颞中回(10)、颞下回(11)、海马旁回(12)以及梭状回(13);
在顶叶,顶上小叶(14)以及中央后回(15);
在枕叶,枕中回(16)、枕叶的楔叶(17、左;18、右)以及距状裂(19);
在大脑边缘系统,前扣带回(20)、中扣带回(21-22)、后扣带回(23)以及杏仁核(24);
在基底神经节,尾状核(25左;26右)、苍白球(27)、丘脑(28)以及小脑(29)
(在LOOCV之中选择出的最终16个FC的重要性)
在以自闭症为对象来进行说明的例子中,将通过内环和外环的特征选择而缩小后的FC的子集作为解释变量,使用181个日本人的数据组,通过稀疏逻辑回归来选择出最终被组入到判别器的16个功能性连接FC。
下面研究最后选择出的16个功能性连接FC究竟是否是在整个外环的过程中以大的权重被频繁地选择的。这对于最后选择出的16个功能性连接FC的稳定性和鲁棒性而言是重要的。
为了这种研究,利用下面的式(4)来定义用于第k个FC(k=1,2,…,9730)的累积性的绝对权重。
[数10]
在此,N=181是LOOCV次数(也就是说受验者的数量),wik是与第i个LOOCV的第k个功能性连接FC关联的权重。
累积性的权重cik是更大的值意味着:在整个LOOCV中,对ASD和TD分类而言第k个功能性连接FC做出更重要的贡献。
图17是表示48个非零的cik的大小的分布的图。
当尝试对它们按大小排序时可知:所选择的16个功能性连接FC(黑色)表示在LOOCV中至少被选择了1次的48个功能性连接FC(灰色)中的重要的子集。
因而,能够得到以下结论:最后选择出的16个FC对于181人的LOOCV的子集而言稳定且鲁棒,能够信赖。
累积性的绝对权重更大表示该功能性连接FC对判别器有更大的贡献。
(生物标记物的验证)
图18是表示如以上那样生成的生物标记物的验证过程的概念图。
使用基于在日本内的地点A~地点C得到TD组107人和ASD患者组74人的数据通过学习而提取出的功能性连接FC以及用于判别的参数,对未使用于该参数学习的数据进行疾病/健康标签的预测,评价与实际的疾病的判别标签的匹配性。
图19是表示如上所述的地点A~C的受验者的属性的数据的图。
在地点A和地点B,实施针对TD组和ASD患者组这两方的测量,在地点C,实施针对TD组的测量。
在此,用指标来表示“惯用手”。在以下的文献中公开了这种指标。
Oldfield,R.C.(1971).The assessment and analysis of handedness:the Edinburgh inventory.Neuropsychologia 9,97-113.
这是用于观察惯用手、也就是说ASD与左右脑的优势之间的关联性的数据。
IQ表示智能指数。
图20是表示如以上说明那样的生物标记物的泛化性能的图。
当使用如以上说明的那样的生物标记物的生成法时,对于日本内的不同的3个地点的数据示出了82%的判别性能。另外,在使用利用了相同的参数的生物标记物、并将在美国的7个地点处测量出的rs-fcMRI数据用作输入的情况下,示出了75%以上的判别性能。
在图20中,对美国地点的泛化在超越了人种、国别的诊断基准这个意义上示出了通过基于有限的受验者数据的学习来得到的生物标记物的性能之高。
图21是表示这种在美国的受验者的属性的图。
在图中,地点ID分别表示以下。
CAL:加州州立理工大学;
CMA:卡耐基梅隆大学;
NYU:纽约大学;
OLN:Institute of Living at Hartford Hospital(哈特福德医院生活研究所);
PIT:匹兹堡大学医学部;
TTY:Trinity Centre for Health Sciences(三一健康科学中心)
USM:犹他大学医学部。
(多疾病生物标记物)
此外,在以上的说明中,在SCCA中的基准变量中,诊断标签与1个疾病有关。
但是,若在以rs-fcMRI数据为解释变量时将多个疾病的标签用作疾病标签,则还能够作为多疾病生物标记物来利用。
即,在该情况下,疾病标签包含用于针对多个疾病各自区分疾病与健康的标签。
例如,作为上述的诊断标签,包括“自闭症”的诊断标签、“精神分裂症”的诊断标签、“抑郁症”的诊断标签、“强迫性障碍”的诊断标签等。
这种诊断标签不过是假想的例示,通过利用上述的针对rs-fcMRI数据的(SCCA+SLR)法来研究到目前为止被称为不同病名的疾病、对各个疾病下的处方药物等的影响与脑活动之间的关系,能够提取各自的相互关系。
作为给药史标签,除了如“精神药物1”“精神药物2”那样药物的种类以外,还包括各药物的用量、给药期间等信息。
作为测定条件,除了如上所述的fMRI拍摄装置的性能(例:施加磁场强度)以外,还包含是在睁眼状态还是闭眼状态下进行了测定这样的信息。
并且,作为受验者的特性信息,包括性别、年龄等信息。
[实施方式2]
在实施方式1中,说明了以下结构:对利用脑活动测量装置(fMRI装置)在多个测定场所测量出的脑活动数据进行测量,基于该脑活动数据,通过利用同一计算机的处理或分散处理来进行生物标记物的生成和利用生物标记物的诊断标签的估计(预测)。
但是,也能够构成为在不同的设施中分散地分别执行以下内容:i)用于通过机器学习来训练生物标记物的脑活动数据的测量(数据收集);ii)通过生物标记物的机器学习进行的生成处理和针对特定的受验者的利用生物标记物的诊断标签的估计(预测)的处理(估计处理);以及iii)针对上述特定的受验者的脑活动数据的测量(对象者的脑活动测量)。
图22是表示分散地处理数据收集、估计处理以及对象者的脑活动测量的情况下的一例的功能框图。
参照图22,地点100.1~100.N是通过脑活动测量装置来测量患者组、健康组的数据的设施,管理服务器200对来自地点100.1~100.N的测量数据进行管理。
计算机300根据服务器200中保存的数据来生成判别器。
MRI装置410设置于利用计算机300上的判别器的结果的另一地点,针对特定的受验者来测量脑活动的数据。
计算机400设置于设置有MRI装置410的另一地点,根据MRI装置410的测定数据来计算特定受验者的脑的功能连接的相关数据,将功能连接的相关数据发送到计算机300,利用返回来的判别器的结果。
服务器200保存从地点100.1~100.N发送来的患者组和健康组的MRI测定数据3102以及与MRI测定数据3102相关联的受验者的人属性信息3104,随着来自计算机300的访问来将这些数据发送到计算机300。
计算机300经由通信接口2090接收来自服务器200的MRI测定数据3102和受验者的人属性信息3104。
此外,服务器200、计算机300、计算机400的硬件结构基本上与图2中说明的“数据处理部32”的结构相同,因此不重复其说明。
返回到图22,相关矩阵计算部3002、第一特征选择部3004、第二特征选择部3006、判别器生成部3008及判别处理部3010、以及功能连接的相关矩阵的数据3106、第一功能连接并集数据3108、第二功能连接并集数据3110及判别器数据3112与实施方式1中说明的相同,因此不重复其说明。
MRI装置410对作为诊断标签的估计对象的受验者的脑活动数据进行测量,计算机400的处理装置4040将测量出的MRI测定数据4102保存到非易失性存储装置4100。
并且,计算机400的处理装置4040基于MRI测定数据4102和MRI装置410的测量对象的受验者的人属性信息,与相关矩阵计算部3002同样地计算功能连接的相关矩阵的数据4106,将该数据保存到非易失性存储装置4100。
由计算机400的用户指定作为诊断的对象的疾病,按照该用户发送的指示,计算机400将功能连接的相关矩阵的数据4106发送到计算机300。与此相应地,判别处理部3010计算针对所指定的诊断标签的判别结果,计算机300经由通信接口2090将该判别结果发送到计算机400。
在计算机400中,借助未图示的显示装置等来对用户通知判别结果。
通过设为这种结构,能够基于针对更多的受验者收集到的数据来对更多的用户提供判别器对诊断标签的估计结果。
另外,也能够设为由分别的管理者来管理服务器200和计算机300的方式,在该情况下,也能够通过限制能够访问服务器200的计算机来提高服务器200中保存的受验者的信息的安全性。
并且,当从计算机300的运营主体的角度来看,即使对于“接受判别器的判别服务的一侧(计算机400)”完全不提供关于判别器的信息,也能够进行“提供判别结果的服务”。
此外,在以上的实施方式1和实施方式2的说明中,设作为用于通过脑功能成像法按时间序列测量脑活动的脑活动检测装置使用实时fMRI来进行了说明。但是,作为脑活动检测装置,能够使用上述的fMRI、脑磁图仪、近红外光测量装置(NIRS)、脑电图仪或它们的组合。例如,在使用它们的组合的情况下,fMRI和NIRS检测与脑内的血流变化相关联的信号,具有高空间分辨率。另一方面,脑磁图仪、脑电图仪具有以下特征:具有高时间分辨率,用于检测伴随脑活动的电磁场的变化。因而,例如若将fMRI与脑磁图仪相组合,则能够在空间上和时间上均以高分辨率测量脑活动。或者,若将NIRS与脑电图仪组合,则还能够将也同样地在空间上和时间上均以高分辨率测量脑活动的系统构成为小型、能够携带的大小。
通过如以上那样的结构,能够实现对于神经/精神疾病作为利用脑功能成像法的生物标记物而发挥功能的脑活动分析装置和脑活动分析方法。
另外,在以上的说明中,说明了在作为受验者的属性包括“诊断标签”的情况下通过利用机器学习生成判别器来使该判别器作为生物标记物而发挥功能的例子,但是本发明并不一定限定于这种情况,只要能够事前通过客观的方法将得到作为机器学习的对象的测定结果的对象受验者组分为多个类别,测定受验者的脑区域间(ROI间)的活动度的相关性(连接),通过对测定结果的机器学习来生成对于类别的判别器,则也可以用于其它判别。
另外,如上所述,这种判别也可以将属于某个属性的可能性显示为概率。
因而,例如,能够客观地评价采取某个“训练”、“行为模式”是否有助于增进受验者的健康。另外,即使处于实际上未达到疾病的状态(“未病”),也能够客观地评价某个如“食物”“饮料”等那样的摄取物、某个活动等是否在更接近健康状态的方面有效。
另外,即使在未病的状态下,只要如上所述那样例如输出“健康的概率为○○%”这样的显示,就能够对用户显示关于健康状态的客观数值。此时,所输出的不一定是概率,也可以将“健康度的连续值、例如健康的概率”变换为得分来进行显示。通过进行这种显示,本实施方式的装置除了能够用于诊断的辅助以外,还能够用作用于用户的健康管理的装置。
此外,在图22中,设从计算机400向计算机300仅发送功能连接的相关矩阵的数据4106来进行了说明。但是,未必限定于这种结构,例如也可以是以下结构:从计算机400向计算机300发送匿名化的状态的MRI测定数据4102和受验者的人属性信息。而且,也可以构成为:在计算机300中,计算功能连接的相关矩阵的数据3106,基于该数据,判别处理部3010计算针对指定的诊断标签的判别结果,计算机300经由通信接口2090将判别结果发送到计算机400。
此时,也可以是,从计算机400发送的匿名化的状态的MRI测定数据4102和受验者的人属性信息从计算机300被传输到服务器200,被保存到服务器200。在计算机300中,也能够基于这样储存的服务器200内的数据来执行机器学习,对判别处理部3010的判别器进行更新。
利用这种结构,也能够基于针对更多的受验者收集到的数据来对更多的用户提供判别器对诊断标签的估计结果。
本次公开的实施方式是用于具体实施本发明的结构的例示,并不限制本发明的技术范围。本发明的技术范围不是由实施方式的说明来表示,而是由权利要求书来表示,意图包括权利要求书的语句上的范围及等同的含义的范围内的变更。
产业上的可利用性
如以上那样,本发明能够应用于用于得到用于针对脑的活动状态来客观地判断健康或疾病的状态的数据的装置。另外,能够应用于针对神经/精神疾病的利用脑功能成像法的生物标记物装置。
附图标记说明
2:受验者;6:显示器;10:MRI装置;11:磁场施加机构;12:静磁场发生线圈;14:倾斜磁场发生线圈;16:RF照射部;18:床;20:接收线圈;21:驱动部;22:静磁场电源;24:倾斜磁场电源;26:信号发送部;28:信号接收部;30:床驱动部;32:数据处理部;34:显示控制部;36:存储部;38:显示部;40:输入部;42:控制部;44:接口部;46:数据收集部;48:图像处理部;50:网络接口。