买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:吉林大学;吉林大学第一医院
摘要:本发明属于脑电分析技术领域,具体涉及一种基于多领域特征和机器学习的早产儿脑功能年龄识别系统;采集早产儿脑电信号,对脑电信号进行降噪和数据分段,得到预处理后第一脑电信号;对第一脑电信号从多领域提取关键特征,包括时域特征、频域特征、非线性特征、以及基于脑功能连接网络的复杂图论特征;将提取到的时域特征、频域特征、非线性特征、复杂图论特征使用特征递归消除法进行特征选择并输入到随机森林中进行训练,得到训练好的随机森林回归模型;根据所述训练好的早产儿脑功能年龄识别系统输出目标早产儿脑电信号的脑功能年龄;本发明基于数据的机器学习建模方法,最大程度了挖掘了与早产儿脑功能年龄相关的脑电信号特征,并通过先进的特征选择方法筛选出效果最佳的特征组合,构建出了准确性高、泛化性强、可移植性高的预测模型,具有一定的理论价值与实际工程意义。
主权项:1.一种基于多领域特征和机器学习的早产儿脑功能年龄识别系统,其特征在于,包括数据采集与预处理模块、多领域特征提取模块、早产儿脑功能年龄识别模块;所述早产儿脑电采集与预处理模块用于处理早产儿脑电数据,分为以下步骤:步骤1:在早产儿静息状态下采集早产儿多通道EEG脑电信号,采集时长至少为1小时,具体采集通道名称为Fp1、Fp2、T3、T4、C3、C4、P3、P4、O1、O2、Cz、Pz,采集频率为500Hz;再将采集的多通道EEG脑电信号文件转换为txt格式文件,将txt文件中的非数值型数据删除,得到只含有数值的各通道脑电样本数据;步骤2:对步骤1得到的各通道脑电样本数据下采样至128Hz,并消除脑电样本数据中49Hz-51Hz范围内的工频噪声,进行截止频率为0.5Hz和30Hz的带通滤波;再去除眼动、心动和肌动伪影噪声以及采集设备引起的噪声,得到预处理结束的各单通道脑电数据;步骤3:从步骤2预处理结束后的各单通道脑电数据中提取20分钟的片断作为待处理数据,对待处理数据做双极性参考处理,得到20分钟长度的双极性通道脑电数据;将通过待处理数据得到的双极性通道脑电数据视为一个脑电样本;所述脑电信号多领域特征提取模块在不同领域从双极性通道数据中提取多维特征,包括时域特征、频域特征、非线性特征、基于脑功能网络的复杂图论特征,具体内容如下:1.提取时域特征所要提取的时域特征包括脑电信号的均值、标准差、偏度、峰度,在脑电样本中分别提取这四个时域特征,设xn表示脑电样本中一个双极性通道第n次采样得到的EEG信号值,N表示总采样数,四个时域特征的计算方式如下:所述均值指脑电样本内一个双极性通道的信号平均值,反映信号整体的平均水平,计算公式为: 所述标准差指脑电样本内一个双极性通道的信号偏离平均值的程度,计算公式为: 所述偏度指脑电样本内一个双极性通道的信号偏斜程度,是对分布对称性的度量,计算公式为: 所述峰度指脑电样本内一个双极性通道的信号分布陡峭程度,计算公式为: 分别对所有脑电样本的全部双极性通道提取上述4个时域特征;2.提取频域特征所述频域特征为脑电信号的功率谱密度,计算过程如下:分别对脑电样本中一个双极性通道对应的脑电数据采用滑动窗口机制,设定窗口步长和大小,设置两个相邻窗口之间不重叠,使窗口在脑电时域信号上滑动,对每个滑动窗口中的数据做傅里叶变换,形成了不同时间窗口对应的频域信号,拼接起来成为频率随时间变化的数据,对于一个双极性通道对应的脑电数据xt,短时傅里叶变换公式为: 其中,wt是窗函数,ω=2Πf,f是频率,τ具体指窗函数w在时域上的对称轴,即窗函数的中心位置,窗函数中心τ决定了信号xt在时域上的分析位置,即取出信号在τ附近的一个切片进行傅里叶变换,t是时间变量,j是一个复数单位,表示虚数部分的系数,指傅里叶变换,wt具体定义为: 其中to为窗口的长度,计算Sω,τ在不同频率区间内的平方和,即为脑电样本中一个双极性通道对应的脑电数据在不同频段的功率谱密度: 按上述步骤对每一个脑电样本分别在Delta0.5-4Hz、Theta4-7Hz、Alpha8-13Hz、Beta13-30Hz这四个频带下提取每个双极性通道的功率谱密度;3.提取非线性特征所述非线性特征为脑电信号的样本熵,计算过程如下:步骤1:将一个双极性通道内N个采样点的双极性通道脑电数据组成脑电时间序列{xn}=x1,x2,…,xN,按序号由小到大的顺序组成m维的重构向量Xmi,Xmi={xi,xi+1,...,xi+m-1},其中1≤i≤N-m+1,Xmi代表脑电时间序列{xn}中从第i个值开始m个连续的双极性通道脑电数据,将所有的Xmi组成一个总数为N-m-1的重构向量序列Xm1,Xm2,...,XmN-m-1;步骤2:对Xmi、Xmj两个向量集合之间的距离d[Xmi,Xmj]进行计算,计算公式为: 其中,1≤q≤m-l;l≤i,j≤N-m+1,i≠j;步骤3:统计Xmi与Xmj之间距离d[Xmi,Xmj]小于或等于相似容限阈值r的数目,记作Bi,对于1≤i≤N-m,按下式计算Bi和重构向量序列向量总数N-m-1之比Bi=num{d[Xmi,Xmj]<r} 步骤4:对于l≤j≤N-m,i≠j,求得每一个重构向量对应的所有的平均值,记为Bmr,Bmr表示两个向量Xmi,Xmj在相似容限阈值r下匹配m个点的概率: 步骤5:将维数增加为m+1,同样计算Xm+1i、Xm+1j之间距离d[Xm+1i,Xm+1j]小于等于相似容限阈值r的数目Ai和向量总数N-m-1之比Ai=num{d[Xm+1i,Xm+1j]<r} 步骤6:对于l≤j≤N-m,i≠j,计算出每一个重构向量对应的所有的平均值,记为Amr,Amr表示两个向量Xm+1i,Xm+1j在相似容限阈值r下匹配m+1个点的概率: 步骤7:由于N表示一段脑电信号的总采样数,为有限值,故脑电样本中一个双极性通道样本熵计算公式为:SampEn2=-ln[AmrBmr]对所有脑电样本的每个双极性通道按上述步骤提取样本熵特征;4.提取复杂图论特征提取基于经验模态分解和相关性功能连接矩阵的复杂图论特征,具体步骤如下:步骤1:对预处理完后的脑电样本中的双极性通道脑电数据做经验模态分解,经验模态分解将脑电信号分解为频率不同的内模态分量,设xt为一段时长为t秒的双极性通道脑电数据,EMD分解后的具体结果如下: 其中IMFot为xt经EMD分解后的第o个内模态分量,每个内膜态分量均为时长为t秒的信号,根据频率的不同携带有分解前信号的不同信息,其中o={1,2,...,p},res为xt分解后的残差分量,p为EMD分解后内模态分量的个数;步骤2:分别对脑电样本中每个双极性通道脑电数据进行EMD分解,然后对同一个脑电样本中不同的双极性通道脑电数据分解出的相同序号的内膜态分量之间计算时间序列相关性;具体相关性指标包括皮尔逊相关性、幅值平方相干性、定位相位滞后指数;所述皮尔逊相关性通过计算皮尔逊相关系数来体现,其中设IMFxn、IMFyn分别表示一个脑电样本中两个不同双极性通道内第n次采样得到的EEG内膜态信号值,两个内膜态信号之间的皮尔逊相关系数计算公式为: 幅度平方相干性计算具体如下:对于IMFxt、IMFyt两段内膜态信号按下式分别计算自功率谱密度Sxxf、Syyf与互功率谱密度Sxyf:Sxxf=E[IMFxt1IMFxt2]Syyf=E[IMFyt1IMFyt2]Sxyf=E[IMFxt1IMFyt2]其中t1、t2分别表示0,t中的不同时刻,E表示数据数学期望,则IMFxt、IMFyt两段内膜态信号之间的幅度平方相干性计算公式为: 定位相位滞后指数具体计算步骤如下:对于一段内膜态信号IMFxt,首先利用希尔伯特变换的解析信号完成瞬时相位的确定,其解析信号为:zt=IMFxt+iht其中,ht是IMFxt的希尔伯特变换,i是复数单位,则IMFxt的瞬时相位为: 对于两段内膜态信号IMFxt、IMFyt,其之间的定位相位滞后指数计算公式为: 其中ΦIMFxt、ΦIMFyt分别为IMFxt、IMFyt的瞬时相位,代表ΦIMFxt、ΦIMFyt两段内膜态信号的相位同步差,sign为符号函数,按下式计算: 对每个脑电样本的每两个双极性通道经EMD分解后的相同频率范围的内膜态分量之间计算上述3种相关性指标,由于每个脑电样本的脑电数据共有多个双极性通道,所以每个脑电样本共有多种可能性组合结果,每个相关性指标得到一个矩阵,所以总共每个脑电样本会得到多个矩阵,这些矩阵作为多种不同的大脑功能连接矩阵,对所有脑电样本按此步骤提取基于EMD的大脑功能连接矩阵;步骤3:建立无权的大脑功能网络采用密度法将大脑功能连接矩阵转化为权的大脑功能网络,具体步骤如下:对步骤2得到的大脑功能连接矩阵根据矩阵中边的连接强度大小进行二值化,最终,所有被保留的边权重被置为1,其他的被舍去的边权重设置为0,得到无权大脑功能连接网络;步骤4:计算复杂大脑功能连接网络的特征指标从建立的无权大脑功能连接网络中提取图论特征,包括无向图的度、特征路径长度、聚类系数,具体计算内容如下:对于给定节点,度就是与它连接的邻居节点个数,其中节点就是某个双极性脑电通道,第p个节点与第q个节点之间的度计算公式为: 其中apq表示连接到节点的边数,当节点p和节点q之间有连接时,apq=1,当节点p和节点q之间无连接时,apq=0,V为大脑功能连接网络中节点的总数;特征路径长度指网络中全部节点两两之间最短距离的平均值,计算公式为: 其中dpq表示节点p和q之间的最短路径长度;聚类系数是一种测量节点在网络中形成紧密群体的程度的指标,计算公式为: 其中Ep为节点p与邻居节点之间的边数,Dp是节点p的度数,即与节点p相连的邻居节点的数量;对所有脑电样本的大脑功能连接矩阵提取基于EMD的复杂图论特征;综上,对所有脑电样本从四个领域提取特征,将四个领域提取出的特征集合进行并列得到最终特征集合;所述早产儿脑功能年龄识别模块采用具有300棵决策树构成的随机森林回归模型对脑电信号多领域特征提取模块中提取出的最终特征集合进行早产儿脑功能年龄的预测。
全文数据:
权利要求:
百度查询: 吉林大学 吉林大学第一医院 基于多领域特征和机器学习的早产儿脑功能年龄识别系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。