买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:苏州大学
摘要:本发明涉及一种基于深度神经网络的听诊器音频识别方法、系统及装置,包括:采集心脏听诊音频数据并标注出每条录音数据中心脏跳动音频的起始和结束位置,将标注后的录音数据划分为训练集、验证集和测试集;构建听诊器音频识别模型,利用所述训练集训练所述听诊器音频识别模型,得到训练后的音频识别模型;基于所述训练后的听诊器音频识别模型,输入待测心脏听诊音频数据,得到心脏听诊录音识别结果。本发明能够准确地捕捉心脏听诊音频中的关键特征,通过自动化处理和分析心脏听诊音频数据,辅助医生出具病情诊断结果,减轻了医生的工作负担,提高了诊断效率。同时,减少了人为因素对诊断结果的影响,提高了诊断的可靠性和一致性。
主权项:1.一种基于深度神经网络的听诊器音频识别方法,其特征在于,包括:S1:采集心脏听诊音频数据并标注出每条录音数据中心脏跳动音频的起始和结束位置,将标注后的录音数据划分为训练集、验证集和测试集;S2:构建听诊器音频识别模型,利用所述训练集训练所述听诊器音频识别模型,得到训练后的听诊器音频识别模型;其中,所述听诊器音频识别模型是由频谱分块转换模块、位置编码模块、多个堆叠的音频帧依赖关系捕捉模块和一个线性分类器依次连接构建而成,所述频谱分块转换模块包括依次连接的对数梅尔滤波器组、频谱分块模块和维度变换模块;S3:基于所述训练后的听诊器音频识别模型,输入待测心脏听诊音频数据,得到心脏听诊录音识别结果,利用所述心脏听诊录音识别结果辅助医生出具病情诊断结果;其中,得到所述训练后的听诊器音频识别模型的方法包括:S21:对所述训练集的音频数据进行分帧和加窗处理,得到音频帧数据;S22:利用所述对数梅尔滤波器组处理所述音频帧数据,得到特征频谱图,通过所述频谱分块模块将所述特征频谱图均匀划分为多个频谱块,利用所述维度变换模块将每个频谱块展平并转换为一维音频帧序列;S23:所述位置编码模块对每个音频帧序列进行位置编码,并将编码后的位置信息添加到每个音频帧序列中,得到包含位置信息的音频帧序列;S24:利用所述音频帧依赖关系捕捉模块捕捉所述包含位置信息的音频帧序列之间的长距离依赖关系,进而提取出音频特征信息;S25:通过线性分类器对所述音频特征信息进行分类,对所述听诊器音频识别模型进行训练,直到满足所述听诊器音频识别模型的损失值小于设定阈值的条件,得到训练后的听诊器音频识别模型;S22中,得到所述特征频谱图的具体方法包括:通过快速傅里叶变换计算得到每个音频帧数据的频谱;基于音频帧数据的频谱,设置对数梅尔滤波器组中的过滤器数量M、频率范围为fL,fH,fL为最低频率,fH为最高频率,将所述最低频率fL和所述最高频率fH分别映射到梅尔刻度上,得到最低梅尔频率MelfL和最高梅尔频率MelfH: 在梅尔刻度上两两对数梅尔滤波器之间的中心频率是等间距的,根据最低梅尔频率MelfL和最高梅尔频率MelfH,计算相邻两个梅尔滤波器中心梅尔频率距离dmel: 根据所述中心梅尔频率距离dmel,等间距地分配M个中心梅尔频率Melfm,并将所述中心梅尔频率Melfm转换成实际频谱中非等间距的中心频率fm: 基于每个对数梅尔滤波器的中心频率fm,计算与中心频率fm对应的每个音频帧数据的频谱的频点bin: 其中,fs表示快速傅里叶变换中的采样频率,fft_len表示快速傅里叶变换的变换点数;基于所述与中心频率fm对应的每个音频帧数据的频谱的频点,得到对数梅尔滤波器组特征序列,将所述对数梅尔滤波器组特征序列按照时间顺序排列,形成一个二维的特征频谱图;S22中,所述频谱块的数量N计算公式为: 其中,W、L分别为输入频谱图的宽度和长度,P为频谱块的尺寸大小,O为频谱块间的重叠尺寸大小。
全文数据:
权利要求:
百度查询: 苏州大学 基于深度神经网络的听诊器音频识别方法、系统及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。