恭喜安徽大学李彬获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜安徽大学申请的专利基于Transformer融合模型的婴儿哭声分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114595772B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210236093.2,技术领域涉及:G06F18/241;该发明授权基于Transformer融合模型的婴儿哭声分类方法是由李彬;江波;王妍设计研发完成,并于2022-03-11向国家知识产权局提交的专利申请。
本基于Transformer融合模型的婴儿哭声分类方法在说明书摘要公布了:本发明公开一种基于Transformer融合模型的婴儿哭声分类方法;通过音频处理模块对输入的音频样本进行变换,得到音频的频谱图;将得到的频谱图通过预训练的Resnet‑50模型,得到频谱图特征;将得到的频谱图特征分别输入至频谱图增强模块和注意力机制模块,分别提取出数据增强后的特征表示和通道内和通道之间的可区分性特征表示;通过Transformer融合模块对双线性生成的特征表示进行融合,突出有用信息,抑制冗余信息,进一步增强特征图的表征能力;将融合后的特征图用于婴儿哭声分类,通过多次迭代训练得到最后分类结果。
本发明授权基于Transformer融合模型的婴儿哭声分类方法在权利要求书中公布了:1.一种基于Transformer融合模型的婴儿哭声分类方法,其特征在于:包括以下步骤:步骤1、输入待分类的婴儿哭声音频数据,通过音频处理模块对输入的音频数据进行预处理,并生成频谱图;步骤2、构建基础网络模型,初步提取频谱图特征;将Resnet-50预训练模型作为基础网络,然后固定Resnet-50模型中卷积层前8层的参数,只有后两层的参数会参与训练过程,之后将两个具有1024个神经元的全连接层、一个速率为0.7的dropout层附加到基础网络中,进而得到基础网络模型;步骤3、对于步骤2所得的频谱图特征,分别通过频谱图增强模块和注意力机制模块来提取鲁棒性特征表示、通道内的可区分性特征表示以及通道之间的可区分性特征表示;频谱图增强模块提取频谱图鲁棒性特征的具体方法为:针对频谱图的时域通道和频域通道分别进行掩膜操作,即设置两个掩模频域通道,且随机值范围在0到20之间;设置两个掩蔽时域通道,且随机值范围在10到30之间;注意力机制模块包括通道注意力机制和空间注意力机制,具体工作过程如下:对于通道注意力机制,首先对每个特征图使用全局最大池化来聚合通道信息;然后全局最大池化生成的特征描述符被发送到两层感知器;公式1如下:Pc=MmlpMmaxP,1最后特征图是由通道注意力图和原始特征图相乘产生的;如公式2所示: 其中Mmax·表示通道之间特征图的全局最大池化,Mmlp·是两层的感知器,P表示输入的特征图,Pc是生成的通道注意力图,Pf1表示通道注意力机制生成的特征图;对于空间注意力机制引入有特征图中每个点的全局最大池化,然后全局最大池化生成的特征描述符被发送到两层感知器;最后由通道注意力图和原始特征图相乘产生特征图,公式3如下: 其中公式3中的Mmax·代表特征图中每个点的全局最大池化,Pf2表示空间注意力机制生成的特征图;步骤4、通过Transformer融合模块对步骤3所得鲁棒性特征表示、通道内的可区分性特征表示以及通道之间的可区分性特征表示进行融合;然后将融合后的特征图用于婴儿哭声分类,通过多次迭代训练得到最后分类结果。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人安徽大学,其通讯地址为:230601 安徽省合肥市经开区九龙路111号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。