恭喜广州大学;广州灵感生态科技有限公司张承云获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜广州大学;广州灵感生态科技有限公司申请的专利一种鸟鸣声识别模型训练方法、识别方法及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113936667B 。
龙图腾网通过国家知识产权局官网在2025-04-08发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111072346.9,技术领域涉及:G10L17/26;该发明授权一种鸟鸣声识别模型训练方法、识别方法及存储介质是由张承云;李清荣;陈庆春;詹海松;李一帆;孟瑞德;余上设计研发完成,并于2021-09-14向国家知识产权局提交的专利申请。
本一种鸟鸣声识别模型训练方法、识别方法及存储介质在说明书摘要公布了:本发明公开了一种鸟鸣声识别模型训练方法、识别方法及存储介质,本发明通过对预训练音频数据集、预训练鸟声数据集、目标鸟声数据集分别进行第一处理,得到对应的第一训练数据,第一处理包括:对预训练音频数据集、预训练鸟声数据集、目标鸟声数据集分别进行第一分帧处理并确定第一幅度谱和第一切片数据;根据第一切片数据进行第二分帧处理并确定第二幅度谱,根据第二幅度谱以及梅尔滤波器组确定第一梅尔谱并进行频率时间屏蔽处理;对负样本数据集进行第二处理,得到第二训练数据,根据第一训练数据以及第二训练数据对鸟鸣声识别模型进行训练,得到目标鸟鸣声识别模型,提高目标鸟鸣声识别模型的识别准确率,本发明可广泛应用于声音识别领域。
本发明授权一种鸟鸣声识别模型训练方法、识别方法及存储介质在权利要求书中公布了:1.一种鸟鸣声识别模型训练方法,其特征在于,包括:获取数据集合;所述数据集合包括预训练音频数据集、预训练鸟声数据集、目标鸟声数据集以及负样本数据集;对所述预训练音频数据集、所述预训练鸟声数据集、所述目标鸟声数据集分别进行第一处理,得到所述预训练音频数据集、所述预训练鸟声数据集以及所述目标鸟声数据集对应的第一训练数据;所述第一处理包括:对所述预训练音频数据集、所述预训练鸟声数据集、所述目标鸟声数据集分别进行第一分帧处理并根据第一分帧处理结果确定第一幅度谱,根据所述第一幅度谱确定由有效帧构成的第一切片数据,根据所述第一切片数据进行第二分帧处理并根据第二分帧处理结果确定第二幅度谱,根据所述第二幅度谱以及梅尔滤波器组确定第一梅尔谱,对所述第一梅尔谱进行频率时间屏蔽处理;对所述负样本数据集进行第二处理,得到第二训练数据;根据所述第一训练数据以及所述第二训练数据,对鸟鸣声识别模型进行训练,得到目标鸟鸣声识别模型;所述鸟鸣声识别模型包括特征提取主干模块以及鸟声识别检测块,所述鸟声识别检测块包括第一支路和第二支路;所述根据所述第一训练数据以及所述第二训练数据,对鸟鸣声识别模型进行训练,得到目标鸟鸣声识别模型,包括:根据所述第二训练数据和所述目标鸟声数据集对应的第一训练数据构成第三训练数据;将所述预训练音频数据集以及所述预训练鸟声数据集对应的第一训练数据以及所述第三训练数据输入至特征提取主干模块进行特征提取处理,将特征提取处理得到的嵌入特征在时间维度上进行聚合,得到子片段级的预测结果;所述特征提取主干模块基于分级迁移学习训练得到;将所述子片段级的预测结果输入至第一支路,进行第一卷积处理,得到各个子片段的鸟声的片段级预测结果;将所述子片段级的预测结果输入至第二支路,进行第二卷积处理并输入用于分类的注意力块,将所述注意力块的输出与所述片段级预测结果相乘并基于子片段的时间进行聚合,得到帧级别预测结果;根据所述片段级预测结果或者所述帧级别预测结果计算损失函数值,并根据所述损失函数值通过微调确定目标鸟鸣声识别模型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人广州大学;广州灵感生态科技有限公司,其通讯地址为:510006 广东省广州市大学城外环西路230号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。