首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于自适应注意力特征融合网络的音乐流派分类方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:天津理工大学

摘要:本发明提供一种基于自适应注意力特征融合网络的音乐流派分类方法,属于音乐信息检索及深度学习领域。为了解决传统卷积网络没有充分考虑音乐特征之间的协同作用,难以区分融合音乐的问题。本发明通过对音频数据进行预处理;分离伴奏音频并进行四种音乐性特征强化方法;利用短时傅里叶变换将原始音频与伴奏音频转化为梅尔频谱图;通过自适应注意力特征融合网络的特征提取模块,分别提取两种频谱图的特征;将特征输入自适应权重特征融合模块,并进行差异化特征学习;输入分类器最终得到音乐的流派类别。本发明主要用于音乐流派的精准分类,避免了流派融合造成的分类偏差问题。

主权项:1.一种基于自适应注意力特征融合网络的音乐流派分类方法,其特征在于,包括:1对音频数据进行预处理:将数据集中所有音频数据处理为30s的波形音频文件,具体为删除时长低于30s的音频数据,截取其余数据的中心30s音频;2分离伴奏音频并进行了四种音乐性特征强化方法:通过人声分离技术模块得到伴奏音频,并通过添加噪声、时间转移、时间拉伸、时频掩蔽四种方法进行音乐性特征强化;3利用短时傅里叶变换将音频数据转化为梅尔频谱图:提取带有128个梅尔滤波器的梅尔谱图,得到大小为2560×256像素的梅尔谱图,将每段音频的频谱图按256×256像素进行裁剪,得到10个256×256像素的包含了3秒音频信息的子谱图并输入特征提取模块;4通过自适应注意力特征融合网络的特征提取模块,分别提取原始音频和伴奏音频频谱图的特征,生成两组具有相同维数的特征;5将特征输入自适应权重特征融合模块,通过计算查询矩阵、键矩阵和值矩阵的关联程度,学习关注权重值,确定每个特征源对分类任务的贡献,进行差异化特征学习;6输入单个隐藏层的MLP分类器,融合特征输入维度为512,dropout比率为0.3,采用ELU激活函数,最终得到音乐的流派类别。

全文数据:

权利要求:

百度查询: 天津理工大学 一种基于自适应注意力特征融合网络的音乐流派分类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。