恭喜大连海事大学张维维获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜大连海事大学申请的专利基于乐音信号频谱图建模的多音音乐歌声旋律提取方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115579018B 。
龙图腾网通过国家知识产权局官网在2025-05-30发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211120049.1,技术领域涉及:G10L25/48;该发明授权基于乐音信号频谱图建模的多音音乐歌声旋律提取方法是由张维维;闫凌宇设计研发完成,并于2022-09-14向国家知识产权局提交的专利申请。
本基于乐音信号频谱图建模的多音音乐歌声旋律提取方法在说明书摘要公布了:本发明公开了一种基于乐音信号频谱图建模的多音音乐歌声旋律提取方法该方法首先求混合音频信号的常Q变换,得到对数频率幅度谱;其次,依据同一乐音声源的基波与各次谐波分量的频点位置关系得到图结构。然后,将常Q变换幅度谱作为图卷积网络输入,将旋律音高转换为独热向量,并将其作为图卷积网络的输出,利用图卷积网络学习复杂的输入输出映射函数,并将图卷积网络的每帧输出节点中最大值所对应的频率作为该帧的初步旋律音高估计结果。最后,采用后处理步骤,构建显著度谱图,微调旋律音高估计。本发明构建对数频率域图结构来实现歌声旋律提取问题,采用数据驱动模式自动学习图卷积网络的参数,达到轻量级参数下的歌声旋律提取目的。
本发明授权基于乐音信号频谱图建模的多音音乐歌声旋律提取方法在权利要求书中公布了:1.一种基于乐音信号频谱图建模的多音音乐歌声旋律提取方法,其特征在于包括:对音频信号进行常Q变换获得对数频率幅度谱,截取一定频率范围内的幅度谱,将第i帧与该帧的前一帧到后一帧的连续3帧幅度谱拼接获得拼接幅度谱,将该拼接幅度谱作为第i帧输入特征,表示为Xi;构建3帧幅度谱拼接对应的邻接矩阵,具体计算公式为: 其中,N=90,h=1,…,5,ij=1,…,270;将拼接幅度谱的每个频点作为图结构的节点,根据邻接矩阵确定边,即各个节点的连接关系,从而将乐音信号的各频率分量用图结构表示;将第i帧信号对应的旋律音高频率进行离散化,得到输出标签的独热向量,将独热向量作为图卷积网络的输出,得到第i帧输入特征Xi所对应的输出标签Yi;对图卷积网络进行训练获得最优参数;采用训练好的网络参数,在测试集上进行旋律音高预测,并将图卷积网络输出节点中最大值对应的频率作为初步的旋律音高估计;对图卷积网络得到的初步旋律音高序列进行中值滤波,得到平滑旋律音高轨迹;对音频信号进行分帧、再对每帧信号进行补零和短时傅里叶变换得到短时傅里叶变换幅度谱;采用相位声码器对短时傅里叶变换幅度谱进行瞬时幅度、瞬时频率修正;逐帧依据显著度函数计算显著度值;所述显著度函数为: 其中,ai是第i个谱峰幅值,Trai为幅度门限函数,wb,h,fi为权重函数;将平滑旋律音高轨迹为中心的正负1.5个半音范围构成的带状区域作为最终歌声旋律输出候选范围,在该候选范围内搜索最大的显著度值,将图卷积网络的非0输出用最大显著度值对应的频率进行修正,对于图卷积网络的0值输出则不进行修正。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连海事大学,其通讯地址为:116026 辽宁省大连市高新园区凌海路1号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。