基于自监督跨模态感知损失的乐队指挥动作生成方法

导航：龙图腾网> 最新专利技术> 基于自监督跨模态感知损失的乐队指挥动作生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：河海大学

摘要：本发明涉及人工智能技术领域，公开了一种基于自监督跨模态感知损失的乐队指挥动作生成方法。该方法首先进行自监督学的音频‑动作同步性学习，自动地采样正负样本对来训练一个两分支网络模型的参数；然后，将训练好的两个分支分别用于提取语义性的音乐控制信号和计算感知损失，再使用判别器计算对抗损失，根据输出动作标准差大小确定感知损失与对抗损失的最佳权重比并训练模型；最后，将测试音频输入至模型中，生成与音乐同步的指挥动作序列并可视化。本发明的重要意义在于使用了跨模态的自监督学习任务作为感知损失网络的预训练任务，可以避免了传统回归损失过度平滑的问题，从而生成自然、美观、多样、且与音乐高度同步的指挥动作。

主权项：1.一种基于自监督跨模态感知损失的乐队指挥动作生成方法，其特征在于，该方法包括如下步骤：步骤1，提取音乐会演出录像视频中的指挥动作，并计算对应音乐的梅尔频谱图，构建含有N个音乐-动作样本对的数据集其中Xi和Yi分别表示第i个样本的音乐数据和动作数据；步骤2，进行自监督的音乐-动作同步性学习，训练时自动地采样同步的正样本对与错位的负样本对，训练带有一个音乐编码器与一个动作编码器的两分支神经网络模型；所述步骤2的具体过程为：2-1、构建神经网络结构；使用一个基于卷积神经网络的音乐编码器Emusic从梅尔频谱图中提取音乐特征EmusicX，使用一个基于时空图卷积神经网络的动作编码器Emotion从指挥动作中提取动作特征EmotionY，将得到的两个特征拼接并输入全连接层f混合，并在最后经由sigmoid激活函数输出一个0，1之间的标量f[EmusicX，EmotionY]；2-2、采样正样本对和负样本对；正样本对是同步的音乐和动作序列，负样本对是不匹配的音乐和动作序列；从同一乐曲中选取负样本，其错位距离至少为10秒；2-3、计算交叉熵损失LCE和对比损失LCT，两个损失函数的定义如下，其中，Xi，Yi是从数据集D中采样得到的第i个样本对，li是该样本对的标签，当为正样本对时li＝1，负样本对时li＝0： 2-4、训练模型，使用交叉熵损失与对比损失之和L＝LCE+LCT训练步骤2-1中构建的两分支神经网络模型，直至模型收敛；在损失函数中，交叉熵损失使网络具备预测给定样本正负的能力，对比损失将两个编码器提取的特征嵌入到一个共享的特征空间中；在训练好的网络模型中，音乐编码器可以提取预测动作所需的语义性音乐特征，动作编码器可以提取音乐相关的动作特征；步骤3，构建一个生成器G和一个判别器D，使用对抗神经网络与步骤2得到的动作编码器分别计算对抗损失与生成动作的感知损失，再对感知损失和对抗损失加权，然后将加权后的两项损失相加，作为生成器G训练过程中的损失函数；计算判别器D的损失函数；利用生成器G和判别器D各自的损失函数轮流训练生成器G和判别器D，直至模型收敛；步骤4，在开发集上根据生成结果的标准差大小确定感知损失和对抗损失的最佳权重比；所述步骤4的具体过程为：4-1、使用不同的权重比λperλadv训练步骤3中的生成器；4-2、在开发集上测试不同权重比λperλadv下训练的生成器，计算生成动作的标准差；4-3、绘制权重比-标准差曲线，找到生成动作标准差恰好升至真实动作标准差时的权重比，确定为最佳权重比；λper，λadv分别为感知损失与对抗损失的权重；步骤5，使用步骤4中得到的最佳权重比下训练的模型进行实际应用，从给定音乐中生成指挥动作并可视化。

全文数据：

权利要求：

百度查询：河海大学基于自监督跨模态感知损失的乐队指挥动作生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种船舶激振装置及船体振动试验分析方法

下一篇：一种拉杆切割打孔集成设备及加工工艺

相关技术

一种船舶激振装置及船体振动试验分析方法

一种拉杆切割打孔集成设备及加工工艺

一种刹车盘保护盖

一种玉米栽培供水装置

一种便于安装的电力计量装置

回环检测方法、装置、电子设备和存储介质

一种智能型多功能机械伤害体验装置

信息处理系统以及信息处理方法

一种大花海棠染色体加倍的诱导方法

一种市政道路铺砖装置

通过光学衍射改善粒度

一种静载试验接桩循环护筒

感知相关技术

用于离线感知部件评估的工具_祖克斯有限公司_202380018056.7

上下文感知句子压缩_国际商业机器公司_202010655365.3

一种人体运动感知装置_无锡子亮传感技术有限公司_202420113746.2

环保气体绝缘智能感知封闭开关设备_万马科技股份有限公司_202410354982.8

感知数据传输方法、装置及存储介质_中国联合网络通信集团有限公司_202410893459.2

面向异常感知的服务迁移方法和装置_北京邮电大学_202410700696.2

核电压调节器能量感知任务调度_高通股份有限公司_202180089295.2

一种查探感知机器人_南昌航空大学_202410853085.1

通信感知方法、装置、通信节点及存储介质_中兴通讯股份有限公司_202310260348.3

海上风电机组智能感知监测系统_盛东如东海上风力发电有限责任公司_202410665927.0

乐队相关技术

一种用于主题公园乐队表演的音响拉杆箱_上海湃喏文化科技有限公司_202322642814.2

用于再现管弦乐队声音的系统和方法_第三宫有限责任公司_201780081620.4

一种乐队演奏指挥台_安阳师范学院_201910159369.X

一种课堂乐器乐队训练的装置及方法_黄河水利职业技术学院_202310253259.6

一种能与音乐同步动作的趣味乐队音乐盒及实现方法_广东轻工职业技术学院_201810578338.3

一种乐队提示显示器装置_艺声文化科技有限公司_202222517547.1

基于自监督跨模态感知损失的乐队指挥动作生成方法_河海大学_202111090024.7

人机交互的交响乐队弦乐组乐器演奏方法、装置及设备_陕西理工大学_202210669544.1

一种摇滚乐队玩具_周志强_202122523539.3

基于自监督跨模态感知损失的乐队指挥动作生成方法_河海大学_202111090024.7

损失相关技术

呼吸性粉尘虚拟冲击器流道内颗粒损失测量系统及评价方法_中煤科工集团重庆研究院有限公司_202410836240.9

基于多级收敛块和综合损失函数系统的极低光图像增强方法_南京邮电大学_202410761487.9

磁约束核聚变损失高能离子能量和螺旋角测量系统_核工业西南物理研究院_201910886119.6

基于注意力机制和联合损失函数的海岸带变化检测方法_武汉理工大学三亚科教创新园_202410932161.8

一种不平衡学习动态恢复大类重要性的损失函数计算方法_海南大学_202111556763.0

经由对偶分解评估损失函数或损失函数的梯度的系统和方法_谷歌有限责任公司_201980044631.4

一种降低烤烟烘烤损失的方法_贵州省烟草公司黔南州公司_202410500422.9

一种基于相对污染损失率的土壤环境损害测定方法_湖北省生态环境科学研究院(省生态环境工程评估中心)_202410738676.4

风力发电机发电量损失分解方法、装置及存储介质_国电联合动力技术有限公司_202410601644.X

基于多尺度注意力和损失惩罚机制的多视图聚类方法_河南大学_202410661309.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于自监督跨模态感知损失的乐队指挥动作生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务