基于语音交互的视频换脸方法、系统、电子设备及介质

导航：龙图腾网> 最新专利技术> 基于语音交互的视频换脸方法、系统、电子设备及介质

申请/专利权人：天翼爱音乐文化科技有限公司

申请日：2024-04-11

公开（公告）日：2024-06-25

公开（公告）号：CN118250488A

主分类号：H04N21/2343

分类号：H04N21/2343;G06T3/04;G06V40/10;G06V40/16;G06V20/40;G06F40/30;G06F40/295;G06V10/774;G06V10/82;G06N3/0464;G06N3/084;H04N21/234;H04N21/44;H04N21/4402;H04N21/233;H04N21/439;G10L15/22;G10L15/26;G10L15/18

优先权：

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：本发明公开了基于语音交互的视频换脸方法和系统、电子设备及介质，包括：获取目标用户的第一语音指令，确定视频描述信息、角色描述信息以及替换图像描述信息；根据视频描述信息获取待处理视频并进行人体识别，得到人体位置信息和人体区域图像；将人体区域图像输入到预先训练好的人物分类模型，得到人物特征描述信息，进而根据人物特征描述信息、人体位置信息以及角色描述信息确定目标换脸对象，根据目标换脸对象对待处理视频进行定位标记，得到待换脸视频帧；根据替换图像描述信息获取目标脸部图像，将待换脸视频帧和目标脸部图像输入到人脸融合模型，得到目标换脸视频。本发明提高了视频换脸的效率和用户的使用体验，可应用于视频处理技术领域。

主权项：1.一种基于语音交互的视频换脸方法，其特征在于，包括以下步骤：获取目标用户的第一语音指令，根据所述第一语音指令确定视频描述信息、角色描述信息以及替换图像描述信息；根据所述视频描述信息获取待处理视频，对所述待处理视频进行人体识别，得到人体位置信息和人体区域图像；将所述人体区域图像输入到预先训练好的人物分类模型，得到人物特征描述信息，进而根据所述人物特征描述信息、所述人体位置信息以及所述角色描述信息确定目标换脸对象，并根据所述目标换脸对象对所述待处理视频进行定位标记，得到待换脸视频帧；根据所述替换图像描述信息获取目标脸部图像，将所述待换脸视频帧和所述目标脸部图像输入到人脸融合模型，得到目标换脸视频。

全文数据：

权利要求：

百度查询：天翼爱音乐文化科技有限公司基于语音交互的视频换脸方法、系统、电子设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种带固定结构的冲压装置

下一篇：一种酶转化罐内部恒温搅拌机构

相关技术

一种带固定结构的冲压装置

一种酶转化罐内部恒温搅拌机构

一种砂浆压实装置

一种生态护坡绿化模块

一种公共卫生用预防传染病喷雾装置

一种纸尿裤生产用包边机

一种液体沥青取样装置

一种配电网规划用的智慧配电网架

一种可移动式智能温控糖化槽生产线

用于储能元件的转换器及电源系统

混料搅拌装置

一种螺旋输送装置

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于语音交互的视频换脸方法、系统、电子设备及介质

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务