买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:广东技术师范大学
摘要:本发明公开了基于模板化编辑的AI数字人对PPT的交互控制方法及装置,方法包括:确定媒体素材元素之间的属性连接关系,根据设置的显示区域及显示方式组合生成播放模板,从PPT文件中提取页面信息并构建讲稿文字内容与PPT页面的2D映射关系,根据讲稿文字内容进行推理生成AI数字人视频帧、AI数字人语音帧和字幕帧,将AI数字人视频帧及页面图片添加至播放模板进行显示,根据2D映射关系在相应显示区域添加提示图示及激光笔标识以生成图像帧,将图像帧与AI数字人语音帧同步输出。本发明属于人工智能技术领域,可根据2D映射关系在相应显示区域添加提示图示及激光笔标识,以实现合成视频过程中对PPT背景素材进行同步控制,大幅提升了AI数字人视频的应用功能。
主权项:1.一种基于模板化编辑的AI数字人对PPT的交互控制方法,其特征在于,所述方法包括:导入媒体素材元素并按照特定的逻辑关系及状态变化需求生成与所述媒体素材元素对应的属性连接、属性仿真及组合动画;根据所输入的设置参数设置PPT页面的显示区域和显示方式,以及AI数字人与所述属性连接、属性仿真及组合动画的结合方式,从而生成对应的播放模板;在所述播放模板中导入PPT文件,提取与所述PPT文件中每一PPT页面对应的页面信息,所述页面信息包含每一PPT页面对应的页面图片及讲稿文字内容;建立所述讲稿文字内容与PPT页面的2D映射关系;发送讲稿文字内容到AI数字人推理模型,以生成与渲染合成帧对应的AI数字人视频帧、AI数字人语音帧和字幕帧;根据所设置的AI数字人与所述属性连接、属性仿真及组合动画的结合方式,在所述播放模板的AI数字人显示区域显示AI数字人视频帧;根据所设置的PPT页面的显示区域和显示方式,在所述播放模板的PPT显示区域按所述显示方式对所述页面图片进行显示;根据所述讲稿文字内容与PPT页面的2D映射关系获取字幕帧对应文字内容在PPT页面的区域坐标生成当前AI数字人语音帧对应文字内容的提示图示;根据所述讲稿文字内容与PPT页面的2D映射关系获取字幕帧对应文字内容在PPT页面的区域坐标渲染绘制圆形亮点进行激光笔标识以渲染生成图像帧;渲染合成的图像帧与当前AI数字人语音帧同步输出到视频板卡、录制到文件或生成网络推流输出。
全文数据:
权利要求:
百度查询: 广东技术师范大学 基于模板化编辑的AI数字人对PPT的交互控制方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。