恭喜中国工商银行股份有限公司李峰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中国工商银行股份有限公司申请的专利数字人视频的字幕添加方法、装置、设备和存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116193162B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310201509.1,技术领域涉及:H04N21/234;该发明授权数字人视频的字幕添加方法、装置、设备和存储介质是由李峰;罗涛;李德强;杨刚设计研发完成,并于2023-03-01向国家知识产权局提交的专利申请。
本数字人视频的字幕添加方法、装置、设备和存储介质在说明书摘要公布了:本申请涉及一种数字人视频的字幕添加方法、装置、设备和存储介质。涉及人工智能技术领域。该方法包括:根据原始文本,生成数字人视频,其中,原始文本包括至少两个第一文本段;根据数字人视频中各图像帧的数字人唇部特征,对数字人视频进行分段,得到具有时间戳的至少两个音频片段;对具有时间戳的至少两个音频片段进行文本识别,得到各音频片段对应的具有时间戳的第二文本段;根据原始文本和各音频片段对应的具有时间戳的第二文本段,为数字人视频添加字幕。本申请提高了分段后的音频片段对应的第二文本段与原始文本中的第一文本段之间的文本匹配度,提高了第一文本段时间戳添加的精准性,保证了为数字人视频添加字幕的精准性。
本发明授权数字人视频的字幕添加方法、装置、设备和存储介质在权利要求书中公布了:1.一种数字人视频的字幕添加方法,其特征在于,所述方法包括:根据原始文本,生成数字人视频,其中,所述原始文本包括至少两个第一文本段;根据所述数字人视频中各图像帧的数字人唇部特征,对所述数字人视频进行分段,得到具有时间戳的至少两个音频片段;对所述具有时间戳的至少两个音频片段进行文本识别,得到各音频片段对应的具有时间戳的第二文本段;根据所述原始文本和各音频片段对应的具有时间戳的第二文本段,为所述数字人视频添加字幕;其中,所述数字人唇部特征包括唇部闭合特征和唇部张开特征,所述根据所述数字人视频中各图像帧的数字人唇部特征,对所述数字人视频进行分段,包括:根据唇部闭合特征对应的图像帧的连续性,将所述唇部闭合特征对应的图像帧划分为至少一个候选分段集合;根据各候选分段集合中包含的图像帧的个数,从所述各候选分段集合中确定至少一个目标分段集合;从每一目标分段集合包含的图像帧中,选择一个分段帧;根据所述分段帧,对所述数字人视频进行分段。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国工商银行股份有限公司,其通讯地址为:100140 北京市西城区复兴门内大街55号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。