首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种视频字幕的人物识别方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京爱奇艺科技有限公司

摘要:本发明实施例提供了一种视频字幕的人物识别方法、装置、设备及存储介质,应用于视频处理技术领域。所述方法包括:对待识别视频进行文字识别,得到多个字幕文本;针对每一个字幕文本,确定该字幕文本所属的视频帧集合中所包含的相应人物,并确定该字幕文本属于相应人物的第一概率;对待识别视频中的音频进行声纹分割聚类,得到至少一个声纹类簇;确定各字幕文本与各声纹片段在时序上的对应关系;将同一声纹类簇中的声纹片段视为同一人物的声纹片段,基于第一概率及对应关系,确定各声纹类簇各自对应的人物;根据各声纹类簇各自对应的人物及对应关系,分别确定各字幕文本对应的人物。应用本发明实施例,能够准确地识别各字幕文本对应的人物。

主权项:1.一种视频字幕的人物识别方法,其特征在于,所述方法包括:对待识别视频进行文字识别,得到多个字幕文本,所述字幕文本与所述待识别视频中的字幕一一对应;针对每一个字幕文本,确定该字幕文本所属的视频帧集合中所包含的相应人物,并确定该字幕文本属于相应人物的第一概率;对所述待识别视频中的音频进行声纹分割聚类,得到至少一个声纹类簇;其中,每个所述声纹类簇中包含至少一段声纹片段,所述声纹片段是对所述音频进行声纹分割得到的;确定各所述字幕文本与各所述声纹片段在时序上的对应关系;将同一所述声纹类簇中的声纹片段视为同一人物的声纹片段,基于所述第一概率及所述对应关系,确定各所述声纹类簇各自对应的人物;根据各所述声纹类簇各自对应的人物及所述对应关系,分别确定各所述字幕文本对应的人物。

全文数据:

权利要求:

百度查询: 北京爱奇艺科技有限公司 一种视频字幕的人物识别方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。