买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京爱奇艺科技有限公司
摘要:本发明实施例提供了一种视频字幕的人物识别方法、装置、设备及存储介质,应用于视频处理技术领域。所述方法包括:对待识别视频进行文字识别,得到多个字幕文本;针对每一个字幕文本,确定该字幕文本所属的视频帧集合中所包含的相应人物,并确定该字幕文本属于相应人物的第一概率;对待识别视频中的音频进行声纹分割聚类,得到至少一个声纹类簇;确定各字幕文本与各声纹片段在时序上的对应关系;将同一声纹类簇中的声纹片段视为同一人物的声纹片段,基于第一概率及对应关系,确定各声纹类簇各自对应的人物;根据各声纹类簇各自对应的人物及对应关系,分别确定各字幕文本对应的人物。应用本发明实施例,能够准确地识别各字幕文本对应的人物。
主权项:1.一种视频字幕的人物识别方法,其特征在于,所述方法包括:对待识别视频进行文字识别,得到多个字幕文本,所述字幕文本与所述待识别视频中的字幕一一对应;针对每一个字幕文本,确定该字幕文本所属的视频帧集合中所包含的相应人物,并确定该字幕文本属于相应人物的第一概率;对所述待识别视频中的音频进行声纹分割聚类,得到至少一个声纹类簇;其中,每个所述声纹类簇中包含至少一段声纹片段,所述声纹片段是对所述音频进行声纹分割得到的;确定各所述字幕文本与各所述声纹片段在时序上的对应关系;将同一所述声纹类簇中的声纹片段视为同一人物的声纹片段,基于所述第一概率及所述对应关系,确定各所述声纹类簇各自对应的人物;根据各所述声纹类簇各自对应的人物及所述对应关系,分别确定各所述字幕文本对应的人物。
全文数据:
权利要求:
百度查询: 北京爱奇艺科技有限公司 一种视频字幕的人物识别方法、装置、设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。