恭喜北京百度网讯科技有限公司马胜杰获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京百度网讯科技有限公司申请的专利视频字幕的识别方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN117315639B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202311229664.0,技术领域涉及:G06V20/62;该发明授权视频字幕的识别方法、装置、电子设备及存储介质是由马胜杰;商晨设计研发完成,并于2023-09-21向国家知识产权局提交的专利申请。
本视频字幕的识别方法、装置、电子设备及存储介质在说明书摘要公布了:本公开提出一种视频字幕的识别方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及AI医疗、计算机视觉、大模型、深度学习等人工智能技术领域。包括:对视频进行光学字符识别,获取视频的字幕区域中包含的第一词组集及每个第一词组对应的第一位置信息;确定每个第一词组中包含的字符数量及第一位置信息对应的区域面积;根据第一词组对应的定位点坐标、包括的字符数量及区域面积中的至少一项,将第一词组集进行过滤处理,以获取第一字幕;识别视频关联的音频数据,获取第二字幕;将第一字幕、第二字幕及预设的提示词,输入大模型,以获取视频的目标字幕。由此,提高了字幕识别的准确性和召回率,提升了字幕处理的整体效果。
本发明授权视频字幕的识别方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种视频字幕的识别方法,包括:对视频进行光学字符识别,以获取所述视频的字幕区域中包含的第一词组集及所述第一词组集中每个第一词组对应的第一位置信息,所述第一位置信息中包括定位点坐标;确定每个所述第一词组中包含的字符数量及所述第一位置信息对应的区域面积;根据所述第一词组对应的定位点坐标、包括的字符数量及所述区域面积中的至少一项,将所述第一词组集进行过滤处理,以获取第一字幕;对所述视频关联的音频数据进行识别,以获取第二字幕;将所述第一字幕、所述第二字幕及预设的提示词,输入大模型,以获取所述视频的目标字幕;其中,所述根据所述第一词组对应的定位点坐标、包括的字符数量及所述区域面积中的至少一项,将所述第一词组集进行过滤处理,以获取第一字幕,包括:根据所述第一词组对应的定位点坐标,确定所述第一词组对应的定位点间的第一相对位置,其中,所述第一词组对应的定位点坐标包括所述第一词组的两个对角线顶点坐标;在与任一第一相对位置对应的第一词组的第一数量,与第二数量间的比值大于第一阈值的情况下,根据所述任一第一相对位置,确定所述视频中字幕内容的第一排列方向,其中,所述第二数量为所述第一词组集中包含的第一词组的数量;在所述定位点坐标为第一词组所在区域的指定位置的坐标的情况下,根据所述第一词组对应的定位点坐标,确定所述第一词组对应的定位点间的第二相对位置,其中,所述指定位置的坐标包括每个词组所在区域中词组开始的左上顶点坐标和词组结束的右下顶点坐标;根据所述第二相对位置,确定所述第一词组中内容的第二排列方向;将与所述第一排列方向不同的第二排列方向的第一词组进行滤除处理,以获取过滤后的第一词组集;基于所述过滤后的第一词组集,生成所述第一字幕。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京百度网讯科技有限公司,其通讯地址为:100085 北京市海淀区上地十街10号百度大厦二层;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。