恭喜北京达佳互联信息技术有限公司刁文获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京达佳互联信息技术有限公司申请的专利事件识别方法、装置、电子设备及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115665504B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211204795.9,技术领域涉及:H04N21/81;该发明授权事件识别方法、装置、电子设备及存储介质是由刁文;邓峰;王俊;曾夕娟设计研发完成,并于2022-09-29向国家知识产权局提交的专利申请。
本事件识别方法、装置、电子设备及存储介质在说明书摘要公布了:本公开关于一种事件识别方法、装置、电子设备及存储介质,涉及互联网技术领域。方法包括:获取视频中的多帧图像和音频,视频为展示目标场景的视频;基于多帧图像,进行图像事件识别,得到至少一个第一事件信息,每个第一事件信息用于指示一个图像事件和图像事件的发生时间点;基于音频,进行音频事件识别,得到至少一个第二事件信息,每个第二事件信息用于指示一个音频事件和音频事件的发生时间段;对至少一个第一事件信息和至少一个第二事件信息进行融合,得到至少一个目标事件信息,每个目标事件信息用于指示一个目标事件和目标事件的发生时间段。该方法得到的目标事件信息在保证了全面性的同时还具有较高的准确性。
本发明授权事件识别方法、装置、电子设备及存储介质在权利要求书中公布了:1.一种事件识别方法,其特征在于,所述方法包括:周期性地获取视频,并缓存获取到的视频,所述视频包括展示目标场景的直播数据流;提取所述视频中的多帧图像和音频,对提取到的所述多帧图像和音频进行缓存,并在到达下一周期之前,实时对提取的音频和每一帧图像进行处理;基于所述多帧图像确定所述目标场景的场景类型;基于所述多帧图像,通过所述场景类型对应的图像事件识别模型,进行图像事件识别,得到至少一个第一事件信息,每个第一事件信息用于指示一个图像事件和所述图像事件的发生时间点,所述图像事件是目标事件在图像方面的表现,根据所述场景类型不同而变化,不同的场景类型对应不同的图像事件识别模型;将所述音频输入所述场景类型对应的音频事件识别模型,以使得所述音频事件识别模型基于所述音频的音频特征进行音频事件识别,得到与所述音频特征匹配的目标音频事件,不同的场景类型对应不同的音频事件识别模型;基于所述音频事件识别模型输出的音频事件和所述音频事件的发生时间段,得到至少一个第二事件信息,每个第二事件信息用于指示一个音频事件和所述音频事件的发生时间段,所述音频事件是所述目标事件在音频方面的表现,所述图像事件识别和所述音频事件识别同时进行;对所述至少一个第一事件信息和所述至少一个第二事件信息进行融合,得到至少一个目标事件信息,每个目标事件信息用于指示一个目标事件和所述目标事件的发生时间段;基于所述至少一个目标事件信息,从所述视频中确定至少一个原始子片段,所述至少一个原始子片段的起止时间分别为所述至少一个目标事件信息所指示的目标事件的发生时间段的起止时间;对所述至少一个原始子片段进行聚类,确定多个事件类别分别对应的至少一个原始子片段;针对任一事件类别,在属于所述事件类别的原始子片段的数目大于所述事件类别对应的预设数目的情况下,从属于所述事件类别的原始子片段中筛选出所述预设数目的原始子片段,将筛选出的所述预设数目的原始子片段作为目标子片段;在属于所述事件类别的原始子片段的数目不大于所述事件类别对应的预设数目的情况下,将属于所述事件类别的原始子片段作为目标子片段;所述事件类别对应的所述预设数目与所述事件类别的目标事件的重要程度正相关,且所述事件类别对应的所述预设数目与所述视频的时长正相关;缓存至少一个目标子片段,直到当前时间到达下一个获取视频的周期;基于所述至少一个目标子片段的数目,获取预设视频模板,所述预设视频模板用于指示对至少一个目标子片段的剪辑方式,不同数目的目标子片段对应不同的预设模板;基于所述预设视频模板,对所述至少一个目标子片段进行剪辑,得到剪辑视频。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京达佳互联信息技术有限公司,其通讯地址为:100085 北京市海淀区上地西路6号1幢1层101D1-7;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。