恭喜浙江大学赵洲获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江大学申请的专利视听事件定位方法和系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113971776B 。
龙图腾网通过国家知识产权局官网在2025-03-21发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202111202501.4,技术领域涉及:G06V20/40;该发明授权视听事件定位方法和系统是由赵洲;夏炎;姜伟昊;沈子栋设计研发完成,并于2021-10-15向国家知识产权局提交的专利申请。
本视听事件定位方法和系统在说明书摘要公布了:本发明公开了一种视听事件定位方法和系统,属于视听事件定位领域。为了更好地解决AVE任务中存在的音视频信息不一致的问题,本发明提出了一种新的时间级和事件级跨模态背景抑制网络,将音频和视频信息作为彼此的监控信号。此外,为了抑制一种模式中的低概率事件,本发明使用音频和视觉预测的CAS分数来实现;此外,为更好地从复杂的视频帧中提取关键的视觉区域特征,本发明设计了一个跨模态门控注意模块CMGA。本发明可高效完成完全监督和弱监督AVE任务及弱监督AVVB任务。
本发明授权视听事件定位方法和系统在权利要求书中公布了:1.一种视听事件定位方法,其特征在于,包括:获取AVE数据集作为训练样本;将样本通过跨模态背景抑制网络,得出事件预测;所述的跨模态背景抑制网络,包括跨模态门控注意模块、时间级背景抑制模块、事件级背景抑制模块、分类器;将训练样本中具有T个非重叠段的视频序列经过相应音频和视频特征的提取后,得到音频特征at和视觉特征vt;其中,Vt和At分别为第t个视频序列的视频和音频;首先由跨模态门控注意模块提取全局视觉信息,并实行通道级注意和空间级注意,利用交叉注意机制计算每一个视频序列的重要视觉区域,形成重要视觉特征;接下来利用时间级背景抑制模块,分别在视频模式下和音频模式下区分和抑制彼此的模糊背景;再利用事件级背景抑制模块抑制噪声事件,得到视频模式下和音频模式下每个事件发生的概率;最后通过分类器融合视听信息,预测事件类别标签及事件相关分数,实现视听事件定位。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。