恭喜北京搜狗科技发展有限公司王琨获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京搜狗科技发展有限公司申请的专利一种图片信息的处理方法、装置及电子设备获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN113590862B 。
龙图腾网通过国家知识产权局官网在2025-01-07发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202010368172.X,技术领域涉及:G06F16/55;该发明授权一种图片信息的处理方法、装置及电子设备是由王琨;孙玉玺;董国盛设计研发完成,并于2020-04-30向国家知识产权局提交的专利申请。
本一种图片信息的处理方法、装置及电子设备在说明书摘要公布了:本发明公开了一种图片信息的处理方法、装置及电子设备,该方法包括:对网页中的图片进行重复图片聚类,获取每个类簇对应的标记文本域集合;针对每各类簇的类簇图片,根据标记文本域集合获取标记文本域集合中每个标记文本域包含有的关键词及关键词的词权重;根据标记文本域中关键词的词权重和关键词在对应标记文本域中的词频,对标记文本域集合中的标记文本域进行筛选,获得多个候选文本域;对多个候选文本域进行相似文本去除,并根据去除相似文本后的多个候选文本域获得类簇图片的描述文本信息。上述方案通过重复图片聚类获得标记文本域集合,从中选取优质文本域作为图片描述文本信息,解决了现有技术中图片描述文本信息准确性较低的技术问题。
本发明授权一种图片信息的处理方法、装置及电子设备在权利要求书中公布了:1.一种图片信息的处理方法,其特征在于,所述方法包括:对网页中的图片进行重复图片聚类,获取每个类簇的类簇图片和所述类簇图片的标记文本域集合;针对每张类簇图片,根据所述标记文本域集合获取所述标记文本域集合中每个标记文本域包含有的关键词及所述关键词的词权重;根据所述标记文本域中关键词的词权重和所述关键词在对应标记文本域中的词频,对所述标记文本域集合中的所述标记文本域进行筛选,获得多个候选文本域;对所述多个候选文本域进行相似文本去除,并根据去除相似文本后的多个候选文本域获得所述类簇图片的描述文本信息;所述根据所述标记文本域中关键词的词权重和所述关键词在对应标记文本域中的词频,对所述标记文本域集合中的所述标记文本域进行筛选,获得多个候选文本域,包括:根据所述标记文本域中关键词的词权重、所述关键词在对应标记文本域中的词频,计算获得每个标记文本域的得分;获得所述标记文本域集合中所述得分最大的前N个标记文本域作为参考文本域;根据N个参考文本域获得所述多个候选文本域;所述根据所述N个参考文本域获得所述多个候选文本域,包括:获取每个所述参考文本域的文本域长度;根据每个所述参考文本域所属的文本域类型,获取每个所述参考文本域的域权重;根据所述文本域长度、所述域权重,对所述N个参考文本域进行筛选,筛选获得所述多个候选文本域。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京搜狗科技发展有限公司,其通讯地址为:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。