Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于关键词的数据采集方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本申请提供了一种基于关键词的数据采集方法及装置,涉及数据处理技术领域,解决了数据采集结果精确度较低技术问题。该方法包括:基于数据采集请求对应采集到的第一采集内容提取多个文本关键词;在多个文本关键词中确定出现频次大于第一预设频次值的目标文本关键词,在第二数据源中确定目标文本关键词的出现频次大于第二预设频次值的第二采集内容;对第一采集内容以及第二采集内容中的图像数据进行识别,根据识别结果确定针对同一事物在多种不同拍摄角度下的目标图像数据,并将针对同一事物的全部目标图像数据划分为同一种类图像;根据多个种类图像对应的多个事件确定多个事件关键词,并通过事件关键词进行数据采集,得到第三采集内容。

主权项:1.一种基于关键词的数据采集方法,其特征在于,所述方法包括:获取数据采集请求,并基于所述数据采集请求对应采集到的第一采集内容提取多个文本关键词;所述第一采集内容来源于第一数据源;在所述多个文本关键词中确定出现频次大于第一预设频次值的目标文本关键词,并在至少一第二数据源中确定所述目标文本关键词的出现频次大于第二预设频次值的至少一第二采集内容;其中,所述第二预设频次值大于所述第一预设频次值;对所述第一采集内容以及所述第二采集内容中的图像数据进行识别,得到识别结果,根据所述识别结果确定针对同一事物在多种不同拍摄角度下的目标图像数据,并将针对同一所述事物的全部所述目标图像数据划分为同一种类图像;针对每个种类中的所述目标图像确定所述目标图像的多个发布时间,并将所述多个发布时间中相差间隔时长大于预设时长阈值的所述目标图像划分为不同种类图像,得到多个种类图像对应的多个事件;根据多个所述种类图像对应的多个所述事件确定多个事件关键词,并通过所述事件关键词进行数据采集,得到第三采集内容;基于所述第一采集内容、所述第二采集内容以及所述第三采集内容得到所述数据采集请求对应的最终采集结果。

全文数据:

权利要求:

百度查询: 戎行技术有限公司 基于关键词的数据采集方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。