Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

线上拍卖预展的艺术品自动化数据采集方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:雅昌文化(集团)有限公司;北京雅昌艺术印刷有限公司;上海雅昌艺术印刷有限公司

摘要:本发明公开一种线上拍卖预展的艺术品自动化数据采集方法及系统,所述方法包括:根据预展平台的数据需求预设字段模板,并为每个字段配置各自的名称、类别、属性、解析规则;识别定稿排版文件页面上的图片框、图码框、文字框;以文本框为基准,关联图片框的拍品图片;以图片框为基准,识别图码框;以图码框的内容作为拍卖号,与文本框解析出的拍卖号字段值比对,比对结果一致则应用字段模版的图片型字段,解析处理保存图片并写入字段值;作为一条记录追加写入拍品清单。本发明能够直接从拍卖图录排版文件中采集数据,省去人工编辑处理,提高效率;同时,通过配置解析提取规则,提高了采集数据的精确度。

主权项:1.一种线上拍卖预展的艺术品自动化数据采集方法,其特征在于,包括:步骤S10:根据预展平台的数据需求预设字段模板,并为每个字段配置各自的名称、类别、属性、解析规则;其中,所述类别包括数值与字符,所述属性包括描述与图片;步骤S20:创建采集任务,并载入所述字段模板;步骤S30:创建空白拍品清单,读入定稿排版文件页面,并设为当前工作页面;步骤S40:识别所述定稿排版文件页面上的图片框、图码框、文字框;步骤S50:以所述文本框为基准,应用字段模板的描述型字段,按对应的解析规则提取并写入字段值,并以提取出的拍卖号字段值去关联所述图片框的拍品图片;步骤S60:以所述图片框为基准,识别并找到与所述图片框小于预设间距的图码框;步骤S70:以所述图码框的内容作为所述图片框的拍卖号,与所述文本框解析出的拍卖号字段值比对,比对结果一致则应用字段模版的图片型字段,解析处理保存图片并写入字段值;步骤S80:将当前的定稿排版文件页面的提取结果作为一条记录追加写入所述拍品清单,并解析定稿排版文件的下一页面,直至所有的页面解析完成,并保存拍品清单至输出文件。

全文数据:

权利要求:

百度查询: 雅昌文化(集团)有限公司 北京雅昌艺术印刷有限公司 上海雅昌艺术印刷有限公司 线上拍卖预展的艺术品自动化数据采集方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。