首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

提取进馆OFD档案文件元数据规范填入档案著录项的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏中威科技软件系统有限公司

摘要:本发明公开提取进馆OFD档案文件元数据规范填入档案著录项的方法,包括以下步骤:创建数据采集库,数据采集库中内建立有指标,指标与档案库内著录项一一对应;建立不同的识别模型,每个识别模型与数据采集库相对应;按照OFD标准对OFD文件进行解析,根据OFD文件是否包含图像,分别将OFD文件中提取的字段元数据存入xml文件中;获取上述步骤中的xml文件中的元数据并进一步筛选,将其与识别模型进行匹配,得到识别提取信息;将识别提取的结果导入建立的数据采集库中,根据匹配的不同结果,进行档案著录,本发明遵循国家标准GBT33190‑2016,在标准的制定之下,对OFD元数据进行提取,加以应用,并且在进馆进行著录项填入时,可以批量处理,大大减轻人员的工作压力。

主权项:1.提取进馆OFD档案文件元数据规范填入档案著录项的方法,其特征在于,包括以下步骤:步骤S1:创建数据采集库,所述数据采集库中建立有指标,所述指标包括提名,责任者,密级,保管期限,抄送人,所述指标与档案库内著录项一一对应;步骤S2:根据OFD公文类型、文件首页样式、关键字段位置范围、关键词位置结构顺序、识别范围偏移量建立不同的识别模型,每个所述识别模型与数据采集库相对应;步骤S3:按照OFD标准对OFD文件进行解析,根据OFD文件是否包含图像,分别将OFD文件中提取的字段元数据存入xml文件中;步骤S4:获取步骤S3中的xml文件中的元数据并进一步筛选,将其与步骤S2中的识别模型进行匹配,得到识别提取信息,其中xml文件中元数据筛选匹配的具体步骤如下:将识别模型与xml文件中的字段元数据相匹配,获取xml文件中的文件类型信息;根据文件类型信息找到对应的识别模型,获取该识别模型中的关键词;继续遍历xml文件中的字段元数据,将xml文件中的字段元数据与上述步骤中获得的识别模型进行匹配;若匹配到关键词,获取xml文件中关键词的内容,根据上一个关键词的内容,重新计算出识别模型中该关键词的偏移量,并重置该关键词的起始位置方位的参数P,然后判断获取到的关键词的内容是否在该位置P范围内,若符合条件,则继续进行匹配,若获取到的关键词的内容不在位置P的范围内,将xml文件中的该字段元数据信息去除;循环上述所有步骤,将OFD中提取的数据字段元数据全部筛选完成,得到最终的提取信息;步骤S5:将识别提取的结果导入步骤S1中建立的数据采集库中,根据匹配的不同结果,进行档案著录。

全文数据:

权利要求:

百度查询: 江苏中威科技软件系统有限公司 提取进馆OFD档案文件元数据规范填入档案著录项的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。