Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种PDF文件元器件提取装置、方法、电子设备及可读存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

摘要:本发明提供了一种PDF文件元器件提取装置、方法、电子设备及可读存储介质,该装置包括:文件读取单元、页面解析单元、坐标变换处理单元、文本框匹配单元以及文本内容替换单元;文件读取单元从引脚表图片中提取文件,页面解析单元解析PDF页面获取文本和图片;坐标变换处理单元计算PDF页面到引脚表图片的变换矩阵,并转换文本框坐标,过滤无效信息;文本框匹配单元匹配变换后的文本框与OCR识别结果;文本内容替换单元则根据匹配关系,用解析文本替换OCR文本,并输出更新信息。本发明通过特征点提取、描述子计算、距离计算和过滤等步骤,实现引脚表图片与PDF页面图片的高精度匹配,提升了引脚表信息提取和替换的效率,减少了误判和漏判,为电子元器件设计提供了可靠数据支持。

主权项:1.一种PDF文件元器件提取装置,其特征在于,包括:文件读取单元,读取引脚表图片,并从所述引脚表图片中提取引脚表文件;其中,所述引脚表图片为引脚配置表格对应的图片;所述引脚表文件至少包括引脚表文本内容和对应的文本框坐标;页面解析单元,用于读取所述引脚表图片对应的PDF页面,并对所述PDF页面进行解析以获得对应的PDF页面文本和PDF页面图片;其中,所述引脚表图片对应的PDF页面包括所述引脚表图片对应的引脚配置表格;所述PDF页面文本至少包括文本内容和文本框坐标;坐标变换处理单元,用于:将所述引脚表图片与所述页面解析单元获得的PDF页面对应的PDF页面图片进行仿射变换,计算所述PDF页面图片变换到所述引脚表图片坐标系的仿射变换矩阵;其中,所述仿射变换矩阵包括x轴、y轴上的缩放系数,以及x轴、y轴上的平移距离;根据获得的仿射变换矩阵对所述PDF页面文本的文本框坐标进行坐标变换,将所述文本框的坐标转换到所述引脚表图片的坐标系下,并判断变换后的坐标是否在所述引脚表图片的有效范围内,以保留或过滤对应的文本信息;文本框匹配单元,用于根据所述坐标变换处理单元得到的变换后的所述PDF页面文本的文本框坐标和所述文件读取单元获得的所述引脚表图片的引脚表文本内容对应的文本框坐标进行匹配;文本内容替换单元,用于根据变换后的所述PDF页面文本的文本框和所述引脚表图片的引脚表文本内容对应的文本框的匹配关系,使用所述PDF页面文本的文本内容直接替换所述引脚表图片的引脚表文本内容,并输出更新后的引脚表文本内容。

全文数据:

权利要求:

百度查询: 粤港澳大湾区(广东)国创中心 一种PDF文件元器件提取装置、方法、电子设备及可读存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术