首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于PDF文件解析的图谱截图抓取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:刘羽

摘要:本发明公开基于PDF文件解析的图谱截图抓取方法,所述方法包括:通过解析文件的中以PDF页面为参照物生成的路径对象(PathObject),得到目标图谱的坐标范围;通过解析PDF页面属性,得到PDF页面的尺寸信息;上述得到的数据形成截图位置中间参数;将目标图谱的PDF页面保存为图片格式;分析输出图片的尺寸属性;根据截图位置中间参数、所保存的目标图谱的PDF页面图片的尺寸及截图专用软件的原点设置情况,进行计算,得到截图位置参数;通过截图专用软件导入截图位置参数对所保存的目标图谱的PDF页面图片进行处理,间接得到目标图谱的截图。上述方案可在PDF文件中对图谱进行准确定位,间接截取图谱为可引用的图片。

主权项:1.基于PDF文件解析的图谱截图抓取方法,其特征在于,所述处理方法包括以下步骤:步骤一:使用计算机软件工具对PDF文件进行解析,获得页面尺寸高和宽;步骤二:使用计算机软件工具对PDF文件进行解析,依次读取图谱报告中存在的路径对象PathObject,并对路径对象的位置信息进行分析,寻找确定图谱位置相对坐标,与步骤一所述页面尺寸一起保存为截图中间参数;步骤三:将PDF格式的图谱文件页面输出为具有可满足使用需求的清晰度的图片格式;步骤四:获得步骤三所输出的图片尺寸高和宽;步骤五:根据步骤二所述截图中间参数进行计算,对步骤三所输出的已知尺寸的图片的指定位置进行截图,通过截图专用工具软件,在导入截图中间参数经过计算后,对步骤三所输出的已知尺寸的图片的根据定位位置的页面比例设定范围进行截取并保存,进一步要求所述图片的指定位置xL、yU、xR、yL系根据截图软件所定义的坐标原点的情况计算得到:如截图软件定义的坐标原点为PDF页面图片的左上角,则通过以下公式计算得到:xL=x0PW*SW;yU=PH-y1PH*SH;xR=x1PW*SW;yL=PH-y0PH*SH;如截图软件定义的坐标原点为PDF页面图片的左下角,则通过以下公式计算得到:xL=x0PW*SW;yU=y1PH*SH;xR=x1PW*SW;yL=y0PH*SH;其中:x0、y0、x1、y1为步骤二所述图谱位置相对坐标;xL,yU、xR,yL分别对应定义截图位置的矩形的呈对角线分布的左上角及右下角的坐标;SW,SH分别为步骤四所述的PDF文件页面图片的宽和高;PW,PH分别为步骤一所述的PDF页面的宽和高,并输出为图谱的图片格式,同时根据需要可删除步骤三所输出的图片。

全文数据:

权利要求:

百度查询: 刘羽 基于PDF文件解析的图谱截图抓取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。