首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于正则表达式的接处警文本车牌号码提取方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京明亿科技有限公司

摘要:本公开实施例公开了基于正则表达式的接处警文本车牌号码提取方法和装置。该方法的一具体实施方式包括:获取待提取车牌号码接处警文本以及目标车牌号码类别集合,其中,各目标车牌号码类别属于预设车牌号码类别集合;将待提取车牌号码接处警文本与目标车牌号码类别集合中的各目标车牌号码类别对应的正则表达式进行匹配,以提取待提取车牌号码接处警文本中的相应目标车牌号码。该实施方式实现了自动提取接处警文本中的车牌号码。

主权项:1.一种基于正则表达式的接处警文本车牌号码提取方法,包括:获取待提取车牌号码接处警文本以及目标车牌号码类别集合,其中,各所述目标车牌号码类别属于预设车牌号码类别集合;将所述待提取车牌号码接处警文本与所述目标车牌号码类别集合中的各目标车牌号码类别对应的正则表达式进行匹配,以提取所述待提取车牌号码接处警文本中的相应目标车牌号码;所述预设车牌号码类别集合中各预设车牌号码类别对应的正则表达式是通过如下第一训练步骤预先训练得到的:获取训练样本集合和测试样本集合,其中,训练样本和测试样本均包括历史接处警文本和标注车牌号码信息,其中,标注车牌号码信息用于表征该历史接处警文本所包括的各所述预设车牌号码类别的车牌号码;训练样本和测试样本中包括的标注车牌号码信息是至少一个;标注车牌号码信息包括预设车牌号码类别以及起始位置和终止位置,用于表征在该训练样本中的历史接处警文本的起始位置和终止位置之间的内容为预设车牌号码类别的车牌号码;训练样本和测试样本中的历史接处警文本不包括无效接处警文本,不包括任何车牌号码的接处警文本被认为是无效接处警文本;对于所述预设车牌号码类别集合中的每个预设车牌号码类别,执行以下第一正则表达式确定操作:将各所述训练样本中标注车牌号码信息包括该预设车牌号码类别的训练样本确定为该预设车牌号码类别对应的正训练样本集合;在该预设车牌号码类别对应的正训练样本集合中选取正训练样本组成目标数目个正训练样本子集合;对于目标数目个正训练样本子集合中的每个正训练样本子集合,基于该正训练样本子集合中各正训练样本,生成与该预设车牌号码类别对应的候选正则表达式;基于所述测试样本集合对所生成的各个候选正则表达式进行测试以确定与每个所生成的候选正则表达式对应的准确率;将所生成的各候选正则表达式中准确率最高的候选正则表达式确定为与该预设车牌号码类别对应的正则表达式;其中,对于预设车牌号码类别集合中的每个预设车牌号码类别,训练样本集合中与该预设车牌号码类别对应的正样本数量和负样本数量的比值在第一预设比例范围内,第一预设比例范围是在大于等于0.6且小于等于1.6之间;测试样本集合中与该预设车牌号码类别对应的正样本数量和负样本数量的比值在第二预设比例范围内,第二预设比例范围是在大于等于0.6且小于等于1.6之间;训练样本集合中与该预设车牌号码类别对应的正样本数量要多于测试样本集合中与该预设车牌号码类别对应的正样本数量;所述在该预设车牌号码类别对应的正训练样本集合中选取正训练样本组成目标数目个正训练样本子集合,包括:执行所述目标数目次正训练样本子集合生成操作以生成所述目标数目个正训练样本子集合,所述正训练样本子集合生成操作包括:在该预设车牌号码类别对应的正训练样本集合中随机选取N个正训练样本组成正训练样本子集合,其中,所述N为对L除以M的商向下取整所得的整数,所述L是该预设车牌号码类别对应的正训练样本集合中的正样本数量,所述M是大于等于2小于所述L的正整数;所述基于该正训练样本子集合中各正训练样本,生成与该预设车牌号码类别对应的候选正则表达式包括:首先对于该正训练样本子集合中的每个正训练样本,按照该正训练样本的各标注车牌号码信息中包括该预设车牌号码类别的标注车牌号码信息中的起始位置和终止位置获取该正训练样本的历史接处警文本中的该预设车牌号码类别的车牌号码;然后,基于针对该正训练样本子集合中的各正训练样本所获取的该预设车牌号码,生成与该预设车牌号码类别对应的候选正则表达式,其中,将目标重复内容作为正则表达式中的内容,而将目标变化内容在正则表达式中用通配符表示,其中,目标重复内容在至少一个文本中的重复比例大于等于预设比例,目标变化内容在至少一个文本中的重复比例小于上述预设比例;所述预设车牌号码类别集合包括以下至少一项:小型汽车号牌,大型汽车号牌,挂车号牌,使、领馆汽车号牌,港澳入出境车号牌,教练汽车号牌,警用汽车号牌,新式军牌。

全文数据:

权利要求:

百度查询: 北京明亿科技有限公司 基于正则表达式的接处警文本车牌号码提取方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。