恭喜北京方寸无忧科技发展有限公司刘学谦获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京方寸无忧科技发展有限公司申请的专利一种兼顾文本长度和相似度的文本纠错方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114386404B 。
龙图腾网通过国家知识产权局官网在2025-04-29发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210015750.0,技术领域涉及:G06F40/279;该发明授权一种兼顾文本长度和相似度的文本纠错方法及系统是由刘学谦;汪玉珠;田贺锁设计研发完成,并于2022-01-07向国家知识产权局提交的专利申请。
本一种兼顾文本长度和相似度的文本纠错方法及系统在说明书摘要公布了:本发明公开了一种兼顾文本长度和相似度的文本纠错方法及系统,通过在相关数据库中进行搜索,获取与待纠错单元最接近的长词,若长词长度处于预设长度区间,创建滑动窗口,用窗口截取文本块,并求得文本块和长词间的编辑距离,得出错误类型,以此对文本进行纠错。若长词长度大于预设长度区间,则判断相似度是否超出预设阈值,再通过文本对比算法,得出错误类型,并进行纠错。对硬件没有特殊要求,且具有非常好的系统兼容性,纠错效率高,大大缩短校对时间。可以实时、快速、便捷的添加新词来满足新词的纠错,通过设置不同领域的数据库,满足不同领域的长词纠错,且不依赖深度学习技术。
本发明授权一种兼顾文本长度和相似度的文本纠错方法及系统在权利要求书中公布了:1.一种兼顾文本长度和相似度的文本纠错方法,其特征在于,包括:获取待纠错文本,并用标点符号将其分割开来,得到待纠错文本单元;在数据库中搜索得到与所述待纠错文本单元最接近的若干个长词;基于所述长词的长度,选择判定方法,得到所述待纠错文本单元的错误类型,根据所述错误类型,对所述待纠错文本单元进行纠错;所述长词的长度处于预设长度区间时,选择长度判定;所述长度判定,具体为:设置三个滑动窗口,所述三个滑动窗口长度为:所述长词的长度减一、所述长词的长度和所述长词的长度加一;所述三个滑动窗口分别对应代表漏字、错字和多字的错误类型;根据所述滑动窗口长度递增顺序,依次用所述三个滑动窗口截取所述待纠错文本单元,得到相对应长度的文本块;依次计算出所述文本块和所述长词的编辑距离,并判断所述编辑距离是否为1,若是,则得到与所述滑动窗口对应的错误类型。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京方寸无忧科技发展有限公司,其通讯地址为:100080 北京市海淀区彩和坊路8号8层807C2;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。