买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京明略软件系统有限公司
摘要:本申请实施例提供了一种人名纠错方法、装置、计算机设备和可读存储介质,人名纠错方法包括:获取待处理人名信息,其中,所述待处理人名信息包括多个字符;获取所述多个字符中排序在预设位置的待定姓氏字符;根据所述待定姓氏字符和所述多个姓氏字符,确定是否能从所述待处理人名信息中提取出目标姓氏字符,其中,所述目标姓氏字符用于表征所述待处理人名信息为汉族人名信息;若能从所述待处理人名信息中提取出所述目标姓氏字符,则对所述待处理人名信息进行汉族人名纠错;若不能从所述待处理人名信息中提取出所述目标姓氏字符,则对所述待处理人名信息进行少数民族人名纠错,通过上述步骤,能够实现自动化的人名纠错。
主权项:1.一种人名纠错方法,其特征在于,应用于计算机设备,所述计算机设备存储有姓氏集合、形近字集合和同音字集合,所述姓氏集合包括多个姓氏字符,所述多个姓氏字符包括多个复姓字符,所述形近字集合包括每个所述姓氏字符的形近字,所述同音字集合包括每个所述姓氏字符的同音字,所述方法包括:获取待处理人名信息,其中,所述待处理人名信息包括多个字符;获取所述多个字符中排序在第一位和第二位的待定姓氏字符;所述待定姓氏字符包括所述多个字符中排序在第一位的第一字符和所述多个字符中排序在第二位的第二字符;根据所述待定姓氏字符和所述多个姓氏字符,确定是否能从所述待处理人名信息中提取出目标姓氏字符,其中,所述目标姓氏字符用于表征所述待处理人名信息为汉族人名信息;若能从所述待处理人名信息中提取出所述目标姓氏字符,则对所述待处理人名信息进行汉族人名纠错;若不能从所述待处理人名信息中提取出所述目标姓氏字符,则对所述待处理人名信息进行少数民族人名纠错;其中,所述根据所述待定姓氏字符和所述多个姓氏字符,确定是否能从所述待处理人名信息中提取出目标姓氏字符的步骤,包括:判断所述待定姓氏字符是否存在于所述多个姓氏字符中;若所述待定姓氏字符存在于所述多个姓氏字符中,则确定从所述多个字符中除去所述待定姓氏字符的剩余字符的字符长度是否超过预设字符长度;若是,则确定不能从所述待处理人名信息中提取出所述目标姓氏字符;若否,则确定能从所述待处理人名信息中提取出所述目标姓氏字符;若所述待定姓氏字符不存在于所述多个姓氏字符中,则确定不能从所述待处理人名信息中提取出所述目标姓氏字符;其中,所述判断所述待定姓氏字符是否存在于所述多个姓氏字符中的步骤,包括:判断所述形近字集合中是否存在与所述第一字符匹配的第一匹配字符;若存在所述第一匹配字符,则确定所述待定姓氏字符存在于所述多个姓氏字符中,并将所述待定姓氏字符的所述第一字符替换为所述第一匹配字符;若不存在所述第一匹配字符,则判断是否能从所述同音字集合中确定出所述第一字符匹配的第二匹配字符;若存在所述第二匹配字符,则确定所述待定姓氏字符存在于所述多个姓氏字符中,并将所述待定姓氏字符中的所述第一字符替换为所述第二匹配字符;若不存在所述第二匹配字符,则从所述形近字集合中确定出所述第一字符的第一待定形近字符、以及所述第二字符的第二待定形近字符,并从所述同音字集合中确定出所述第一字符的第一待定同音字符、以及所述第二字符的第二待定同音字符;判断所述第一待定形近字符和所述第二待定形近字符的组合,或者,所述第一待定形近字符和所述第二待定同音字符的组合,或者,所述第一待定同音字符和所述第二待定形近字符的组合,或者,所述第一待定同音字符和第二待定同音字符的组合,是否存在于所述多个复姓字符中;若是,则判定所述待定姓氏字符存在于所述多个姓氏字符中,并将所述待定姓氏字符中的所述第一字符和所述第二字符替换为目标复姓字符,其中,所述目标复姓字符为存在于所述多个复姓字符中的所述组合;若否,则判定所述待定姓氏字符不存在于所述多个姓氏字符中。
全文数据:
权利要求:
百度查询: 北京明略软件系统有限公司 人名纠错方法、装置、计算机设备和可读存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。