买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京锐安科技有限公司
摘要:本发明公开了一种语句分词方法、装置、计算机设备及存储介质。该方法包括:获取目标语句;根据预设词典和目标语句确定第一词语和第二词语,根据第一词语确定前缀树,第一词语为目标语句中记载于预设词典的词语,第二词语为未记载于预设词典的词语;根据前缀树确定第一有向无环图;根据第二词语和第一有向无环图确定第二有向无环图;根据第二有向无环图确定目标路径,目标路径用于表示目标语句的分词方式。目标路径可以为第二有向无环图的优选路径,进而得到优选的分词方式,提高分词准确性。
主权项:1.一种语句分词方法,其特征在于,包括:获取目标语句;根据预设词典和所述目标语句确定第一词语和第二词语,根据所述第一词语确定前缀树,所述第一词语为所述目标语句中记载于所述预设词典的词语,所述第二词语为未记载于所述预设词典的词语;根据所述前缀树确定第一有向无环图;根据所述第二词语和所述第一有向无环图确定第二有向无环图;根据第二有向无环图确定目标路径,所述目标路径用于表示所述目标语句的分词方式;所述根据所述第一词语确定前缀树,包括:针对每个字符位置上的单字,确定在所述预设词典中是否包含所述单字;在所述预设词典包含所述单字的情况下,将建立所述单字为根节点的前缀树;基于所述单字,确定多个目标词语;针对每个所述目标词语,确定所述目标词语是否记载于所述预设词典中;在所述目标词语记载于所述预设词典的情况下,将所述目标词语确定为第一词语,并将所述第一词语添加到所述根节点的前缀树中;根据目标文件确定所述目标语句,包括:接收用户输入的目标文件;获取所述目标文件中的多个语句;依次将所述多个语句中的一个语句作为目标语句。
全文数据:
权利要求:
百度查询: 北京锐安科技有限公司 语句分词方法、装置、计算机设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。