首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

繁简体文本的转换方法、装置、设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明涉及人工智能技术领域及医疗领域,揭露了一种繁简体文本的转换方法,该方法包括:将待分词句子输入分词模型中进行分词,根据繁简体映射字典判断单字词是否对应多个繁体字,若对应多个繁体字,在单字词前面顺序或者后面顺序加入预设数量的字词进行转换,若转换的繁体字不同,则按待分词句子的语义选择合适的繁体字,得到单字词结果;采用从后往前的最长子串匹配对多字词进行转换,得到多字词转换结果,将单字词转换结果与多字词转换结果进行拼接得到与之对应的繁体句子,将繁体句子进行拼接,得到已转换文本。本发明还提出一种繁简体文本装置、电子设备以及存储介质。

主权项:1.一种繁简体文本的转换方法,其特征在于,所述转换方法包括简体文本转换繁体文本的步骤:获取待转换文本,按预设的断句规则将所述待转换文本拆分成多个待分词句子,将所述待分词句子输入预设的分词模型中,利用所述预设的分词模型对所述待分词句子进行分词,得到单字词和多字词;根据预设的繁简体映射字典对所述单字词进行判断,若判断的结果为所述单字词对应数量至少有两个的繁体字,则在所述单字词前面顺序加入预设数量的字词,得到前词多字词,根据所述预设的繁简体映射字典,将所述前词多字词转换成对应的繁体字,得到单字词转换结果;根据所述预设的繁简体映射字典,采用最长子串匹配将所述多字词转换成对应的繁体字,得到多字词转换结果;将所述单字词转换结果与所述多字词转换结果进行拼接,得到所述待分词句子对应的繁体句子。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 繁简体文本的转换方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。