Document
拖动滑块完成拼图
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

结合RPA及AI的拼音标注文本生成方法及装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京来也网络科技有限公司;来也科技(北京)有限公司

摘要:本申请提出一种结合RPA及AI的拼音标注文本生成方法及装置,涉及RPA及AI技术领域,其中方法包括:获取待进行拼音标注的中文文本,生成中文文本对应的拼音文本;将中文文本输入预设的停顿模型,获取中文文本中的停顿信息;按照停顿信息对中文文本进行分词,得到分词结果;基于分词结果以及拼音文本,确定连续三声汉字组成的词语;对连续三声汉字组成的词语进行变声处理,生成中文文本对应的拼音标注文本并输出,该方法可自动对文本中的连续三声汉字组成的词语进行变声处理,更加准确的对文本进行拼音标注,提高了文本的标注效率和正确率。

主权项:1.一种结合RPA及AI的拼音标注文本生成方法,其特征在于,包括:获取待进行拼音标注的中文文本,生成所述中文文本对应的拼音文本;将所述中文文本输入预设的停顿模型,获取所述中文文本中的停顿信息;按照所述停顿信息对所述中文文本进行分词,得到分词结果;基于所述分词结果以及所述拼音文本,确定连续三声汉字组成的词语;对所述连续三声汉字组成的词语进行变声处理,生成所述中文文本对应的拼音标注文本并输出;其中,所述得到分词结果之前,还包括:根据自然语言处理NLP确定停顿分词中每个分词的词性,根据所述词性确定停顿分词后的每个词语,将所述词语输入预设的分词模型,获取所述词语的分词结果;在所述词语的分词结果中存在字数大于等于第二预设数量的待拆分词语时,根据自然语言处理NLP按照所述待拆分词语的字数对所述待拆分词语进行拆分,使得所述待拆分词语的字数小于等于第二预设数量;在所述分词后的结果中存在大于第一预设数量的连续单字词时,对连续单字词进行组合。

全文数据:

权利要求:

百度查询: 北京来也网络科技有限公司 来也科技(北京)有限公司 结合RPA及AI的拼音标注文本生成方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。