首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种法语地名机器翻译方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:中国测绘科学研究院

摘要:本发明公开一种法语地名机器翻译方法,方法包括:首先对预处理后的所述法语地名词组进行区分,获得地名通名部分和地名专名部分;其次将所述地名专名部分按照法汉音译表中字母组合进行翻译,获得专名音译结果;然后将所述地名通名部分按照法语通名所指的地理实体类别进行翻译,获得通名音译结果;最后将所述专名音译结果和所述通名音译结果进行整合,获得地名翻译结果。本发明公开的技术方案实现机器翻译,减少地名生成时的人力消耗,并提高了翻译法语地名的效率。

主权项:1.一种法语地名机器翻译方法,其特征在于,所述方法包括:获取待翻译的法语地名词组;对所述法语地名词组进行预处理;基于预处理后的所述法语地名词组进行区分,获得地名通名部分和地名专名部分;将所述地名专名部分按照法汉音译表中字母组合进行翻译,获得专名音译结果;将所述地名通名部分按照法语通名所指的地理实体类别进行翻译,获得通名音译结果;将所述专名音译结果和所述通名音译结果进行整合,获得地名翻译结果;所述基于预处理后的所述法语地名词组进行区分,获得地名通名部分和地名专名部分,具体包括:基于地名语料库中存储的预处理后的法语地名词组确定地名通名模板;根据各所述地名通名模板确定所有的通名结构分解方案;计算各所述地名通名模板对应的对数频率;对同一所述通名结构分解方案内的各所述对数频率求和,得到各所述通名结构分解方案对应的对数频率总和;将所述对数频率总和最大的所述通名结构分解方案作为地名结构树;将所述地名结构树的子叶节点作为所述地名专名部分;将所述地名结构树的非子叶节点作为所述地名通名部分;所述基于地名语料库中存储的预处理后的法语地名词组确定地名通名模板,具体包括:利用计算地名语料库中任意有序词对的互信息;其中,Pa表示预处理后的法语地名词组a在地名语料中出现的频率,Pb表示预处理后的法语地名词组b在地名语料中出现的频率,Pab表示预处理后的法语地名词组a与b之间的共现频率,MIab表示有序词对a,b的互信息;预处理后的法语地名词组a与预处理后的法语地名词组b组成有序词对a,b;将所述地名语料库中共现频率大于第一设定值且互信息大于第二设定值的有序词对存储到有序词对库中;遍历所有句子,将每个句子中构成预处理后的法语地名词组作为有向无环图上的点;当句子中的两个预处理后的法语地名词组属于所述有序词对库中的有序词对时,则在有向无环图上将两点连成线,绘制成有向边;找出有向无环图上所有路径,对于每一条路径按照访问节点对应的预处理后的法语地名词组生成一个候选地名模板;所述路径由多个有向边组成的;统计各候选地名模板的频率,将频率大于设定频率阈值的候选地名模板作为地名通名模板;所述将所述地名专名部分按照法汉音译表中字母组合进行翻译,获得专名音译结果,具体包括:以最小熵为原则,对单词字母进行无监督学习,获得字母组合分布;采用最短路径法分词法对所述地名专名部分中字母进行切分组合,获得多个字母组合;根据所述字母组合分布计算不同字母组合的平均熵值;选取熵值最小的字母组合作为最优字母组合;将所述最优字母组合按照法汉音译表译写为汉字的过程,从而得到专名音译结果;所述将所述地名通名部分按照法语通名所指的地理实体类别进行翻译,获得通名音译结果,具体包括:利用法汉辞典以及所述地名通名模板对所述地名通名部分进行翻译和解析,获得地名层次语法结构;根据自底向上的原则,逐层将所述地名层次语法结构中的法语地名要素转换成中文地名要素,获得通名音译结果。

全文数据:

权利要求:

百度查询: 中国测绘科学研究院 一种法语地名机器翻译方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。