基于上下文的汉越跨语言句嵌入方法

导航：龙图腾网> 最新专利技术> 基于上下文的汉越跨语言句嵌入方法

申请/专利权人：昆明理工大学

申请日：2022-05-19

公开（公告）日：2024-06-21

公开（公告）号：CN114861631B

主分类号：G06F40/211

分类号：G06F40/211;G06F40/279;G06F40/30;G06F18/22;G06N3/0455;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2022.08.23#实质审查的生效;2022.08.05#公开

摘要：本发明涉及基于上下文的汉越跨语言句嵌入方法，属自然语言处理领域。本发明首先构建训练数据集；再利用mBERT模型获取训练数据集中对应的汉越上下文跨语言句嵌入，并基于孪生网络结构搭建线性微调层，对获取到的汉越上下文跨语言句嵌入进行重构，并以此构建对比损失用于反向优化微调层。本发明通过构建融合孪生网络结构的线性微调层对mBERT模型中获取到的汉越上下文跨语言句嵌入进行重构，有效缓解了mBERT模型中因汉越句级平行语料稀缺及语法差异较大导致的汉越跨语言句嵌入语义对齐效果不佳的问题。实验结果表明，本发明的准确度均取得了较大提升，提高汉越嵌入分布间的重合度，改善汉越低资源上下文跨语言句嵌入的语义对齐效果。

主权项：1.基于上下文的汉越跨语言句嵌入方法，其特征在于：所述方法的具体步骤如下：Step1、使用汉语与越南语同主题的可比语料构建汉越平行句对数据集与非平行句对数据集作为正例和负例，进行相应预处理操作后用于孪生网络线性微调层的训练；Step2、基于mBERT模型获取训练集对应的汉越上下文跨语言句嵌入，并融合孪生网络结构搭建线性微调层，用于对mBERT模型中获取到的汉越上下文跨语言句嵌入进行重构，并构建对比损失用于反向优化线性微调层；Step3、将mBERT模型与优化好的线性微调层进行组合，得到基于上下文的汉越跨语言句嵌入模型mBERT-SF，用于获取高质量的汉越上下文跨语言句嵌入；所述Step2的具体步骤为：Step2.1、基于多语预训练模型mBERT获取训练集中对应的汉越上下文跨语言句嵌入CLSS和CLST；Step2.2、构建两个结构相同的子网络Network1和Network2组成线性重构层，分别对汉越输入句对中对应的上下文跨语言句嵌入CLSS和CLST进行重构，使具有相同语义的汉越跨语言句嵌入在共享嵌入空间中拥有相近的向量表示；每个子网络均由一个全连接层和一个Dropout层构成，其中，全连接层大小为768维*768维，负责对mBERT模型输出的原始上下文跨语言句嵌入进行特征提取；为进一步提升模型的泛化能力，在全连接层fc后添加了一层Dropout层，通过对全连接层中的神经元以概率p进行随机剔除，防止模型产生过拟合问题；两个子网络Network1和Network2特征提取过程如公式1所示，由于两个网络的结构相同且权重共享，因此这里使用x代表汉语或越南语微调前的跨语言句嵌入CLSS、CLST，利用同样的计算公式展示两者的运算过程；y＝pfWx1公式1中，x代表子网络Network1和Network2重构后的输出，其中pfWx代表Dropout层的输出，p为神经元的随机剔除概率、W为全连接层fc的权重值；最终结果y即可代表经微调层重构后的汉语和越南语上下文跨语言句嵌入Ezh和Evi；Step2.3、采用对比损失构建匹配层用于反向微调两个子网络，使正例中的汉越上下文跨语言句嵌入尽可能相似，负例间的嵌入相似度尽可能低，如公式2所示； DEzh,Evi＝||Ezh-Evi||23其中，Ezh和Evi为经微调层重构后的汉语与越南语上下文跨语言句嵌入；DEzh,Evi代表两嵌入之间的欧式距离，如公式3所示；l代表输入的汉越句对所对应的标签，当输入为平行句对所构建的正例时，l＝0，为非平行句对构成的负例时，l＝1；m为设定的最大边距值margin，通过执行m-DEzh,Evi运算为负例中欧氏距离超过最大边距值的句对生成较小的损失，以满足模型的优化目标；所述Step3的具体步骤为：Step3.1、将mBERT模型与优化好的线性微调层进行融合，组成mBERT-SF模型；Step3.2、当输入新的汉语或越南语句子时，首先基于mBERT模型获取其对应的汉越或越南语上下文跨语言句嵌入；然后，通过融合孪生网络结构的线性微调层对其进行重构，使具有相似语义的汉越上下文跨语言句嵌入在共享嵌入空间中拥有更为相近的向量表示，有效缓解多语预训练模型中汉越句级平行语料稀缺和语言差异性大导致的语义对齐误差问题。

全文数据：

权利要求：

百度查询：昆明理工大学基于上下文的汉越跨语言句嵌入方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种叠加机

下一篇：一种仓库物资搬运装置

相关技术

一种叠加机

一种仓库物资搬运装置

一种纸面石膏板加工用除尘装置

一种杀菌效果好的卤制品杀菌锅

一种巡检方便的电容补偿柜

一种上颌窦膜推起工具

一种纸箱印刷机用送料装置

一种用于3C零件组装的点胶设备

一种用于光伏发电装置的R型回转减速机

一种汽车质量块加工用刀具

一种机罩

一种新型全遮光窗帘面料

嵌入相关技术

一种嵌入式LED球泡灯_江门市天衍照明科技有限公司_202420183915.X

一种嵌入式触摸屏_佛山市顺德区技强电子有限公司_202322452987.8

一种LED嵌入式筒灯_无锡市益明光电有限公司_202322974357.7

低压铸造预嵌入钢套结构_六丰金属科技(昆山)有限公司_202322914103.6

用于内衬管道或通道的嵌入软管_英普瑞格股份有限公司_202280077017.X

一种嵌入式光伏电站_安徽吉电新能源有限公司_202322714319.8

一种嵌入式侧板灯_深圳市八斗光电科技有限公司_202322811987.2

基于标签特定特征与多重相关信息的嵌入式多标签分类方法_南京邮电大学_202410205503.6

一种基于嵌入式的电子标签阅读器_苏州鑫福耀智能科技有限公司_202322940956.7

电子芯片的嵌入式分流微通道散热器_东南大学_202410580371.5

跨相关技术

跨乘式车辆_雅马哈发动机株式会社_202311807345.3

跨膜新抗原肽_居里研究所_202280033953.0

跨设备分屏方法及相关装置_华为技术有限公司_202211695536.0

一种基于区块链跨链的车联网跨域服务公平可信提供方法_北京交通大学_202410408472.4

基于跨尺度与跨模态注意力机制的药物-靶标结合亲和力预测方法_重庆大学_202410505535.8

一种跨平台框架的快速构建方法_广州知韫科技有限公司_202410494027.4

跨链转移数据处理方法及装置_杭州高新区(滨江)区块链与数据安全研究院_202410346108.X

制动液压控制装置及跨乘型车辆_罗伯特·博世有限公司_202180017301.3

用于跨乘式车辆的收纳盒_雅马哈发动机株式会社_202311808252.2

一种FPGA跨时钟分析检测方法_成都迪真计算机科技有限公司_202410684834.2

语言相关技术

基于大语言模型的自然语言数据分析方法及系统_北京尚博信科技有限公司_202410549288.1

基于大语言模型的信息提取装置、方法_山东浪潮科学研究院有限公司_202410203010.9

多任务大语言模型训练方法及装置_支付宝(杭州)信息技术有限公司_202410473352.2

一种多语言混合智能翻译方法_江苏省舜禹信息技术有限公司_202011359255.9

训练大语言模型的方法、装置、电子设备_北京百川智能科技有限公司_202311856910.5

用于为预训练的语言模型处置长文本的系统和技术_甲骨文国际公司_202280076746.3

一种基于Modelica语言的离散式动态集热器的建模方法_南京远思智能科技有限公司_202410508263.7

自然语言的处理方法、装置、设备、介质和程序产品_中国工商银行股份有限公司_202410353899.9

一种基于大语言模型的文本搜索匹配方法和系统_公安部第三研究所_202410368833.7

一种基于视觉语言模型的自动导引车导航方法及装置_浙江大学湖州研究院_202410674459.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于上下文的汉越跨语言句嵌入方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务