一种领域中文语言预训练模型构建的方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西安电子科技大学

摘要：本发明公开了一种领域中文语言预训练模型构建的方法，其包括：构建领域的实体词库，所述实体词库包括实体词以及实体关系；获取训练文本数据，对所述训练文本数据进行遮罩处理和词向量嵌入处理，得到对应的词向量序列；根据词向量序列、空间关系位置编码序列和包含有实体关系的两个句子的正序列和负序列，对基于多层Transformer模型的RoBERTa模型进行训练得到训练完成的预训练模型，将所述预训练模型接入相对应的下游任务，实现下游任务迁移。本发明能够有效提取专业领域知识以及提升对专业领域的语义理解。

主权项：1.一种领域中文语言预训练模型构建的方法，其特征在于，包括：步骤1：构建领域的实体词库，所述实体词库包括实体词以及实体关系；步骤2：获取训练文本数据，对所述训练文本数据进行遮罩处理和词向量嵌入处理，得到对应的词向量序列；步骤3：根据词向量序列、空间关系位置编码序列和包含有实体关系的两个句子的正序列和负序列，对基于多层Transformer模型的RoBERTa模型进行训练得到训练完成的预训练模型，将所述预训练模型接入相对应的下游任务，实现下游任务迁移。

全文数据：

权利要求：

百度查询：西安电子科技大学一种领域中文语言预训练模型构建的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种水箱散热装置

下一篇：地铁站台无障碍上下车装置

相关技术

一种水箱散热装置

地铁站台无障碍上下车装置

用于质检排班的数据库管理方法、计算机设备及计算机可读存储介质

一种施工环境采样检测装置

一种低能耗低污染物排放的生物质气化炉

一种水稻种子处理装置

一种滚筒杀青机

一种蝶阀手柄的锁紧装置

一种新型的料仓降尘降温、温湿度联动系统

一种埋地管道防腐层破损检测装置

一种多工位双面印刷装置

一种应用于水电站的桌面应急演练数字化系统

预相关技术

一种预拼接式厕所_河南千山卫浴有限公司_202323429142.3

预埋钢筋防护型切割装置_中建六局第八建设有限公司_202323283733.4

前腿预剥、扯皮输送机_南京市宏伟屠宰机械制造有限公司_202323513090.8

基于无线预排冷的淋浴控制系统_广州海鸥住宅工业股份有限公司_202410748973.7

处理前以平面方式预成型流体样品_安捷伦科技有限公司_202080009056.7

一种建筑管道预埋施工装置_丽洲建设集团有限公司_202323381947.5

地下室外墙后浇带预封闭结构_大元建业集团股份有限公司_202420133467.2

一种医用凝胶预混注射装置_聊城大学_202323006446.9

蒸发器预除霜装置、制冷设备及方法_珠海格力电器股份有限公司_202210573171.8

一种弹性面预辊涂铝板_广东广方装饰材料有限公司_202322960318.1

训练相关技术

屏气训练仪_国家体育总局体育科学研究所_202323076047.X

一种大黄鱼野化训练系统及训练方法_浙江省海洋水产养殖研究所_202011149146.4

问答模型训练方法、文本处理方法及奖励模型训练方法_恒生电子股份有限公司_202410779372.2

一种医疗仿真训练装置及其训练方法_清华大学_202411017929.5

用于篮球运动训练的训练评价方法及系统_湖南化工职业技术学院_202410827340.5

一种消防体能训练的爬楼训练机_杭州变革者运动科技有限公司_202323625905.1

一种康复用训练装置_天津中医药大学第一附属医院_202420253883.6

一种口内缝合训练装置_成都中教智汇信息技术有限公司_202420305754.7

一种骨科牵引训练装置_深圳精诚医疗集团如皋医院有限公司_202410697640.6

识别模型训练方法及装置_国泰财产保险有限责任公司_202410894286.6

模型相关技术

三维模型编码装置、三维模型解码装置、三维模型编码方法、以及三维模型解码方法_松下电器(美国)知识产权公司_201880068948.7

一种龙舟模型_集美大学诚毅学院_202420413082.1

打印模型替代体_东莞慧琦医疗科技有限公司_202323554651.9

土岩交界面剪切损伤本构模型构建方法、模型及应用_重庆大学_202410488431.0

问答模型训练方法、文本处理方法及奖励模型训练方法_恒生电子股份有限公司_202410779372.2

一种基于数据模型和前端配置模型快速开发平台及方法_青岛诺亚信息技术有限公司_202411179228.1

物理模型嵌入到大语言模型应用于专业领域的方法和系统_华东理工大学_202410735958.9

一种可自动瞄准射击的水弹炮台模型及玩具模型_刘铂_202323023425.8

一种基于石油业务模型的油气企业大模型构建方法_北京侏罗纪软件股份有限公司_202311789160.4

基于模型拓印的垂类大模型生成方法、平台及存储介质_深圳乐行智慧产业有限公司_202410869347.3

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种领域中文语言预训练模型构建的方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务