Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜厦门快商通科技股份有限公司江豪获国家专利权

恭喜厦门快商通科技股份有限公司江豪获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜厦门快商通科技股份有限公司申请的专利一种训练文本匹配模型的方法、装置以及存储介质获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114781477B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210231382.3,技术领域涉及:G06F18/214;该发明授权一种训练文本匹配模型的方法、装置以及存储介质是由江豪;肖龙源;李稀敏;李威设计研发完成,并于2022-03-09向国家知识产权局提交的专利申请。

一种训练文本匹配模型的方法、装置以及存储介质在说明书摘要公布了:本发明涉及人工智能领域,其公开了一种训练文本匹配模型的方法,包括:使用第三训练集训练预先训练的语言模型得到第一教师模型,使用第一教师模型对预先建立的待蒸馏模型进行知识蒸馏得到第一学生模型;使用第一训练集训练第一教师模型得到第二教师模型,将第二训练集存储到搜索引擎,使用第二教师模型提取第二训练集的特征向量,将特征向量存储到近似近邻搜索库;通过第一训练集中的已标注数据包含的第一文本和第二文本从搜索引擎和近似近邻搜索库中分别获取第一结果集和第二结果集,并确定蒸馏数据;基于蒸馏数据训练第一学生模型,生成训练好的目标模型。本发明可以在训练过程中有针对性地对训练集的数据进行增强,提高知识蒸馏的效果。

本发明授权一种训练文本匹配模型的方法、装置以及存储介质在权利要求书中公布了:1.一种训练文本匹配模型的方法,其特征在于,包括步骤:S1,获取第一训练集、第二训练集和第三训练集,所述第一训练集包含第一领域内的用于文本匹配的已标注数据,所述第二训练集包含所述第一领域内的用于文本匹配的未标注数据,所述第三训练集包含第二领域内用于文本匹配的已标注数据;S2,将所述第三训练集输入预先训练的语言模型,基于文本匹配任务对所述预先训练的语言模型进行训练,得到候选语言模型,将所述候选语言模型作为知识蒸馏中的第一教师模型,使用所述第一教师模型对预先建立的待蒸馏模型进行知识蒸馏,得到第一学生模型;S3,使用所述第一训练集对所述第一教师模型进行训练,得到训练好的第二教师模型,将所述第二训练集中的未标注数据存储到搜索引擎,使用所述第二教师模型提取与所述第二训练集中的未标注数据对应的特征向量,将所述特征向量存储到近似近邻搜索库,所述搜索引擎对所述第二训练集中的未标注数据进行分词建立倒排索引,所述近似近邻搜索库使用预定的近似最近邻搜索算法对所述特征向量建立索引;S4,所述第一训练集中的已标注数据包含第一文本和第二文本,根据所述第一文本从所述搜索引擎和所述近似近邻搜索库中获取第一结果集,根据所述第二文本从所述搜索引擎和所述近似近邻搜索库中获取第二结果集,通过将所述第一文本和所述第二结果集进行拼接以及将所述第二文本和所述第一结果集进行拼接确定用于知识蒸馏的蒸馏数据;S5,基于所述蒸馏数据和所述第二教师模型,使用知识蒸馏方法对所述第一学生模型进行训练,生成训练好的目标模型。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人厦门快商通科技股份有限公司,其通讯地址为:361000 福建省厦门市软件园三期诚毅北大街63号1301单元;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。