买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明公开了一种文本向量提取模型的训练方法、装置、介质及计算机设备,涉及机器学习技术领域。其中方法包括:获取利用样本训练集中的多个文本训练得到的初始文本向量提取模型;并确定所述初始文本向量提取模型在本轮迭代训练过程中输出的所述多个文本分别的文本特征向量;与此同时,根据所述文本特征向量,分别计算所述多个问题文本中任意一个问题文本与多个所述正答案文本和多个所述负答案文本之间的第一相似度,并基于所述第一相似度,确定所述任意一个问题文本的新负答案文本;最终根据所述任意一个问题文本对应的正答案文本和新负答案文本,对所述初始文本向量提取模型进行迭代训练,直至模型收敛。本发明适用于文本向量提取模型的训练。
主权项:1.一种文本向量提取模型的训练方法,其特征在于,包括:获取利用样本训练集中的多个文本训练得到的初始文本向量提取模型,所述多个文本包括多个问题文本以及所述多个问题文本分别对应的正答案文本和负答案文本;确定所述初始文本向量提取模型在本轮迭代训练过程中输出的所述多个文本分别对应的文本特征向量;根据所述文本特征向量,分别计算所述多个问题文本中任意一个问题文本与多个所述正答案文本和多个所述负答案文本之间的第一相似度,并基于所述第一相似度,确定所述任意一个问题文本对应的新负答案文本;根据所述任意一个问题文本对应的正答案文本和新负答案文本,对所述初始文本向量提取模型进行迭代训练,直至模型收敛;其中,根据所述任意一个问题文本对应的正答案文本和新负答案文本,对所述初始文本向量提取模型进行迭代训练,直至模型收敛,包括:根据所述任意一个问题文本对应的文本特征向量和所述正答案文本对应的文本特征向量,计算所述任意一个问题文本与所述正答案文本之间的第二相似度;根据计算的所述第二相似度,构建所处初始文本向量提取模型对应的第一损失函数;根据所述任意一个问题文本对应的文本特征向量和所述新负答案文本对应的文本特征向量,计算所述任意一个问题文本与所述新负答案文本之间的第三相似度;根据计算的所述第三相似度,构建所述初始文本向量提取模型对应的第二损失函数;根据所述第一损失函数和所述第二损失函数,对所述初始文本向量提取模型进行迭代训练,重复更新负答案文本和训练模型的过程,直至模型收敛。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 文本向量提取模型的训练方法、装置、介质及计算机设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。