首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本处理方法、装置、设备以及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:腾讯科技(深圳)有限公司

摘要:本申请实施例提供了一种文本处理方法、装置、设备以及介质,该方法可应用在文本内容理解场景中,用于提高摘要生成质量。方法包括:获取第i次迭代的参考模型、待训练模型和文本训练集;在第i次迭代中,将文本训练集内的训练样本中的原始文本输入至参考模型进行前向计算,得到参考预测文本;将原始文本输入至待训练模型进行前向计算,得到样本预测文本;根据参考预测文本、样本预测文本、训练样本中的正摘要文本和负摘要文本,修正第i次迭代的待训练模型的参数,得到第i次迭代的摘要生成模型;对样本预测文本进行修正得到样本修正文本,将原始文本、样本预测文本、样本修正文本封装为新增样本,将新增样本添加至第i+1次迭代的文本训练集。

主权项:1.一种文本处理方法,其特征在于,包括:获取第i次迭代的参考模型和待训练模型,获取第i次迭代的文本训练集;第i次迭代的文本训练集中的每一个训练样本包含原始文本、负摘要文本以及正摘要文本,i为正整数;通过第i次迭代的参考模型,对第i次迭代的文本训练集中的训练样本所包含的原始文本进行摘要提取处理,得到参考预测文本;通过第i次迭代的待训练模型,对第i次迭代的文本训练集中的训练样本所包含的原始文本进行摘要提取处理,得到样本预测文本;根据所述参考预测文本、所述样本预测文本、所述正摘要文本和所述负摘要文本,对第i次迭代的待训练模型的网络参数进行修正,得到第i次迭代的摘要生成模型;第i次迭代的摘要生成模型用于作为第i+1次迭代的参考模型和待训练模型;对所述样本预测文本进行修正,得到样本修正文本,将所述原始文本、所述样本预测文本以及所述样本修正文本封装为新增样本,将所述新增样本添加至第i+1次迭代的文本训练集;第i+1次迭代的文本训练集用于训练第i+1次迭代的待训练模型。

全文数据:

权利要求:

百度查询: 腾讯科技(深圳)有限公司 文本处理方法、装置、设备以及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。