买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:阿里巴巴(中国)有限公司
摘要:本申请实施例提供了一种文本摘要模型的训练方法及装置,包括:获取训练数据集,训练数据集包括:至少一个标注摘要样本,标注摘要样本关联有至少一个相关文本样本;从标注摘要样本中获取至少一个关键句子,并在与标注摘要样本关联的相关文本样本中,获取与关键句子匹配的相似句子;利用关键句子与相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;利用标注摘要样本与相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型。本申请采用输入多个相似句子的训练方式,可以较大幅度的降低模型的输入量,从而减少计算量,另外,由于关键句子和相似句子的提取减少了其他冗余内容带来的干扰,因此也提高了整体的训练效率。
主权项:1.一种文本摘要模型的训练方法,其特征在于,包括:获取训练数据集,所述训练数据集包括:至少一个标注摘要样本,所述标注摘要样本关联有至少一个相关文本样本;从所述标注摘要样本中获取至少一个关键句子,并在与所述标注摘要样本关联的相关文本样本中,获取与所述关键句子匹配的相似句子;利用所述关键句子与所述相似句子的对应关系训练初始文本摘要模型,获得第一文本摘要模型;利用所述标注摘要样本与所述相关文本样本的对应关系训练第一文本摘要模型,获得第二文本摘要模型,所述第二文本摘要模型用于根据至少一个相关文本生成摘要文本。
全文数据:
权利要求:
百度查询: 阿里巴巴(中国)有限公司 文本摘要模型的训练方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。