买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:平安科技(深圳)有限公司
摘要:本发明涉及人工智能技术领域,提供了一种文本摘要生成方法、装置、设备及介质。该方法包括:将待处理文档的第一图片分割成多张第二图片并输入预设变压模型中进行贴片嵌入,输出每张第二图片的图像特征;根据预设分词算法对待处理文档的文本进行分词得到多个分词并输入预设变压模型中进行标记嵌入,输出每个分词的词向量特征;将每张第二图片的图像特征和每个分词的词向量特征输入预设对齐模型进行对齐处理,输出对齐结果;将对齐结果输入预设变压模型的解码器,输出待处理文档对应的多个关键词,将所有关键词按顺序进行拼接,输入待处理文档的摘要。本发明还涉及区块链技术领域,上述图像特征、词向量特征还可以存储于一区块链的节点中。
主权项:1.一种文本摘要生成方法,其特征在于,所述方法包括:将待处理文档包含的第一图片分割成多张第二图片,将多张所述第二图片输入预设变压模型中进行贴片嵌入,输出每张第二图片的图像特征;根据预设分词算法对所述待处理文档的文本进行分词得到多个分词,将每个分词输入预设变压模型中进行标记嵌入,输出每个所述分词的词向量特征;将每张所述第二图片的图像特征和每个所述分词的词向量特征输入预设对齐模型进行对齐处理,输出对齐结果;将所述对齐结果输入所述预设变压模型的解码器,输出所述待处理文档对应的多个关键词,将所有关键词按顺序进行拼接,输入所述待处理文档的摘要;其中,所述将每张所述第二图片的图像特征和每个所述分词的词向量特征输入预设对齐模型进行对齐处理,输出对齐结果,包括:将每张所述第二图片的图像特征和每个所述分词的词向量特征输入预设对齐模型进行注意力权重分配,输出每张所述第二图片的第一初始值和每个所述分词的第二初始值;分别对所述第一初始值和所述第二初始值进行池化操作,得到每张所述第二图片的向量和每个所述分词的向量;根据每张所述第二图片的向量和每个所述分词的向量,对每张所述第二图片的图像特征和每个所述分词的词向量特征执行预设次数的循环对齐,输出对齐结果;所述根据每张所述第二图片的向量和每个所述分词的向量,对每张所述第二图片的图像特征和每个所述分词的词向量特征执行预设次数的循环对齐,输出对齐结果,包括:将所有的第二图片的图像特征进行池化操作得到所述第一图片的向量,及将所有的每个分词的词向量特征进行池化操作得到所述文本的向量;根据预设第一损失值计算公式,将所述第一图片的向量和每张所述第二图片的向量进行对比学习训练,得到第一损失值,及根据预设第二损失值计算公式,将所述文本的向量和每个所述分词的向量进行对比学习训练,得到第二损失值;根据所述第一损失值和所述第二损失值,调整所述预设对齐模型在剃度反传的参数,并对每张所述第二图片的图像特征和每个所述分词的词向量特征执行预设次数的循环对齐,输出对齐结果;所述将每张所述第二图片的图像特征和每个所述分词的词向量特征输入预设对齐模型进行注意力权重分配,输出每张所述第二图片的第一初始值和每个所述分词的第二初始值,包括:根据预设对齐模型的注意力机制,对每张所述第二图片的图像特征和每个所述分词的词向量特征进行注意力权重分配并进行相似度计算,得到每张所述第二图片的图像特征对应的第一信息向量,及输出每个所述分词的词向量特征对应的第二信息向量;输入第一激活函数和第二激活函数,将所述第一信息向量和所述第二信息向量进行拼接并执行预设次数的对齐操作,输出每张所述第二图片的第一初始值和每个所述分词的第二初始值。
全文数据:
权利要求:
百度查询: 平安科技(深圳)有限公司 文本摘要生成方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。