首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

召回文本的生成方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:平安科技(深圳)有限公司

摘要:本发明涉及人工智能技术,揭露了一种召回文本的生成方法,包括:生成基础用户画像,获取每个所述画像语义的画像向量;提取产品数据的产品关键词,获取每个所述产品关键词的关键词向量;选取目标画像向量和目标关键词向量;利用待训练的召回装置计算所述目标画像向量和所述目标关键词向量的相似度;计算所述相似度和预设的相似阈值的损失值,当所述损失值小于预设的损失阈值时,得到训练完成的召回装置,将待测文本输入至所述训练完成的召回装置,得到召回文本。此外,本发明还涉及区块链技术,数据列表可存储于区块链的节点。本发明还提出一种召回文本的生成装置、电子设备以及存储介质。本发明可以提高召回文本的生成的效率。

主权项:1.一种召回文本的生成方法,其特征在于,所述方法包括:获取用户的基础信息,根据所述基础信息生成基础用户画像;对所述基础用户画像中的画像语义进行加权计算,得到每个所述画像语义的画像向量;获取产品的产品数据,提取所述产品数据的产品关键词;对所述产品关键词进行赋权量化计算,得到每个所述产品关键词的关键词向量;选取目标任务下的所述画像向量为目标画像向量,选取目标任务下的所述关键词向量为目标关键词向量;将所述目标画像向量和所述目标关键词向量输入至待训练的召回装置,利用所述待训练的召回装置计算所述目标画像向量和所述目标关键词向量的相似度;计算所述相似度和预设的相似阈值的损失值,当所述损失值小于预设的损失阈值时,得到训练完成的召回装置,将待测文本输入至所述训练完成的召回装置,得到召回文本;其中,所述计算所述相似度和预设的相似阈值的损失值,包括:利用如下公式计算所述相似度和预设的相似阈值的损失值: 其中,Lk1,...,θk,θs为所述损失值,K表示任务总数,k表示第k个任务,表示目标任务中第t迭代训练时第k个任务的任务权重,其中t代表训练迭代次数,ωk,0和是权重计算模型的超参数,X是输入样本数据,Lkθk,θs表示第k个任务的损失函数,θs是所有任务的共享参数,θk是每个任务单独的独立参数,表示样本是否在任务k场景N的样本空间,其中表示第i个场景在第k个任务中的标签,N表示存在N个场景,是在第i个场景和第k个任务中的真实值,是在第i个场景和第k个任务中的损失函数;所述计算所述目标画像向量和所述目标关键词向量的相似度,包括:利用如下公式计算所述目标画像向量和所述目标关键词向量的相似度: 其中,dx,y为所述相似度,xi为所述目标画像向量中第i个目标画像分向量,yi为所述目标关键词向量中第i个目标关键词分向量,n表示所述目标画像向量中的所述目标画像分向量个数;所述对所述产品关键词进行赋权量化计算,得到每个所述产品关键词的关键词向量,包括:利用预先训练的语料模型将每个所述产品关键词表征为n维的词向量;对所述词向量进行赋权量化计算,得到所述产品关键词的关键词权重向量;按照预设的向量维度设定对所述关键词权重向量进行向量维度调整,得到所述产品关键词的关键词向量;所述提取所述产品数据的产品关键词,包括:利用预设的停用词表,对所述产品数据的停用词进行过滤;对过滤后的产品数据进行去低频词处理;对去低频词处理后得到的产品数据进行分词处理,得到产品关键词;所述对所述基础用户画像中的画像语义进行加权计算,得到每个所述画像语义的画像向量,包括:利用预设的向量提取模型获取所述基础用户画像中的画像语义;根据预设的向量函数对所述画像语义进行加权计算,得到所述画像语义的画像向量;所述根据所述基础信息生成基础用户画像,包括:从所述基础信息中选取其中一个信息为目标信息;对所述目标信息进行核心语义提取,得到信息语义;对所述信息语义进行向量化处理,得到语义向量;将所有基础信息对应的语义向量拼接为所述基础用户画像。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 召回文本的生成方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。