买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
摘要:本发明涉及知识问答技术领域,尤其涉及一种用于知识问答的数据处理方法、装置、介质及设备,包括:对第一知识答案中的初始实体词和初始关键词进行分组,通过初始实体词和初始关键词之间的关联程度以及词组对应的重要程度,筛选得到目标关键词,融合初始问题和目标关键词得到目标扩充问题,提高了问题深度和有效信息的丰富性,在第一大语言模型对初始问题进行全面分析的基础上,基于对应知识领域的目标大语言模型对目标问题进行深度分析,获取目标知识答案,并对初始问题进行多次扩充和深化,不断更新目标知识答案,获取到准确性更高的目标知识答案作为目标知识查询结果,提高了目标知识查询结果的准确性,进而提高了与用户问答需求的匹配性。
主权项:1.一种用于知识问答的数据处理方法,其特征在于,所述用于知识问答的数据处理方法包括如下步骤:S100,获取到初始问题对应的若干个初始关键词、所述初始问题对应的第一知识答案和第一知识领域、所述第一知识答案对应的若干个初始实体词、每个初始实体词在所述第一知识答案中的第一位置和第一出现次数,以及每个初始关键词在所述第一知识答案中的第二位置和第二出现次数;S200,根据所述第一位置和所述第二位置,对所述第一知识答案中的所有初始实体词和所有初始关键词进行分组,获取到若干个词组,其中,所述第一位置包括第一语句序号,第一语句序号是指对应的初始实体词在所述第一知识答案中对应的语句的序号,所述第二位置包括第二语句序号,第二语句序号是指对应的初始关键词在所述第一知识答案中对应的语句的序号,S200还包括如下步骤:S210,为每个第一语句序号分配初始集合,其中,所述初始集合为空集;S220,针对任一初始实体词,根据当前初始实体词对应的第一语句序号,将当前初始实体词分配至对应的初始集合中;S230,针对任一初始关键词,根据当前初始关键词对应的第二语句序号和每个初始集合对应的第一语句序号,将当前初始关键词分配至对应的初始集合中;S240,遍历所有的初始实体词和所有的初始关键词,将所有的初始实体词和所有的初始关键词分配至对应的初始集合中,获取到更新后的初始集合;S250,将每个更新后的初始集合确定为对应的词组;S300,针对任一初始实体词,根据当前初始实体词的第一位置、当前初始实体词对应的词组中的所有初始关键词的第二出现次数,以及当前初始实体词对应的词组中的初始关键词的第二位置,获取到当前初始实体词对应的词语优先级;S400,遍历所有的初始实体词,将最大的词语优先级对应的初始实体词确定为目标关键词;S500,根据所述初始问题和所述目标关键词,获取到目标扩充问题;S600,将所述目标扩充问题输入至所述第一知识领域对应的目标大语言模型中,获取到所述目标扩充问题对应的目标知识答案;S700,将所述目标知识答案作为第一答案,更新返回次数,并返回执行步骤S100,直至最大的词语优先级或者返回次数满足停止条件,将满足所述停止条件时的最大的词语优先级对应的目标知识答案,确定为所述初始问题对应的目标知识查询结果。
全文数据:
权利要求:
百度查询: 浙江有数数智科技有限公司 一种用于知识问答的数据处理方法、装置、介质及设备
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。