买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京华飞数据技术有限公司
摘要:本发明涉及多语言智能问答管理技术领域,具体为一种基于logistic算法的多语言智能问答管理系统及方法,包括分析在不同历史问答记录下,用户在多语言智能问答程序中输入的问题之间的一致程度;对用户的历史问答记录进行优化调整,得到用户的目标问答数据;对当前周期内用户在多语言智能问答程序内输入的问题数据进行获取,对当前周期内用户在多语言智能问答程序内的问题数据进行优化调整,得到当前周期内用户的目标问题数据;获取用户的目标问题数据,使用多语言智能问答程序生成目标问题数据对应的目标答案数据,在多语言智能问答程序内将目标答案数据向用户进行展示,并对多语言智能问答程序进行智能管理。
主权项:1.一种基于logistic算法的多语言智能问答管理方法,其特征在于,所述方法包括:步骤S100:构建问答管理云平台,获取用户在多语言智能问答程序中的历史问答记录,从所述历史问答记录中提取出历史问答数据,分析在不同历史问答记录下,所述用户在多语言智能问答程序中输入的问题之间的一致程度,得到所述用户的标记一致数据;所述步骤S100包括:步骤S101:构建问答管理云平台,获取用户在多语言智能问答程序中的各个历史问答记录,从所述历史问答记录中提取出用户的历史问答数据,所述历史问答数据,包括一次问答记录中所述用户输入的问题文本信息和所述多语言智能问答程序输出的答案文本信息;步骤S102:获取所述各个历史问答记录中所述用户在多语言智能问答程序内输入问题的时间点,并记为所述各个历史问答记录的标记时间点;步骤S103:获取所述各个历史问答记录中所述用户的问题文本信息,使用预设的logistic算法模型对所述问题文本信息进行意图识别,并根据所述问题文本信息的语义,将所述问题文本信息分解为若干个单词,并将所述若干个单词转化为对应的若干个词向量,并将所述若干个词向量进行汇集,得到所述问题文本信息对应的词向量组;步骤S104:获取所述用户的各个历史问答记录中问题文本消息的词向量组,分析不同历史问答记录下,所述用户在多语言智能问答程序中输入问题之间的一致程度,其中,第a个历史问答记录与第b个历史问答记录之间的问题一致程度具体分析过程为,获取第a个历史问答记录的词向量组A,获取第b个历史问答记录的词向量组B,并对所述词向量组A和所述词向量组B进行对齐,具体对齐过程为,当所述词向量组A内的词向量的总个数大于所述词向量组B的总个数,将所述词向量组B中的缺失词向量的数值赋值为0,并补充至所述词向量组B中,反之当则将所述词向量组A中的缺失词向量的数值赋值为0,并补充至所述词向量组A中,直至所述词向量组A与所述词向量组B之间的词向量的总个数相同;步骤S105:计算所述词向量组A与所述词向量组B之间的表示空间一致值: ;其中,j为所述向量组A中词向量的总个数;表示所述向量组A中第i个词向量对应的数值;表示所述向量组B中第i个词向量对应的数值;步骤S106:计算所述词向量组A与所述词向量组B之间的词组一致值: ;设置词组一致值阈值,当所述词向量组A与所述词向量组B之间的词组一致值大于第一词组一致值阈值,判定所述词向量组A记为所述词向量组B的一致,判定所述第a个历史问答记录与所述第b个历史问答记录之间的问题一致;步骤S107:获取被判定的问题一致的若干个历史问答记录,获取所述若干个历史问答记录的标记时间点,根据时间先后顺序,对所述若干个历史问答记录进行排序,对所述若干个历史问答记录中的次序最小的历史问答记录进行标记,并将所述若干历史问答记录中剩余未标记的历史问答记录进行汇集,得到所述次序最小的历史问答记录的标记历史问答记录集;步骤S108:获取所述用户的所述各个历史问答记录的标记历史问答记录集并进行汇集,得到所述用户的标记一致数据;步骤S200:基于所述用户的标记一致数据,分析不同历史问答记录中所述多语言智能问答程序输出答案之间的差异程度,并计算不同历史问答记录的标记答案差异值,基于所述标记答案差异值,对所述用户的历史问答记录进行优化调整,得到所述用户的目标问答数据;所述步骤S200包括:步骤S201:获取所述用户的标记一致数据,从所述标记一致数据中获取所述用户的各个被标记的历史问答记录的标记历史问答记录集,获取所述各个历史问答记录的答案文本信息;步骤S202:分析不同历史问答记录中所述多语言智能问答程序输出答案之间的差异程度,并计算不同历史问答记录的标记答案差异值,其中,历史问答记录与历史问答记录之间的标记答案差异值的具体计算过程为,所述历史问答记录为被标记的历史问答记录,所述历史问答记录为,所述历史问答记录的标记历史问答记录集中的历史问答记录;步骤S203:获取所述历史问答记录和所述历史问答记录的答案文本信息,使用预设的logistic算法模型,分别对所述历史问答记录和所述历史问答记录的答案文本信息进行意图识别,并根据所述答案文本信息的语义,将所述答案文本信息分解为各个单词并进行汇集,分别得到所述历史问答记录和所述历史问答记录的单词组和单词组;步骤S204:使用logistic算法模型,分别对所述单词组和所述单词组进行意图识别和语义检索,得到所述单词组与所述单词组中被判定词义相同的单词的总个数M,获取所述单词组与所述单词组中包含的单词总个数之和N,计算所述历史问答记录和所述历史问答记录中答案文本信息之间的标记答案差异值;步骤S205:获取计算的所述历史问答记录,与所述历史问答记录的标记历史问答记录集中的若干个历史问答记录之间的标记答案差异值,当所述历史问答记录和所述历史问答记录之间的标记答案差异值,大于预设的标记答案差异阈值,将所述历史问答记录从所述历史问答记录的标记历史问答记录集中剔除;步骤S206:从所述历史问答记录的标记历史问答记录集中,获取与所述历史问答记录时间距离最长的历史问答记录,并记为所述历史问答记录的目标历史问答记录,获取所述目标历史问答记录的问题文本信息,使用所述目标历史问答记录的问题文本信息,作为所述历史问答记录中问题文本信息的标准问题文本信息;步骤S207:获取被标记的所述各个历史问答记录中的问题文本信息对应的标准问题文本信息,并将被标记的所述各个历史问答记录中的问题文本信息对应的标准问题文本信息,和未标记的历史问答记录中的问题文本信息进行汇集,得到所述用户的目标问答数据;步骤S300:对当前周期内所述用户在多语言智能问答程序内输入的问题数据进行获取,根据所述用户的目标问答数据,对当前周期内所述用户在所述多语言智能问答程序内的问题数据进行优化调整,得到当前周期内所述用户的目标问题数据;所述步骤S300包括:步骤S301:对当前周期内所述用户在多语言智能问答程序行为进行监测,获取所述用户输入的问题数据,所述问题数据为当前周期内所述用户在多语言智能问答程序中输入的问题文本信息;步骤S302:获取所述用户在当前周期内的问题文本信息,与所述用户的历史问答记录中问题文本信息之间的词组一致值,当词组一致值大于预设的第二词组一致值阈值时,对大于预设的第二词组一致值阈值的历史问答记录进行获取并汇集,并记为所述用户在当前周期内的问题文本信息的对照历史问答记录集;步骤S303:当所述对照历史问答记录集中未存在被标记的历史问答记录时,对所述用户在当前周期内输入的问题文本信息不进行调整,得到所述用户在当前周期内的目标问题数据,当所述对照历史问答记录集中存在被标记的历史问答记录时,剔除所述对照历史问答记录集中未被标记的历史问答记录;步骤S304:获取所述对照历史问答记录集中的历史问答记录的问题文本信息的标准问题文本信息,并使用logistic算法模型,基于所述对照历史问答记录集中的历史问答记录的问题文本信息的标准问题文本信息,对当前周期内所述用户在所述多语言智能问答程序内的问题数据进行优化调整,得到所述用户在当前周期内的目标问题数据;步骤S400:获取所述用户的目标问题数据,并根据所述目标问题数据,使用多语言智能问答程序生成所述目标问题数据对应的目标答案数据,在多语言智能问答程序内将所述目标答案数据向所述用户进行展示,并对多语言智能问答程序进行智能管理;所述步骤S400包括:步骤S401:获取所述用户在当前周期内的目标问题数据,利用多语言智能问答程序中的logistic算法模型,对所述目标问题数据进行意图识别、语义检索和语义分段,并根据logistic算法模型处理后的目标问题数据,在所述多语言智能问答程序中的问题数据源进行答案搜索和校验,并生成所述目标问题数据对应的目标答案数据;步骤S402:获取所述目标问题数据的目标答案数据,在多语言智能问答程序内将所述目标答案数据向所述用户进行展示,并对多语言智能问答程序进行智能管理。
全文数据:
权利要求:
百度查询: 南京华飞数据技术有限公司 一种基于logistic算法的多语言智能问答管理系统及方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。