首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种面向AIGC交互分析的数据准备方法、系统、设备及介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浪潮通用软件有限公司

摘要:本申请提供了一种面向AIGC交互分析的数据准备方法、系统、设备及介质,属于电数字数据处理技术领域。该方法通过预先训练完成的文本标签识别模型,确定与第一分词处理后的交互语句对应的标签序列;基于预设表达式构建规则,确定标签序列对应的标签组合序列及与标签组合序列对应的条件表达式。通过预置的数据库候选文本词典及预设匹配规则,确定与第二分词处理的交互语句对应的严格匹配关键词、模糊匹配关键词。基于严格匹配关键词及与模糊匹配关键词对应的相似候选文本,确定第二分词处理对应的分词结果。基于若干预设SQL语句规则匹配模板,生成交互SQL查询语句,以基于交互SQL查询语句确定与交互语句对应的交互应答信息。

主权项:1.一种面向AIGC交互分析的数据准备方法,其特征在于,所述方法包括:通过预先训练完成的文本标签识别模型,确定与第一分词处理后的交互语句对应的标签序列;其中,所述标签序列包括按照所述交互语句的语序排列且与各第一文本分词对应的预设标签;基于预设表达式构建规则,确定所述标签序列对应的标签组合序列及与所述标签组合序列对应的条件表达式;所述预设表达式构建规则用于对所述标签序列中多个所述预设标签进行组合并得到所述标签组合序列;各所述标签组合序列分别存在唯一对应的所述条件表达式;通过预置的数据库候选文本词典及预设匹配规则,确定与第二分词处理的所述交互语句对应的严格匹配关键词、模糊匹配关键词;其中,所述预设匹配规则用于匹配所述数据库候选文本词典中与第二文本分词一致的候选文本;基于所述严格匹配关键词及与所述模糊匹配关键词对应的相似候选文本,确定所述第二分词处理对应的分词结果;基于若干预设SQL语句规则匹配模板,生成与所述条件表达式及所述分词结果对应的交互SQL查询语句,以基于所述交互SQL查询语句确定与所述交互语句对应的交互应答信息;其中,在通过预先训练完成的文本标签识别模型,确定与第一分词处理后的交互语句对应的标签序列之前,所述方法还包括:获取预先构建的语句训练样本集;其中,所述语句训练样本集至少包括若干交互语句样本及其对应的SQL查询语句;各所述交互语句样本预先标注有用于组成所述条件表达式的所述预设标签;将所述语句训练样本集中各所述交互语句样本输入待训练的文本标签识别模型,以使所述文本标签识别模型通过其BERT模型,对各所述交互语句样本分别进行所述第一分词处理,并通过输出层输出与所述第一分词处理后的所述交互语句样本对应的样本预测标签序列;通过交叉熵损失函数,确定各所述样本预测标签序列与相应的真实标签序列的差异程度值,直至所述差异程度值小于预设阈值,得到训练完成的所述文本标签识别模型;其中,所述预设表达式构建规则包含不同所述预设标签进行组合得到的所述标签组合序列与不同所述条件表达式之间的关联关系。

全文数据:

权利要求:

百度查询: 浪潮通用软件有限公司 一种面向AIGC交互分析的数据准备方法、系统、设备及介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。