买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市金橙果科技有限公司
摘要:一种基于扩散变换器的人工智能中台模型,包括文本输入模块、文本编码模块、特征提取模块、扩散变换模块、模型嵌入模块、文本输出模块、输出反馈模块;本发明提出的一种基于扩散变换器的人工智能中台模型,用户输入的自然语言文本被转换至计算机能理解的数值型表示,将用户的输入进行文字特征提取,保留用户的偏好,通过阴影机制,对用户的输入进行偏好合并和干扰剔除,实现中台模型的优化输入语句,降低模型幻觉的功能。
主权项:1.一种基于扩散变换器的人工智能中台系统,包括文本输入模块、文本编码模块、特征提取模块、扩散变换模块、模型嵌入模块、文本输出模块、输出反馈模块;文本输入模块中,用户进行自然语言文本输入;文本编码模块中将用户输入的文本转换成计算机理解的数值型表示;特征提取模块提出特征提取算法,对用户输入的文本进行特征提取,并将提取的特征输入至文本优化模型;扩散变换模块基于扩散变换器模型,采用文本优化算法,构建文本优化模型,融合用户偏好和剔除干扰项;模型嵌入模块将构建的特征提取模块和文本优化模型嵌入人工智能大模型,剔除输入文本干扰项,添加用户偏好;文本输出模块中,将人工智能大模型的回复转换成用户理解的语言进行输出;输出反馈模块中,用户对计算机的回答进行回复,对用户的偏好进行修正;所述文本优化算法,首先对于用户的文字输入,进行随机词插入,作为噪声向量,插入用户输入文字的编码向量集合中,再在编码向量集合中合并用户特征偏好中的编码向量,共同组成一次文本编码向量集合,在模型训练阶段,提供给定的词汇表F,所述算法提出一种阴影机制,对文本中的数据添加阴影度,阴影度高的部分模型关注度降低,阴影度计算公式如下: 其中,ηi,k、ηi,k-1分别表示文本编码向量集合中第i个编码向量第k阶段的阴影度、第i个编码向量第k-1阶段的阴影度、ci,k表示文本编码向量集合中第i个编码向量第k阶段是否被关注,关注ci,k=1,αi,j、αi,k-1分别表示文本编码向量集合中第i个编码向量第j阶段的关注度、第i个编码向量第k-1阶段的关注度,Sj表示第j阶段前被关注的次数,I{·}表示示性函数,当括号内的等式成立时,示性函数值为1,当括号内的等式不成立时,示性函数值为-1,βi表示文本编码向量集合中第i个编码向量,f·表示扩散函数,公式为: 模型训练阶段通过概率选择编码向量作为关键词,其余编码向量当作干扰项去除,最后生成添加用户偏好和去除干扰项的优化后的用户输入文本,每种用户输入文本的生成概率计算公式如下: 其中,xi表示选择的关键词,yj表示词汇表F中的字词,pxi表示选择xi作为关键词的概率,pi表示xi作为关键词生成该文本的概率。
全文数据:
权利要求:
百度查询: 深圳市金橙果科技有限公司 一种基于扩散变换器的人工智能中台系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。