恭喜浙江工业大学曹斌获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜浙江工业大学申请的专利一种基于有监督对比学习的开放服务意图检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115098681B 。
龙图腾网通过国家知识产权局官网在2025-02-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210758042.6,技术领域涉及:G06F16/353;该发明授权一种基于有监督对比学习的开放服务意图检测方法是由曹斌;陶晨伟;范菁设计研发完成,并于2022-06-29向国家知识产权局提交的专利申请。
本一种基于有监督对比学习的开放服务意图检测方法在说明书摘要公布了:本发明公开了一种基于有监督对比学习的开放服务意图检测方法,首先使用BERT进行语义编码得到初始词向量表示,然后利用标签信息通过线性分类层和有监督对比学习表示层同时学习,获得丰富且有区分度的句向量特征表示。表示学习完成后,该模型就变为下一步联合训练的特征提取器。为了获得更多的开放类事件文本帮助训练,使用数据增强方式Mix‑up生成新的开放类样本。最后将获取的样本和合成的样本同时输入到具有两个分支的联合训练模型中进行训练优化。判断意图事件文本属于哪个已知类,如果不属于任何已知意图事件类,就认为它是开放类意图事件。本发明构建的已知意图事件分类和开放类意图检测检测方法具有推理速度快、解释性强、准确率高的特点。
本发明授权一种基于有监督对比学习的开放服务意图检测方法在权利要求书中公布了:1.一种基于有监督对比学习的开放服务意图检测方法,其特征在于,包括以下步骤:S1:对原始数据集中的意图事件文本分类,将数据集分为域内样本IND和域外样本OOD;S2:对数据集进行数据预处理,删除文本中多余的空格和标点符号;S3:将步骤S2预处理得到的IND样本进行BERT编码,得到整个文本的句向量表示;S4:基于步骤S3得到的句向量表示,通过线性分类层,利用交叉熵损失函数Softmax-Loss来捕获同一类的特征,得到交叉熵损失S5:基于步骤S3得到的句向量表示,使用有监督对比学习,扩大不同类的特征差异和缩小同一类的特征差异,得到监督对比学习损失S6:基于步骤S4和步骤S5分别得到的交叉熵损失和监督对比学习损失,相加得到微调阶段的整体损失,进行训练优化,得到具有区分度的特征提取器模型;S7:基于步骤S2得到的预处理后的IND样本,通过Mix-up操作构造出人工合成的OOD样本;S8:嵌入表示,把已知IND样本、已知OOD样本和步骤S7中人工合成的OOD样本这三部分数据输入步骤S6得到的特征提取器,得到每个样本的句嵌入向量表示;S9:多任务联合优化,包括两个部分,第一部分是多分类任务,从步骤S8输入的样本中筛选出IND样本,利用SoftMax交叉熵损失进行优化,得到任务损失;第二部分是置信度学习任务,得到一个样本归属于新事件的置信度损失;将两部分损失相加训练得到开放意图检测模型;所述步骤S3具体为:给定一个文本s,对于文本中的每一个单词Ti输入到BERT模型中:xj=mena-poolingBERTCLS,T1,T2…,TN其中CLS表示下游任务的分类标签,N表示文本的长度,mean-pooling表示对BERT得到的每个词的语义进行均值处理,最后得到xj表示整个文本的句向量表示;所述步骤S7中,通过Mix-up操作构造出人工合成的OOD样本的方法为:合成的OOD样本xood是通过对两个不同类别的已知类样本加权求和计算产生的:xood=α*xi+1-α*xj其中xi和xj是来自不同IND事件类型的两个事件文本的句向量表示,α是一个从0到1的均匀分布。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江工业大学,其通讯地址为:310014 浙江省杭州市下城区潮王路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。