Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜中国人民解放军空军工程大学孙鹏获国家专利权

恭喜中国人民解放军空军工程大学孙鹏获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜中国人民解放军空军工程大学申请的专利一种基于领域BERT模型的服务文本分类方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115344695B

龙图腾网通过国家知识产权局官网在2025-05-23发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210890080.7,技术领域涉及:G06F16/35;该发明授权一种基于领域BERT模型的服务文本分类方法是由孙鹏;闫云飞;张杰勇;徐鑫;刘彬;钟贇;程海燕;马钰棠;赵亮设计研发完成,并于2022-07-27向国家知识产权局提交的专利申请。

一种基于领域BERT模型的服务文本分类方法在说明书摘要公布了:本发明属于网络服务文本技术领域,具体地涉及一种基于领域BERT模型的服务文本分类方法。包括:步骤1:采用TF‑IDF算法从服务文本语料中提取领域词汇;步骤2:在步骤1的基础上,建立BERT‑BiLSTM模型,将步骤1提取的领域词汇输入进BERT‑BiLSTM模型的BERT词表后,将服务文本语料输入BERT‑BiLSTM模型进行训练,实现服务文本分类;步骤3:根据步骤2的服务文本语料特性和分类结果,选择最佳的损失函数以均衡数据集。为了证明所提出方法的有效性,在互联网获取的真实数据集上进行了大量对比试验,其实验结果表明:本发明提出的方法相较于TextCNN、BiLSTM‑attention、RCNN和Transformer模型Macro‑F1值分别提高了4.29个百分点、6.59个百分点、5.3个百分点和43个百分点,实验结果表明本发明方法能够显著提高对文本分类精度。

本发明授权一种基于领域BERT模型的服务文本分类方法在权利要求书中公布了:1.一种基于领域BERT模型的服务文本分类方法,其特征在于:包括:步骤1:采用TF-IDF算法从服务文本语料中提取领域词汇;步骤2:在步骤1的基础上,建立BERT-BiLSTM模型,将步骤1提取的领域词汇输入进BERT-BiLSTM模型的BERT词表后,将服务文本语料输入BERT-BiLSTM模型进行训练,实现服务文本分类;所述步骤2具体为:步骤2.1:建立BERT-BiLSTM模型结构,BERT-BiLSTM模型结构由BERT模型和BiLSTM模型组合而成,BERT模型操作完成后进入到BiLSTM模型,BERT模型依次包括embeding层、多个encoder层和pooler层,BiLSTM层包括多个LSTM层,其中BERT模型通过embedding嵌入层生成文本词向量,通过encoder层中的多头注意力机制和前馈神经网络层捕捉文本词汇特征,最后通过pooler层中的全连接层进入BiLSTM层,BiLSTM层负责获取词向量的之间的上下文特征,最后通过全连接层进行分类;步骤2.2:对步骤2.1的BERT模型结构中输入文本句子,将句子中的单词转化为嵌入,其中,BERT的输入由字嵌入、段嵌入和位置嵌入组成,字嵌入代表文本单词的嵌入,其依照设定的领域词表按照贪心原则进行词汇匹配,段嵌入标明了单词所属的句子,位置嵌入标识了单词在输入文本中的具体位置;步骤3:根据步骤2的服务文本语料特性和分类结果,选择最佳的损失函数以均衡数据集;所述步骤3包括:步骤3.1:通过步骤2的BERT-BiLSTM模型训练后,获取步骤1领域词汇的服务数据集特性和步骤2的分类结果,改变损失函数以得到最优结果,针对服务语料的数量不平衡性,需要列出每个服务类别下的服务数量,以观察数量不平衡性;针对服务语料的难易不平衡性,需要列出训练完成后各个服务样本正确分类的概率,即分类难易性,最后通过对比两组数据的变异系数大小以衡量服务语料的不均衡性,变异系数计算方法如下: 其中,CV为变异系数,σ为数据标准差,μ为数据平均值;步骤3.2:根据步骤3.1中所获得的变异系数,定性地确定服务文本语料的不平衡特性,根据分类结果的优劣,定量地调整变焦损失函数系数,获得最优结果,所述变焦损失函数公式为: 其中,αt为类别数量平衡权重,θ为数量调制系数,pt代表样本属于真实样本的概率,γ为难易调制系数,通过控制θ和γ以调整损失函数聚焦的样本不平衡性质,当θ=1,γ=0时,函数形式等价为交叉熵损失函数,当θ=1,γ>0时,函数形式等价为焦点损失函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中国人民解放军空军工程大学,其通讯地址为:710077 陕西省西安市莲湖区丰镐东路一号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。