首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

融合词性信息的方面级情感三元组抽取方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:昆明理工大学

摘要:本发明涉及融合词性信息的方面级情感三元组抽取方法,属情感分析领域。本发明在模型输入阶段融合词性信息,加深模型对数据自身语义的理解;然后以多任务学习的方式高效地完成方面级情感三元组抽取任务,其中,使用两个标注器来完成方面词和观点词的抽取,使用biaffine情感依赖解析器来充分学习方面词和观点词之间的交互信息,以判别方面词对应的情感极性;最后对三元组进行解码操作得到三元组的跨度表示。在SemEval公开的四个基准数据集上进行了实验,实验结果表明了本发明在方面级情感三元组抽取任务中的性能优于其余基线模型,从而验证了本发明融合词性信息的做法确实有助于交互建模,最终得以提升模型的性能。

主权项:1.融合词性信息的方面级情感三元组抽取方法,其特征在于:所述融合词性信息的方面级情感三元组抽取方法的具体步骤如下:Step1、基于文本的词向量表示及其对应的词性向量表示,将二者融合;Step2、获得含有词性信息的融合特征表示;Step3、将融合特征表示输入多任务学习网络预测三元组,即以词性信息为引导,并行完成方面词抽取、观点词抽取、情感极性解析;Step4、三元组解码,根据启发式规则生成三元组跨度表示;所述Step1中,使用预训练模型GloVe将输入句中的各个单词映射到一个低维向量空间,获得对应的词向量表示其中d是词向量的维度;对于输入序列首先,使用NLTK词性标注器pos_tag为其中的每个单词标注词性标签,然后,给每个词性标签分配一个词性向量d为词性向量的维度,与词向量维度一致;最后,将每个单词的词性向量与词向量拼接得到融合特征的向量表示fi;所述Step2中,得到融合特征的向量表示fi之后,使用Bi-LSTM网络来获取含有上下文信息的表示随后,通过一个线性层和一次非线性变换,实现降维的同时获取方面词和观点词的特征表示;未将隐藏层向量直接输入模型下一阶段的原因有两个:其一,隐藏层状态的特征包含计算冗余信息,有过拟合的风险;其二,该操作可剔除与方面词和观点词无关的特征;所述Step3中,多任务学习网络架构包括两个部分:方面词和观点词的抽取,以及词级情感依赖解析;抽取方面词和观点词时,网络模型采用{B,I,O}标记方案,其中,B表示方面词或观点词的起始位置、I表示中间位置、O表示其他;将方面词和观点词的特征向量表示输入多任务学习网络模型,词级情感依赖解析过程中,使用在句法依赖解析中具有较优的性能的biaffine评分器来捕获每个词对中两个词的交互关系,随后,训练词级情感依赖解析器;所述Step4中,使用启发式规则进行情感三元组解码,以得到跨度表示的三元组;具体将由biaffine评分器产生的情感依赖关系作为枢轴,对方面词和观点词标注器生成的标签进行逆序遍历;所述Step2中,通过一个线性层和一次非线性变换,实现降维的同时获取方面词和观点词的特征表示的具体计算过程如下: 其中,分别为方面词和观点词的特征向量表示,dr为向量维度,和分别为可学习的权重和偏置,此外,g·是非线性函数ReLU·,即max·,0;所述Step3中,将方面词和观点词的特征向量表示输入多任务学习网络模型,模型预测句中每个词为方面词的概率分布如3式所示,观点词概率分布如4式所示; 其中,为权重矩阵、为偏置,两者均为训练参数,分别为方面词和观点词的特征向量表示,dr为向量维度。

全文数据:

权利要求:

百度查询: 昆明理工大学 融合词性信息的方面级情感三元组抽取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。