首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

文本情绪原因对抽取方法、系统、电子设备与存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华中师范大学

摘要:本申请公开了一种文本情绪原因对抽取方法、系统、电子设备与存储介质,其中方法包括:获取待抽取文本;将待抽取文本输入至情绪原因对抽取模型,获得情绪原因对抽取模型输出的待抽取文本的各子句对为情绪原因对的预测概率;情绪原因对抽取模型用于获取待抽取文本的各子句的特征,对各子句的特征进行分区过滤,获得各子句的特定于情绪子句抽取任务的情绪特征、特定于原因子句抽取任务的原因特征以及任务之间的共享特征,以确定各子句对的特征,并基于各子句对的特征执行情绪原因对抽取任务,获得各子句对的预测概率;基于各子句对的预测概率,确定待抽取文本中的情绪原因对,从而提升了情绪原因对抽取任务的精度。

主权项:1.一种文本情绪原因对抽取方法,其特征在于,包括:获取待抽取文本;将待抽取文本输入至情绪原因对抽取模型,获得所述情绪原因对抽取模型输出的所述待抽取文本的各子句对为情绪原因对的预测概率;所述情绪原因对抽取模型用于获取所述待抽取文本的各子句的特征,对各子句的特征进行分区过滤,获得各子句的特定于情绪子句抽取任务的情绪特征、特定于原因子句抽取任务的原因特征以及任务之间的共享特征,以确定各子句对的特征,并基于各子句对的特征执行情绪原因对抽取任务,获得各子句对的预测概率;所述情绪原因对抽取模型基于样本待抽取文本,以及用于表征样本待抽取文本的各样本子句对是否为情绪原因对的真实标签训练得到;基于所述各子句对的预测概率,确定所述待抽取文本中的情绪原因对;获取所述待抽取文本的各子句的特征,包括:基于情感词典,确定待抽取文本的各子句的情感极性;在各子句中情感极性超过预设阈值的子句的首部和尾部插入预设的情感标记,获得标记后的各子句;对标记后的各子句进行编码,获得所述各子句的特征;对标记后的各子句进行编码,获得所述各子句的特征,包括:对标记后的各子句进行编码,获得各子句的包含上下文信息的向量;将各子句作为各节点,各子句的向量作为各节点的初始状态,构建有向图;利用所述情绪原因对抽取模型中的关系图卷积神经网络,对有向图中节点之间的关系进行编码和聚合,获得各子句的特征;其中,子句的特征的处理过程包括:分区阶段和过滤阶段;在分区阶段,编码器通过输入门和遗忘门将神经元划分为三个分区,分别为情绪分区原因分区和共享分区在第i个时间步骤,利用情绪门和原因门进行神经元分区,和的计算方式如下: 其中,cummax·=cumsumsoftmax·,Linear·表示线性变换操作;xi′表示由RGCN所输出的子句ci的特征,hi-1是第i-1个子句在PFN中的隐藏状态;在进行分区之前,基于和计算遗忘门,计算方式如下: 其中,fie,fic和fis分别表示情绪遗忘门、原因遗忘门和共享遗忘门;计算情绪输入门原因输入门和共享输入门利用输入门和遗忘门将神经元划分为三个分区,分别为情绪分区原因分区和共享分区其计算方式如下: 其中,表示当前第i个时间步骤的输入信息,ui-1表示历史信息;在过滤阶段,利用激活函数对以上分区进行处理,最终得到三种类型的子句特征表示,分别为情绪特定特征原因特定特征和任务间共享特征其计算方式如下: 和中的信息也用于计算当前时刻细胞单元的状态ui和PFN的隐藏状态hi,且所计算出的这两种信息将作为下一个时间步骤的输入,其计算方式如下: hi=tanhui。

全文数据:

权利要求:

百度查询: 华中师范大学 文本情绪原因对抽取方法、系统、电子设备与存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。