恭喜北京计算机技术及应用研究所赵立永获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜北京计算机技术及应用研究所申请的专利一种面向开源情报的多模态数据情感分析方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN116561639B 。
龙图腾网通过国家知识产权局官网在2025-06-03发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202310596095.7,技术领域涉及:G06F18/24;该发明授权一种面向开源情报的多模态数据情感分析方法是由赵立永;王又辰;杨雨婷;方志;赵勤博设计研发完成,并于2023-05-24向国家知识产权局提交的专利申请。
本一种面向开源情报的多模态数据情感分析方法在说明书摘要公布了:本发明涉及一种面向开源情报的多模态数据情感分析方法,属于人工智能、大数据、情感分析领域。本发明通过在SparkStreaming框架内封装多模态情感分析模型,实现了资源分类矩阵算子、图文数据对增强算子、多模态算法算子和多标签内容算子;该方法处理过程如下:首先,对从HDFS接收的输入数据进行预处理操作,其次,调用资源分类矩阵算子对文本、视频、图像进行分类处理,再次,调用图文数据对增强算子进行图文数据增强,调用多模态算法算子和多标签内容算子实现情感预测,最后,将预测的结果写入到Kafka,完成情感预测的整个流程。本发明实现大数据+深度学习的技术融合,满足可扩展性和低资源应用,支持海量数据的智能挖掘分析。
本发明授权一种面向开源情报的多模态数据情感分析方法在权利要求书中公布了:1.一种面向开源情报的多模态数据情感分析方法,其特征在于,该方法包括:通过在SparkStreaming框架内封装多模态情感分析模型,实现了资源分类矩阵算子、图文数据对增强算子、多模态算法算子和多标签内容算子;该方法处理过程如下:首先,对从HDFS接收的输入数据进行预处理操作,其次,调用资源分类矩阵算子对文本、视频、图像进行分类处理,再次,调用图文数据对增强算子进行图文数据增强,调用多模态算法算子和多标签内容算子实现情感预测,最后,将预测的结果写入到Kafka,完成情感预测的整个流程;其中,调用多模态算法算子和多标签内容算子实现情感预测包括:S31、多模态特征抽取和融合首先构建文本信息的语义特征,在词向量阶段先输入Bert预训练好的词向量用Wit表示,i表示词编号,t表示当前的句子,经过双向GRU得到两个方向的隐状态表示然后使用Attention计算每个hit的重要性权重αit,对权重Softmax归一化之后,对hit加权求和得到句子的嵌入向量表示si;在图文特征融合阶段,首先输入句嵌入向量si,经过双向的GRU得到两个方向的隐状态,拼接得到每个句子的隐状态hi,使用Faster-RCNN提取每个图像的特征向量mj,然后使用mj对hi作Attention,通过计算两者的内积,实现图像向量和句向量的非线性转换,再经过Softmax得到每个转换后的hi对应的重要性权重βj,最后对转换后的hi加权求和得到文档针对每张图像的文本表示Di;输入针对不同图像生成的文本表示Di,使用Attention计算得到对应的权重ri,然后进行加权求和得到最终的文档向量D,整体特征表示为In,n表示总的融合文本和图像个数;S32、通过多标签内容算子实现多标签内容情感输出多标签内容算子用于多标签内容情感输出,利用情感集合S={S1l,p,q,S2l,p,q,...,Snl,p,q,n∈输入数据量,l,p,q∈三级多标签组合},根据整体特征向量In利用交叉熵作为目标损失函数更新模型参数,通过Softmax函数输出S情感集合的标签;多标签内容是根据新媒体新闻信息类型,进行多级标签分类,即整体情感标签不再是正负中三种,而是细粒度的多级分类标签;标签分类存储有三级,第一级是信息流类型,信息流类型集合={视频流,图像流,文本流,混合流,l∈信息流类型;第二级是新闻信息类型,新闻信息类型集合={法律,财经,娱乐,科技,体育,军事},p∈新闻信息类型;第三级是情感表达类型,情感表达类型集合={赞扬,中立,抵触,批判},q∈情感表达类型;对新闻信息类型进行多级情感分类,使读者更准确的把握新闻多领域情感。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京计算机技术及应用研究所,其通讯地址为:100854 北京市海淀区永定路51号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。