一种基于关键词引导和GATv2-LSTM网络的场景图问答方法

导航：龙图腾网> 最新专利技术> 一种基于关键词引导和GATv2-LSTM网络的场景图问答方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

摘要：本发明公开了一种基于关键词引导和GATv2‑LSTM网络的场景图问答方法，步骤包括：对文本和场景图预处理，将文本形式的问题换为词向量序列，删除图中与问题无关的节点并编码生成新的场景图表示。将问题的词向量序列利用Transformer进行编码，提取问题关键词，利用关键词引导GATv2学习场景图特征，并利用LSTM网络对图特征进行归纳、推理，最后将问题特征与场景图特征相融合，输入到分类器获取最终答案。本方法使用场景图和关键词引导，并利用LSTM进行归纳、推理，能够有效缩小模态间差距、避免模型直接学习图像与文本间的映射，提高问答的准确率。

主权项：1.一种基于关键词引导和GATv2-LSTM网络的场景图问答方法，其特征在于包括以下步骤：步骤1对文本问题和场景图进行预处理，主要包含将问题分割成字符序列，去除标点符号并转换为词向量序列，场景图去除与问题无关的节点并编码等，包括以下步骤：步骤1.1利用输入层将文本形式的问题数据输入到模型中，输入的文本数据为：E＝{E1,E2,...,En}其中Ei表示该问题中的第i个单词或标点符号；步骤1.2去除标点符号，获得单词序列，然后利用GloVe将单词转换为300维的向量表示w：w＝{w1,w2,...,wn}其中wi表示问题文本中的第i个单词向量；步骤1.3利用spaCy给文本问题打上POS标签，基于该标签提取出文本中出现的名词，计算名词与场景图中各节点的余弦相似度，根据余弦相似度过滤掉场景图中不重要节点，保留最相似的部分节点及其邻域节点；步骤1.4基于上述场景图中剩余的节点，对场景图进行编码，具体操作为：利用场景图节点属性和原始场景图节点编码生成新的节点，利用边缘属性编码形成新的节点边缘，从而用新的节点表示场景图中对象，利用边缘表示对象间关系，编码方式如下：其中表示原始节点信息，eij表示原始边缘信息，xi表示编码生成的新的节点表示；步骤2对文本问题进行编码并提取关键词，包括以下步骤：步骤2.1利用TransformerEncoder模块编码文本问题，编码后的问题充分考虑了问题中各个词汇的位置信息和每个单词对整个文本问题的贡献，可以更好地表征问题，减少语义歧义，编码方式如下：q＝TransformerEncoderw其中w表示向量形式的问题表示，q表示编码后的问题；步骤2.2利用自注意力机制获取问题中各个词汇的自注意力得分qscore，基于自注意力得分，提取对回答问题最重要的n个关键词；qscore＝selfattentionw其中w表示向量形式的问题表示，qscore表示问题中各单词注意力得分；步骤3利用步骤2.2中得到问题关键词作为指令引导GATv2图神经网络学习步骤1.4中编码得到的新的场景图，并利用LSTM归纳总结特征，主要包含以下步骤：步骤3.1首先将问题关键词利用GloVe转换为300维的指令向量，然后将指令向量与编码生成的场景图边缘表示和节点表示进行拼接，实现方式如下：其中instructioni表示第i个关键词生成的指令向量，Xi和Ei表示新的节点和边缘信息，concat表示拼接操作；步骤3.2将拼接后的新的节点表示和边缘表示输入到多个GATv2网络中，学习场景图特征，并将多个关键词引导学习到的图特征拼接成一个序列；GATv2的计算公式如下：其中eij表示注意力系数，αij表示节点i和节点j之间的注意力得分，表示基于注意力得分计算得出的新的节点表示；其中h表示最终输出的场景图信息，hi表示经由第i个指令向量引导GATv2网络学习到的场景图特征；步骤3.3由于不同关键词之间包含时序关系，因而引导产生的图特征也包含时序关系，基于步骤3.2的图特征序列h，利用LSTM网络学习这种时序关系。LSTM网络的输入为h＝{h1,h2,...,hn}，输出信息为{H1,H2,...,Hn}，其中Hn为最后时刻隐藏层的特征向量，即LSTM输出的图特征hout；步骤4将步骤2中得到问题表示与步骤3学习得到的图特征进行融合获取最终答案，主要包含以下步骤；步骤4.1首先对步骤3.3输出的图特征hout进行池化操作，从而减少参数并扩大感知视野，然后将图像特征和步骤2.1中得到问题表示进行逐元素乘积，从而融合两种特征；步骤4.2利用两层的MLP网络对融合后的特征进行处理，最后输入分类器获取最终答案，具体操作如下：其中FC1和FC2为全连接层，表示层数为两层的MLP，⊙表示逐元素点乘，fout表示最终融合后的特征表示，yout表示最终输出的答案。

全文数据：

权利要求：

百度查询：武汉科技大学一种基于关键词引导和GATv2-LSTM网络的场景图问答方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：基于岩石地基的抗拔桩施工装置及施工方法

下一篇：一种用于过滤器焊接的定位夹持装置

相关技术

基于岩石地基的抗拔桩施工装置及施工方法

一种用于过滤器焊接的定位夹持装置

一种卵巢癌诊断用分泌物透光分析装置

一种炒茶控制设备

核桃油指纹图谱构建及掺假鉴别用平台系统

货厢和车辆

一种高强韧性风电轴承钢及制法、用途和一种风电轴承

一种倾斜折板精馏柱

一种亚稳态铝团簇离子、其制备方法及其催化应用

一种轨道式可拓展智能线形灯

一种高层建筑多模爬升模板及其施工方法

一种花卉基质打散混合装置及方法

网络相关技术

建立虚拟私有网络连线的方法及网络装置_华硕电脑股份有限公司_202310570885.8

网络时间扇区化_高通股份有限公司_202380033141.0

广角网络摄像头_深圳市德创水下智能装备有限公司_202420439360.0

无线电信网络_英国电讯有限公司_202180072977.2

网状网关网络及方法_德律阿得网络股份有限公司_202380034131.9

一种网络中断的聚合方法、装置及网络通信设备_无锡沐创集成电路设计有限公司_202311050077.5

神经网络剪枝方法、神经网络剪枝系统及计算机程序产品_北京集度科技有限公司_202411478595.1

网络接入方法和系统、通信网络、电子设备和存储介质_中国电信股份有限公司_202210667138.1

用于网络实体的基于区块链的网络保护的方法和系统_拉德沃有限公司_201980042983.6

高速工业总线中继网络中的时钟同步方法、网络及设备_北京神经元网络技术有限公司_202211215668.9

场景相关技术

用户设备架构适配带内场景_上海诺基亚贝尔股份有限公司_202410584333.7

特色场景建筑空间设计展示装置_浙江省省直建筑设计院有限公司_202323361094.9

一种基于时序场景创建器的自监督视频场景边界检测方法_重庆大学_202411216320.0

一种数字孪生场景移动扫描装置_北京数字航宇科技有限公司_202420831101.2

一种虚拟现实场景快速构建方法_成都孚谦科技有限公司_202411244520.7

典型场景下网-荷协同优化模型的构建方法_国网山东省电力公司聊城供电公司_202411094639.0

场景描述文件的生成方法及装置_海信视像科技股份有限公司_202380034331.4

一种危险场景处理方法及装置_华为技术有限公司_202011194437.5

多场景芯片消耗控制系统和方法_杭州得明电子有限公司_202411488012.3

自然场景对象检测方法、系统、设备存储介质_中国科学技术大学_202411051936.7

-LSTM相关技术

基于Relaxed Lasso-LSTM模型的短临风速预测方法_长光卫星技术股份有限公司_202411070959.2

一种基于并行LSTM-CNN和BiGRU的轴承故障检测方法_沈阳化工大学_202410995126.0

一种基于LSTM自编码器的耕地闲置识别方法_中国农业科学院农业信息研究所_202410705819.1

基于LSTM和自动编码器的卫星链路流量预测方法_北京理工大学_202210427294.0

基于退火优化LSTM算法反演湖泊叶绿素的方法及系统_南京信息工程大学_202411150514.5

基于STL和带有注意力机制的LSTM的旅游需求预测方法_安徽大学_202111414339.2

一种基于LSTM神经网络的分层能源系统优化调度方法_国网江苏省电力有限公司淮安供电分公司_202410923285.X

基于VMD-LSTM-ELMAN的露天区域氡析出率预测方法_深圳大学_202410887826.8

一种基于改进LSTM的变分自编码器的驾驶风格特征提取方法_大连海事大学_202411092853.2

一种基于相似日的GRA-BI-LSTM光伏功率预测方法及模型_无锡英臻科技股份有限公司_202411075462.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于关键词引导和GATv2-LSTM网络的场景图问答方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务