一种基于编码器-双解码器的图像中文描述生成方法

导航：龙图腾网> 最新专利技术> 一种基于编码器-双解码器的图像中文描述生成方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：上海师范大学

摘要：本发明涉及一种基于编码器‑双解码器的图像中文描述生成方法，包括：获取数据集，包括图像描述数据集和对应的背景语料数据集；对数据集进行数据预处理，将预处理后的数据集划分为训练集、验证集和测试集；构建编码器‑双解码器模型，并设定模型参数以及超参数，基于训练集和验证集，对编码器‑双解码器模型进行训练；基于测试集对训练后的编码器‑双解码器模型进行测试，以得到图像描述生成模型；将待描述图像输入图像描述生成模型，输出得到待描述图像对应的标题字段以及描述文本。与现有技术相比，本发明能够充分利用编码器获取的特征信息、能够对图像包含的信息进行丰富描述，具有准确率高、语句含义丰富通顺、图像与文本相关性强的优点。

主权项：1.一种基于编码器-双解码器的图像中文描述生成方法，其特征在于，包括以下步骤：S1、获取数据集，所述数据集包括图像描述数据集和对应的背景语料数据集；S2、对数据集进行数据预处理，将预处理后的数据集划分为训练集、验证集和测试集；S3、构建编码器-双解码器模型，并设定相应的模型参数以及超参数，之后基于训练集和验证集，对编码器-双解码器模型进行训练；基于测试集对训练后的编码器-双解码器模型进行测试，以得到图像描述生成模型；S4、将待描述图像输入图像描述生成模型，输出得到待描述图像对应的标题字段以及描述文本；步骤S3具体包括以下步骤：S31、构建编码器-双解码器模型，其中，编码器用于提取图像中的信息以及信息之间的关联，双解码器用于读取来自编码器输出的信息、并输出对应的描述；S32、基于训练集和验证集，对编码器-双解码器模型进行训练；S33、基于测试集对训练后的编码器-双解码器模型进行测试，并根据设定的评估指标对测试结果进行评估，若评估通过，则当前训练后的编码器-双解码器模型即为图像描述生成模型，否则返回步骤S32；步骤S31中编码器采用Transformer结构，所述双解码器包括依次连接的Title-Decoder和Text-Decoder，所述编码器分别与Title-Decoder、Text-Decoder相连接，所述Title-Decoder和Text-Decoder均采用LSTM网络实现；步骤S33中对训练后的编码器-双解码器模型进行测试时，所述Text-Decoder的输入包括编码器输出信息、从Title-Decoder输出中提取得到的关键词信息、来自背景语料库中的信息在Attention机制下对于描述文本的整体扩写；步骤S4具体包括以下步骤：S41、输入待描述图像，编码器采用多级自注意力机制提取出图像特征信息；S42、编码器将提取到的所有图像特征信息输入Title-Decoder中，输出得到待描述图像对应的标题字段；S43、从Title-Decoder输出的标题字段中提取出关键词信息，结合编码器提取的图像特征信息，共同输入Text-Decoder中，输出得到待描述图像对应的文本信息；S44、整合Title-Decoder和Text-Decoder的输出，以作为待描述图像所包含信息的描述。

全文数据：

权利要求：

百度查询：上海师范大学一种基于编码器-双解码器的图像中文描述生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种硫化定型装置

下一篇：一种小导管余料自动对焊设备

相关技术

一种硫化定型装置

一种小导管余料自动对焊设备

一种钛渣冶炼电炉

一种可拆卸式汽车斜坡支架

一种露天设备防尘防锈蚀装置

一种竹制品生产加工用物料分拨装置

一种太阳能电池用防水除尘框架

一种多功能护理床

一种搪玻璃反应釜过滤结构

一种干冰块自动理料设备

一种鞋盒

一种小型铸件生产用铸造装置

中文相关技术

中文地址加密方法、装置、设备及存储介质_深圳市智慧城市科技发展集团有限公司_202411390819.3

基于改进YOLOv5的中文标注手势识别方法与系统_扬州大学_202111551115.6

中文作文评分方法、装置、电子设备和可读存储介质_成都佳发安泰教育科技股份有限公司_202410949122.9

一种便携式中文汉字书写用面板_太原学院_202323442252.3

一种基于编码器-双解码器的图像中文描述生成方法_上海师范大学_202111419735.4

一种基于依存图解析的一体化中文信息抽取方法及装置_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202411009247.X

一种基于中文分词识别技术的垃圾信息剔除系统及方法_合肥大多数信息科技有限公司_202011391134.2

一种多语义特征协同的中文地址匹配方法_兰州交通大学_202411400842.6

一种中文句法分析方法和系统_中国专利信息中心_202110023058.8

基于多层次自适应语义增强的中文医疗命名实体识别方法和装置_浙江工业大学_202410982954.0

图像相关技术

图像处理装置和图像处理方法_索尼集团公司_202080043358.6

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300296.9

图像编码/解码方法和图像数据的传输方法_LX半导体科技有限公司_202411317982.7

运动图像编码装置以及运动图像解码装置_夏普株式会社_201980085198.9

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300015.X

图像处理装置、相机系统和图像处理方法_索尼半导体解决方案公司_201980075070.4

图像生成辅助装置以及图像生成辅助方法_发那科株式会社_202180010036.6

图像处理装置、图像处理方法以及片材_松下知识产权经营株式会社_201980076798.9

图像编码/解码设备和发送图像数据的设备_LX半导体科技有限公司_202411300011.1

图像处理装置、图像处理方法以及程序_株式会社东芝_201980073242.4

描述相关技术

扩展现实场景描述中的碰撞管理_交互数字CE专利控股有限公司_202380028149.8

一种可捕获描述细节的图像生成方法、装置、设备及介质_联通沃悦读科技文化有限公司_202410844795.8

一种多特征融合的视频描述方法、装置及存储介质_桂林电子科技大学_202210167890.X

基于采用一点双矢量描述控制对象的数控装备控制方法_华中科技大学_202410866426.9

一种潜山油藏开发后期剩余油描述方法_中国石油化工股份有限公司_202010998463.7

基于个性描述和会话历史的个性化对话方法及系统_济南大学_202410944262.7

基于指令与描述的安全属性挖掘方法及系统_中国人民解放军战略支援部队信息工程大学_202410915997.7

一种描述符传输方法、装置、设备及存储介质_合肥六角形半导体有限公司_202411412577.3

基于迁移学习的图像描述生成方法、装置、设备及介质_平安科技(深圳)有限公司_202210415615.5

一种基于强化学习的情绪化图像描述方法及系统_南京邮电大学_202210151256.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于编码器-双解码器的图像中文描述生成方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务