基于任务型对话的图像编辑系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：北京邮电大学

摘要：本发明涉及图像处理技术领域，提出了基于任务型对话的图像编辑系统，包括对话理解模块，用于根据输入的对话文本得到对话状态，所述对话状态包括用户要编辑的属性和编辑程度；图像编辑模块，用于接收用户输入图像和对话状态，根据对话状态对用户输入图像进行编辑，输出编辑后的图像；系统回复模块，用于输出系统回复信息；所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数，所述编码器和所述解码器均为N个，每一所述解码器的输出均设置一个适应器。通过上述技术方案，解决了现有技术中图像编辑方法在连续的图像编辑时出现历史编辑信息遗忘、用户需求理解偏差、系统交互不准确、不灵活的问题。

主权项：1.基于任务型对话的图像编辑系统，其特征在于，包括：对话理解模块，用于根据输入的对话文本得到对话状态，所述对话状态包括用户要编辑的属性和编辑程度；所述对话文本包括对话历史信息和当前的用户需求；图像编辑模块，用于接收用户输入图像和对话状态，根据对话状态对用户输入图像进行编辑，输出编辑后的图像；系统回复模块，用于根据对话文本和编辑后的图像，输出系统回复信息；所述对话理解模块包括依次连接的编码器、解码器、第一线性层和Softmax函数，所述编码器和所述解码器均为N个，每一所述解码器的输出均设置一个适应器，任一所述适应器包括依次连接的归一化层Layer_Norm、第二线性层Linear、激活函数Relu和第三线性层Linear，所述对话理解模块的训练步骤具体包括：使用预训练的Transformer模型参数对所述编码器和所述解码器参数进行初始化；对于输入的对话文本x，使用词嵌入得到词向量x_emb，然后使用编码器将x_emb编码为特征z，具体为：其中Encoder表示堆叠的N个编码器；将特征和输出标签y的词向量y_emb输入N个解码器，第i个解码器的输出z’具体为：其中Decoder_i表示第i个解码器，将第i个解码器的结果输入到第i个适应器中：固定所述编码器和所述解码器的参数，修改适应器的参数θ，直到损失函数在设定范围内，所述损失函数具体为：其中，x为输入的对话文本，y为对话理解模块的输出标签，|y|表示输出的长度，表示输出概率，表示第i个输出，表示输出正确的概率；所述图像编辑模块具体包括：图像反转编码器，用于得到用户输入图像的特征w；文本编码器，用于得到对话状态中文本的隐向量et；语义调整模块，用于：根据文本的隐向量et计算得到向量Qp，作为注意力机制中的Query信息；根据用户输入图像的特征w计算得到向量K和V，所述向量K和V分别作为注意力机制中的Key值和Value值；将向量K与向量Qp相乘得到对话状态的文本与用户输入图像之间的相关性权重Attentionp；将相关性权重Attentionp与向量V进行加权求和得到用户输入图像的编辑方向Δw；将用户输入图像的特征w沿着编辑方向Δw更新，得到编辑后的图像特征w’=w+Δw；图像生成器，用于根据编辑后的图像特征w’得到编辑后的图像。

全文数据：

权利要求：

百度查询：北京邮电大学基于任务型对话的图像编辑系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自动化的输出电机安装方法

下一篇：用于混合动力飞行器中DC总线电压的稳定的系统与方法

相关技术

一种自动化的输出电机安装方法

用于混合动力飞行器中DC总线电压的稳定的系统与方法

一种电压监测及通断监测电路

一种高质量铝型材热挤压冷却成型装置及其方法

用于非活动模式下的后续小数据传输的管理优先级排序

一种自动化振动清洗设备

一种超疏水分离膜的制备方法

一种火电厂用管路对接检修工具

一种多种方式方便打开的纸盒及其制备方法

一种扩散片的自动化生产装置及其使用方法

多屏显示方法、装置、设备和介质

一种基于IP6加密生成地址系统

图像相关技术

图像编码设备、图像解码设备及发送图像数据的设备_LG电子株式会社_202411023697.4

图像处理装置、图像处理方法和图像处理系统_索尼集团公司_201980080331.1

一种图像增强方法、图像处理芯片及图像增强视频系统_奕行智能科技(广州)有限公司_202311421604.9

图像显示控制装置、图像显示系统及图像显示控制方法_株式会社索思未来_202280092153.6

图像解码装置、图像解码方法和程序_KDDI株式会社_202080057655.6

图像处理方法、图像采集设备、装置、介质及产品_英特灵达信息技术(深圳)有限公司_202410810325.X

图像编码/解码方法及发送图像数据的方法_LG电子株式会社_202411023702.1

图像编码/解码方法和图像数据的发送方法_LX半导体科技有限公司_202410979222.6

图像分割方法_中国科学院微电子研究所_202410819913.X

图像差生成_谷歌有限责任公司_202280092560.7

型相关技术

可变容量型油泵_日立安斯泰莫株式会社_202380022786.4

易操作型环网柜_陕西中昊电气集团有限公司_201811115571.4

薄型气体传输装置_研能科技股份有限公司_202011123719.6

防锈紧固型护栏配件_南通美森机械制造有限公司_202323481668.6

19缸直型机芯_东莞市文洋机电有限公司_202420473399.4

桥型滤波器_RF360新加坡私人有限公司_202380022518.2

一种飞机下半部外保型装配型架_江西洪都商用飞机股份有限公司_202410997121.1

一种O型与唇型密封组合密封及开槽结构体_鲍文娟_202411040529.6

一种用于真空型数控熔炼炉的型壳检测装置_天津创英凯金新材料科技有限公司_202411059712.0

柳叶型屋顶包包装片材_乐美包装(昆山)有限公司_202411181465.1

编辑相关技术

Ago蛋白在真核细胞靶向基因编辑中的应用及靶向基因编辑方法_河北科技大学_202410709806.1

用于消息编辑的系统和方法_法斯埃托股份有限公司_202110602245.1

一种场景编辑器_广东金朋科技有限公司_202410810451.5

确定限制编辑例外项的方法_永中软件股份有限公司_202410816848.5

信息编辑方法、装置、设备和存储介质_长沙市到家悠享网络科技有限公司_202011158845.5

基于任务型对话的图像编辑系统_北京邮电大学_202310118446.3

DNA聚合酶介导的基因组编辑_武汉大学_202280091683.9

一种在线编辑客户端渲染方法_北京艺源酷科技有限公司_202410736599.9

天气系统编辑方法以及装置、系统、设备_完美世界(北京)软件科技发展有限公司_202010905379.6

使用腺苷脱氨酶碱基编辑器编辑疾病相关基因的方法，包括遗传性疾病的治疗_比姆医疗股份有限公司_202080028186.5

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于任务型对话的图像编辑系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务