首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

采用无训练扩散修改方式在图像中添加物体的方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门大学

摘要:本发明公开一种采用无训练扩散修改方式在图像中添加物体的方法,在不添加额外输入也不需要进行任何训练的情况下,允许用户在保持图像其余内容几乎不变的同时,将一个对象添加到选定的图像区域中。其包括步骤:让用户在扩散模型生成的原图上框选一个生成区域,并用一个单词指定希望在框选的生成区域中生成的用户添加物体;将用于生成原图的提示和用于生成用户添加物体的提示分别编码,然后将编码结果拼接,作为最终生成结果的提示编码;同时生成三图,在生成过程中,控制用户添加物体的生成位置,并得到最终生成结果的隐变量;增强最终生成结果在框选的生成区域中的互注意力值;在生成过程即将结束时进行腐蚀‑膨胀操作,消去不连通的小块区域。

主权项:1.一种采用无训练扩散修改方式在图像中添加物体的方法,其特征在于包括以下步骤:步骤1、让用户在扩散模型生成的原图上框选一个生成区域,并用一个单词指定希望在框选的生成区域中生成的用户添加物体;步骤2、将用于生成原图的提示和用于生成用户添加物体的提示分别编码,然后将编码结果拼接,作为最终生成结果的提示编码;步骤3、分别基于生成原图的提示、生成用户添加物体的提示、最终生成结果的提示编码同时生成三图;在生成过程中,在前20%的时间步上基于layoutcontrol技术,控制用户添加物体的生成位置,使之与框选的生成区域一致;将用户添加物体在生成区域内的隐变量与原图其余部分的隐变量拼接,作为最终生成结果的隐变量;增强最终生成结果在框选的生成区域中的互注意力值;步骤4、在生成过程即将结束时,以如下方法在最终生成结果上编辑;4-1基于互注意力图,采用K聚类方法,将在框选的生成区域中拥有点的数量超过预设阈值的类的所有点初步确定属于用户添加物体的像素点;4-2基于4-1中确定的属于用户添加物体的像素点,在隐变量中以这些像素点为起始进行区域增长,获取其他相似点;4-3在4-1和4-2中,对于得到的结果都进行腐蚀-膨胀操作,消去不连通的小块区域。

全文数据:

权利要求:

百度查询: 厦门大学 采用无训练扩散修改方式在图像中添加物体的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术