买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京大学
摘要:本发明公开一种颜色可控的文本引导灰色图着色方法及系统,属于数字图像灰色图着色领域。所述方法包括:针对带有文本描述的灰色图,提取所述灰色图的灰色图隐变量、语义边缘图隐变量和标准空间语义特征,并获取文本描述特征;在所述灰色图隐变量的基础上注入文本描述特征,得到粗粒度着色隐变量;将该粗粒度着色隐变量联合语义边缘图隐变量作为ControlNet着色框架输入,并将标准空间语义特征与ControlNet着色框架的主干特征融合后注入ControlNet着色框架,以得到着色结果图隐变量;将所述灰色图隐变量经过解码得到的中间特征作为所述着色结果图隐变量的结构引导和灰色信息,生成颜色可控的颜色图。本发明可以生成不同的颜色丰富程度的颜色图。
主权项:1.一种颜色可控的文本引导灰色图着色方法,其特征在于,所述方法包括:针对带有文本描述的灰色图,提取所述灰色图的灰色图隐变量、语义边缘图隐变量和标准空间语义特征,并获取文本描述特征;其中,所述标准空间语义特征代表所述灰色图对应的语义分割图中的每个空间位置对应的语义特征;在所述灰色图隐变量的基础上注入文本描述特征,得到粗粒度着色隐变量;将该粗粒度着色隐变量联合语义边缘图隐变量作为ControlNet着色框架输入,并将标准空间语义特征与ControlNet着色框架的主干特征融合后注入ControlNet着色框架,以得到着色结果图隐变量;其中,所述ControlNet着色框架基于StableDiffusion构建;将所述灰色图隐变量经过解码得到的中间特征作为所述着色结果图隐变量的结构引导和灰色信息,生成颜色可控的颜色图。
全文数据:
权利要求:
百度查询: 北京大学 一种颜色可控的文本引导灰色图着色方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。