买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:谷歌有限责任公司
摘要:该技术采用了可用于各种成像应用的基于图像块的多尺度变换器300。这避免了对图像固定输入大小的约束,并有效地预测了原生分辨率图像的质量。将原生分辨率图像304转换为多尺度表示302,使得变换器的自注意力机制能够捕获关于细粒度详细图像块和粗粒度全局图像块的信息。空间嵌入316用于将图像块位置映射到固定网格,其中每个尺度的图像块位置被散列到相同网格。采用单独的尺度嵌入318在多尺度表示中区分不同尺度的图像块。执行自注意力508以创建最终图像表示。在一些情况下,在执行自注意力之前,系统可以将可学习分类标记322预置到输入标记的集合中。
主权项:1.一种用于处理图像的方法,所述方法包括:通过一个或多个处理器构造原生分辨率图像的多尺度表示,所述多尺度表示包括原生分辨率图像和保持纵横比的调整大小的变体的集合;通过所述一个或多个处理器对与原生分辨率图像或保持纵横比的调整大小的变体的集合中的一个的相应区域相关联的每个图像块的对应空间嵌入进行编码,从而形成空间编码图像块的集合;通过所述一个或多个处理器将尺度嵌入的集合应用于空间编码的图像块的集合,以捕获与原生分辨率图像和纵横比调整大小的变体的集合相关联的尺度信息,从而形成输入标记的集合;以及通过所述一个或多个处理器根据变换器编码器模块对输入标记的集合执行自注意力以创建最终图像表示。
全文数据:
权利要求:
百度查询: 谷歌有限责任公司 用于图像分析的多尺度变换器
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。