买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:小语智能信息科技(云南)有限公司
摘要:本发明涉及融合门控注意力的缅甸语文本图像生成方法,属于自然语言处理领域。为了解决传统文本图像合成算法合成的缅甸语图像与真实应用场景存在较大差距造成训练的识别模型性能不佳的问题,提出一种融合门控注意力的缅甸语文本图像生成方法,主要包括缅甸语图像数据集构建及预处理、缅甸语文本渲染模块、融合门控注意力的缅甸语图像文本图像生成三部分构成。本发明相比通用的图像文本生成方法本发明有效地合成较高质量的文本图像,使生成的缅甸语文本图像更接近真实场景的文本图像。
主权项:1.融合门控注意力的缅甸语文本图像生成方法,其特征在于:所述方法的具体步骤如下:Stepl、缅甸语图像数据集构建及预处理:结合缅甸语的字符组合特征构造缅甸语文本图像数据集;构建的缅甸语文本图像数据集包含源图像、目标文本在灰色背景图呈现的图像、目标文本的骨架化图像、源图像的背景图像、目标文本在源图像背景图像上的源文本样式渲染效果图、目标文本灰度图像的二进制掩码以及目标文本在灰色背景图上源文本样式渲染效果图,这些图像数据作为模型网络的训练数据;Step2、通过缅甸语文本渲染模块将源图像Is和目标文本在源图像背景图像上的源文本样式渲染效果图It作为输入,目的是从源图像Is中提取前景风格,具体包括字体、颜色、几何变形;文本渲染模块输出含有目标文本的语义图像Ot和源图像的文本风格的图像Osk;Step3、通过背景提前网络将源图像中所有文本笔划像素擦除并用适当的纹理填充;为了更好地辅助提取缅甸语图像文本样式和背景,提出融合门控注意力的图片擦除方法,减少背景噪声的干扰,使得模型能更好地区分文本笔划区域的纹理和背景图像,以便更精确地从输入图像中提取出背景部分;最后将提取到的背景图像与文本渲染模块得到的目标文本以及源图像文本风格进行融合得到编辑后的缅甸语图像。
全文数据:
权利要求:
百度查询: 小语智能信息科技(云南)有限公司 融合门控注意力的缅甸语文本图像生成方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。