首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于深度学习的图像处理方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京小蝇科技有限责任公司

摘要:本发明提供一种基于深度学习的图像处理方法和装置,所述方法包括:获取待检测的图像数据,将所述图像数据与输入的提示信息相融合,以得到输入数据;将所述输入数据输入预先构建的目标检测模型,以得到所述目标检测模型输出的目标检测结果;其中,所述目标检测模型是基于预先构建的深度学习网络,利用自然图像样本、与所述自然图像样本对应的提示信息,以及标签信息进行训练得到的。解决了现有技术中图像处理过程中目标检测缺少交互能力,图像处理效果受限的技术问题。

主权项:1.一种基于深度学习的图像处理方法,其特征在于,所述方法包括:获取待检测的图像数据,将所述图像数据与输入的提示信息相融合,以得到输入数据;将所述输入数据输入预先构建的目标检测模型,以得到所述目标检测模型输出的目标检测结果;其中,所述目标检测模型是基于预先构建的深度学习网络,利用自然图像样本、与所述自然图像样本对应的提示信息,以及标签信息进行训练得到的;所述深度学习网络的网络架构包括:图像编码器,所述图像编码器用于在输入的自然图像样本中提取语义信息,并经过多次下采样得到自然图像样本的特征图;提示信息编码器,所述提示信息编码器用于在输入的提示信息中提取语义信息,并经过信息融合和处理,以得到融合有提示信息的特征图;特征融合模块,所述特征融合模块用于将多尺寸的特征图进行特征融合;标签匹配模块,所述标签匹配模块利用最小代价损失确定样本的标签信息,使用对比学习建立图像信息和文本描述之间的关系;所述提示信息包括掩码信息和文本信息,所述提示信息编码器包括:掩码编码器,所述掩码编码器用于在输入的掩码图像中提取语义信息,并经过多次下采样得到掩码图像的特征图;融合层,所述融合层用于将自然图像样本的特征图与掩码图像的特征图进行融合;文本编码器,所述文本编码器用于提取输入的文本信息的高级语义信息,通过对比学习建立图像特征和文本特征之间的关联;所述特征融合模块包括同尺度特征融合和跨尺度特征融合。

全文数据:

权利要求:

百度查询: 北京小蝇科技有限责任公司 基于深度学习的图像处理方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。