首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

焦点堆栈重建指导下的基于散焦的深度预测方法及系统 

申请/专利权人:上海人工智能创新中心

申请日:2022-09-15

公开(公告)日:2024-07-02

公开(公告)号:CN115359108B

主分类号:G06T7/571

分类号:G06T7/571;G06N3/0455;G06N3/0464;G06N3/0895

优先权:

专利状态码:有效-授权

法律状态:2024.07.02#授权;2022.12.06#实质审查的生效;2022.11.18#公开

摘要:本发明涉及深度预测技术领域,提出一种焦点堆栈重建指导下的基于散焦的深度预测方法及系统。该方法包括下列步骤:进行数据处理,其中对颜色‑深度数据集进行点扩散函数渲染以生成焦点堆栈数据集;向神经网络中输入所述焦点堆栈数据集以生成预测深度和预测全焦点图像;根据所述预测深度和所述预测全焦点图像生成重建焦点堆栈;以及对所述预测深度、所述预测全焦点图像以及所述重建焦点堆栈进行自监督训练。本方法在进行基于散焦的深度预测时可以不依赖于全焦点AIF图像,而完全依靠焦点堆栈进行自监督训练,因此具有拥有强大的迁移能力、在工业上能够广泛的应用,并且随着使用的焦点堆栈大小增加可以获得更高的深度预测精度而增加模型大小。

主权项:1.一种焦点堆栈重建指导下的基于散焦的深度预测方法,其特征在于,包括下列步骤:进行数据处理,其中对颜色-深度数据集进行点扩散函数渲染以生成焦点堆栈数据集;向神经网络中输入所述焦点堆栈数据集以生成预测深度和预测全焦点图像;根据所述预测深度和所述预测全焦点图像生成重建焦点堆栈;以及对所述预测深度、所述预测全焦点图像以及所述重建焦点堆栈进行自监督训练;其中所述神经网络包括DAIF-Net卷积神经网络,其有多个U-Net的编码器以接受焦点堆栈的输入,所有的编码器共享相同的模型参数,在U-Net的编码器的基础上,该模型增加了全局最大池以收集模型各层间最大的特征值作为堆栈的全局信息,连接在编码器的本地特征后进行训练,每个编码器在预测的时候都能接触到堆栈全局及照片局部的模糊度信息,在该模型中用最大值融合的方式合并各层的特征作为残差连接输入U-Net的解码器中,模型输入为n张颜色-焦平面数据,其中n为堆栈大小,输出为AIF-深度图像,其中AIF表示全焦点。

全文数据:

权利要求:

百度查询: 上海人工智能创新中心 焦点堆栈重建指导下的基于散焦的深度预测方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。