恭喜杭州电子科技大学陈平安获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜杭州电子科技大学申请的专利结合注意力机制的立体图像舒适度预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115361557B 。
龙图腾网通过国家知识产权局官网在2025-03-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210992815.7,技术领域涉及:H04N19/154;该发明授权结合注意力机制的立体图像舒适度预测方法是由陈平安;周洋;林坤;蔡毛毛;殷海兵;黄晓峰;杨阳;俞定国设计研发完成,并于2022-08-18向国家知识产权局提交的专利申请。
本结合注意力机制的立体图像舒适度预测方法在说明书摘要公布了:本发明方法公开了结合注意力机制的立体图像舒适度预测方法。本发明方法首先通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;然后分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量,合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测。本发明方法不仅降低了流程复杂度,还规避了因视差计算不准确带来的影响。
本发明授权结合注意力机制的立体图像舒适度预测方法在权利要求书中公布了:1.结合注意力机制的立体图像舒适度预测方法,其特征在于:步骤1通过对输入的左、右视点图像分别进行半重叠采样,得到多个图像块对;首先,对输入的左视点图像和右视点图像进行半重叠裁剪操作,得到多个大小为480×270像素的图像块,裁剪后的图像块作为输出图像块,裁剪间隔为240×135像素;对每个输出图像块进行局部归一化处理;每次左视点图像或右视点图像裁剪后得到的图像块个数其中,M和N分别是输入视点图像的宽和高,m和n是裁剪后的图像块的宽和高;左视点图像和右视点图像局部归一化处理后的输出图像块分别表示为Plk和k=1,2,…,K,图像块对表示为步骤2将图像块对作为模型输入,分别得到低、中、高级特征的相加特征图和相减特征图;所述模型包含两个主要子网络、三个次要子网络,以及用于回归预测的全连接层网络;首先通过加减运算得到低、中、高级特征的相加和相减特征图;低级特征的相加特征图Alow=Fl+Fr,低级特征的相减加特征图Dlow=Fl-Fr;其中,Fl和Fr分别表示左、右视点图像块的输出特征图中的低级特征;相同方法得到中级特征的相加特征图Amedium和相减特征图Dmedium,高级特征的相加特征图Ahigh和相减特征图Dhigh;步骤3分别将低、中、高级特征的相加和相减特征图拼接成新的特征块,输入并行双注意力模块进行注意力加权;将低级特征的相加和相减特征图拼接成新的特征块Fadl=Alow,Dlow,输入并行双注意力模块;通过并行双注意力模块中的通道注意力模块,得到特征块Fadl的通道注意力权重矩阵其中C表示输入通道数,为实数域;然后,使用得到的通道注意力权重,对特征块Fadl进行通道注意力加权运算,获得通道加权特征表示逐元素乘法;通过并行双注意力模块中的空间注意力模块获得特征块Fadl的空间注意力权重矩阵使用该空间注意力权重对特征块Fadl进行空间加权运算,得到输出的空间注意力加权特征Fsl:相同方法,将中、高级特征的相加特征图和相减特征图拼接成新的特征块,分别为Fadm和Fadh,得到中级特征的通道和空间注意力加权特征分别为Fcm和Fsm,高级特征的通道和空间注意力加权特征分别为Fch和Fsh;步骤4将低、中、高级特征的通道和空间注意力加权特征拼接成新的特征块,并分别输入对应的次要子网络,最终得到三个次要子网络的输出特征向量;首先,将低级特征的通道和空间注意力加权特征拼接成新的特征块Fcsl=Fcl,Fsl,并将Fcsl输入次要子网络A,输出特征向量为Flow;将中、高级的特征通道和空间注意力加权特征拼接成新的特征块,分别表示为Fcsm和Fcsh,并分别输入次要子网络B和次要子网络C,经过次要子网络B的输出特征向量为Fmedium,经过次要子网络C的输出特征向量为Fhigh;步骤5合并三个次要子网络的输出特征向量,并输入用于回归预测的全连接层网络进行舒适度回归预测;首先,合并三个次要子网络的输出特征向量为Fall:Fall=ConcatFlow,Fmedium,Fhigh,Concat·表示将多个一维特征向量合并在一起,用于回归预测的全连接层网络包含第一个全连接层和第二个全连接层;然后,将输出特征向量Fall输入用于回归预测的全连接层网络,最终输出值为每个图像块对的舒适度分数W1表示第一个全连接层的权重向量,W2表示第二个全连接层的权重向量,b1表示第一个全连接层的偏置,b2表示第二个全连接层的偏置,g·表示激活函数;整个立体图像的舒适度预测值为在模型训练过程中,将立体图像的舒适度平均意见得分作为每个图像块对的标签值yk,并计算L1损失作为训练过程中的最小化目标函数:
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人杭州电子科技大学,其通讯地址为:310018 浙江省杭州市下沙高教园区2号大街;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。