首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江苏大学

摘要:本发明公开了基于SAE‑LSSVR农作物镉含量Vis‑NIR光谱深度特征模型建立方法,初始化堆叠自动编码器的权值矩阵W和偏移量b,将光谱数据集合S作为i层的输入;从光谱数据集合S和镉含量标签集合V中分别提取训练集合、预测集合和交叉验证集合,利用偏最小二乘支持向量机回归算法分别计算训练集合、预测集合和交叉验证集合对应的决定系数R2和均方根误差RMSE,并将m‑1赋值给m,当m=0时,预测集合SPi最大决定系数Rp2对应的节点数mc为i+1层最优节点数;若第i层和第i+1层堆叠自动编码器最优节点数所对应的预测集决定系数RBi和RBi+1满足条件:||RBi+1‑RBi||<ε,ε为误差,且i大于等于2,寻找最优堆叠自动编码器层数,完成模型,本方法提供一种速度快、精度高的镉含量Vis‑NIR光谱深度模型建立方法。

主权项:1.基于SAE-LSSVR农作物叶片镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,采集不同浓度镉胁迫叶片样本的Vis-NIR高光谱图像,对所采集高光谱图像进行预处理获得光谱数据集合S;同时测量样本中镉含量信息,形成镉含量标签集合V;输入光谱数据集合S和镉含量标签集合V;设置堆叠自动编码器网络结构,堆叠自动编码器的特征降维其本质为编码过程,其主要是通过映射函数将输入的训练样本非线性映射至隐含层中,数学表达公式为:h=fx=sfW×S+bn,其中,h为隐含层激活值,sf为编码激活函数,W为输入层与隐含层之间的权值矩阵,bh为输入层与隐含层之间测偏移向量,初始设置堆叠自动编码器网络结构,输入第i=1层节点个数;初始化自动编码器网络中参数权值矩阵W和偏移量bh,将预处理后光谱数据集合S作为i层的输入;从光谱数据集合S中提取训练集合SCi、预测集合SPi、交叉验证集合SVi;从镉含量标签集合V中提取训练集合VCi、预测集合VPi和交叉验证集合VCVi,设定第i+1层初始节点数为m,采用偏最小二乘支持向量机回归分别对SCi和VCi、SPi和VPi、SVi和VCVi进行回归建模,并分别计算出训练集合、交叉验证集合和预测集合的决定系数R2、均方根误差RMSE,并将m-1赋值给m,决定系数R2和均方根误差RMSE的计算方法如下: yk和分别表示第k个样本实际测量值和LSSVR模型评估值;是实测值的平均值,k取值为1,2,3,…,n,n为生菜叶片的样本数;对m是否为0进行判定:若是,寻找第i+1层预测集合SPi最大决定系数Rp2对应的节点数mc为i+1层最优节点数;并将mc、Rp2和Rp2对应的RMSEP进行存放;若否,则寻找最优堆叠自动编码器层数,若第i层和第i+1层堆叠自动编码器最优节点数所对应的预测集决定系数RBi和RBi+1满足条件:||RBi+1-RBi||<ε,且i大于等于2,则完成最优节点数寻找,确定i-1为最优堆叠自动编码器层数,ε为误差,ε取值为0.001;决定系数RBi的计算方法为yk和分别表示第k个样本实际测量值和LSSVR模型评估值;是实测值的平均值,k取值为1,2,3,…,n,n为生菜叶片的样本数。

全文数据:基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法技术领域本发明属于植物检测技术领域,尤其涉及基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法。背景技术在土壤-农作物生长发育体系中,重金属镉Cd对农作物胁迫效应日益加剧,造成农作物毒害效应、代谢紊乱和发育受损。问题的严重性还在于低浓度重金属在农作物体内积累的初期,不易为人们所注意或察觉,而一旦毒害作用比较明显表现出来后就难以消除。且重金属易在生菜茎叶部富集累积,可通过食物链危害人类健康和生命安全。已有研究表明食用含镉Cd生菜,轻则恶心呕吐、全身乏力,重则引起骨质酥松、骨骼病变,诱发骨癌以及心血管疾病等。因此,在不同镉胁迫下菜叶片中重金属含量的检测是十分必要的。高光谱成像技术是一种新兴的无损检测技术,有效的融合了光谱技术和成像技术,能同时获得待测样品的光谱和空间信息。不同镉浓度胁迫下,将对菜叶片的生长呈现不同作用包括促进、抑制和毒害作用,叶绿素含量将呈现不同程度的变化。可见光-近红外高光谱图像技术能有效的反映了作物叶片内部色素和细胞结构的变化。为此,可见光-近红外高光谱成像技术可用于生菜叶片中镉的检测。采集得到的高光谱图像信息中往往包含噪声,在处理高光谱图像数据前需要适当的去噪算法。此外,为了更方便地找到光谱值与预测值之间的关系,需要找到一种合适的特征选择和定量建模方法。目前,对高光谱图像光谱数据的降维方法从数据相关性角度分为线性方法和非线性方法。主成分分析法、线性判别方法等作为传统的线性方法,都是采用线性映射的手段处理高光谱图像数据的,但是高光谱波段间较强的相关性导致了这些方法在最终处理效果上的不足,而深度学习作为非线性方法通过引入神经网络先天的非线性,弥补了这些不足。其中,深度学习分支之一的堆叠自动编码器是一种无监督深度学习算法,分别对每层深度网络进行训练,提取数据的深度特征,已广泛应用于模式识别、图像分类等领域,在高光谱数据分析中,通过提取高光谱数据深度特征,能够更加高效地进行降维处理。目前,堆叠自动编码器在光谱信息处理研究主要集中在光谱数据降维方面。现有技术中基于加权自动编码器的马尾松苗木根部水分快速检测方法,利用SG结合一阶微分对光谱进行预处理后,采用堆叠自动编码器进行高阶特征提取,而后构架LSSVR模型。也有研究利用自动编码器实现光谱数据压缩。但是采用上述两个发明专利算法存在未进行深层次算法嵌合,所建立模型仍存在编码器和解码器,并且所建立的模型结构复杂、随机性较大等问题。发明内容本发明根据现有技术中存在的问题,提出了基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,目的在于提供一种检测速度快、精度高、对农作物叶片不会造成破坏的镉含量Vis-NIR光谱深度模型建立方法。本发明所采用的技术方案如下:基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,包括以下部分:数据准备:采集不同浓度镉胁迫的样本的高光谱图像,对所高光谱图像进行预处理获得光谱数据集合S;同时测量样本中镉含量信息,形成镉含量标签集合V;构建模型:输入光谱数据集合S和镉含量标签集合V;初始化堆叠自动编码器的权值矩阵W和偏移量b,设置堆叠自动编码器网络结构,将光谱数据集合S作为i层的输入;从光谱数据集合S和镉含量标签集合V中分别提取训练集合、预测集合和交叉验证集合,利用偏最小二乘支持向量机回归算法分别计算训练集合、预测集合和交叉验证集合对应的决定系数R2和均方根误差RMSE,并将m-1赋值给m,当m=0时,预测集合SPi最大决定系数Rp2对应的节点数mc为i+1层最优节点数;并将mc、Rp2和Rp2对应的RMSEP进行存放;若第i层和第i+1层堆叠自动编码器最优节点数所对应的预测集决定系数RBi和RBi+1满足条件:||RBi+1-RBi||<ε,ε为误差,且i大于等于2,寻找最优堆叠自动编码器层数,完成模型。进一步,所述预测集决定系数RBi的计算方法为:yk和分别为预测集中第k个样本中镉实际测量值和模型预测值。是预测中镉实际测量的平均值,k取值为k取值为1、2、3、…、n,n为样本数。进一步,所述训练集合是分别从光谱数据集合S和镉含量标签集合V中抽取75%的数据;所述预测集合是从光谱数据集合S和镉含量标签集合V中抽取25%的数据;所述交叉验证集合是采用五折交叉验证法从训练集合SCi中获取交叉验证集合SVi。进一步,所述预处理的过程为:在所采集的高光谱图像信息中获取叶片ROI可见光-近红外光谱信息;采用一阶导数法结合标准归一化变换对叶片ROI可见光-近红外光谱信息进行处理获得光谱数据集合S。进一步,所述镉含量标签集合V获取的方法为:采用原子吸收光谱法测定叶片中重金属镉含量。本发明的有益效果:本发明是在提取不同镉胁迫农作物叶片Vis-NIR高光谱图像信息基础上,通过淹模图像获取整个叶片感兴趣区域光谱,利用SAE-LSSVR算法完成叶片镉含量Vis-NIR光谱特征建模,具有检测速度快,精度高,定量检测效果好,对待检测物不造成破坏的优点,可自主学习得到作物叶片深度语义信息,从而实现重金属镉胁迫定量检测。为重金属镉胁迫梯度诊断提供可靠的技术保障。附图说明图1是基于SAE-LSSVR的生菜叶片镉含量Vis-NIR光谱特征建模方法的流程图;图2是生菜叶片感兴趣区域Vis-NIR光谱图;图3是生菜叶片感兴趣区域Vis-NIR光谱数据一阶导数法1stDer结合标准归一化变换法SNV预处理后光谱图。具体实施方式为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。本发明所设计的基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法适用于农作物叶片重金属镉含量光谱检测,例如油菜、水稻、生菜等作物。不同重金属镉浓度胁迫下这些作物叶片中将形成一些富含N-H和O-H有机物碳水化合物、氨基酸、蛋白质、多酚等、以及叶细胞膜过氧化程度加深以增强叶片对镉的抗逆性,为此Vis-NIR光谱能有效表征作物叶片中重金属镉含量,本实施例仅以生菜叶片作为例子阐述,适用于生菜叶片中重金属镉含量定量检测。具体过程如下:步骤1,样本的制备:培育试验在Venlo型温室大棚内进行生菜的无土栽培,以便获取较纯正的实验样本。生菜样本拟选用意大利耐抽薹生菜。生菜种子首先在营养基质槽中进行育苗,在幼苗5-6叶期前采用营养液培养。营养液按照日本山崎配方进行配置,待长出新叶后选取长势较好且一致的生菜幼苗移植于珍珠岩固体基质中,1周之后进行镉胁迫处理。营养液中的Cd以CdCl2形式加入,镉浓度梯度设置为0mgLCK、0.2mgL、0.5mgL、1mgL、2mgL、5mgL、10mgL,每个处理8次重复。培养期间每天用HCl或NaOH调节营养体系以稳定pH值,每天更换一次营养液并保持连续通气。于莲座期,采集相同位置的叶片用于Vis-NIR高光谱图像采集试验。步骤2,数据的准备:A,采用可见光-近红外高光谱图像采集系统,获取采集不同浓度重金属镉胁迫下的生菜叶片Vis-NIR高光谱图像信息,将整个生菜叶片作为感兴趣区域ROI,regionofinterest,利用反射值较大的波长732.16nm图像与反射值较小的波长673.23nm图像作比,设定二值化分割阈值为1.1,对作比后图像进行阈值分割获取淹模图像,最后通过淹模图像获取去除背景后整个生菜叶片感兴趣区域可见光-近红外光光谱如图2所示。对生菜叶片感兴趣区域可见光-近红外光谱信息采用一阶导数法1stDer结合标准归一化变换法SNV进行预处理,从而获得光谱数据集合S={x1,y1,x2,y2,...,xm,yn},其中,xm是波段数为m的菜叶光谱波长,yn为菜叶光谱波长xm对应的光谱反射值。B,采用原子吸收光谱法AAS,atomicabsorptionspectrometry测定生菜叶片中重金属镉含量,获得生菜叶片重金属镉含量标签集合V。具体过程如下:参照国家标准GB5009.15-2014,生菜叶片重金属镉含量计算公式为:其中,X为试样中镉含量,单位为mgkg或mgL;c1为试样消化液中镉含量,ngmL;c0为空白液中镉含量,单位为纳克每毫升ngmL;V为试样消化液定容总体积,单位为毫升mL;m为试样质量或体积,单位为克或毫升g或mL;1000为换算系数。最终得到生菜叶片重金属镉含量标签集合V={s1,v1,s2,v2,...,sn,vn};sn为某一个菜叶样本,vn为某一个菜叶样本重金属镉含量,n为菜叶样本总数。步骤3,构建模型:3.1,输入光谱数据集合S={x1,y1,x2,y2,...,xm,yn}和菜叶重金属镉含量标签集合V={s1,v1,s2,v2,...,sn,vn};3.2,初始化堆叠自动编码器相关参数,堆叠自动编码器的特征降维其本质为编码过程,其主要是通过映射函数将输入的训练样本非线性映射至隐含层中,数学表达公式为:h=fx=sfW×s+bh,其中,h为隐含层激活值,sf为编码激活函数,选择为sigmoid函数,学习率设置为0.01,W为输入层与隐含层之间的权值矩阵,bh为输入层与隐含层之间测偏移向量,s为输入光谱数据集合,初始设置堆叠自动编码器网络结构,输入第i=1层节点个数m1=618。初始化自动编码器网络中参数权值矩阵W和偏移量bh,将预处理后光谱数据集合S作为i=1层的输入。3.3,寻找i+1层最优节点数,具体过程如下:3.3.1,将光谱数据集合S内75%的数据作为训练集合SCi,剩余25%的数据作为预测集合SPi,且采用五折交叉验证法从训练集合SCi中获取交叉验证集合SVi;训练集合SCi、预测集合SPi和交叉验证集合SVi的样本数分别为t1、t2和t3,其中,t=t1+t3,t1=t2×5,t=n,n为生菜叶片的样本数。3.3.2,同上,将生菜叶片重金属镉含量标签集合V依次获取训练集合VCit1×1、交叉验证集合VCVit2×1和预测集合VPit3×1。3.3.3,设定第i+1层初始节点数为m,采用偏最小二乘支持向量机回归LSSVR分别对训练集合SCi和VCi、预测集合SPi和VPi和交叉验证集合SVi和VCVi进行回归建模,并分别出计算训练集合、交叉验证集合和预测集合的决定系数R2和均方根误差RMSE,并将m-1赋值给m,决定系数R2和均方根误差RMSE的计算方法如下:其中,n为生菜叶片的样本数,yk和分别表示第k个样本实际测量值和LSSVR模型评估值;是实测值的平均值,k=1、2、3、...、n。3.3.4,对m是否为0进行判定:若是,寻找第i+1层预测集合Rp2最大值对应的节点数mc为i+1层最优节点数,并将mc存放至集合BTi中,将Rp2最大值存放至RBi中,Rp2最大值对应的RMSEP存放至集合REPi中;若否,调至步骤3.4进行进一步循环。3.4,寻找最优堆叠自动编码器层数,完成模型若第i层和第i+1层堆叠自动编码器最优节点数所对应的预测集决定系数RBi和RBi+1满足条件:||RBi+1-RBi||<ε,且i大于等于2,决定系数RBi的计算方法为:yk和分别为预测集中第k个样本中镉实际测量值和模型预测值。是预测中镉实际测量的平均值,k取值为1,2,3,…,n。则完成最优节点数寻找循环结束,计算终止,确定i-1为最优堆叠自动编码器层数,否则,继续步骤3;ε为误差,ε取值为0.001。如表1所示,本发明利用SAE-LSSVR算法完成生菜叶片镉含量Vis-NIR光谱深度特征建模,SAE结构框架、建模结果如表所示:表1SAE-LSSVR结构框架与建模结果模型规模表示SAE-LSSVR模型中各层神经元个数。例如:[618-309-141]表示输入层总计618个神经元即原始输入光谱波段数为618,网络中包括2个隐含层神经元个数分别为309和141,并将最后1个隐含层141个节点作为SAE网络的输出即LSSVR模型的输入。从表1中可以看出,当隐含层个数为4,模型规模为[618-309-141-61-41],所建立的Cd含量SAE-LSSVR预测模型效果最佳,其模型的Rp2,RMSEP和RDP值分别为0.9530,0.02306和3.391。已有研究表明,相对分析误差RDP大于3时,所建立的模型较为稳定且检测效果好。以上实施例仅用于说明本发明的设计思想和特点,其目的在于使本领域内的技术人员能够了解本发明的内容并据以实施,本发明的保护范围不限于上述实施例。所以,凡依据本发明所揭示的原理、设计思路所作的等同变化或修饰,均在本发明的保护范围之内。

权利要求:1.基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,采集不同浓度镉胁迫的样本的高光谱图像,对所高光谱图像进行预处理获得光谱数据集合S;同时测量样本中镉含量信息,形成镉含量标签集合V;输入光谱数据集合S和镉含量标签集合V;初始化堆叠自动编码器的权值矩阵W和偏移量b,设置堆叠自动编码器网络结构,将光谱数据集合S作为i层的输入;从光谱数据集合S和镉含量标签集合V中分别提取训练集合、预测集合和交叉验证集合,利用偏最小二乘支持向量机回归算法分别计算训练集合、预测集合和交叉验证集合对应的决定系数R2和均方根误差RMSE,并将m-1赋值给m,当m=0时,预测集合SPi最大决定系数Rp2对应的节点数mc为i+1层最优节点数;并将mc、Rp2和Rp2对应的RMSEP进行存放;若第i层和第i+1层堆叠自动编码器最优节点数所对应的预测集决定系数RBi和RBi+1满足条件:||RBi+1-RBi||<ε,ε为误差,且i大于等于2,寻找最优堆叠自动编码器层数,完成模型。2.根据权利要求1所述的基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,所述预测集决定系数RBi的计算方法为:yk和分别为预测集中第k个样本中镉实际测量值和模型预测值,是预测集中镉实际测量的平均值,k取值为1、2、3、…、n,n为样本数。3.根据权利要求1所述的基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,所述训练集合是分别从光谱数据集合S和镉含量标签集合V中抽取75%的数据;所述预测集合是从光谱数据集合S和镉含量标签集合V中抽取25%的数据;所述交叉验证集合是采用五折交叉验证法从训练集合SCi中获取交叉验证集合SVi。4.根据权利要求1所述的基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,所述预处理的过程为:在所采集的高光谱图像信息中获取叶片ROI可见光-近红外光谱信息;采用一阶导数法结合标准归一化变换对叶片ROI可见光-近红外光谱信息进行处理获得光谱数据集合S。5.根据权利要求1所述的基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法,其特征在于,所述镉含量标签集合V获取的方法为:采用原子吸收光谱法测定叶片中重金属镉含量。

百度查询: 江苏大学 基于SAE-LSSVR农作物镉含量Vis-NIR光谱深度特征模型建立方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。