vlambda博客
学习文章列表

桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测










桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测








 






高礼彬,陈金浩,张怡卓,王克奇*


(东北林业大学机电工程学院,哈尔滨 150040) 


关键词 



抗压强度;近红外光谱;变量空间迭代收缩法;采样误差分布分析;相关向量机;桦木












 


ABSTRACT

摘 要

 



木材顺纹抗压强度是评价木材力学性能的重要指标,而传统测量方法操作复杂、精确度低。以桦木为例,提出基于近红外光谱技术(NIR)的SEPA-VISSA-RVM木材顺纹抗压强度模型,实现对其更加精确的预测。试验选取100个木材试件,在900~1 700nm近红外光谱波段上采集数据并测量抗压强度真值;然后采用卷积平滑(SG)方法进行光谱预处理;使用采样误差分布分析(SEPA)作为变量空间迭代收缩算法(VISSA)的改进策略进行特征波长优选;最后通过粒子群优化算法(PSO)优化核函数参数并建立相关向量机(RVM)的预测模型。试验表明:在特征波长优选方面,以偏最小二乘法(PLS)建模为基础的SEPA-VISSA方法,其预测决定系数为0.959 3,预测均方根误差为2.899 5,相对分析误差为3.025 6,光谱变量数由512减小到111个,占总波长的22%,均优于VCPA、CARS和VISSA算法;在建模预测方面,以SEPA-VISSA所选波长为基础的RVM模型,PSO优化的拉普拉斯(Laplacian)核函数的核宽度为10.404 3,决定系数为0.944 9,预测均方根误差为2.043 2,相对分析误差为4.293 6,预测效果优于PLS和SVR。因此,基于近红外光谱的SEPA-VISSA-RVM建模能够实现对桦木顺纹抗压强度更准确和稳定的无损检测。

//

桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测


木材顺纹抗压强度是结构用材重要的力学指标之一,而传统的破坏性检测方法时间长、成本高,且由于木材的各向异性及不均匀性,造成操作复杂且准确度低。

近红外光谱技术
NIR
NIR

近红外光谱技术(NIR)具有简单便捷、快速有效的特点,通过建立NIR定量分析模型,可实现快速无损测定。





黄安民等指出近红外光谱技术在木材物理力学研究方面具有极大的潜力;


虞华强等将近红外光谱作为初步检测杉木木材力学性质的工具;


赵荣军等利用近红外光谱方法预测人工林粗皮桉木材力学性质效果较好。


因此,近红外光谱技术在木材力学性能检测中被证明是一种理想可靠的方法。




在近红外光谱建模过程中

Near Infrared Spectroscopy


在近红外光谱建模过程中,原始光谱会包含大量无用信息,要先进行特征选择,实现降维处理。


云永欢等Yun等提出模型集群分析(MPA)算法框架运用于光谱特征优选,打破了传统一次性建模思路,力求最大限度地利用已有样本集的信息,通过随机采样,从大量的子模型中提取统计信息并进行选择分析。

基于MPA算法框架开发的算法常见的有

桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测







变量组合集群分析(VCPA)算法,其根据优秀子集中变量出现频率作为变量重要性的评价标准选取特征变量组合;


竞争性自适应重加权(CARS)算法,其通过搜索方法及评价变量重要性程度的标准以得到最优的变量子集;


变量迭代空间收缩(VISSA)算法,其在变量空间中迭代收缩,保证新的变量空间优于前一个,得到最优变量组合。






其中,VCPA和CARS的弊端在于当校正集样本出现波动时,对于变量的重要性判断会受到一定程度的影响,会降低模型的预测能力。


VISSA避免了这种缺点,但因其在每轮迭代子数据集时,得到的是特征波长数量比例不同的子数据集,可能无法准确评价子模型的优劣,导致有效信息丢失,增加不稳定性。因而引入采样误差分布分析(SEPA)与VISSA相结合进行改进,相比于原VISSA能以一种更温和的方式消除非信息变量。


合适的建模方法是建立光谱数据与真值之间联系的关键,由于木材的各向异性及不均匀性,使高维度特征变量之间的相关性非常敏感,采用线性建模会导致模型的精度大大降低,如偏最小二乘回归法(PLS)。而非线性建模能有效提升预测精度,有较好的泛化能力且不会出现过拟合的问题,如支持向量回归(SVR),但其不提供后验概率且参数不易设置。


桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测

因此,在SVR基础上提出基于贝叶斯框架的稀疏概率学习模型——相关向量机(RVM),其不仅具有SVR模型的优点,且核函数可以任意指定,不是必须正定,此外调节参数较少,便于模型优化,相较于SVR模型能够完成更精确的预测。




东北林业大学高礼彬,王克奇等 以桦木木材为试验对象,使用近红外光谱仪采集光谱数据并测定顺纹抗压强度真值,然后以SEPA作为VISSA的改进策略进行特征波长筛选,在此基础上采用RVM非线性建模方法进行木材抗压强度预测,并与其他波长优选算法和建模方法效果进行比较。

 


1 材料与方法


1.1   试验材料
1.2   近红外光谱采集与预处理
1.3   真值测试
1.4   近红外光谱SEPA-VISSA-RVM建模方法
1.4.1   SEPA-VISSA算法
1.4.2   RVM建模原理

 


2 结果与分析


2.1   特征波长提取
以SG预处理后的512个波长点作为对象,采用不同算法设置参数,并进行降维试验,过程如图1所示。其中,VCPA 的二进制采样(BMS)采样数为500,指数递减函数(EDF)运行数为200,比率为0.5;CARS的蒙特卡洛采样数为2 000;VISSA和SEPA-VISSA的加权二进制采样(WBMS)采样数均为2 000。试验均设最大主成分数n为10,交叉验证为5折,每个试验各进行10次,取试验结果中值。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
不同算法的波长选择对比见图2。结合图1和2可知:①VCPA在EDF运行到187次时,最小RMSECV为3.672 2,此时得到15个波长点,占总波长的3%;②CARS在蒙特卡洛采样1 799次时,最小RMSECV为12.597 0,此时得到12个波长点,占总波长的2%;③VISSA选取了77个波长点,占总波长的15%,此时模型的最小RMSECV为3.681 8;④SEPA-VISSA选取了111个波长点,占总波长的22%,此时最小RMSECV±STD(SEPA)为3.822 0。此处4种算法的采样方法和判断最优变量特征方式都各不相同,由于是随机采样的子模型,仅表现当前对应算法选取特征时的子模型状况,相互间无直接联系。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
对于木材的主要成分纤维素和木质素,其含有大量的含氢基团C—H、O—H、N—H等在近红外光谱区产生吸收,其中二级倍频主要位于1 000~1 400nm处,一级倍频主要位于1 400~1 800nm处,因此使其在近红外光谱区域有丰富的吸收信息。从图2可以看出,在990,1 210,1 460和1 660nm附近有主要吸收。根据吸收峰可得,1 210和1 660nm处分别为C—H键二级倍频伸缩和一级倍频伸缩,1 460nm处为O—H键一级倍频伸缩振动,990nm处为N—H键二级倍频对称伸缩振动。由图2可知,VCPA和CARS选择波长数量较少,可能会遗漏信息变量而降低建模准确性,而SEPA-VISSA相比于VISSA所选特征波长增加了1 460nm处C—H键一级倍频振动以及一些非主要的吸收峰,这是VISSA算法在特征波长多而杂时,子数据集随机产生所带来的不稳定性,而SEPA-VISSA算法能更稳定包含更多信息变量。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
对各算法优选后的特征波长进行PLS建模,如表3所示。其中,SEPA-VISSA在校正集中决定系数为0.940 2,校正均方根误差为3.049 2;在预测集中,决定系数为0.959 3,预测均方根误差为2.899 5,相对分析误差为3.025 6。相比之下,验证了SEPA-VISSA在校正集和预测集中的PLS模型效果均优于其他算法,主要原因如下:①相对于复杂的抗压强度本身而言,影响抗压强度的因素有很多,如木材的各向异性及不均匀性等特点,但通过VCPA和CARS所提取的特征波长可能会排除主要信息变量,导致预测结果不理想;②在SEPA-VISSA算法中,运用SEPA中的RMSECV±STD作为子模型的评判指标对VISSA改进,提取出的特征波长信息与抗压强度实际值拟合度更高,除了主要的特征波长,还包含一些非主要的特征波长,以更加柔和精确的方式剔除无信息特征波长,进一步提升预测模型的准确性。
 
2.2   建模方法及比较
将SEPA-VISSA特征优选后的数据作为输入,以PSO算法分别对Gaussian、Exponential和Laplacian核函数的核宽度进行优化,其中PSO参数惯性权重ω和学习因子C1C2为预置值,设最大迭代数为80,上下界为26和2-6,5折交叉验证,各运行10次,取最佳结果。不同核函数的PSO优化过程如图3所示,3种核函数参数优化的迭代次数分别为53,59和38,最佳适应度值为3.027 1,3.325 1和3.132 3。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
不同核函数的PSO-RVM模型效果对比见表4,根据表4,采用Laplacian建立RVM模型时,其核宽度为10.404 3,预测决定系数为0.944 9,预测均方根误差为2.043 2,均优于基于Gaussian和Exponential的RVM模型,因此采用Laplacian进行建模,可进一步提高抗压强度预测模型的精度。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
不同建模方法的模型效果对比如图4所示,为SEPA-VISSA提取特征波长分别采用PLS、SVR和RVM这3种方法进行建模。其中PLS模型的预测决定系数为0.959 3,优于SVR和RVM,这是因为建模所输入的SEPA-VISSA特征波长是在PLS建立子模型的基础上所筛选的,因此,因变量(抗压强度)的全部变异通过回归关系被自变量(特征波长)解释的比例,即决定系数是更高的。但是由于木材的各向异性及不均匀性等特点,特征波长之间更多是处在非线性不可分的状态,因此SVR和RVM非线性模型的预测均方根误差分别为2.235 5和2.043 2,相对分析误差分别为3.924 3和4.293 6,均优于PLS建模,模型更稳定和精确。此外,RVM相比于SVR引入了贝叶斯方法,提供了后验概率的输出,能产生更稀疏的解,同时其调参也更为简便。从预测的结果数据来看,RVM模型的效果最优,建模效果优于PLS和SVR。
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测

结论

在900~1 700nm近红外光谱波段上,以桦木为例,提出SEPA-VISSA-RVM的木材抗压强度预测建模方法。通过实例和数据证明该模型不仅在波长优选上具有优势,且相比于常用的PLS和SVR建模效果更好,在实际工程中具有良好应用性。

1)利用SEPA作为VISSA的改进策略提取出的111个特征波长建立PLS模型,得到决定系数为0.959 3,预测均方根误差为2.899 5,相对分析误差为3.025 6,与VCPA、CARS和VISSA相比,在使用PLS线性建模时预测精准度更高,提升了木材抗压强度预测模型的准确性和鲁棒性。

2)将SPEA-VISSA与RVM建模方法相结合,通过PSO对RVM进行参数优化,选择Laplacian核函数建模,得到决定系数为0.944 9,预测均方根误差为2.043 2,相对分析误差为4.293 6,相比于PLS和SVR,RVM作为非线性建模方法可更加精确地计算出桦木抗压强度的预测值。




该文发表于《林业工程学报》2022年第1期。

引文格式:

高礼彬,陈金浩,张怡卓,等.桦木顺纹抗压强度的SEPA-VISSA-RVM 近红外光谱预测[J].林业工程学报,2022,7(1) : 52-58.
GAO L B,CHEN J H,ZHANG Y Z,et al.Prediction of compressive strength parallel to grain of birch wood using near infrared spectroscopy and SEPA-VISSA-RVM model[J].Journal of Forestry Engineering,2022, 7(1):52-58.
桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
更多精彩推荐,请关注我们


桦木顺纹抗压强度的SEPA-VISSA-RVM近红外光谱预测
把时间交给阅读
图片来源于网络
排版:Rachel