PCA analysis of reflectance spectra

光谱系列第2辑:PCA降维

对于光谱这种高维数据,常常需要通过降维发现其内部的规律。

首先看下原始光谱。从中仅仅能看出不同波段的变异信息,很难挖掘到更多与样品类别相关的特征。

于是采用PCA进行降维,观察不同样品的差异。从下面的图中,似乎可以看出样品有成簇分布的可能。但是PCA降维是无法将分类信息展示出来。

于是通过层次聚类,发现类别相关的特征。有意思的结果出来了。似乎能根据光谱特征将样品分为不同类别。

从直觉上看,4个类别似乎还是有可能的。

plot(dend)

采用kmeans进行聚类,发现确实4个类别是比较好的。而且还能生成非常漂亮的聚类PCA。

# Gap statistic plot
fviz_gap_stat(res.km$gap_stat)

fviz_cluster(res.km, geom = "point")

至此,光谱降维外加聚类的完整分析流程就结束了。下面就是需要根据样品的生物学特征来做解释了。比如4个类别刚好是质地不同的类型,那么解释起来就更有说服力了。

Wei Li (李伟)
Wei Li (李伟)
PostDoc of Crop Science

My research interests include smart breeding, high throughput crop phenotyping and quantitative genetics.

Related