- 类型:高光谱遥感影像
- 详情:
- 波长范围:400nm-1000nm
- 光谱分辨率:2.5nm,共300个光谱通道
- 来源:由课题组自主开发的高光谱成像仪集成系统和UVA(杭州高光谱成像技术有限公司研发)拍摄
RG: 绿光波段反射率
RN:近红外波段反射率
传统方法(用于对比)
- 使用波长为563nm的高光谱反射率作为绿光波段反射率(RG),波长为865nm的高光谱反射率作为近红外波段反射率(RN)计算NDWI:
- 使用波长范围为520-600nm的平均反射率作为RG,760-950nm的平均反射率作为RN计算NDWI:
对波长范围为520-600nm的反射率积分作为RG,760-950nm的反射率积分作为RN计算NDWI:
-
选择初始化的 k 个样本作为初始聚类中心
-
针对数据集中每个样本计算它到k个聚类中心的距离dis并将其分到距离最小的聚类中心所对应的类中
Xi为样本,Cj为聚类中心,m为每个样本的特征维度
-
样本点划分完毕后,再次计算每个聚类的聚类中心,迭代地重复分配样本点,直到每个点到其对应聚类的聚类中心误差平方和(SSE)不变
-
本研究使用的K值为20
新的方法
分别对520-600nm和760-950nm进行PCA(主成分分析),选择分析之后的第一主成分为PG,PN,然后计算NDWI:
PCA分析是最常用的线性降维方法,其目的,就是为了在尽量保证“信息量不丢失”的情况下,对原始特征进行降维
对于高光谱数据来说,其优点在于可以很灵敏的反映地物的光谱特征,但在分类时,这种灵敏可能会导致结果的不正确。在机器学习中有欠拟合和过拟合两个概念,欠拟合表示拟合度不够,可以对应遥感数据中的多光谱数据,由于光谱分辨率低,很多信息无法被详细的反映,导致不同种类的物体展现的光谱特征相同,即同谱异物;而过拟合则恰恰相反,它对应的就是遥感数据中的高光谱数据,由于光谱分辨率高,地物的反射率会受到阴影、耀斑等多种噪音的干扰,而导致同种地物展现的光谱特征不同,即同物异谱。
所以,对于高光谱数据,进行PCA分析,可以一定程度上降低噪音的干扰,同时将多维度的特征转换为低纬度甚至一维特征,可以减少后续数据的处理难度
- 对数据进行中心化:去均值
- 计算数据的协方差矩阵
- 求解协方差矩阵的特征向量和特征值
- 将特征值与特征向量组合,并对特征值进行降序排序
- 将排序后的特征向量组合成特征向量矩阵
- 将中心化后的数据与特征向量矩阵的转置相乘得到新的数据