实习序号及题目 实习人姓名 任课教师姓名 刘勇老师 实习8. 监督分类与非监督分类 专业班级及编号 实习指导教师姓名 11地信17 实习地点 榆中校区实验楼A109 实习日期时间 实习目的 2013年12月19日 理解影像监督分类和非监督分类的原理、方法和步骤,初步掌握土地利用/土地覆盖的计算机自动分类方法 实习内容 1. 选取研究区数据(512×512或者1024×1024),通过目视解译建立分类系统及其编码体系 2. 按照监督分类的步骤,在影像上找出对应各个土地利用/覆盖类型的参考图斑,利用ROI工具建立训练区,给出各个类别的特征统计表。 3. 计算各个样本之间的可分离性。说明哪些地物类型之间较易区分,哪些类型之间难以区分。 4. 监督分类:利用最大似然法完成分类。 5. 分类精度评价,从随机采集100~200个样本点,并确保每一类别不少于10个样本;进行分类精度评价,得到分类混淆矩阵,计算Kappa系数,并对结果进行解释。 6. 分类后处理(clump—sieve—majority)。 运用ISODATA方法进行非监督分类:预先假定地表覆盖类型为30类,迭代次数选为15,由系统完成非监督分类;然后进行类别定义与合并子类,最后进行结果评价。 基本原理 1、遥感影像分类就是将遥感影像上所有或特定部分的像元划归到对应的分类单元当中去,进而满足制图需求;分类的原则是: 互斥性:指所有类别之间不存在重叠或者模糊性 完备性:无一遗漏地包含影像中所有涉及的特征类型 层次性:分类等级体系中次一级类型可以合并到更高级别的类型中去。 分类结果是生成一个新的专题图层,可进一步用于GIS空间分析 2、土地利用是指人类对地球表面的利用状况,如工业用地、住宅用地、商业用地、公路、铁路等。土地利用状况是人类根据土地本身的自然属性以及社会需求,经长期改造和利用的结果。依据不同的土地用途和利用方式,土地利用的分类系统有不同的类别和等级。 土地覆盖是指地球表面的自然状态,如森林、草场、河流、湖泊等,是自然环境与人类活动综合作用的结果。对于林地,可根据林地生态环境的不同,分为针叶林地、阔叶林地、针阔叶混交林地等,以反映林相结构、林地所处生境、分布特征及其所具有的地带性分布规律。 土地利用和土地覆盖是从遥感影像中提取地理信息类别的重要依据。 3、监督分类又称“训练分类法”,用被确认类别的样本象元去识别其它未知类别象元的过程。在分类之前通过目视判断和野外调查,对图像上某些样区中图像地物的类别属性有了先验知识,对每一种类别选取一定数量的训练样本,计算机计算每种训练样区的统计或其它信息,同时用这些中子类别对判决函数进行训练,使其符合于对各种子类别分类的要求;随后用训练好的判决函数去对其它待分数据进行分类,是每个像元和训练样本作比较,按不同的规则将其划分到与其最相似的样本类,以此完成对整个图像的分类; 4、非监督分类也称“聚类分析”或“点群分析”。在多光普图像中搜寻、定义其自然相似光谱集群的过程。它不必对图像地物获取先验知识,仅依靠图像上不同类地物光谱(或纹理)信息进行特征提取,在统计特征的差别来达到分类的目的,最后对已分出的各个类别的实际属性进行确认。 非监督分类主要过程: (1)确定初始类别参数,即确定最初类别数和类别中心。 (2)计算每一个像素所对应的特征向量与各点群中心的距离。 (3)选取与中心距离最短的类别作为这一向量的所属类别。 (4)计算新的类别均值向量。 (5)比较新的类别均值与初始类别均值,如果发生改变,则以新的类别均值作为聚类中心,再从第(2)步开始进行迭代。 (6) 如果点群中心不再变化,计算停止。 5、最大似然法:最大似然法假设遥感图像上的每个波段数据都为正态分布。其基本 思想是:地物数据在空间中构成特定的点群;每一类的每一维数据都在自己的数轴上为正态分布,该类的多位数据就构成了一个多位正态分布;各类的多为正态分布模型各有其分布特征,例如,所在位置、形状、密集或分散的程度等。对于具有3个特征的正太分布来说,每一类的数据就是一个近似钟形的立方体。不同类形成的“钟”在高低、粗细、尖阔等方面都不相同;根据各类已知数据,可以构造出各类的多维正态分布模型(实际为各类中各数据向量的频率,即概率密度函数或概率分布函数);在此基础上,对于任何一个像素,可以反过来求它属于各类的概率,取最大概率对应的类为分类结果。 6、聚类统计(clump):通过对分类专题影像每个分类图斑的面积计算、相邻区域中最大图斑面积的分类值记录等操作,产生一个clump类组输出影像,其中每个图斑都包含clump类组属性,用于进一步处理。 过滤分析(sieve):对经clump处理后的clump类组影像,按照定义的数值大小,剔除clump影像中较小的类组图斑,并给所有小图斑赋予新的属性值0。 类别合并:在非监督分类中由于分类之前不知道有多少类,在策略上总是先分出较多的类再进行合并。其基本思想是将要合并的两个或两个以上类的编码和颜色改为相同的编码和颜色。 7、遥感图像分类精度分析通常把分类图与标准数据进行比较,然后用正确分类的百 分比来表示分类精度。实际工作中,多采用抽样方式以部分像素或不分类别来代替整幅图像进行精度评价。 混淆矩阵:是有n行n列组成的矩阵,用来表示分类结果的精度。n代表类别数。混淆矩阵的左右方向依次排列着实际类别的代码或名称,上下方向依次排列着分类结果各类别的代码或名称。矩阵中的元素师分属各类的像素数或占总像素数的百分比。显然矩阵的主对角线上的数字即是分类正确的像素数或其百分比。 错分误差:又称运行误差。是图像的某一类地物被错分到其他类的百分比。 漏分误差:又称结果误差。是实际的某一类地物被错分到其他类的百分比。 用户精度:表示从分类结果图中任取一个随机样本,其所具有的类型与地面实际类型相同的概率,表示分类结果中给类别的可信度,即这幅图的可靠性。 生产者精度:又称制图精度。表示实际的任意一个随机样本与分类图上同一地点的分类结果相一致的条件概率,用于比较各分类方法的好坏。 Kappa系数:是一个测定两幅图之间吻合程度或精度的指标。 总体分类精度:等于被正确分类像元的总和除以像元总数。被正确分类的像元数目沿着混淆矩阵的对角线分布。总像元数等于所有真实参考源的像元总数。 8、遥感影像的监督分类是在分类前人们已对遥感影像样本区中的类别属性有了先验知识,建立了分类体系和分类方案,据此建立影像分类判别规则和分类器(亦即建立判别函数),进而完成整幅影像的类型划分,将每个像元归并到所对应的一个类别中去。 在监督分类中,综合运用实地观测、航片解译、地图分析等方面的知识来识别遥感影 像中的各种覆盖类型。其中,训练样区是能够代表已知地表覆盖类型的均质、有代表性的地块。 遥感影像的非监督分类是基于多变量聚类分析(clustering analysis)的思想,在没有任何先验知识的情况下,仅依据影像上地物的光谱特征,顺其自然地完成分类。在分类后处理过程中对已分出各类地物的顺序编码进行重新编码和归并,以满足分类系统的要求。 数据准备 实习1选取的研究区Landsat TM/ETM+数据(512×512,1024×1024) 操作方法及过程 1. 选取研究区数据(512×512或者1024×1024),通过目视解译建立分类系统及其编码体系 选择前面实习中使用过的子区,选取的子区位于民和回族土族自治县。对子区进行目视解译,影像中主要的图例覆盖类型有水稻田、水浇地、河流、居民地、草地、林地、工业区、裸地。 选择tools/Google earth,在Google earth上查看对应的地物类型。 2. 按照监督分类的步骤,在影像上找出对应各个土地利用/覆盖类型的参考图斑,利用ROI工具建立训练区,给出各个类别的特征统计表。 打开子区影像,选择tools/region of interest/ROI Tool,选择new region,新建训练区,为影像上对应的土地利用/覆盖类型建立相应的训练区,并设置好颜色,颜色的选取尽量应与实际土地利用类型相对应,根据土地利用/覆盖类型的大小程度选择polyline、polygon、point进行训练区的选取。每一种地物都必须保重包括70个象元以上的内容和,对于小面积的地物我们需要选择polyline或者point进行选择,这样可以保证精度。 3. 计算各个样本之间的可分离性。说明哪些地物类型之间较易区分,哪些类型之间难以区分。 在选取训练区的窗口中选择options/compute ROI separability,在选择输入图层中选择子区LE71310352001195SGS00_sub512,选择所有训练区,即可得到可分离性矩阵,统计J—M距离和分散度,并将结果导入到Excel中,对结果进行分析。 在options下勾选calculate covariance with stats,然后在ROI窗口中点击select all,点击stats,对特征矩阵进行统计并分析。 4. 监督分类:利用最大似然法完成分类。 Classification/supervised/maximum likelihood,选择子区,点击OK,选择select all items将所有地物类型选择,在set probability threshold中选择none,在out rule images选择no,选择输出路径与文件名,点击OK,生成最大似然分类。另外设置其中Set Probability Threshold设置似然度的阈值,如果选择single value,则在下方输入一个0-1的值,似然度小于该阈值的不被分入该类,我们这里设为none,Output Rule Image设为No,选择保存路径。 在子区窗口中选择Overlay/classification,再输入文件名中选择刚刚生成的最大似然分类,即可在影像上显示分类结果。 在分类窗口中选择未定义的图例,在上右击显示分类结果,选择options/edit class colors/names,在窗口下修改名称与颜色,点击OK,将分类结果显示在影像中,完成监督分类。 5. 分类精度评价,从随机采集100~200个样本点,并确保每一类别不少于10个样本;进行分类精度评价,得到分类混淆矩阵,计算Kappa系数,并对结果进行解释。 在子区影像上选择tools/region of interest/ROI Tool,选择所有roi,删除所有roi,重新对各类土地利用进行采点。 选择classification/confusion matrix/using ground truth ROIs,选择最大似然分类生成结果,如果训练区样本与重新选取的roi命名一致,则会自动导入,否则要在select ground truth ROI与select classification image的两个窗口中进行匹配,点击add combination,点击OK,下面生成的对话框保持默认设置,点击OK,即可得到混淆矩阵与Kappa系数,进行分析。 6. 分类后处理(clump—sieve—majority)。 首先是聚类处理Classification → Post Classification → Clump Classes选择分类之后生成的数据,加载进来之后,在选择类型的时候选择全部,select all items 行列大小选择3*3的栅格大小,选择位置进行保存。之后是类别筛选,选择Classification→Post Classification→Sieve classes,在Select Input File中选择刚才生成影像,Group Min Threshold设为2,且分别将Number of Neighbors设为8,保存路径。将最邻近4像元和8像元所得影像进行比较 。 进行主要次要分析。选择Classification→post classification,分别选择主要分 析Majority/Minority Analysis,在第七步的基础上进行操作,在Select Input File对话框中选择上一步生成的数据,Select All Items,Analysis Method设定为Majority,kernel size选择3*3,权重设置为1,最后选择保存路径。主要分析和次要分析步骤类似,最后将所得影像进行比较分析。 7.运用ISODATA方法进行非监督分类:预先假定地表覆盖类型为30类,迭代次数选为15,由系统完成非监督分类;然后进行类别定义与合并子类,最后进行结果评价。 选择classification/unsupervised/Isodata,选择子区为输入文件,,点击OK,设置参数如下图所示。 对照原影像将30种类型进行编号并改名字,改变颜色;进行相同类别的合并:选择Classification中的分类后处理post classification,选择合并同类别Combine Classes,选择之前的非监督分类影像,在输入的文件中依次选择要合并的类,在输出的文件中选择相同的类别,点击Add Combination,所有的类别合并完后点击确定即可。 结果与分析 1、各个样本之间的可分离性。说明哪些地物类型之间较易区分,哪些类型之间难以区分。 Jeffries-Matusita(J—M距离): 水稻田 水浇地 河流 居民地 草地 林地 工业区 裸地 1.9998 2.0000 2.0000 2.0000 1.9525 2.0000 2.0000 水稻田 2.0000 2.0000 1.9494 1.9890 2.0000 2.0000 水浇地 1.9998 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 河流 2.0000 2.0000 2.0000 2.0000 居民地 2.0000 2.0000 2.0000 2.0000 1.9494 2.0000 2.0000 1.8620 2.0000 2.0000 草地 1.9525 1.9890 2.0000 2.0000 1.8620 2.0000 1.9956 林地 2.0000 工业区 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 1.9956 2.0000 裸地 Transformed Divergence(分散度): 水稻田 水浇地 河流 居民地 草地 林地 工业区 裸地 2.0000 2.0000 2.0000 2.0000 1.9996 2.0000 2.0000 水稻田 2.0000 2.0000 2.0000 1.9969 2.0000 2.0000 水浇地 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 2.0000 河流 2.0000 2.0000 2.0000 2.0000 居民地 2.0000 2.0000 2.0000