专利 一种基于主成分分析和极限学习机的滑坡易发性预测模型

(19)中华人民共和国国家知识产权局 (12)发明专利申请 (10)申请公布号 (43)申请公布日 (21)申请号 202111636445.5 (22)申请日 2021.12.2 9 (71)申请人南昌大学地址 330000 江西省南昌市东湖区红谷滩新区学府大道 999号 (72)发明人黄发明　李金凤　潘李含　陶思玉　毛达熊　 (74)专利代理机构南昌青远专利代理事务所 (普通合伙) 36123 代理人刘爱芳 (51)Int.Cl. G06K 9/62(2022.01) G06N 3/04(2006.01) G06N 3/06(2006.01) G06N 3/08(2006.01)G06F 16/29(2019.01) G06V 10/77(2022.01) G06V 10/764(2022.01) (54)发明名称一种基于主成分分析和极限学习机的滑坡易发性预测模型 (57)摘要本发明涉及地质灾害预测技术领域，具体涉及一种基于主成分分析和极限学习机的滑坡易发性预测模型，包括如下步骤： S1：获取研究区滑坡编录及滑坡易发性建模相关环境因子； S2：利用主成分分析对环境因子进行降维，计算主成分得分作为初始滑坡易发性值，并划分不同的易发性区间； S3：将极高易发区与遥感影像进行叠加，通过目视解译确定滑坡隐患点作为扩充滑坡样本，滑坡编录与扩充滑坡样本共同组成滑坡样本； S4：从极低易发区随机选取栅格单元作为非滑坡样本； S5：建立极限学习机预测模型。可以消除环境因子之间的相关性以及其在进行综合评价时所反映的重复信息。主成分分析降维后的数据，其冗余性大大降低，为后续计算节省时间。权利要求书2页说明书7页附图1页 CN 114358167 A 2022.04.15 CN 114358167 A 1.一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于，包括以下步骤： S1：获取研究区滑坡编录及滑坡易发性建模相关环境因子； S2：利用主成分分析对环境因子进行降维，计算主成分得分作为初始滑坡易发性值，并划分不同的易发性区间； S3：将极高易发区与遥感影像进行叠加，通过目视解译确定滑坡隐患点作为扩充滑坡样本，滑坡编录与扩充滑坡样本共同组成滑坡样本； S4：从极低易发区随机选取栅格单元作为非滑坡样本； S5：建立极限学习机预测模型。 2.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S1中的滑坡编录通过研究区历史滑坡编录资料和地质勘探报告获得；环境因子通过查询地理信息平台或通过ArcGIS软件对相关环境因子进一步处理获得，分为地形地貌、地层岩性、地表覆盖和水文环境四类。 3.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S2中的主成分分析是基于环境因子的频率比值(frequency ratio, FR)进行的；滑坡频率比代表着滑坡灾害的分布与相关环境因子之间的关系，揭示滑坡灾害的发生与各孕灾环境因子的相关程度，频率比的计算公式为： FR>1表明环境因子在该属性空间内有利于滑坡发育， FR<1表明环境因子在该属性区间内不利于滑坡发育。 4.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S2中的主成分分析方法是在力保数据信息丢失最少的原则下，对高维空间进行降维处理的一种方法，能够大幅降低环境因子之间的相关性和冗余性，提高建模效率；环境因子是否适合主成分分析需经“KMO检验”和“球形检验 ”确定；所述“KMO检验”是用于比较变量间简单相关系数和偏相关系数的指标，当所有变量间的简单相关系数平方和远远大于偏相关系数平方和时， KM O值接近1； KMO值越接近于1,意味着变量间的相关性越强，原有变量越适用于主成分分析；当所有变量间的简单相关系数平方和接近0时， KMO值接近0； KM O值越接近于0,意味着变量间的相关性越弱，原有变量越不适合作因子分析；对于主成分分析， KMO值0.9以上表示非常适合； 0.8表示适合； 0.7表示一般； 0.6表示不太适合； 0.5以下表示极不适合；所述“球形检验 ”是根据相关系数矩阵的行列式得到的，如果该值较大，且其对应的相伴概率值小于用户心中的显著性水平，那么应该拒绝零假设，认为相关系数矩阵不可能是单位阵，即原始变量之间存在相关性，适合于做主成份分析；相反，如果该统计量比较小，且其相对应的相伴概率大于显著性水平，则不能拒绝零假设，认为相关系数矩阵可能是单位阵，不宜于做主成分分析。 5.根据权利要求4所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，权　利　要　求　书 1/2 页 2 CN 114358167 A 2其特征在于：所述主成分个数的选取一般按照x％准则，即前k个主成分的累计方差贡献率不小于x％；当x取8 0～85时能够使用较少个数的主成分表达较充分的信息；当x取值继续增大时，主成分个数进一步增多，将使得综合评价的进行更为麻烦；当x取值过小时，主成分所反映的原始信息不足，原始信息的损失过大；每个主成分的构成可根据主成分载荷阵确定，通过主成分载荷阵可以得出环境因子与主成分之间的线性关系，并对每个主成分所表示的含义有较为合理的解释。 6.根据权利要求5所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述主成分应满足如下原则： (1)数据变异最大原则，即主成分取数据最大方向，使主成分包含尽可能多的原始信息； (2)最小二乘原则，从几何观点看，原样本点与新的空间中主超平面上投影的距离平方和达到最小，才能使原始信息的损失达到最小； (3)群点相似性改变最小原则，要使主成分分析的信息损失最小，就要使各数据间的相似性改变最小。主成分分析的目的由两点组成:(1)将多个有相关关系的变量压缩成少数几个不相关的主成分,并保留绝大部分信息； (2)给出各主成分的具有实际背景和意义的解释。 7.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S2中的主成分得分在计算时使用主成分方差贡献率法确定权重系数，即需要说明的是，在得出主成分得分后应对其进行归一化处理，得到处于0～1之间的概率值，该值越大，表示该点发生滑坡的概率越大，反之亦然；主成分得分能够作为初始滑坡易发性值，并通过A rcGIS软件绘制初始滑坡易发性图。 8.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S2在划分易发性区间时，应采用自然间断分级法，将研究区划分为5 类滑坡易发性级别：极低易发区、低易发区、中易发区、高易发区和极高易发区；所述自然间断分级法中的 “自然间断点 ”类别是基于数据中固有的自然分组，通过对分类间隔加以识别，可对相似值进行最恰当地分组，并可使各个类之间的差异最大化；要素将被划分为多个类，对于这些类，会在数据值的差异相对较大的位置处设置其边界。 9.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S3中滑坡样本的扩充可通过以下方法得到：将初始滑坡易发性图与高分辨率遥感影像进行叠加，目视解译极高易发区内的地物和地形地貌特征，通过对研究区历史滑坡形态和色调等特征的分析来建立区域滑坡遥感解译标志；最后根据滑坡遥感解译标志并基于人机交互式目视解译出极高易发区内的滑坡隐患点；在ArcGIS软件中标记出滑坡隐患点并从中随机选取一定数量的栅格单元以扩充滑坡样本。 10.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型，其特征在于：所述步骤S4中所述非滑坡样本选取的数量应与步骤S3中选取的滑坡样本相同，并利用SPSS软件随机选取；等量的滑坡样本与非滑坡样本共同组成样本点，所述样本点中的滑坡点应赋值为 1，代表该点发生滑坡，非滑坡点赋值为0，代表该点不发生滑坡；之后，应按照7:3的比例将样本点随机划分为训练集和测试集。权　利　要　求　书 2/2 页 3 CN 114358167 A 3

专利 一种基于主成分分析和极限学习机的滑坡易发性预测模型

专利一种基于主成分分析和极限学习机的滑坡易发性预测模型