(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111636445.5
(22)申请日 2021.12.2 9
(71)申请人 南昌大学
地址 330000 江西省南昌市东湖区红谷滩
新区学府大道 999号
(72)发明人 黄发明 李金凤 潘李含 陶思玉
毛达熊
(74)专利代理 机构 南昌青远专利代理事务所
(普通合伙) 36123
代理人 刘爱芳
(51)Int.Cl.
G06K 9/62(2022.01)
G06N 3/04(2006.01)
G06N 3/06(2006.01)
G06N 3/08(2006.01)G06F 16/29(2019.01)
G06V 10/77(2022.01)
G06V 10/764(2022.01)
(54)发明名称
一种基于主成分分析和极限学习机的滑坡
易发性预测模型
(57)摘要
本发明涉及地质灾害预测技术领域, 具体涉
及一种基于主成分分析和极限学习机的滑坡易
发性预测模型, 包括如下步骤: S1: 获取研究区滑
坡编录及滑坡易发性建模相关环境因子; S2: 利
用主成分分析对环境因子进行降维, 计算主成分
得分作为初始滑坡易发性值, 并划分不同的易发
性区间; S3: 将极高易发区与遥感影像进行叠加,
通过目视解译确定滑坡 隐患点作为扩充滑坡样
本, 滑坡编录与扩充滑坡样本共同组成滑坡样
本; S4: 从极低易发区随机选取栅格单元作为非
滑坡样本; S5: 建立 极限学习机预测模型。 可以消
除环境因子之间的相关性 以及其在进行综合评
价时所反映的重复信息。 主成分分析降维后的数
据, 其冗余 性大大降低, 为后续计算节省时间。
权利要求书2页 说明书7页 附图1页
CN 114358167 A
2022.04.15
CN 114358167 A
1.一种基于主成分分析和极限学习机的滑坡易发性预测模型, 其特征在于, 包括以下
步骤:
S1: 获取研究区滑坡编录及滑坡易发性建模相关环境因子;
S2: 利用主成分分析对环境因子进行降维, 计算主成分得分作为初始滑坡易发性值, 并
划分不同的易发性区间;
S3: 将极高易发区与遥感影像进行叠加, 通过目视解译确定滑坡隐患点作为扩充滑坡
样本, 滑坡编录与扩充滑坡样本共同组成滑坡样本;
S4: 从极低易发区随机 选取栅格单 元作为非滑坡样本;
S5: 建立极限学习机预测模型。
2.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S1中的滑坡编录通过研究区历史滑坡编录资料和地质勘探报告获
得; 环境因子通过查询地理信息平台或通过ArcGIS软件对相关环境因子进一步处理获得,
分为地形地貌、 地层岩性、 地表 覆盖和水文环境四类。
3.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S2中的主成分分析是基于环境因子的频率比值(frequency ratio,
FR)进行的;
滑坡频率比代表着滑坡灾害的分布与相关环境因子之间的关系, 揭示滑坡灾害的发生
与各孕灾环境因子的相关程度, 频率比的计算公式为:
FR>1表明环境因子在该属性空间内有利于滑坡发育, FR<1表明环境因子在该属性区间
内不利于滑坡发育 。
4.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S2中的主成分分析方法是在力 保数据信息丢失最少的原则下, 对高
维空间进行降维处理的一种方法, 能够大幅降低环境因子之间的相关性和冗余性, 提高建
模效率; 环境因子是否适 合主成分 分析需经“KMO检验”和“球形检验 ”确定;
所述“KMO检验”是用于比较变量间简单相关系数和偏相 关系数的指标, 当所有变量间
的简单相关系数平方和远远大于偏相关系数平方和时, KM O值接近1; KMO值越接近于1,意味
着变量间的相关性越强, 原有变量越适用于主成分分析; 当所有变量间的简单相关系 数平
方和接近0时, KMO值接近0; KM O值越接近于0,意味着变量间的相关性越弱, 原有变量越不适
合作因子 分析; 对于主成分分析, KMO值0.9以上表 示非常适合; 0.8表示适合; 0.7表 示一般;
0.6表示不太适合; 0.5以下表示极不 适合;
所述“球形检验 ”是根据相关系数矩阵的行列式得到的, 如果该值较大, 且其对应的相
伴概率值小于用户心中的显著性水平, 那么应该拒绝零假设, 认为相关系 数矩阵不可能是
单位阵, 即原始变量之间存在相关性, 适合于做主成份 分析; 相反, 如果该 统计量比较小, 且
其相对应的相伴概率大于显著性水平, 则不能拒绝零假设, 认为相关系 数矩阵可能是单位
阵, 不宜于做主成分 分析。
5.根据权利要求4所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,权 利 要 求 书 1/2 页
2
CN 114358167 A
2其特征在于: 所述主成分个数 的选取一般按照x%准则, 即前k个主成分的累计方差贡献率
不小于x%; 当x取8 0~85时能够使用较少个数的主成分表达较充分的信
息; 当x取值继续增大时, 主成分个数进一步增多, 将使得综合评价的进行更为麻烦; 当x取
值过小时, 主成分所反映的原 始信息不足, 原 始信息的损失过 大;
每个主成分的构 成可根据主成分载荷阵确定, 通过主成分载荷阵可以得出环境因子与
主成分之间的线性关系, 并对每 个主成分所表示的含义有较为 合理的解释。
6.根据权利要求5所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述主成分应满足如下原则: (1)数据变异最大原则, 即主成分取数据最大方
向, 使主成分包含尽可能多的原始信息; (2)最小二乘原则, 从几何观 点看, 原样本点与新的
空间中主超平 面上投影的距离平方和达到最小, 才能使原始信息的损失达到最小; (3)群点
相似性改变最小原则, 要使主成分分析 的信息损失最小, 就要使各数据间的相似性改变最
小。
主成分分析的目的由两点组成:(1)将多个有相关关系的变量压缩成少数几个不相关
的主成分,并保留绝大部分信息; (2)给 出各主成分的具有实际背景和意 义的解释。
7.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S2中的主成分得分在计算时使用主成分方差贡献率法确定权重系
数, 即
需要说明的是, 在得出主成分得分后应对其进行归一化处理, 得到处于0~1之间的概
率值, 该值越大, 表示该点发生滑坡的概率越大, 反之亦然; 主成分得分能够作为初始滑坡
易发性值, 并通过A rcGIS软件绘制初始 滑坡易发性图。
8.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S2在划分易发性区间时, 应采用自然间断分级法, 将研究区划分为5
类滑坡易 发性级别: 极低易 发区、 低易 发区、 中易 发区、 高易 发区和极高易 发区; 所述自然间
断分级法中的 “自然间断点 ”类别是基于数据中固有的自然分组, 通过对分类间隔加以识
别, 可对相似值进 行最恰当地分组, 并可使 各个类之间的差异 最大化; 要 素将被划分为多个
类, 对于这些类, 会在数据值的差异相对较大的位置处设置其 边界。
9.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S3中滑坡样本的扩充可通过以下方法得到: 将初始滑坡易发性图与
高分辨率遥感影像进行叠加, 目视解译极高易发区内的地物和地形地貌特征, 通过对研究
区历史滑坡形态和色调等特征的分析来建立区域滑坡遥感解译标志; 最后根据滑坡遥感解
译标志并基于人机交互式目视解译 出极高易 发区内的滑坡隐患点; 在ArcGIS软件中标记出
滑坡隐患点并从中随机 选取一定数量的栅格单 元以扩充滑坡样本 。
10.根据权利要求1所述的一种基于主成分分析和极限学习机的滑坡易发性预测模型,
其特征在于: 所述步骤S4中所述非滑坡样本选取的数量应与步骤S3中选取的滑坡样本相
同, 并利用SPSS软件随机选取; 等量的滑坡样 本与非滑坡样 本共同组成样本点, 所述样本点
中的滑坡点应赋值为 1, 代表该点发生滑坡, 非滑坡点赋值为0, 代表该点不 发生滑坡; 之后,
应按照7:3的比例将 样本点随机划分为训练集和 测试集。权 利 要 求 书 2/2 页
3
CN 114358167 A
3
专利 一种基于主成分分析和极限学习机的滑坡易发性预测模型
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 20:40:48上传分享