(19)中华 人民共和国 国家知识产权局
(12)发明 专利申请
(10)申请公布号
(43)申请公布日
(21)申请 号 202111461757.7
(22)申请日 2021.12.02
(71)申请人 中国水利水电科 学研究院
地址 100038 北京市海淀区复兴 路甲一号
(72)发明人 林俊强 刘瀚 刘毅 杨明辉
樊博 张迪 彭期冬 靳甜甜
庄江波 李游坤
(74)专利代理 机构 北京世誉鑫诚专利代理有限
公司 11368
代理人 李世端
(51)Int.Cl.
G06Q 50/02(2012.01)
G06Q 10/04(2012.01)
G06F 16/2455(2019.01)
(54)发明名称
一种鱼类繁殖关键水文因子筛选和响应阈
值确定方法
(57)摘要
本发明提供的一种鱼类繁殖关键水文因子
筛选和响应阈值确定方法, 所述确定方法包括:
梳理影响鱼类繁殖的水文因子和历史数据资料,
获取鱼类繁殖活动监测数据; 根据所述鱼类繁殖
活动监测数据筛选影响鱼类繁殖的水文因子; 根
据所述水文因子计算刺激鱼类繁殖响应的水文
因子阈值。 弥补了传统筛选方法容易遗漏关键因
子或所选因子冗余性较强的不足, 从而极大提升
了水文因子 筛选识别的效率与准确性。
权利要求书2页 说明书6页 附图2页
CN 114155113 A
2022.03.08
CN 114155113 A
1.一种鱼类繁殖关键水文因子筛选和响应阈值确定方法, 其特征在于, 所述确定方法
包括:
梳理影响鱼类繁殖的水文因子和历史数据资料, 获取鱼类繁殖活动监测数据;
根据所述鱼类繁殖活动监测数据筛 选影响鱼类繁殖的水文因子;
根据所述水文因子计算刺激鱼类繁殖响应的水文因子阈值。
2.根据权利要求1所述的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法, 其特
征在于, 所述 根据所述鱼类繁殖活动监测数据筛 选影响鱼类繁殖的水文因子具体包括:
根据所述鱼类繁殖活动 监测数据构建鱼类繁殖关键环境因子数据集, 用以表征多种环
境状态特 征与鱼类行为的响应关系, 用数 学表达式表述:
Bm=F(f1,f2,...,fi,...,fn)m (1)
式中, B为鱼类产卵行为数据集; F为特征数据集, 不同的鱼类产卵行为响应关系用n个
特征fi表示, 特征包括各类环境因子; m为 通过数值模拟、 现场监测手段获取的数据样本量;
预处理m个所述鱼类产卵数据样本和对应的环境因子数据样本, 获得无因次化后的n个
环境因子和产卵数据的集 合;
其中, 预处理后的第 i个环境因子数据集合为{fi1,fi2,…fiL,…fim}, fiL为在第L个产卵
数据样本中, 第i个环境因子的无因次化数据, 其中, 1≤i≤n, 1≤L≤m;
采用最大互信息系数法, 计算所述鱼类产卵数据集B与各环境因子fi, 以及不同环境因
子fi和fj之间的相关性, 用于识别环境变化与鱼类繁殖的响应关系, 剔除冗余变量, 并筛选
出刺激鱼类繁殖响应的主导环境因子;
根据所述主导环境因子获得影响鱼类繁殖的水文因子 。
3.根据权利要求1所述的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法, 其特
征在于, 所述 根据所述水文因子计算刺激鱼类繁殖响应的水文因子阈值具体包括:
将鱼类产卵行为测试样本划分为有效繁殖响应样本和无效繁殖响应样本, 作为真实繁
殖响应有效性样本集; 其中有效繁殖响应为一次自然繁殖事件的繁殖规模不少于当年该江
段总繁殖规模的5%;
构建鱼类繁殖响应预测模型, 给定水文因子数据的取值范围的率定若干试验阈值 Itest;
根据所述试验阈值Itest重新判定样本鱼类繁殖响应有效性, 与真实判定 结果进行对比,
获得真阳样本数TP、 假阳样本数 FP、 真阴样本数TN和假阴样本数 FN;
计算所述试验阈值Itest下模型预测的真阳率、 假阳率、 真阴率和假阴率; 所述真阳率为
所述预测模型 的灵敏度, 所述假阳率为预测模型 的误判率, 所述真阴率为预测模型 的特异
度, 所述假阴率为预测模型的漏判率;
穷举判别试验, 在给定试验阈值Itest遍历它的所有取值区间后, 将每个阈值Itest下的假
阳率和真阳率绘制成特 征曲线;
根据所述特 征曲线采用约登指数法求 解最佳判别阈值 Ithreshold;
根据所述最佳判别阈值Ithreshold确定影响鱼类繁殖的关键水文因子的单因子响应阈
值;
采用逻辑法的方式并联和串联关键水文因子的响应 阈值, 构建多指标响应预测模型预
测鱼类繁殖响应有效性;
获得预测鱼类繁殖活动的关键环境因子阈值组合方式。权 利 要 求 书 1/2 页
2
CN 114155113 A
24.根据权利要求2所述的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法, 其特
征在于, 所述 最大互信息系数法具体为:
利用互信息和网格划分进行计算, 用于衡量两个变量X和Y之间的关联程度, 线性和非
线性的强度;
给定由2个因素组成的数据集D={(xi,yi),i=1,2,...,m}, m为样本数量, 2个因素数据
集形成以X轴和Y轴构成的二维空间, 如果将X轴划分为x个区间, Y轴划分为y个区间, 得到一
个x×y的网格划分 G, 在该网格下 数据集D的互信息 定义为:
式中, x和y是正整数, p(x,y)是 联合概率, p(x)和p(y)为 边缘概率;
若固定网格划分的数量, 改变网格划分的位置, 得到不同的互信 息值, 记最大的互信 息
值为I*(D,x,y), 将不同网格划分数量下得到的最大互信息值标准化, 取值在区间[0,1], 获
得特征矩阵:
在给定数据样本规模m的数据集D中, 最大互信息系数定义 为:
其中, MIC取值范围在[0, 1], 若MIC(B, fi)越趋近于1, 表明鱼类产卵对环境因子为强响
应关系, 若MIC(B, fi)趋近于0, 表明鱼类产卵和环境因子弱相关, 排除无关变量。权 利 要 求 书 2/2 页
3
CN 114155113 A
3
专利 一种鱼类繁殖关键水文因子筛选和响应阈值确定方法
文档预览
中文文档
11 页
50 下载
1000 浏览
0 评论
309 收藏
3.0分
温馨提示:本文档共11页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
本文档由 人生无常 于 2024-03-18 21:06:37上传分享