一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种鱼类繁殖关键水文因子筛选和响应阈值确定方法与流程

2022-03-09 07:49:38 来源:中国专利 TAG:


1.本发明涉及水利水电工程生态环境保护技术领域,尤其涉及一种鱼类繁殖关键水文因子筛选和响应阈值确定方法。


背景技术:

2.我国自20世纪80年代以来开始大规模兴建水利水电工程,对防洪、发电、航运、灌溉等都产生了巨大的综合效益,但也不可避免改变了河流天然水文情势和水生生态环境,造成江河鱼类资源衰退等不利生态影响。为协调流域水能资源利用与河流生态系统的健康可持续发展,近年来以三峡水库为代表的大型水利水电工程积极开展生态调度试验,通过人造水文过程,促进江河鱼类自然繁殖,但是从实际调度效果上看,有的场次生态调度能较好刺激鱼类繁殖活动,有的场次则未能引起鱼类繁殖响应,究其原因是鱼类繁殖的关键水文因子及其阈值尚未完全明晰。
3.因此,如何从众多水文影响因子中,筛选出影响鱼类自然繁殖的关键因子,并定量确定相应的阈值,对于指导水库的生态调度方案制定具有重要意义。传统关键水文因子的确定方法,一般是通过专家咨询法,确定影响鱼类繁殖的关键水文因子。水文因子阈值的确定方法,在无鱼类繁殖活动观测数据时,一般是采用天然情况下(未建坝前)这些水文因子的历史数据,统计整个鱼类繁殖期水文因子的多年平均值作为生态调度的参考阈值,或以水文因子统计频率在25%-75%的变化范围作为阈值范围,在有鱼类繁殖活动观测数据时,一般是根据鱼类繁殖活动观测记录,统计有繁殖响应时期的水文因子变动范围作为生态调度的参考阈值范围。
4.现有方法存在如下不足:
5.(1)影响鱼类繁殖的关键水文因子筛选方法偏于专家的主观认识,一些超出当前理论认知水平的水文因子可能遗漏,或者所选的水文因子之间不完全独立,具有一定的信息冗余性;
6.(2)鱼类繁殖响应的水文因子阈值确定方法多为统计平均值或统计出现的频率范围,即使是有鱼类繁殖观测数据的统计分析,其阈值分析结果也仅是有繁殖活动下的水文因子出现范围,这些分析结果均只具有统计意义,缺乏生物学的响应检验分析。若按当前分析的水文因子阈值进行水库生态调度,鱼类不一定会有繁殖响应,这大大增加了生态调度效果的不确定性。


技术实现要素:

7.鉴于上述问题,提出了本发明为提供克服上述问题或者至少部分地解决上述问题的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法。
8.根据本发明的一个方面,提供了一种鱼类繁殖关键水文因子筛选和响应阈值确定方法,所述确定方法包括:
9.梳理影响鱼类繁殖的水文因子和历史数据资料,获取鱼类繁殖活动监测数据;
10.根据所述鱼类繁殖活动监测数据筛选影响鱼类繁殖的水文因子;
11.根据所述水文因子计算刺激鱼类繁殖响应的水文因子阈值。
12.可选的,所述根据所述鱼类繁殖活动监测数据筛选影响鱼类繁殖的水文因子具体包括:
13.根据所述鱼类繁殖活动监测数据构建鱼类繁殖关键环境因子数据集,用以表征多种环境状态特征与鱼类行为的响应关系,用数学表达式表述:
14.bm=f(f1,f2,

,fi,

,fn)mꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
15.式中,b为鱼类产卵行为数据集;f为特征数据集,不同的鱼类产卵行为响应关系用n个特征fi表示,特征包括各类环境因子;m为通过数值模拟、现场监测手段获取的数据样本量;
16.预处理m个所述鱼类产卵数据样本和对应的环境因子数据样本,获得无因次化后的n个环境因子和产卵数据的集合;
17.其中,预处理后的第i个环境因子数据集合为{f
i1
,f
i2
,
…fil
,
…fim
},f
il
为在第l个产卵数据样本中,第i个环境因子的无因次化数据,其中,1≤i≤n,1≤l≤m;
18.采用最大互信息系数法,计算所述鱼类产卵数据集b与各环境因子fi,以及不同环境因子fi和fj之间的相关性,用于识别环境变化与鱼类繁殖的响应关系,剔除冗余变量,并筛选出刺激鱼类繁殖响应的主导环境因子;
19.根据所述主导环境因子获得影响鱼类繁殖的水文因子。
20.可选的,所述根据所述水文因子计算刺激鱼类繁殖响应的水文因子阈值具体包括:
21.将鱼类产卵行为测试样本划分为有效繁殖响应样本和无效繁殖响应样本,作为真实繁殖响应有效性样本集;其中有效繁殖响应为一次自然繁殖事件的繁殖规模不少于当年该江段总繁殖规模的5%;
22.构建鱼类繁殖响应预测模型,给定水文因子数据的取值范围的率定若干试验阈值i
test

23.根据所述试验阈值i
test
重新判定样本鱼类繁殖响应有效性,与真实判定结果进行对比,获得真阳样本数tp、假阳样本数fp、真阴样本数tn和假阴样本数fn;
24.计算所述试验阈值i
test
下模型预测的真阳率、假阳率、真阴率和假阴率;所述真阳率为所述预测模型的灵敏度,所述假阳率为预测模型的误判率,所述真阴率为预测模型的特异度,所述假阴率为预测模型的漏判率;
25.穷举判别试验,在给定试验阈值i
test
遍历它的所有取值区间后,将每个阈值i
test
下的假阳率和真阳率绘制成特征曲线;
26.根据所述特征曲线采用约登指数法求解最佳判别阈值i
threshold

27.根据所述最佳判别阈值i
threshold
确定影响鱼类繁殖的关键水文因子的单因子响应阈值;
28.采用逻辑法的方式并联和串联关键水文因子的响应阈值,构建多指标响应预测模型预测鱼类繁殖响应有效性;
29.获得预测鱼类繁殖活动的关键环境因子阈值组合方式。
30.可选的,所述最大互信息系数法具体为:
31.利用互信息和网格划分进行计算,用于衡量两个变量x和y之间的关联程度,线性和非线性的强度;
32.给定由2个因素组成的数据集d={(xi,yi),i=1,2,

,m},m为样本数量,2个因素数据集形成以x轴和y轴构成的二维空间,如果将x轴划分为x个区间,y轴划分为y个区间,得到一个x
×
y的网格划分g,在该网格下数据集d的互信息定义为:
[0033][0034]
式中,x和y是正整数,p(x,y)是联合概率,p(x)和p(y)为边缘概率;
[0035]
若固定网格划分的数量,改变网格划分的位置,得到不同的互信息值,记最大的互信息值为i
*
(d,x,y),将不同网格划分数量下得到的最大互信息值标准化,取值在区间[0,1],获得特征矩阵:
[0036][0037]
在给定数据样本规模m的数据集d中,最大互信息系数定义为:
[0038][0039]
其中,mic取值范围在[0,1],若mic(b,fi)越趋近于1,表明鱼类产卵对环境因子为强响应关系,若mic(b,fi)趋近于0,表明鱼类产卵和环境因子弱相关,排除无关变量。
[0040]
本发明提供的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法,所述确定方法包括:梳理影响鱼类繁殖的水文因子和历史数据资料,获取鱼类繁殖活动监测数据;根据所述鱼类繁殖活动监测数据筛选影响鱼类繁殖的水文因子;根据所述水文因子计算刺激鱼类繁殖响应的水文因子阈值。弥补了传统筛选方法容易遗漏关键因子或所选因子冗余性较强的不足,从而极大提升了水文因子筛选识别的效率与准确性。
[0041]
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
[0042]
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
[0043]
图1为本发明实施例提供的一种鱼类繁殖关键水文因子筛选和响应阈值确定方法的流程图;
[0044]
图2为本发明实施例提供的鱼类繁殖关键环境因子的单指标roc曲线。
具体实施方式
[0045]
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例
所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0046]
本发明的说明书实施例和权利要求书及附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元。
[0047]
实施例1:
[0048]
下面结合附图和实施例,对本发明的技术方案做进一步的详细描述。
[0049]
如图1所示,研究区为某河流中上游,研究对象为四大家鱼。
[0050]
步骤一:基础数据资料梳理和收集。根据国内外文献调研、专家咨询方法,梳理可能影响鱼类繁殖的水文因子,如流量、水位、涨水初始流量、流量日增长量、流量日上涨率、洪峰流量、涨水持续时间、涨水初始水位、水位日增长量、水位日上涨率、涨水过程最高水位、涨水过程起始水位等42个环境因子,收集历史水文数据资料,收集鱼类繁殖活动监测数据,如鱼类早期资源量数据、鱼类繁殖活动日期、鱼类繁殖习性等。
[0051]
步骤二:采用最大互信息系数法筛选研究区鱼类繁殖关键环境因子。对两两变量组成的联合样本的散点图中采取特定规模的网格划分,根据网格中的边际概率密度函数和联合概率密度函数,计算两变量的互信息值,通过归一化后结果检测两变量间的关联性。将关联性过低的环境因子筛除,最终确定该研究区域鱼类的4个繁殖关键水文因子为:起始流量、洪峰流量、流量日增长率和流量总增长量。
[0052]
表1研究区鱼类繁殖关键水文因子
[0053][0054]
步骤三:收集上述4个环境因子的历史数据,结合历年研究区鱼类繁殖数据,采用受试者工作特征曲线法验证各水文因子与鱼类繁殖的相关性,相关性通过特征曲线下面积的大小进行判断如图2所示。初始流量、洪峰流量、流量日增长率和流量总增长量的auc分别为0.711,0.893,0.917,0.891,表明采用初始流量、洪峰流量、流量日增长率和流量总增长量四个环境指标均可以较好预测鱼类自然繁殖有效性。
[0055]
表2 auc值分布解释
[0056][0057]
步骤四:基于roc曲线采用约登指数法率定影响鱼类繁殖的环境因子的最佳阈值。约登指数的值通过roc曲线的灵敏度及特异度相加减去1求得,约登指数越大则以该点对应阈值进行预测的结果真实性越高。分别基于流量日增长率、洪峰流量与鱼类繁殖效果的roc曲线,计算约登指数,即可得出初始流量的鱼类繁殖响应阈值为14960m3/s,洪峰流量的鱼类繁殖响应阈值为19610m3/s,流量日增长率的鱼类繁殖响应阈值为1405m3/s/d、流量总增长量的鱼类繁殖响应阈值为4050m3/s。
[0058]
步骤五:分别采用逻辑“或”法,逻辑“和”法,以单指标模型中auc值最大,预测鱼类是否繁殖效果最高的流量日增长率预测模型为基础,尝试构建不同多指标组合的响应预测模型,寻找性能更佳的多指标联合判别组合。通过对比得出,采用“流量日增长率or洪峰流量”的多指标模型具备最好的预测效果。
[0059]
步骤六:得出结论,以流量日增长率大于1405m3/s/d或者洪峰流量大于19610m3/s的多指标阈值对研究区域目标鱼类的繁殖响应进行判定具备最高的准确性。
[0060]
最大互信息系数法,利用互信息和网格划分进行计算,用于衡量两个变量x和y之间的关联程度,线性或非线性的强度。给定由2个因素组成的数据集d={(xi,yi),i=1,2,

,m},m为样本数量,这2个因素数据集形成以x轴和y轴构成的二维空间,如果将x轴划分为x个区间,y轴划分为y个区间,可以得到一个x
×
y的网格划分g,在该网格下数据集d的互信息定义为:
[0061][0062]
式中,x和y是正整数,p(x,y)是联合概率,p(x)和p(y)为边缘概率。
[0063]
若固定网格划分的数量,通过改变网格划分的位置,可得到不同的互信息值,记其中最大的互信息值为i
*
(d,x,y),将不同网格划分数量下得到的最大互信息值标准化,使其取值在区间[0,1],可得如下特征矩阵:
[0064][0065]
在给定数据样本规模m的数据集d中,最大互信息系数定义为:
[0066][0067]
其中,最大互信息系数mic取值范围在[0,1],若mic(b,fi)越趋近于1,表明鱼类产卵对环境因子为强响应关系,若mic(b,fi)趋近于0,表明鱼类产卵和环境因子弱相关或者
无关,可排除无关变量。
[0068]
各环境因子间的最大互信息系数mic值通过上述同样的方法进行确定,若mic(fi,fj)越趋近于1,表明这两个环境因子之间可替代性越强,即冗余性越强,可排除其中一个环境因子,从而得出关键环境因子。
[0069]
受试者特征曲线法的真阳率,表征预测模型的灵敏度;代表模型判断有效繁殖响应的能力,tpr=tp/(tp fn);假阴率表征预测模型的漏判率,代表有效繁殖响应被误判为无效的比率,fnr=fn/(tp fn)。真阴率表征预测模型的特异度,代表判断无效繁殖响应的能力,tnr=tn/(fp tn);假阳率表征预测模型的误判率,代表无效繁殖响应被误判为有效的比率,fpr=fp/(fp tn)。
[0070]
受试者工作特征曲线法通过灵敏度和特异度来反应关键环境因子与鱼类繁殖响应有效性的相关关系,特征曲线下面积大于0.7,则两个变量具有高关联度。
[0071]
约登指数法通过计算特征曲线上各点灵敏度与特异度之和减去1来计算,约登指数最大点对应的数据即为该环境因子阈值i
threshold

[0072]
youden=max(tpr tnr-1)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(8)
[0073]
逻辑“或”法是指当某次繁殖事件中,当多个环境因子中任一指标在单指标响应预测模型中判定为响应时,就判定该次事件为鱼类有效繁殖响应事件。
[0074]
逻辑“和”法是指当某次繁殖事件中,当多个环境因子中所有指标在单指标响应预测模型中都判定为响应时,才判定该次事件为鱼类有效繁殖响应事件。
[0075]
有益效果:
[0076]
1、本发明梳理统计了大量环境水文因子数据,通过最大互信息系数法一一进行筛选与分析,弥补了传统筛选方法容易遗漏关键因子或所选因子冗余性较强的不足,极大提升了水文因子筛选识别的效率与准确性。
[0077]
2、本发明分析不同水文条件下鱼类产卵行为,将各类环境因子变化引起的历次鱼类繁殖响应,依据占当年该江段总繁殖规模的比例,分为有效繁殖响应和无效繁殖响应,从生物学响应的角度进行统计分析,削减了年际间亲鱼数量差异、以及少量亲鱼偶发式少量产卵对鱼类繁殖判定的影响。
[0078]
3、本发明通过受试者特征曲线法分析不同环境因子与鱼类繁殖间的响应关系,得出各关键环境因子判定鱼类繁殖有效性的最适宜划分阈值,计算方法充分考虑了鱼类在水库运行后不同水文条件下的实际繁殖响应情况,较传统统计平均值方法和频率范围方法更具有生物学意义,预见性更强,不确定性更低,可指导水库生态调度方案的制定,提高生态调度实践的成功率。
[0079]
4、本发明计算结果形式简单,以单指标或多指标组合方式呈现,以划定的各指标最佳阈值来进行预测判别,易推广到不同流域、不同水库和一线人员进行应用。
[0080]
以上的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上仅为本发明的具体实施方式,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献