Nothing Special   »   [go: up one dir, main page]

CN118260538B - 强人类干扰河湖生态结构与功能复苏评价方法及系统 - Google Patents

强人类干扰河湖生态结构与功能复苏评价方法及系统 Download PDF

Info

Publication number
CN118260538B
CN118260538B CN202410684832.3A CN202410684832A CN118260538B CN 118260538 B CN118260538 B CN 118260538B CN 202410684832 A CN202410684832 A CN 202410684832A CN 118260538 B CN118260538 B CN 118260538B
Authority
CN
China
Prior art keywords
data
ecological
river
interference
human interference
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410684832.3A
Other languages
English (en)
Other versions
CN118260538A (zh
Inventor
戴江玉
吴时强
吴修锋
吕学研
查伟
陈丹
孙凡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Original Assignee
Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources filed Critical Nanjing Hydraulic Research Institute of National Energy Administration Ministry of Transport Ministry of Water Resources
Priority to CN202410684832.3A priority Critical patent/CN118260538B/zh
Publication of CN118260538A publication Critical patent/CN118260538A/zh
Application granted granted Critical
Publication of CN118260538B publication Critical patent/CN118260538B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/10Pre-processing; Data cleansing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • G06F18/2135Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods based on approximation criteria, e.g. principal component analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Biophysics (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • Genetics & Genomics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Physiology (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种强人类干扰河湖生态结构与功能复苏评价方法及系统,包括如下步骤:确定研究区域,采集研究区域内的原始研究数据并预处理,得到符合预定标准的基础数据;基于基础数据,挖掘人类干扰活动模式,并进行人类干扰活动对河湖生态结构影响的聚类分析,输出分析结果;基于分析结果,定量评估计算人类干扰对河湖生态结构的影响,获得评估数据;调用预构建功能复苏预测模型,基于评估数据进行模拟并输出功能复苏目标和解决方案。解决了现有技术存在的数据质量差、时空表征弱和评估片面化等问题,提高了强人类干扰下河湖结构与功能复苏评价准确率和效率。

Description

强人类干扰河湖生态结构与功能复苏评价方法及系统
技术领域
本发明涉及水文水生态技术,尤其是强人类干扰河湖生态结构与功能复苏评价方法及系统。
背景技术
河湖生态系统是地球生态环境的重要组成部分,不仅具有调节气候、净化水质、保护生物多样性等生态功能,还在人类社会经济发展中扮演着重要角色。人类活动对于河湖生态系统产生较大干扰,这些干扰包括但不限于农业活动、工业排放、城市扩展和水利工程等。研究人类干扰对河湖生态系统的影响并提出科学的评价方法,对于恢复和保护河湖生态系统具有重要的现实意义。通过系统地评估人类干扰对生态系统的影响,能够制定更有效的管理策略和恢复措施,从而实现河湖生态系统的可持续发展。
目前,关于河湖生态系统的研究主要集中在以下几个方面:首先,生态数据的采集和分析。现代技术,如遥感、无人机和传感器网络等,使得生态数据的获取更加便捷和全面。这些数据包括水质参数、生物多样性、生态群落的时空分布等,为生态系统的研究提供了坚实的基础。其次,河网拓扑结构的分析。随着拓扑学方法被应用于研究河网的结构和动态变化,通过分析河网的连通性、分支结构等,揭示其生态功能和演变规律。此外,人类活动对河湖生态系统的影响研究也取得了显着进展,通过这些方法,可以量化和解析不同类型的人类活动对生态系统的影响程度和机制。
尽管在河湖生态系统研究方面取得了显着进展,但仍然存在一些亟待解决的问题。首先,数据采集与处理的精度和全面性有待提高。当前的数据多依赖于单一技术手段,难以全面反映生态系统的复杂性和动态变化,且数据质量参差不齐,影响了后续分析的准确性。其次,河网拓扑结构分析方法的时空适应性不足,现有的图论和拓扑学方法在处理动态变化的河网结构时存在一定局限,难以准确反映人类活动对河网结构的长期影响。最后,人类干扰影响评估方法的科学性和系统性有待提升。现有的评估方法多停留在单一因素分析,缺乏对多因素综合作用的系统评价,且对不同类型人类活动的敏感性分析不足,影响了管理策略的有效性。
故需要研究创新,以期能够解决现有技术中的部分问题。
发明内容
发明目的,提供一种强人类干扰河湖生态结构与功能复苏评价方法及系统,以解决现有技术存在的上述问题。
技术方案,根据本申请的一个方面,提供一种强人类干扰河湖生态结构与功能复苏评价方法,包括如下步骤:
步骤S1、确定研究区域,采集研究区域内的原始研究数据并预处理,得到符合预定标准的基础数据;所述原始研究数据包括DEM数据、河网数据、水文生态数据和人类干扰活动数据;
步骤S2、基于基础数据,挖掘人类干扰活动模式,并进行人类干扰活动对河湖生态结构影响的聚类分析,输出分析结果;
步骤S3、基于分析结果,定量评估计算人类干扰对河湖生态结构的影响,获得评估数据;
步骤S4、调用预构建功能复苏预测模型,基于评估数据进行模拟并输出功能复苏目标和解决方案。
根据本申请的另一个方面,还提供一种强人类干扰河湖生态结构与功能复苏评价系统,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项技术方案所述的强人类干扰河湖生态结构与功能复苏评价方法。
有益效果,通过数据驱动的方法,定量刻画了人类活动对河湖生态系统的多尺度、多过程影响,并在此基础上模拟评估了生态系统的响应与复苏潜力,技术路线完整,方法创新性强,能够很好地支撑河湖生态保护实践。具体的技术效果,将在下文结合具体实施方式进行描述。
附图说明
图1是本发明的流程图。
图2是本发明步骤S1的流程图。
图3是本发明步骤S2的流程图。
图4是本发明步骤S3的流程图。
图5是本发明步骤S4的流程图。
具体实施方式
需要说明的是,由于系统较为复杂,对于本领域技术人员已经知晓或属于现有技术的内容,未做详细描述。
如图1所示,根据本申请的一个方面,提供一种强人类干扰河湖生态结构与功能复苏评价方法,包括如下步骤:
步骤S1、确定研究区域,采集研究区域内的原始研究数据并预处理,得到符合预定标准的基础数据;所述原始研究数据包括DEM数据、河网数据、水文生态数据和人类干扰活动数据;
步骤S2、基于基础数据,挖掘人类干扰活动模式,并进行人类干扰活动对河湖生态结构影响的聚类分析,输出分析结果;
步骤S3、基于分析结果,定量评估计算人类干扰对河湖生态结构的影响,获得评估数据;
步骤S4、调用预构建功能复苏预测模型,基于评估数据进行模拟并输出功能复苏目标和解决方案。
在本实施例中,采用多源异构数据融合的思路,综合利用DEM、河网、水文、生态和人类活动等多个来源的数据,用以河湖生态系统的自然属性和人为干扰状况,较全面地反映了生态系统的复杂性和动态变化特征。采用智能算法和优化策略,如孤立森林算法进行异常值检测,Z-score标准化消除量纲影响,基于联合熵的参数寻优实现数据自动配准等,在保证计算效率的同时提高了数据质量和分析精度。通过时空立方体表示、自适应网格划分、重采样等创新的数据组织形式,既考虑了数据的动态性,又实现了多源数据的标准化表达和精度统一,为后续的时空分析提供了高质量的数据支持。因此,从技术层面看,该方案在多源数据获取、智能处理、时空表达等方面进行了系统优化,较好地解决了以往数据采集与处理环节的不足。
针对传统拓扑学方法难以处理动态河网结构的问题,采用了Mapper拓扑数据分析和时变拓扑聚类等方法。首先,Mapper算法通过滤波函数变换和局部聚类,将高维、非线性的河网结构映射到低维拓扑空间,不仅能够刻画河网的静态拓扑特征,还能揭示河网结构随时间演化的动态变化规律,大大增强了拓扑分析方法的时空适应性。其次,时变拓扑聚类则进一步量化了河网结构的动态变化过程,通过聚类算法自动识别出不同时段内河网结构的演化模式。最后,结合Ullmann子图同构分析人类干扰的影响,实现了对河网动态响应的阶段性刻画和规律提炼。还计算了河网拓扑的分形维度、连通性和关键节点等多个指标,多角度评估了河网结构的复杂性与稳定性。
在本实施例中,从生态网络分析、生物多样性指数、Shapley值分解和Sobol敏感性分析等多个角度,系统评估了人类干扰对河湖生态系统结构和功能的影响,突破了以往单一因素分析的局限。其中,生态网络分析从物种共现和相互作用的角度刻画了群落结构对干扰的响应,并通过社团检测揭示了干扰导致的群落破碎化风险;多样性指数的时空计算则定量评估了物种多样性格局和群落演替过程对干扰的敏感性;Shapley值分解和Sobol敏感性分析进一步定量辨识了不同干扰活动的生态贡献率差异,并揭示了干扰因子与生态因子间的交互作用强度,提升了干扰评估的科学性和精细化水平。此外,通过因果推断网络挖掘干扰活动间的驱动关系,并分析河网结构与生态过程的动态响应,该方案还对人类干扰的复合效应和级联反馈进行了系统刻画,突破了以往研究中因果机制考虑不足的问题。
如图2所示,根据本申请的一个方面,所述步骤S1进一步为:
步骤S11、采集或调用原始研究数据并清洗、标准化和配准,包括:采用孤立森林算法进行数据清洗,去除常量指标,采用Z-score标准化方法进行标准化,以不同数据源之间的联合熵为优化目标,搜索最优数据配准参数;
步骤S12、读取标准化后的水生态数据,采用因子分析法进行数据降维;
步骤S13、读取DEM数据并采用Mapper方法计算地形拓扑特征的显著性;
步骤S14、读取DEM和河网数据,提取并分析河网拓扑,获得基本河网拓扑、时变河网拓扑和河网拓扑分形维度数据;
步骤S15、读取人类干扰活动数据,并采用自适应网格划分方法转化为不同尺度的时空立方体数据,并对不同来源的时空立方体数据进行重采样,使其具有一致的时空分辨率;
步骤S16、将步骤S12至步骤S15输出的数据存储在预定位置,形成基础数据集合。
根据本申请的一个方面,所述步骤S12具体为:
步骤S121、读取标准化后的水生态数据,计算协方差矩阵,使用最大似然法对观测数据的协方差矩阵进行分解,估计初始因子载荷矩阵和特殊方差,通过迭代计算,不断更新公共方差估计值,直至达到收敛条件,得到最终的因子载荷矩阵;
步骤S122、对初始因子载荷矩阵进行Promax斜交旋转,通过旋转,使每个因子在预定M指标上有高于预设值的载荷,在其他指标上的载荷小于预设值;
步骤S123、基于旋转后的因子载荷矩阵,计算每个样本在各个因子上的得分;构建并评估因子分析模型的拟合优度和因子的可靠性,实现数据降维。
在本申请的另一实施例中,步骤S121中计算协方差矩阵的过程具体为:
计算每个指标的均值,然后将原始数据减去对应的均值,使每个指标的均值为0。中心化后的数据矩阵记为X*。
将中心化后的数据矩阵X*乘以其转置矩阵X*T,再除以样本数n-1,得到p×p的协方差矩阵S。公式为:S=X*TX*/(n-1)。矩阵S的对角线元素Sii 表示第i个指标的方差,非对角线元素Sij表示第i个指标和第j个指标的协方差。
将协方差矩阵S的每个元素除以对应指标的标准差,得到相关系数矩阵R。公式为:Rij = Sij / (Sii Sjj)1/2。相关系数矩阵度量了不同指标之间的线性相关性,取值范围为[-1,1]。
在因子分析中,通常对相关系数矩阵R进行分解,提取公共因子。最大似然法则是在假设观测数据服从多元正态分布的前提下,估计因子载荷矩阵和特殊方差,使观测数据的似然函数最大化。具体的估计过程涉及迭代优化算法,如期望最大算法(EM算法)等。
采用孤立森林算法进行数据清洗,能够有效地检测和去除原始数据中的异常值、噪声和冗余信息,提高数据质量。Z-score标准化方法和基于联合熵的数据配准方法,可以消除不同来源数据间的尺度差异和分布偏差,实现多源异构数据的有效融合。Mapper方法能够揭示DEM数据中蕴含的地形拓扑结构信息,为后续的河网拓扑提取和生态过程分析提供重要的地形背景。时空立方体方法通过自适应网格划分和重采样,实现了人类干扰数据时空特征的规范表达和尺度统一。因子分析通过水文生态数据降维,能够在保留数据主要信息的基础上,去除指标间的多重共线性,便于后续的统计建模和机理分析。总之,采用了一系列的数据处理方法,较好地解决了原始数据质量不一、尺度不一、信息冗余等问题,为后续分析奠定了坚实的数据基础。
如图3所示,根据本申请的一个方面,所述步骤S2进一步为:
步骤S21、基于时空立方体数据,挖掘人类干扰模式并进行聚类,获得聚类结果;
步骤S22、采用时变聚类算法计算河网在不同时段的拓扑变化,并进行模式分析;基于模式分析结果,采用Ullmann算法在综合数据集中识别出受人类干扰活动的子图结构,形成受干扰子图集合,通过节点指标逐一对受干扰子图进行定量分析,计算人类干扰对河网拓扑的影响程度,获得人类影响数据;
步骤S23、构建ARMA模型,对人类干扰活动的时间序列和干扰活动空间分布进行分析,获得时空分布数据,并挖掘人类干扰活动的因果关系;
步骤S24、步骤S21至S23的聚类结果、影响数据、时空分布数据和因果关系作为分析结果输出。
根据本申请的一个方面,步骤S21具体为:
步骤S211、将时空立方体数据重构为二维的干扰矩阵,行代表时空位置,列代表干扰强度,对矩阵进行非负化处理;
步骤S212、采用交替最小二乘算法,将干扰矩阵分解为干扰模式矩阵和活动强度矩阵的乘积,引入L1正则化项,获得稀疏的干扰模式矩阵;
步骤S213、将干扰模式矩阵进行归一化处理,将每个样本在各个干扰模式上的隶属度转化为概率分布,根据最大概率原则,将每个样本划分到概率最大的聚类中,得到聚类结果。
在本申请的另一实施例中,步骤S213的具体过程进一步为:
S2131、对NMF(即步骤S212)得到的模式矩阵进行归一化处理,将每个样本在各个模式上的隶属度转化为概率分布。然后,根据最大概率原则,将每个样本划分到概率最大的聚类中,得到硬聚类结果。每个聚类对应一个干扰活动模式。
S2132、采用轮廓系数度量聚类结果的紧凑性。对于每个样本,计算其与同类样本的平均距离a和与最近异类样本的平均距离b,然后计算轮廓系数s=(b-a)/max(a,b)。s的取值范围为[-1,1],越接近1表示聚类越紧凑,越接近-1表示样本可能分配错误,接近0表示样本在两个聚类的边界上。计算所有样本轮廓系数的均值,作为整体聚类紧凑性的度量。
S2133、聚类分离性评估:采用Davies-Bouldin指数(DBI)度量聚类结果的分离性。对于每对聚类i和j,计算它们的类内散度Si和Sj(即类内样本与中心点的平均距离),以及类间距离Mij(即两个中心点之间的距离)。然后,计算Rij=(Si+Sj)/Mij,得到聚类i和j的相似性度量。对每个聚类i,计算Ri=max(Rij),即与其他聚类最大的相似性。最后,计算DBI=mean(Ri),即所有聚类Ri的平均值。DBI越小,表示聚类之间的分离性越好。
S2134、聚类显著性评估:通过置换检验(Permutation Test),评估聚类结果的统计显著性。随机置换样本的类别标签,重新计算聚类评估指标(如轮廓系数或DBI),重复多次得到置换分布。将实际聚类结果的指标值与置换分布进行比较,计算p值,即实际指标值在置换分布中的百分位数。p值越小,表示聚类结果越显著,不太可能是随机产生的。
根据本申请的一个方面,所述步骤S23具体为:
步骤S231、读取人类干扰活动数据和人类影响数据,采用ADF方法对人类干扰活动强度的时间序列进行平稳性检验;对人类干扰活动强度的时间序列进行傅里叶变换和小波变换,获取频域特性,提取周期成分;
步骤S232、构建ARMA模型,选择最优的ARMA模型阶数,使用最大似然估计或条件最小二乘法拟合模型参数;
步骤S233、对干扰模式矩阵进行中心化处理,减去每一列的均值,对数据进行标准化,使其具有零均值和单位方差;
步骤S234、使用高斯核函数将干扰模式矩阵映射到高维特征空间,在高维特征空间进行主成分分析,提取非线性主成分;基于主成分分析结果构建主成分得分矩阵,基于基础数据,构建原始空间位置矩阵;
步骤S235、对主成分得分矩阵和原始空间位置矩阵进行奇异值分解,获得它们在公共低维空间的嵌入表示信息;根据主成分得分,对干扰活动在空间上的分布模式进行可视化;
步骤S236、读取人类干扰活动数据,对不同人类干扰活动强度的时间序列进行格兰杰因果检验,计算不同时滞下的条件互信息,判断两两活动间的因果关系;对人类干扰活动强度序列进行核化,计算不同人类干扰活动间的偏相关系数,剔除其他人类干扰活动的影响,使用置换检验,评估偏相关的显著性;
步骤S237、基于显著的因果关系构建干扰活动的因果网络;采用Lasso正则化,优化因果网络结构;基于因果网络挖掘人类干扰活动的因果关系。
在本申请的另一实施例中,步骤S231对人类干扰活动强度的时间序列进行傅里叶变换和小波变换,获取频域特性,提取周期成分的过程具体如下:
读取平稳化处理后的人类干扰活动(强度)的时间序列数据,记为{x(t), t=1,2,...,N},其中N为序列长度。对数据进行去均值处理,即减去序列的算术平均值,得到均值为0的序列{x'(t)}。
对去均值后的序列{x'(t)}进行离散傅里叶变换(DFT),得到频域表示序列{X(k),k=0,1,...,N-1}。具体计算公式为:X(k) = Σ[x'(t) * exp(-j*2πkt/N)], t=0,1,...,N-1;其中,j为虚数单位,k为频率指标。通过快速傅里叶变换算法(FFT)可以高效实现DFT计算。
根据傅里叶变换得到的频域序列{X(k)},计算功率谱密度(PSD)估计值。采用周期图法计算PSD,公式为:P(k) = (1/N)|X(k)|2,k=0,1,...,N-1;其中,P(k)为频率k处的功率谱密度估计值。将PSD估计值对频率k作图,得到功率谱密度曲线。
根据功率谱密度曲线,提取具有显著峰值的频率成分,作为人类干扰强度序列的候选周期成分。采用虚警概率(False Alarm Probability, FAP)方法判断候选周期的显著性:
根据指定的显著性水平α(如0.05),计算临界功率谱密度阈值Pc。Pc的计算公式为:
Pc=-ln(1-(1-α)1/N)*Pm;其中,Pm为PSD估计值的均值。
将候选周期的PSD估计值与Pc比较,高于Pc的周期通过显著性检验,被判定为显著周期成分。
对于每个提取出的显著周期成分,采用最小二乘法拟合正弦函数,估计其周期参数,包括周期长度T、振幅A和初始相位φ。正弦函数的形式为:x(t) = A * sin(2πt/T +φ) + ε(t);
其中,ε(t)为随机误差项。使用Levenberg-Marquardt优化算法最小化残差平方和,求解最优的周期参数估计值。
采用连续小波变换(CWT)对人类干扰活动的强度序列进行时频分析。选择合适的母小波函数(如Morlet小波),计算小波系数W(a,b):W(a,b) = (1/sqart(a)) * Σ[x(t) *ψ((t-b)/a)], t=1,2,...,N;其中,a为尺度参数,b为时间平移参数,ψ为母小波函数。通过改变a和b的取值,得到不同尺度和时间位置上的小波系数。
对小波系数W(a,b)的模平方|W(a,b)|2计算小波功率谱(WPS),反映序列在不同尺度和时间位置上的能量分布。将WPS对尺度a和时间b作图,得到时频分布图。
在小波功率谱图上,提取局部能量最大的区域,对应序列在该时间尺度上的显著周期成分。采用蒙特卡洛模拟方法,生成大量与原序列具有相同一阶自相关系数的红噪声序列,计算它们的小波功率谱分布,从而确定原序列WPS的置信区间。超出置信区间的高能量区识别为显著周期成分。
综合傅里叶分析和小波分析的结果,对不同时间尺度上识别出的显著周期进行对比和融合。若两种方法识别出的周期一致,则进一步确认该周期的可靠性;若出现差异,则根据物理机制和先验知识进行甄别,选出最可能的周期成分。
对最终确定的显著周期成分,分析其时间尺度、能量强度、持续时间等特征参数,揭示人类干扰强度的多尺度周期演化规律。结合河流水文过程、人类活动节律等背景知识,探讨周期形成的原因和机制。
以上步骤通过傅里叶变换和小波变换等时频分析方法,从频域和时频域两个角度挖掘人类干扰强度序列中蕴含的周期性信息,并采用统计检验和置信区间等方法定量评估周期的显著性和可靠性,最终得到不同时间尺度上的显著周期成分及其参数。这些分析结果可以揭示人类干扰的周期演化特征,可以为理解人类活动与河湖生态系统的动态相互作用提供重要参考。
在本申请的另一实施例中,步骤S234中计算主成分得分矩阵的过程具体为:
对干扰模式矩阵进行中心化和标准化处理,使每个模式的均值为0,方差为1。
采用高斯核函数计算干扰模式之间的核矩阵K。核矩阵度量了模式在高维特征空间中的相似性。
对核矩阵K进行中心化,然后计算其特征值和特征向量。选择前q个最大的特征值对应的特征向量,构成特征向量矩阵V。
将特征向量矩阵V乘以中心化后的核矩阵K,得到n×q的主成分得分矩阵F。主成分得分反映了原始干扰模式在核主成分空间中的坐标。
因此,主成分得分矩阵F是通过KPCA得到的,它表示了干扰模式在非线性主成分空间中的低维表示。
接下来,将主成分得分矩阵F与原始空间位置矩阵P进行双图嵌入,以实现模式和位置的同时表示。原始空间位置矩阵P是一个n×2的矩阵,其中n是干扰模式的数量,每一行对应一个模式的空间坐标(如经纬度坐标)。P矩阵可以直接从原始数据中获取,或者通过对模式所在位置进行地理编码得到。
在得到F和P两个矩阵后,使用双图嵌入算法,包括典型相关分析(CCA)或核典型相关分析(KCCA),将它们映射到一个共同的低维空间中,得到模式和位置的同时表示。这样,就可以在同一个图中可视化干扰模式的空间分布特征,并分析模式与位置之间的关联关系。
在本实施例中,基于非负矩阵分解(NMF)对时空立方体数据进行干扰模式挖掘和聚类,通过采用稀疏正则化,能够自动识别出具有显著时空分布特征的干扰活动模式,并揭示不同模式间的内在联系。与传统的欧氏距离聚类相比,NMF能够克服"维数灾难"问题,在高维数据中更准确地刻画样本间的相似性。采用时变拓扑聚类和Ullmann子图同构算法,分析人类干扰对河网拓扑结构的影响,通过动态地刻画河网拓扑的时空变化,识别出河网中对干扰活动响应最显著的关键区域,可以指导重点河段的生态修复和保护。ARMA时间序列模型和Granger因果检验用于挖掘人类干扰强度的时间动态规律和不同干扰活动间的因果关联,有助于理解人类干扰的累积效应和驱动机制。
总的来看,本实施例采用的非传统聚类、图模式挖掘、时间序列分析等方法,从时间和空间两个维度系统刻画了人类干扰活动的模式特征,能够定量呈现不同类型人类活动对河湖生态系统的干扰状况,为生态影响分析提供重要的过程解释。
在本申请的另一实施例中,步骤S236的时间序列因果检验,具体过程为:
对每对人类干扰活动强度时间序列(记为X和Y),选择合适的时滞阶数p(如采用AIC准则确定),拟合p阶向量自回归(VAR)模型:
X(t) = ∑αi X(t-i) + ∑βi Y(t-i) +εX(t), i=1,2,..,p;
Y(t) = ∑γi X(t-i) + ∑δi Y(t-i) + εY(t), i=1,2,..,p;
其中,αi、βi、γi、δi为回归系数,εX(t)和εY(t)为随机误差项。
构建两个嵌套的VAR模型:一个是完整模型,包含了X和Y的自回归项与交叉回归项;另一个是约束模型,去掉了Y对X的回归项(即令所有βi为0)或X对Y的回归项(即令所有γi为0)。
采用F检验比较两个嵌套模型的残差平方和,计算F统计量:
F = [(RSSr - RSSu)/p] / [RSSu/(n-2p-1)];
其中,RSSr和RSSu分别为约束模型和完整模型的残差平方和,n为样本量。
在给定显著性水平α下,若F统计量超过自由度为(p, n-2p-1)的F分布临界值,则拒绝原假设(βi全为0或γi全为0),认为Y是X的格兰杰原因(或X是Y的格兰杰原因)。
对每对人类干扰活动强度序列X(t)和Y(t),选择最大时滞阶数p_max,计算不同时滞p下的条件互信息(CMI):
I(X(t); Y(t-p) | Y(t-1),...,Y(t-p+1)) = ∑P(X,Yp,Yp') * log[P(X,Yp|Yp') / (P(X|Yp') * P(Yp|Yp'))]
其中,Yp表示Y(t-1)到Y(t-p+1)的向量,Yp'表示Y(t-p)的向量,P表示概率分布。
采用最近邻密度估计方法,从数据样本中估计CMI的值。
对每个时滞p,独立地置换Y(t)的时间索引,破坏X(t)与Y(t-p)的时间依赖关系,计算置换后的CMI值,重复多次(如1000次)得到CMI的经验零分布。以95%分位数作为CMI的显著性阈值,若原始CMI超过该阈值,则在5%的显著性水平下认为Y是X的原因。
选择具有最大显著CMI值的时滞pmax作为Y影响X的因果时滞。
核化偏相关分析的详细步骤如下:
对每个人类干扰活动强度序列X(t),采用高斯核函数将其映射到再生希尔伯特空间(RKHS):Φ(X(t)) = exp(-||X(t)-X(ti)||2/ (2σ2));其中,X(ti)为核函数的中心点(可取X(t)序列的所有样本值),σ为核函数的带宽参数。对所有变量的核化结果构成特征矩阵K,其中第(i,j)个元素为Φ(Xi(t))和Φ(Xj(t))的内积。
对核化后的特征矩阵K,计算其逆矩阵K-1
根据K-1的元素,计算变量Xi和Xj去除其他变量影响后的偏相关系数ρij:
ρij = -K-1ij / sqart(K-1ii * K-1jj);其中,K-1ij表示K-1矩阵的第(i,j)个元素。
得到所有变量对之间的偏相关系数矩阵P,刻画了变量间的直接相关性强度。
对偏相关系数矩阵P中的每个元素ρij,进行显著性检验。
独立地置换Xi和Xj的样本观测值,破坏两个变量之间的相关关系,计算置换后的偏相关系数,重复多次(如1000次)得到偏相关系数的经验零分布。
在给定的显著性水平α(如0.05)下,若|ρij|超过经验零分布的(1-α/2)分位数,则认为Xi和Xj之间存在显著的直接相关性。
将每个人类干扰活动定义为因果网络的一个节点。
根据格兰杰因果检验和核化偏相关分析的结果,识别出所有显著的因果关系和相关关系,作为候选的网络边。
对每个节点Xi,基于其他节点的状态,构建Lasso正则化的线性回归模型:
Xi(t) = ∑wij Xj(t-pij) + i(t), j≠i;其中,wij为回归系数,表征节点Xj对Xi的影响强度,pij为得到的因果时滞,εi为误差项。
在最小化均方误差的同时,加入L1正则化项,得到Lasso优化目标:
min (1/n) ∑(Xi(t) - ∑wij Xj(t-pij))2+ λ∑|wij|;
其中,λ为正则化参数,控制网络的稀疏程度。
采用坐标下降法或最小角回归法,求解Lasso优化问题,得到稀疏化的回归系数w*ij。
根据Lasso回归得到的稀疏系数w*ij,如果w*ij≠0,则在节点X_j到X_i之间建立一条有向边,边权重为|w*ij|。
采用Bootstrap重抽样方法, Lasso回归过程多次(如500次),得到因果网络结构的Bootstrap支持度。设定Bootstrap支持度阈值(如80%),保留超过阈值的边,得到最终的因果网络拓扑。
根据BIC准则,评估不同λ取值下因果网络的拟合优度和复杂度,选择最优的正则化参数λopt:BIC(λ) = n ln(RSSλ / n) + kλ ln(n);其中,RSSλ为λ取值下的残差平方和,kλ为非零回归系数的个数。采用交叉验证法,评估因果网络模型的预测性能,如均方误差、决定系数等。对比不同模型选择准则(如BIC、AIC、Cross-Validation)下得到的因果网络,分析网络结构的稳健性。
以上步骤通过时间序列因果检验、核化偏相关分析等方法,定量刻画了人类干扰活动之间的直接因果关系和相关性,并采用Lasso正则化和BIC模型选择等方法,构建了稀疏化的因果网络模型,揭示了人类干扰活动的动态交互机制。
如图4所示,根据本申请的一个方面,所述步骤S3进一步为:
步骤S31、调取分析结果和基础数据,构建物种共现网络和互作网络,对共现网络和互作网络进行社团划分,并评估社团结构的显著性,以及计算共现网络和互作网络的连通性指标和中心性指标;
步骤S32、针对种群生态网络,包括共现网络和互作网络,基于生态学网络分析方法,分析每类人类干扰活动对生态系统结构的影响,计算物种多样性指数、群落相似性、空间自相关和时间周转率;
步骤S33、调用自适应采样算法计算每类人干扰类活动的时空影响序列数据,获得时空分布特征数据;分析并计算河网拓扑变化对生态过程的影响数据;
步骤S34、基于时空分布特征数据,采用Shapley法评估人类干扰活动的影响贡献,采用Sobol指数分析评估全局敏感性;获得评估数据并输出。
根据本申请的一个方面,所述步骤S34进一步为:
步骤S341、读取时空分布特征数据,并构建所有可能的人类干扰活动组合,计算每种人类干扰组合下生态过程的效用值;对每个人类干扰活动,计算其在所有组合中的边际贡献,采用蒙特卡洛采样,随机生成活动组合序列,估计Shapley值的数学期望;根据Shapley值大小,对不同干扰活动的影响贡献进行排序;
步骤S342、构建并从人类干扰活动因子的多维参数空间中,采用Sobol序列采样方法生成参数样本集,将采样得到的参数样本输入生态过程模型,模拟每个样本下的生态响应,计算生态过程模型输出的均值和方差;
步骤S343、基于方差分解原理,计算一阶Sobol指数和总阶Sobol指数;根据Sobol指数大小,对人类活动干扰因子的重要性进行排序。
在本申请的另一实施例中,步骤S31中的共现网络和互作网络的构建过程具体为:
将不同样方的物种组成数据整理为物种×样方的0-1矩阵,矩阵元素aij=1表示物种i在样方j中出现,aij=0表示缺失。对0-1矩阵进行转置,得到样方×物种的共现矩阵,矩阵元素bij表示样方i和样方j共有的物种数。
对每对物种(i,j),基于超几何分布计算其共现关系的P值:
Pij = P(X≥kij | N, Ki, Kj) = ∑x=k_ij min(Ki,Kj)(Ki choose x)(N-Ki chooseKj-x) / (N choose Kj);其中,N为总样方数,Ki和Kj分别为物种i和j出现的样方数,kij为物种i和j共同出现的样方数。对P值进行多重假设检验的校正,如Bonferroni校正或FDR控制,得到校正后的P值矩阵Padj。
根据共现矩阵和P值矩阵,构建物种共现网络。网络节点代表物种,节点之间的连边表示显著的共现关系。设定P值阈值(如0.05),过滤Padj高于阈值的物种对,保留显著性水平较高的共现关系。共现网络可以是无权网络(只考虑物种间是否共现)或加权网络(边权重反映共现强度,如kij/N)。
基于文献调研、专家知识、数据库查询等方式,收集已知的物种互作关系数据,如捕食、竞争、互利共生、寄生等。整理互作关系数据为源物种、目标物种、互作类型、互作强度等信息的结构化表格。
对于每种互作类型,设计互作强度的量化指标和计算方法。例如:
捕食强度可用捕食者对被捕食者种群数量的影响系数来度量;竞争强度可用物种对共享资源的利用率或重叠度来度量;互利共生强度可用共生双方的适合度收益来度量;寄生强度可用寄生者对宿主的危害程度来度量。
根据互作关系表格中的定性描述或定量数据,计算每对物种之间的互作强度,得到互作强度矩阵W。
根据互作关系表格和互作强度矩阵,构建有向加权的互作网络。网络节点代表物种,有向边表示互作关系的方向(如捕食者→被捕食者),边权重为互作强度。对于同时存在多种互作关系的物种对,可以构建多层网络,每层表示一种互作类型;或者将不同类型的互作强度进行加权汇总(如加权和或加权平均),得到综合的互作强度。
基于随机游走的思想,假设在网络中随机游走,如果两个节点属于同一个社团,则它们之间的随机游走转移概率较高。
定义节点i和j之间的转移概率Pij = Aij / di,其中Aij为邻接矩阵元素(0或1),di为节点i的度。通过幂迭代计算转移概率矩阵P的t步幂Pt,得到t步随机游走的转移概率。t一般取较小值,如2-5。基于Pt计算节点之间的相似度,进行层次聚类,得到网络的社团结构。
基于网络结构的信息论描述,假设网络是信息流的载体,最优的社团划分使得信息在社团内的传递最为简洁。定义社团结构的信息熵,使用贪婪搜索策略,优化目标为最小化信息熵L,得到最优的社团划分。
计算社团划分的模块度Q: Q = ∑_c (ecc - ac2);其中,ecc为社团c内部的边数占总边数的比例,ac为与社团c节点相连的边数占总边数的比例。模块度Q反映了社团内部边密度与外部边稀疏度之间的差异,Q越大表示社团结构越显著。通过基于零模型的显著性检验,评估模块度的统计显著性。
计算网络的连通分量数,即最大的连通子图的数量。连通分量数越少,表示网络的整体连通性越强。计算网络的平均路径长度,即任意两个节点之间的最短路径长度的均值。平均路径长度越小,表示节点之间的平均距离越近,网络连通性越强。计算网络的直径,即任意两个节点之间的最短路径长度的最大值。直径越小,表示网络的最大跨度越小,连通性越强。
计算节点的度中心性,即节点的连接数。度中心性越高,表示节点在网络中的活跃度和影响力越大。计算节点的介数中心性,即节点在其他节点之间的最短路径上出现的频率。介数中心性越高,表示节点在网络的信息传递和控制中的重要性越大。计算节点的接近中心性,即节点与其他节点之间的平均距离的倒数。接近中心性越高,表示节点在网络中的可达性和影响范围越大。
计算网络的聚类系数C,即节点的邻居之间相互连接的概率。C越大,表示网络的局部聚集性越高。计算网络的平均路径长度L,即任意两个节点之间的平均最短路径长度。L越小,表示网络的全局连通性越强。将网络的C和L与等规模的随机网络进行比较,如果C远大于随机网络,而L与随机网络相当,则认为网络具有小世界性。
计算网络节点的度分布P(k),即度为k的节点在网络中出现的概率。对度分布进行双对数坐标下的线性拟合,如果度分布满足幂律形式P(k) ~ k,其中γ为幂律指数,则认为网络具有无标度性。无标度网络的度分布具有长尾特征,少数节点的度很高,大多数节点的度较低,网络的异质性和鲁棒性较强。
以上步骤详细描述了共现网络和互作网络构建的数据处理过程,包括共现关系和互作关系的定量表示、显著性评估、网络构建等关键环节。在此基础上,运用Walktrap、Infomap等社团检测算法揭示网络的模块化结构特征,并通过连通性、中心性、小世界性、无标度性等指标分析网络的拓扑属性。这些方法可以深入刻画群落内物种间的非随机共现模式和复杂互作关系,评估人类干扰对物种共存和生态功能的潜在影响,为进一步探究生物多样性维持机制和生态系统稳定性提供重要的网络视角和定量分析工具。
在本申请的另一实施例中,步骤S32中的物种多样性指数、群落相似性、空间自相关和时间周转率计算过程具体为:
对每个时空位置的群落样本,统计出现的物种数,即为该样本的物种丰富度(Species Richness, SR)。将各样本的SR值汇总,计算SR的时间序列和空间分布矩阵。
对每个群落样本,计算各物种的相对多度比例pi(第i种物种的个体数占总个体数的比例)。计算Shannon-Wiener指数H: H = -∑pi * log(pi)。H值越大,表示群落物种多样性越高。
将各样本的H值汇总,得到H的时间序列和空间分布矩阵。
对每个群落样本,计算Simpson指数D:D =∑pi2。D值越大,表示群落中优势种的比例越高,物种多样性越低。计算Simpson多样性指数1-D,反映物种多样性水平。1-D越大,多样性越高。将各样本的1-D值汇总,得到1-D的时间序列和空间分布矩阵。
对每个群落样本,计算Pielou均匀度指数J: J = H / ln(SR)。J的取值范围为[0,1],越接近1表示群落中物种分布越均匀。将各样本的J值汇总,得到J的时间序列和空间分布矩阵。
对物种丰富度SR、Shannon-Wiener指数H、Simpson指数1-D、均匀度指数J的时间序列,计算不同时期的均值、方差、变异系数等统计量,分析其年际变化趋势和波动特征。对SR、H、1-D、J的空间分布矩阵,绘制等值线图或空间插值图,分析其空间分布格局和梯度变化特征。采用趋势分析、周期分析等方法,刻画物种多样性指数的时空动态规律。
对每对群落样本(样本i和样本j),提取共有物种数Sij和总物种数Tij(样本i和j物种数的并集)。计算Jaccard相似性系数Jij: Jj = Sj / Tj。Jj的取值范围为[0,1],越接近1表示两个群落的物种组成越相似。
构建Jaccard相似性矩阵J,矩阵的第(i,j)个元素为Jij。
对每对群落样本(样本i和样本j),计算共有物种的个体数差值绝对值之和Sij,以及两个样本物种个体数总和Tij。计算Bray-Curtis相异性指数BCij:BCij = Sij / Tij。BCij的取值范围为[0,1],越接近1表示两个群落的物种组成和丰度差异越大。
构建Bray-Curtis相异性矩阵BC,矩阵的第(i,j)个元素为BCij。
对Jaccard相似性矩阵J或Bray-Curtis相异性矩阵BC,应用层次聚类或K-means聚类等方法,将不同时空位置的群落样本聚为若干类群。分析各类群的时空分布特征,揭示群落组成的相似性格局。
对相似性矩阵或相异性矩阵,绘制热图(Heatmap),用颜色深浅表示不同时空位置群落间的相似性或相异性水平。对热图进行行列聚类,揭示群落相似性的时空分布模式,如季节性、周期性等。
基于相似性矩阵或相异性矩阵,应用主坐标分析(PCoA)或非度量多维尺度分析(NMDS)等排序方法,提取反映群落变化梯度的主轴。分析主轴得分与环境因子(如水文、地形、干扰强度等)的相关性,解释群落组成变化的生态驱动机制。
根据群落样本的空间位置关系(如地理距离、拓扑连通性等),构建空间权重矩阵W。常用的方法包括阈值距离法、K近邻法、Delaunay三角剖分法等。对权重矩阵W进行行标准化处理,使每行权重之和为1。
基于空间权重矩阵W和群落物种丰富度(或其他多样性指数)的空间分布向量x,计算Moran's I指数:I = (n/S0) * ∑∑wij(xi - xmean)(xj - xmean) / ∑(xi - xmean)2
其中,n为样本数,S0为权重矩阵W所有元素之和,xmean为物种丰富度的均值。
计算Geary's C指数:C = (n-1)/(2S0) * ∑∑wij(xi - xj)2/ ∑(xi - xmean)2
Moran's I和Geary's C都度量了空间自相关性的强度,I的取值范围为[-1,1],C的取值范围为[0,2]。I大于0(或C小于1)表示正的空间自相关,即相近位置的群落组成相似;I小于0(或C大于1)表示负的空间自相关。
对每个空间位置i,计算其局部Moran's I指数(LISA):
Ii = (xi - xmean) / (∑(xi - xmean)2/ n) * ∑wij(xj - xmean);
对每个空间位置i,计算其局部Geary's C指数:Ci = ∑wij(xi - xj)2/ (∑(xi- xmean)2/ (n-1));局部指数反映了每个位置与其邻域的相关性,可用于识别空间异常点和热点区域。
对Moran's I和Geary's C指数,通过Monte Carlo置换检验,计算其统计显著性。
在置换检验中,随机重排群落样本的空间位置,重新计算指数值,重复多次得到指数的经验分布。
根据实际指数值在经验分布中的百分位,计算p值,评估空间自相关性的显著性水平。
通过改变空间权重矩阵W的定义方式(如改变阈值距离、K近邻数等),在不同的空间尺度下重复上述步骤。
绘制Moran's I或Geary's C指数随尺度变化的曲线,分析空间自相关性的尺度效应。
确定最优的分析尺度,选择合适的空间权重矩阵进行后续分析。
将不同时期的群落物种组成数据重组为时间序列格式,每个时间步长(如每年或每季度)对应一个群落样本。对于每个空间位置,提取其时间序列数据,构建时间步长×物种的时间序列矩阵。
采用Bray-Curtis相异性指数或Jaccard相异性指数(1-Jij),计算相邻两个时间步长之间的群落相异性。对于第t步长和第t+1步长,计算其相异性指数d_t,t+1。重复计算所有相邻步长对的相异性指数。
基于成对相异性指数,计算第t步长到第t+1步长的时间周转率TR_t,t+1:
TRt,t+1= dt,t+1/ (tt+1- tt);其中,tt和tt+1分别为第t和t+1步长的时间戳。时间周转率TR度量了单位时间内群落组成的变化速率,TR越大表示群落组成变化越快。将所有相邻步长的TR值串联,得到时间周转率的时间序列TRt
对周转率时间序列TRt,计算其均值、方差、变异系数等统计量,评估群落组成变化的总体速率和波动水平。对TRt进行趋势分析,如Mann-Kendall检验或Sen's slope估计,判断周转率是否存在长期的增加或减少趋势。对TRt进行周期性分析,如Fourier分析或小波分析,提取周转率的周期性成分,如季节周期、年际周期等。
对不同空间位置的TR时间序列,计算其时间均值,得到周转率的空间分布图。对周转率的空间分布图进行插值分析,如克里金插值或IDW插值,揭示周转率的空间分异格局。分析周转率与环境因子的空间相关性,探讨群落变化速率的空间分布机制。
在本实施例中,采用生态网络分析的理论方法,通过构建物种共现网络和互作网络,从群落的物种组成和种间关系两个角度分析人类干扰对生态系统结构的影响。网络的社团分析、连通性和中心性指标,能够量化人类干扰导致的群落组成变化、生境破碎化程度和关键物种损失风险,为生物多样性保护提供直接依据。多样性指数和相似性指数的时空计算,进一步揭示了人类干扰对物种多样性格局和群落演替过程的影响。Shapley值分解和Sobol敏感性分析方法,定量评估了不同人类干扰活动对生态系统变化的贡献率,并考察了不同干扰因子与生态因子间的交互作用,这对于理解人类干扰的生态效应机制和制定有针对性的管控措施具有重要意义。此外,通过分析河网拓扑变化与生态过程的响应关系,该方案还将河流廊道的结构连通性和功能连通性与生态系统健康状况紧密联系起来,强调了河流生态系统完整性维持的重要性。
总之,采用生态网络分析、景观生态指数、Shapley值分解和Sobol敏感性分析等方法,在定量层面深入阐释了人类干扰影响下的河湖生态系统结构和过程特征,能够较全面地评估人类活动的生态效应。
在本申请的另一实施例中,分析并计算河网拓扑变化对生态过程的影响数据的过程具体为:
将河网拓扑数据转化为适用于元胞自动机或随机游走模型的格式,如网格或图结构。
对于网格结构,将河网栅格化,每个栅格表示一个元胞,元胞状态表示是否为河道。
对于图结构,将河网抽象为由节点(如河段、交汇处)和边(如河道连接)组成的网络。
根据物种的扩散特性(如扩散能力、扩散方式、扩散偏好等),设定元胞自动机或随机游走模型中的参数。对于元胞自动机,设定元胞状态转移规则,如物种在相邻河道元胞间的扩散概率、扩散距离等。
对于随机游走模型,设定物种在河网节点间移动的概率、步长分布等。
根据物种的起始栖息地分布,在河网结构中随机或指定位置释放一定数量的物种个体。对于多物种扩散模拟,按照各物种的相对丰度设定初始分布比例。
利用元胞自动机或随机游走模型,逐步模拟物种在河网中的扩散过程。
对于元胞自动机,根据状态转移规则更新每个时间步的元胞状态,直到达到预设的模拟时长或收敛条件。
对于随机游走模型,在每个时间步随机选择物种个体进行移动,更新个体的位置,直到达到预设的模拟时长或稳定分布。
统计物种在河网中的扩散距离、扩散速度、占据河段数等指标,评估物种的扩散能力和范围。
对于多次模拟,计算扩散指标的平均值和变异系数,评估扩散过程的稳定性和可重复性。
分别在原始河网和变化河网中进行物种扩散模拟,比较物种扩散指标的差异。
采用统计检验方法,如t检验或方差分析,评估河网拓扑变化对物种扩散过程的影响是否显著。
选择反映河网连通性的拓扑指标,如α指数、β指数、γ指数等。α指数表示河网中实际环数与最大可能环数之比,反映河网的环状结构发达程度。β指数表示河网中河段数与节点数之比,反映河网的支链发达程度。γ指数表示河网中实际连接数与最大可能连接数之比,反映河网的整体连通性。
分别计算原始河网和变化河网的α、β、γ指数。α指数的计算公式为:α= (M-N+1) /(2N-5),其中M为河段数,N为节点数。β指数的计算公式为:β=M/N。γ指数的计算公式为:γ=M/[3(N-2)]。比较原始河网和变化河网的α、β、γ指数,评估河网拓扑变化对连通性的影响。连通性指标值越大,表示河网的环状结构、支链发达程度或整体连通性越高。计算连通性指标的变化率,即(变化河网指标值-原始河网指标值)/原始河网指标值,定量评估连通性的相对变化。选择反映河网节点和通道重要性的关键性指标,如介数中心性、迁移率等。介数中心性表示节点在河网中所有最短路径上的出现频次,反映节点在河网连通性维持中的重要程度。迁移率表示通过节点或通道的物种个体数占总个体数的比例,反映节点或通道在物种扩散过程中的重要程度。
分别计算原始河网和变化河网中每个节点的介数中心性和每条通道的迁移率。
介数中心性的计算公式为:CB(v) = ∑s≠v≠t(σst(v) / σst),其中σst为节点s和t之间的最短路径数,σst(v)为经过节点v的最短路径数。迁移率的计算公式为:Mij = nij /N,其中nij为通过通道ij的物种个体数,N为总个体数。
根据介数中心性和迁移率,识别原始河网和变化河网中的关键节点和关键通道。
对节点的介数中心性进行排序,介数中心性越高的节点,在河网连通性维持中的重要性越大。
对通道的迁移率进行排序,迁移率越高的通道,在物种扩散过程中的重要性越大。
选择排名前列的节点和通道作为关键节点和关键通道,设定合适的阈值以平衡关键性与识别数量。
比较原始河网和变化河网的关键节点和关键通道,评估河网拓扑变化对关键性的影响。
计算关键节点和关键通道的变化率,即(变化河网指标值-原始河网指标值)/原始河网指标值,定量评估关键性的相对变化。
关键节点或通道的丧失或衰减,可能导致河网连通性的降低和物种扩散的阻碍,需要重点关注和保护。
以上步骤详细描述了河网拓扑变化对物种扩散过程、河网连通性、关键节点和通道的影响分析方法。通过元胞自动机或随机游走模型模拟物种在河网中的扩散动态,并比较原始河网和变化河网中的扩散指标差异,可以定量评估河网拓扑变化对物种扩散能力和范围的影响。同时,采用α、β、γ等连通性指标度量河网拓扑变化前后的连通性变化,揭示河网环状结构、支派发达程度和整体连通性的响应。此外,运用介数中心性和迁移率等关键性指标识别河网中对维持连通性和物种扩散至关重要的关键节点和通道,并评估其在河网拓扑变化中的损失风险。
在本申请的另一实施例中,步骤S34进一步,
Shapley值法评估干扰活动的影响贡献:根据生态过程的特点,定义干扰活动组合的效用函数。可以采用加性效用、乘性效用或非线性效用等形式。列举所有可能的干扰活动组合,计算每种组合下生态过程的效用值。可以通过实际观测数据或模型模拟获得效用值。对每个干扰活动,计算其在所有组合中的边际贡献。采用蒙特卡洛采样,随机生成活动组合序列,估计Shapley值的数学期望。根据Shapley值大小,对不同干扰活动的影响贡献进行排序。绘制Shapley值的条形图或雷达图,直观比较各活动的相对重要性。
基于Sobol指数的全局敏感性分析:从干扰因子的多维参数空间中,采用拉丁超立方采样或Sobol序列采样等方法,生成参数样本集。样本应覆盖参数空间的各个区域。将采样得到的参数样本输入生态过程模型,模拟每个样本下的生态响应。计算模型输出的均值和方差。基于方差分解原理,计算一阶Sobol指数和总阶Sobol指数。一阶指数反映单个因子的影响,总阶指数反映因子及其交互作用的综合影响。根据Sobol指数大小,对干扰因子的重要性进行排序。绘制Sobol指数的堆积柱状图,展示因子的主效应和交互效应。
干扰情景的生态风险评估:从人类干扰活动中,识别潜在的生态风险源。风险源可能来自土地利用变化、污染排放、水文调控等多个方面。从发生概率和危害后果两个维度,对每个风险源进行表征。采用模糊数学方法,将定性的风险描述转化为定量的风险指标。采用层次分析法,对风险源的发生概率和危害后果进行两两比较,计算它们的相对重要性权重。运用模糊综合评判,计算每个风险源的综合风险指数。根据综合风险指数,对干扰情景下的生态风险进行分级,划分为低风险、中风险、高风险等不同等级。制定与风险等级相适应的管理对策。
在一个实施例中,构建了如下的河流水生态功能评价指标体系,目标层为:
河流水生态功能状况。准则层为岸线空间功能、水文动力功能、理化生境功能、指示物种功能。指标层为:岸线自然状况、岸线宽度指数河流纵向连通性指数、生态流量满足程度、水质优劣程度生境多样性指数、大型底栖无脊椎动物质量指数、鱼类保有指数。
生态风险(生态功能状况)分级标准为:
优、蓝色、[0.925,1];良、绿色、[0.695,0.925);
中、黄色、[0.465,0.695);一般、橙色、[0.235,0.465);
差、红色、[0,0.235)。
如图5所示,根据本申请的一个方面,所述步骤S4进一步为:
步骤S41、调用预构建功能复苏预测模型,对干扰情景的生态风险、景观连通性和评生态恢复力进行估;
步骤S42、输入设定的生态保护目标,评估人类干扰活动对河湖生态结构的影响参数,给出解决方案集合。
在本实施例中,基于既有生态风险评估模型,综合考虑生态系统的脆弱性、景观连通性和自我恢复能力等因素,针对不同人类干扰情景开展生态复苏潜力模拟,这在很大程度上弥补了以往生态评估中对"复苏"这一关键环节考虑不足的问题。通过设置不同的生态保护目标,该方案还可以比较不同管控措施下的生态系统响应,并通过情景分析优选最佳的河湖管理方案,这对于平衡人类活动需求和生态保育目标,协调经济发展与环境保护的关系具有重要的决策指导作用。
在本实施例中,通过采用生态风险评估、生态恢复力评估等方法,以及基于过程的生态系统管理理念,即充分考虑外部干扰因素和内部自组织过程对生态系统结构与功能的双重影响,兼顾自然的恢复能力和人工的修复作用,对于因地制宜地制定河湖生态保护与修复策略具有重要的指导意义。
在本申请的另一实施例中,量化人类干扰管理措施的生态效益,如生物多样性提升、水质改善、生态系统服务价值增加等。采用生态经济学方法,将生态效益转化为货币价值。核算干扰管理措施的实施成本,包括直接成本和间接成本。直接成本如工程投资、设备购置、人工费用等,间接成本如机会成本、环境外部性等。计算不同管理措施的成本效益比,即生态效益与实施成本之比。对成本和效益进行折现,将其转化为现值。分析不同参数取值下成本效益比的变化,如折现率、效益估值系数、成本估算系数等。通过敏感性分析,确定成本效益评估结果的稳健性。综合考虑成本效益比、生态风险、社会可接受性等因素,对不同管理方案进行优选。可采用多准则决策方法,如TOPSIS、PROMETHEE等,权衡各方案的优劣。
由于功能复苏预测模型和生态保护目标等内容可以采用现有技术实现,故未做详细描述。基本流程为构建目标函数和约束条件,采用遗传算法等方法求解,最后通过TOPSIS方法优选和决策。
根据本申请的另一个方面,还提供一种强人类干扰河湖生态结构与功能复苏评价系统,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现上述任一项技术方案所述的强人类干扰河湖生态结构与功能复苏评价方法。
需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合。为了避免不必要的重复,本发明对各种可能的组合方式不再另行说明。

Claims (7)

1.强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,包括如下步骤:
步骤S1、确定研究区域,采集研究区域内的原始研究数据并预处理,得到符合预定标准的基础数据;所述原始研究数据包括DEM数据、河网数据、水文生态数据和人类干扰活动数据;
步骤S2、基于基础数据,挖掘人类干扰活动模式,并进行人类干扰活动对河湖生态结构影响的聚类分析,输出分析结果;
步骤S3、基于分析结果,定量评估计算人类干扰对河湖生态结构的影响,获得评估数据;
步骤S4、调用预构建功能复苏预测模型,基于评估数据进行模拟并输出功能复苏目标和解决方案;
所述步骤S2进一步为:
步骤S21、基于时空立方体数据,挖掘人类干扰模式并进行聚类,获得聚类结果;
步骤S22、采用时变聚类算法计算河网在不同时段的拓扑变化,并进行模式分析;基于模式分析结果,采用Ullmann算法在综合数据集中识别出受人类干扰活动的子图结构,形成受干扰子图集合,通过节点指标逐一对受干扰子图进行定量分析,计算人类干扰对河网拓扑的影响程度,获得人类影响数据;
步骤S23、构建ARMA模型,对人类干扰活动的时间序列和干扰活动空间分布进行分析,获得时空分布数据,并挖掘人类干扰活动的因果关系;
步骤S24、步骤S21至S23的聚类结果、影响数据、时空分布数据和因果关系作为分析结果输出;
所述步骤S3进一步为:
步骤S31、调取分析结果和基础数据,构建物种共现网络和互作网络,对共现网络和互作网络进行社团划分,并评估社团结构的显著性,以及计算共现网络和互作网络的连通性指标和中心性指标;
步骤S32、针对种群生态网络,包括共现网络和互作网络,基于生态学网络分析方法,分析每类人类干扰活动对生态系统结构的影响,计算物种多样性指数、群落相似性、空间自相关和时间周转率;
步骤S33、调用自适应采样算法计算每类人干扰类活动的时空影响序列数据,获得时空分布特征数据;分析并计算河网拓扑变化对生态过程的影响数据;
步骤S34、基于时空分布特征数据,采用Shapley法评估人类干扰活动的影响贡献,采用Sobol指数分析评估全局敏感性;获得评估数据并输出;
所述步骤S4进一步为:
步骤S41、调用预构建功能复苏预测模型,对干扰情景的生态风险、景观连通性和生态恢复力进行评估;
步骤S42、输入设定的生态保护目标,评估人类干扰活动对河湖生态结构的影响参数,给出解决方案集合。
2.如权利要求1所述的强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,所述步骤S1进一步为:
步骤S11、采集或调用原始研究数据并清洗、标准化和配准,包括:采用孤立森林算法进行数据清洗,去除常量指标,采用Z-score标准化方法进行标准化,以不同数据源之间的联合熵为优化目标,搜索最优数据配准参数;
步骤S12、读取标准化后的水生态数据,采用因子分析法进行数据降维;
步骤S13、读取DEM数据并采用Mapper方法计算地形拓扑特征的显著性;
步骤S14、读取DEM和河网数据,提取并分析河网拓扑,获得基本河网拓扑、时变河网拓扑和河网拓扑分形维度数据;
步骤S15、读取人类干扰活动数据,并采用自适应网格划分方法转化为不同尺度的时空立方体数据,并对不同来源的时空立方体数据进行重采样,使其具有一致的时空分辨率;
步骤S16、将步骤S12至步骤S15输出的数据存储在预定位置,形成基础数据集合。
3.如权利要求2所述的强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,步骤S21具体为:
步骤S211、将时空立方体数据重构为二维的干扰矩阵,行代表时空位置,列代表干扰强度,对矩阵进行非负化处理;
步骤S212、采用交替最小二乘算法,将干扰矩阵分解为干扰模式矩阵和活动强度矩阵的乘积,引入L1正则化项,获得稀疏的干扰模式矩阵;
步骤S213、将干扰模式矩阵进行归一化处理,将每个样本在各个干扰模式上的隶属度转化为概率分布,根据最大概率原则,将每个样本划分到概率最大的聚类中,得到聚类结果。
4.如权利要求3所述的强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,所述步骤S12具体为:
步骤S121、读取标准化后的水生态数据,计算协方差矩阵,使用最大似然法对观测数据的协方差矩阵进行分解,估计初始因子载荷矩阵和特殊方差,通过迭代计算,不断更新公共方差估计值,直至达到收敛条件,得到最终的因子载荷矩阵;
步骤S122、对初始因子载荷矩阵进行Promax斜交旋转,通过旋转,使每个因子在预定M指标上有高于预设值的载荷,在其他指标上的载荷小于预设值;
步骤S123、基于旋转后的因子载荷矩阵,计算每个样本在各个因子上的得分;构建并评估因子分析模型的拟合优度和因子的可靠性,实现数据降维。
5.如权利要求3所述的强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,所述步骤S23具体为:
步骤S231、读取人类干扰活动数据和人类影响数据,采用ADF方法对人类干扰活动强度的时间序列进行平稳性检验;对人类干扰活动强度的时间序列进行傅里叶变换和小波变换,获取频域特性,提取周期成分;
步骤S232、构建ARMA模型,选择最优的ARMA模型阶数,使用最大似然估计或条件最小二乘法拟合模型参数;
步骤S233、对干扰模式矩阵进行中心化处理,减去每一列的均值,对数据进行标准化,使其具有零均值和单位方差;
步骤S234、使用高斯核函数将干扰模式矩阵映射到高维特征空间,在高维特征空间进行主成分分析,提取非线性主成分;基于主成分分析结果构建主成分得分矩阵,基于基础数据,构建原始空间位置矩阵;
步骤S235、对主成分得分矩阵和原始空间位置矩阵进行奇异值分解,获得它们在公共低维空间的嵌入表示信息;根据主成分得分,对干扰活动在空间上的分布模式进行可视化;
步骤S236、读取人类干扰活动数据,对不同人类干扰活动强度的时间序列进行格兰杰因果检验,计算不同时滞下的条件互信息,判断两两活动间的因果关系;对人类干扰活动强度序列进行核化,计算不同人类干扰活动间的偏相关系数,剔除其他人类干扰活动的影响,使用置换检验,评估偏相关的显著性;
步骤S237、基于显著的因果关系构建干扰活动的因果网络;采用Lasso正则化,优化因果网络结构;基于因果网络挖掘人类干扰活动的因果关系。
6.如权利要求1所述的强人类干扰河湖生态结构与功能复苏评价方法,其特征在于,所述步骤S34进一步为:
步骤S341、读取时空分布特征数据,并构建所有可能的人类干扰活动组合,计算每种人类干扰组合下生态过程的效用值;对每个人类干扰活动,计算其在所有组合中的边际贡献,采用蒙特卡洛采样,随机生成活动组合序列,估计Shapley值的数学期望;根据Shapley值大小,对不同干扰活动的影响贡献进行排序;
步骤S342、构建并从人类干扰活动因子的多维参数空间中,采用Sobol序列采样方法生成参数样本集,将采样得到的参数样本输入生态过程模型,模拟每个样本下的生态响应,计算模生态过程型输出的均值和方差;
步骤S343、基于方差分解原理,计算一阶Sobol指数和总阶Sobol指数;根据Sobol指数大小,对人类活动干扰因子的重要性进行排序。
7.一种强人类干扰河湖生态结构与功能复苏评价系统,其特征在于,包括:
至少一个处理器;以及,
与至少一个所述处理器通信连接的存储器;其中,
所述存储器存储有可被所述处理器执行的指令,所述指令用于被所述处理器执行以实现权利要求1至6任一项所述的强人类干扰河湖生态结构与功能复苏评价方法。
CN202410684832.3A 2024-05-30 2024-05-30 强人类干扰河湖生态结构与功能复苏评价方法及系统 Active CN118260538B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410684832.3A CN118260538B (zh) 2024-05-30 2024-05-30 强人类干扰河湖生态结构与功能复苏评价方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410684832.3A CN118260538B (zh) 2024-05-30 2024-05-30 强人类干扰河湖生态结构与功能复苏评价方法及系统

Publications (2)

Publication Number Publication Date
CN118260538A CN118260538A (zh) 2024-06-28
CN118260538B true CN118260538B (zh) 2024-08-06

Family

ID=91606025

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410684832.3A Active CN118260538B (zh) 2024-05-30 2024-05-30 强人类干扰河湖生态结构与功能复苏评价方法及系统

Country Status (1)

Country Link
CN (1) CN118260538B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN118709123B (zh) * 2024-08-28 2024-11-05 水利部交通运输部国家能源局南京水利科学研究院 流域水生态产品时空动态模拟评估方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112613664A (zh) * 2020-12-25 2021-04-06 武汉理工大学 基于水上交通事故风险预测与评估的预警方法和系统
CN113269384A (zh) * 2021-02-26 2021-08-17 河海大学 一种对河流系统健康状态进行预警的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005196752A (ja) * 2003-12-10 2005-07-21 Hiroshi Sato 社会、経済、市場における現象の可視化手段、モデル化手段、シミュレーション手段、及び分析手段。並びに社会を自律的に理解する機械或いは計算機の実現手段
CN116630122B (zh) * 2023-07-24 2023-09-19 水利部交通运输部国家能源局南京水利科学研究院 基于水文-生态响应关系的湖泊生态水力调控方法及系统

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112613664A (zh) * 2020-12-25 2021-04-06 武汉理工大学 基于水上交通事故风险预测与评估的预警方法和系统
CN113269384A (zh) * 2021-02-26 2021-08-17 河海大学 一种对河流系统健康状态进行预警的方法

Also Published As

Publication number Publication date
CN118260538A (zh) 2024-06-28

Similar Documents

Publication Publication Date Title
Nie et al. A novel hybrid model based on combined preprocessing method and advanced optimization algorithm for power load forecasting
Dias et al. Concept lattices reduction: Definition, analysis and classification
Luo et al. Air pollutant prediction based on ARIMA-WOA-LSTM model
Park et al. Hierarchical community classification and assessment of aquatic ecosystems using artificial neural networks
Chai et al. A decomposition–integration model with dynamic fuzzy reconstruction for crude oil price prediction and the implications for sustainable development
Dalal et al. Improving scenario discovery using orthogonal rotations
CN111785329A (zh) 基于对抗自动编码器的单细胞rna测序聚类方法
Khayatian et al. Building energy retrofit index for policy making and decision support at regional and national scales
CN118260538B (zh) 强人类干扰河湖生态结构与功能复苏评价方法及系统
Represa et al. Data mining paradigm in the study of air quality
CN117078114B (zh) 引水工程影响下受水湖泊水质评价方法和系统
Garai et al. Development of MCS based-ensemble models using CEEMDAN decomposition and machine intelligence
CN117808214A (zh) 水利工程数据分析系统
Bolorunduro et al. Community detection on multi-layer graph using intra-layer and inter-layer linkage graphs (cdmiilg)
Mal-Sarkar et al. Spatio-temporal pattern discovery in sensor data: a multivalued decision systems approach
Wang et al. Multiple imputation of maritime search and rescue data at multiple missing patterns
de Almeida et al. A case study on environmental sustainability: A study of the trophic changes in fish species as a result of the damming of rivers through clustering analysis
Diallo et al. Deciphering Clusters With a Deterministic Measure of Clustering Tendency
Parnika et al. Performance Analysis of Machine Learning Algorithms to Predict Water Potability
Cheng et al. A Pattern Discovery Approach to Multivariate Time Series Forecasting
Sahu et al. Spatio-temporal Bayesian modeling of precipitation using rain gauge data from the Hubbard Brook Experimental Forest, New Hampshire, USA
Mishra Data Science and Interdisciplinary Research: Recent Trends and Applications
Javed Cluster Analysis of Time Series Data with Application to Hydrological Events and Serious Illness Conversations
Lander Multi-objective graph mining algorithms for detecting and predicting communities in complex dynamic networks
Wu et al. Variation-Incentive Loss Re-weighting for Regression Analysis on Biased Data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant