CN112215299A - 一种水文气象空间数据均值估计的块状自举方法 - Google Patents
一种水文气象空间数据均值估计的块状自举方法 Download PDFInfo
- Publication number
- CN112215299A CN112215299A CN202011158557.XA CN202011158557A CN112215299A CN 112215299 A CN112215299 A CN 112215299A CN 202011158557 A CN202011158557 A CN 202011158557A CN 112215299 A CN112215299 A CN 112215299A
- Authority
- CN
- China
- Prior art keywords
- sample
- block
- hydrometeorological
- mean
- sample set
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000005070 sampling Methods 0.000 claims abstract description 22
- 238000012952 Resampling Methods 0.000 claims description 16
- 230000008929 regeneration Effects 0.000 claims description 5
- 238000011069 regeneration method Methods 0.000 claims description 5
- 230000002596 correlated effect Effects 0.000 abstract description 4
- 230000001419 dependent effect Effects 0.000 abstract description 2
- 238000001556 precipitation Methods 0.000 description 33
- 238000010586 diagram Methods 0.000 description 5
- 230000001932 seasonal effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000875 corresponding effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
- G06N20/20—Ensemble learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
技术领域
本发明涉及水文气象技术领域,更具体的,涉及一种水文气象空间数据均值估计的块状自举方法。
背景技术
水文气象变量(如降雨量、气温、蒸散发和辐射等)具有复杂的空间变异性和非平稳性,因此对区域水文气象变量的面平均值进行统计推断以及定量描述其由空间相关性带来的不确定性的难度比较大。目前通常采用自举法(Bootstrap)模拟均值的抽样统计推断。自举法以原始数据为基础,通过重采样扩充样本容量,从而得到样本均值序列的经验分布。但是自举法要求各样本间独立同分布,而对于水文气象变量这类空间相关、非独立同分布样本,使用自举法处理时会失效。
现有技术中,如2019年07月12日公告的中国专利,水文气象要素空间插值最优分辨率的确定方法,公告号为CN106340018B,通过选择最优分辨率,使获得的空间插值结果图像包含的有效数据最大化,更具参考使用价值,但没有解决使用自举法处理水文气象变量这类空间相关、非独立同分布样本时会失效的问题。
发明内容
本发明为克服目前使用自举法处理水文气象变量这类空间相关、非独立同分布样本时会失效的技术缺陷,提供一种水文气象空间数据均值估计的块状自举方法。
为解决上述技术问题,本发明的技术方案如下:
一种水文气象空间数据均值估计的块状自举方法,包括以下步骤:
S1:从观测区域获取N个水文气象空间数据点的信息,形成样本集合X={x1,x2,...,xN};其中,样本xi为第i个水文气象空间数据点的信息,i=1,2,…,N;
S2:在样本集合中对样本进行B次块状自举抽样,得到B组重抽样样本集合;
上述方案中,考虑到了水文气象空间数据内部存在相依性的特征,通过块状自举抽样,保证一定范围内的水文气象空间数据点作为一整块进行抽取,避免了破坏数据本身的相依结构,从而避免自举法失效。
优选的,在步骤S1中,获取的水文气象空间数据点的信息为水文气象空间数据点的坐标。
优选的,水文气象空间数据点的坐标为经纬度坐标。
优选的,在步骤S2中,块状自举抽样包括以下步骤:
S2.1:设定搜索半径r;
S2.2:从样本集合中随机选取一个样本,以所选取的样本的坐标为中心,将落于其搜索范围内的样本以及所选取的样本纳入再生样本集合;
S2.3:判断再生样本集合中的样本数量是否超过N;
若不超过,则返回步骤S2.2。
优选的,在步骤S2.2中,按照每个样本等概率的原则从样本集合中随机选取一个样本。
优选的,每个样本被选取的概率为
优选的,在步骤S2.2中,通过将样本i与所选取的样本j之间的距离dij和搜索半径r进行比较,从而判断出样本i是否落于样本j的搜索范围内;
若距离dij小于等于搜索半径r,则样本i落于样本j的搜索范围内;
否则,样本i未落于样本j的搜索范围内。
优选的,通过欧几里得法计算样本i与样本j之间的距离dij,计算公式为:
其中,ui为样本i的经度坐标,vi为样本i的纬度坐标;uj为样本j的经度坐标,vj为样本j的纬度坐标。
优选的,在步骤S3中,对重抽样样本集合进行均值估计的计算公式为:
优选的,在步骤S3中,得到估计均值序列后,还包括根据估计均值序列对样本集合的均值进行区间估计。
与现有技术相比,本发明技术方案的有益效果是:
本发明提供了一种水文气象空间数据均值估计的块状自举方法,考虑到了水文气象空间数据内部存在相依性的特征,通过块状自举抽样,保证一定范围内的水文气象空间数据点作为一整块进行抽取,避免了破坏数据本身的相依结构,从而避免自举法失效。
附图说明
图1为本发明中实施例1的技术方案实施步骤流程图;
图2为本发明中实施例1的块状自举抽样的步骤流程图;
图3为本发明中实施例2的四个季节多年平均降水空间分布图;
图4为本发明中实施例2的由普通自举法获得的澳大利亚/新西兰面平均降水区间估计图;
图5为本发明中实施例2的由普通自举法获得的南美洲东南部面平均降水区间估计图;
图6为本发明中实施例2的由所述的一种水文气象空间数据均值估计的块状自举方法获得的澳大利亚/新西兰面平均降水区间估计图;
图7为本发明中块状自举法获得的南美洲东南部面平均降水区间估计图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种水文气象空间数据均值估计的块状自举方法,包括以下步骤:
S1:从观测区域获取N个水文气象空间数据点的信息,形成样本集合X={x1,x2,...,xN};其中,样本xi为第i个水文气象空间数据点的信息,i=1,2,…,N;
S2:在样本集合中对样本进行B次块状自举抽样,得到B组重抽样样本集合;
在具体实施过程中,考虑到了水文气象空间数据内部存在相依性的特征,通过块状自举抽样,保证一定范围内的水文气象空间数据点作为一整块进行抽取,避免了破坏数据本身的相依结构;对于基于半径范围搜索的重抽样样本,可以应用独立同分布的自举法进行均值估计。
更具体的,在步骤S1中,获取的水文气象空间数据点的信息为水文气象空间数据点的坐标。
更具体的,水文气象空间数据点的坐标为经纬度坐标。
更具体的,如图2所示,在步骤S2中,块状自举抽样包括以下步骤:
S2.1:设定搜索半径r;
S2.2:从样本集合中随机选取一个样本,以所选取的样本的坐标为中心,将落于其搜索范围内的样本以及所选取的样本纳入再生样本集合;
S2.3:判断再生样本集合中的样本数量是否超过N;
若不超过,则返回步骤S2.2。
在具体实施过程中,每次块状自举抽样得到一组重抽样样本集合,通过重复进行B次块状自举抽样,对应得到B组重抽样样本集合。
更具体的,在步骤S2.2中,按照每个样本等概率的原则从样本集合中随机选取一个样本。
更具体的,每个样本被选取的概率为
更具体的,在步骤S2.2中,通过将样本i与所选取的样本j之间的距离dij和搜索半径r进行比较,从而判断出样本i是否落于样本j的搜索范围内;
若距离dij小于等于搜索半径r,则样本i落于样本j的搜索范围内;
否则,样本i未落于样本j的搜索范围内。
更具体的,通过欧几里得法计算样本i与样本j之间的距离dij,计算公式为:
其中,ui为样本i的经度坐标,vi为样本i的纬度坐标;uj为样本j的经度坐标,vj为样本j的纬度坐标。
更具体的,在步骤S3中,对重抽样样本集合进行均值估计的计算公式为:
更具体的,在步骤S3中,得到估计均值序列后,还包括根据估计均值序列对样本集合的均值进行区间估计。
实施例2
本实施例2基于实施例1的方法进行实验,以美国气候预测中心(CPC)1982-2010全球季节网格降水数据为例,计算不同季节降水1982-2010多年平均降水,并计算全球不同分区多年平均降水的面平均值。
图3给出了北半球冬、春、夏和秋季(分别表示为DJF、MAM、JJA和SON)下1982-2010多年平均降水空间分布图。图中可以看到季节降水分布呈现明显的空间相关性和季节性。DJF期间,全球雨带主要分布在南半球,其中澳大利亚北部、菲律宾、印度尼西亚、南美洲中部、非洲中部等区域降雨量较大。由DJF到MAM和JJA,雨带逐渐北移。JJA期间,东亚及南亚一带、美洲中部、非洲中部一带降雨量大。引入政府间气候变化专门委员会(Intergovernmental Panel on Climate Change)第五次评估报告参考区域,对比不同区域多年平均季节降雨特点。参考区域位置在图3中以黑色框线标识,每个区域以不同数据标记区分。
对于每一个子区域,区域面平均降水计算如下
其中,Pi为网格i的观测多年平均降水量,N为该区域网格总数。
首先采用普通自举法估计区域面平均降雨分布区间。对于每个区域,又放回的抽取N个数据点,并计算均值,重复1000次,获得一组区域面平均降水序列,构成经验分布,用于面平均降水置信区间估计。图4给出了基于普通自举法的澳大利亚/新西兰陆地降水面平均降水区间估计,其对应的区域在图3中标识为区域26。图中,红色原点表示观测多年平均降水的面平均值,深蓝色区间表示估计的50%置信区间,浅蓝色表示估计的80%置信区间。图中可以看到,澳大利亚/新西兰陆地降水存在很强的季节性,在DJF期间,季节面平均降水超过250mm,而MAM、JJA和SON降水整体偏低。此外,四个季节的降水量区间均较窄,特别是JJA和SON两个季节。对比图3可以看到,在JJA和SON两个季节,澳大利亚/新西兰一带降水空间分布均匀,整体偏低。类似的,图5给出了南美洲东南部区域四个季节面平均降水的区间估计值,其在图3中对应于区域10。相比于澳大利亚/新西兰区域,南美洲东南部区域降水整体季节性较弱,四个季节观测值差距效于50mm。整体上,DJF和MAM降水偏多,JJA和SON降水较低。
然后采用本发明提供的一种水文气象空间数据均值估计的块状自举方法对面平均降水进行区间估计。预设搜索半径为5°,半径搜索邻近网格累积样本点的方法进行重抽样。图6给出了基于本发明提供的一种水文气象空间数据均值估计的块状自举方法估计的澳大利亚/新西兰区域面平均降水区间估计。可以明显看到,四个季节估计的区间范围相比普通自举法更大。尤其是DJF,面平均降水80%区间超过100mm,对比图3空间分布图,在DJF期间,澳大利亚北部呈现明显雨带,由北至南降雨量呈递减的趋势,降雨出现强烈的空间相依性特征。而普通自举法基于所有数据点进行重抽样,强烈的空间相依性导致其估计失效,无法估计出当地面平均降水存在的分布范围。图7给出了南美洲东南部区域基于本发明提供的一种水文气象空间数据均值估计的块状自举方法抽样估计的面平均降水区间。相比图5,四个季节整体降水区间增大,尤其是JJA,80%区间超过100mm。
以上实验结果表明,本发明提供的一种水文气象空间数据均值估计的块状自举方法可以有效考虑空间数据的多维度、不规则以及自相关的特点。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (10)
2.根据权利要求1所述的一种水文气象空间数据均值估计的块状自举方法,其特征在于,在步骤S1中,获取的水文气象空间数据点的信息为水文气象空间数据点的坐标。
3.根据权利要求2所述的一种水文气象空间数据均值估计的块状自举方法,其特征在于,水文气象空间数据点的坐标为经纬度坐标。
5.根据权利要求4所述的一种水文气象空间数据均值估计的块状自举方法,其特征在于,在步骤S2.2中,按照每个样本等概率的原则从样本集合中随机选取一个样本。
7.根据权利要求4所述的一种水文气象空间数据均值估计的块状自举方法,其特征在于,在步骤S2.2中,通过将样本i与所选取的样本j之间的距离dij和搜索半径r进行比较,从而判断出样本i是否落于样本j的搜索范围内;
若距离dij小于等于搜索半径r,则样本i落于样本j的搜索范围内;
否则,样本i未落于样本j的搜索范围内。
10.根据权利要求1所述的一种水文气象空间数据均值估计的块状自举方法,其特征在于,在步骤S3中,得到估计均值序列后,还包括根据估计均值序列对样本集合的均值进行区间估计。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158557.XA CN112215299B (zh) | 2020-10-26 | 2020-10-26 | 一种水文气象空间数据均值估计的块状自举方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011158557.XA CN112215299B (zh) | 2020-10-26 | 2020-10-26 | 一种水文气象空间数据均值估计的块状自举方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112215299A true CN112215299A (zh) | 2021-01-12 |
CN112215299B CN112215299B (zh) | 2023-08-15 |
Family
ID=74055269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011158557.XA Active CN112215299B (zh) | 2020-10-26 | 2020-10-26 | 一种水文气象空间数据均值估计的块状自举方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112215299B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023220934A1 (zh) * | 2022-05-17 | 2023-11-23 | 中山大学 | 一种水文气象集合预报偏差及可靠度的判别方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820774A (zh) * | 2015-04-16 | 2015-08-05 | 同济大学 | 一种基于空间复杂性的图幅抽样方法 |
CN108830419A (zh) * | 2018-06-15 | 2018-11-16 | 武汉大学 | 一种基于ecc后处理的梯级水库群入库流量联合预报方法 |
CN109241147A (zh) * | 2018-10-22 | 2019-01-18 | 上海工程技术大学 | 一种用于评估统计值变异性的方法 |
CN110008568A (zh) * | 2019-03-29 | 2019-07-12 | 中国人民解放军战略支援部队航天工程大学 | 小样本下装备平均修复时间的非统计估计模型 |
CN110795473A (zh) * | 2019-11-13 | 2020-02-14 | 哈尔滨工业大学 | 一种基于自举法的加速搜索方法 |
CN111310889A (zh) * | 2020-01-16 | 2020-06-19 | 西北工业大学 | 一种基于深度神经网络的蒸发波导剖面估计方法 |
-
2020
- 2020-10-26 CN CN202011158557.XA patent/CN112215299B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104820774A (zh) * | 2015-04-16 | 2015-08-05 | 同济大学 | 一种基于空间复杂性的图幅抽样方法 |
CN108830419A (zh) * | 2018-06-15 | 2018-11-16 | 武汉大学 | 一种基于ecc后处理的梯级水库群入库流量联合预报方法 |
CN109241147A (zh) * | 2018-10-22 | 2019-01-18 | 上海工程技术大学 | 一种用于评估统计值变异性的方法 |
CN110008568A (zh) * | 2019-03-29 | 2019-07-12 | 中国人民解放军战略支援部队航天工程大学 | 小样本下装备平均修复时间的非统计估计模型 |
CN110795473A (zh) * | 2019-11-13 | 2020-02-14 | 哈尔滨工业大学 | 一种基于自举法的加速搜索方法 |
CN111310889A (zh) * | 2020-01-16 | 2020-06-19 | 西北工业大学 | 一种基于深度神经网络的蒸发波导剖面估计方法 |
Non-Patent Citations (1)
Title |
---|
苗青;付忠良;赵向辉;徐可佳;: "基于CUDA的并行改良随机抽样一致性算法", 四川大学学报(工程科学版), no. 04, pages 1 - 5 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023220934A1 (zh) * | 2022-05-17 | 2023-11-23 | 中山大学 | 一种水文气象集合预报偏差及可靠度的判别方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN112215299B (zh) | 2023-08-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Mastrandrea et al. | Bridging the gap: linking climate-impacts research with adaptation planning and management | |
Kyselý et al. | Comparison of regional and at‐site approaches to modelling probabilities of heavy precipitation | |
WO2022011728A1 (zh) | 一种面向遥相关模式的空间自相关聚类方法 | |
CN109360421B (zh) | 一种基于机器学习的交通信息预测方法及装置、电子终端 | |
WO2021051863A1 (zh) | 水位预警监控方法、装置、存储介质及电子设备 | |
CN113505521B (zh) | 一种耦合神经网络-数值模拟的城市内涝快速预报方法 | |
CN112395557A (zh) | 一种基于瞬时发展速率识别骤发干旱的方法 | |
Deni et al. | The best probability models for dry and wet spells in Peninsular Malaysia during monsoon seasons | |
CN113807301A (zh) | 一种新增建设用地自动提取方法及自动提取系统 | |
CN112215299A (zh) | 一种水文气象空间数据均值估计的块状自举方法 | |
Bariotakis et al. | Environmental (in) dependence of a hybrid zone: Insights from molecular markers and ecological niche modeling in a hybrid zone of Origanum (Lamiaceae) on the island of Crete | |
CN113917568B (zh) | 一种基于确定性系数的降水预报能力与遥相关作用关联方法 | |
Gavrutenko et al. | Temporal matching of occurrence localities and forest cover data helps improve range estimates and predict climate change vulnerabilities | |
CN104240237A (zh) | 一种灾区毁坏程度估计的方法和装置 | |
Bonta et al. | Cumulative storm rainfall distributions: comparison of Huff curves | |
CN114154680A (zh) | 一种城市地面塌陷预测方法、装置及电子设备 | |
CN117171533B (zh) | 一种地理测绘作业数据实时采集处理方法及系统 | |
CN113988222A (zh) | 一种基于Faster-RCNN的森林火灾检测与识别方法 | |
CN111737639A (zh) | 一种1-范数和2-范数混合的时变图信号分布式修复方法 | |
Fan et al. | Assessment of Central Asian heat extremes by statistical downscaling: Validation and future projection for 2015‒2100 | |
CN113837668B (zh) | 一种极端气候事件辨识方法和系统 | |
CN109118497A (zh) | 确定图形的方法及装置、存储介质和处理器 | |
Singh et al. | The Changing Face of Urbanization, Population Expansion, and its Driving Forces: a Case Study of an Indian City | |
Khan et al. | Analysis of forest cover change and its environmental impact in Kupwara region of Jammu and Kashmir through remote sensing. | |
Matsika | Land-cover change: Threats to the grassland biome of South Africa |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |