Nothing Special   »   [go: up one dir, main page]

CN104750799A - 一种基于地址解析数据的建设用地类型快速识别方法 - Google Patents

一种基于地址解析数据的建设用地类型快速识别方法 Download PDF

Info

Publication number
CN104750799A
CN104750799A CN201510128347.9A CN201510128347A CN104750799A CN 104750799 A CN104750799 A CN 104750799A CN 201510128347 A CN201510128347 A CN 201510128347A CN 104750799 A CN104750799 A CN 104750799A
Authority
CN
China
Prior art keywords
land
data
unit
character
construction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510128347.9A
Other languages
English (en)
Other versions
CN104750799B (zh
Inventor
赵渺希
郭振松
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN201510128347.9A priority Critical patent/CN104750799B/zh
Publication of CN104750799A publication Critical patent/CN104750799A/zh
Priority to PCT/CN2016/082559 priority patent/WO2016150407A1/zh
Priority to SG11201707620RA priority patent/SG11201707620RA/en
Application granted granted Critical
Publication of CN104750799B publication Critical patent/CN104750799B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于地址解析数据的建设用地类型快速识别方法,包括下述步骤:S1、利用现有开放平台的地址解析工具对所挖掘的各项数据进行地址解析;S2、对传统数据进行地址解析,获取其地理信息;S3、基于地址解析数据的类型和特征,通过各类数据的综合评价实现对各类建设用地的功能强度测定和用地性质的综合评价;S4、在建设用地功能强度测定和用地性质的综合评价之后,对生成的用地类型划分图分别进行用地识别率和用地识别准确率的判断,当它同时满足这两个要求时即可判定基于地址解析数据的建设用地类型快速识别完成。本发明与传统的实地勘察和调研进行绘制现状用地性质分析图相比,大大缩减了时间成本和人力成本。

Description

一种基于地址解析数据的建设用地类型快速识别方法
技术领域
本发明涉及城市建设用地的研究领域,特别涉及一种基于地址解析数据的建设用地类型快速识别方法。
背景技术
伴随着新信息技术的快速发展,大数据时代的降临已经改变了城市生活,同时也推动了城市规划技术的发展。近年来,社会活动产生数据快速增长,例如微博数据、手机数据、公交卡数据、图片数据、百度数据等为城市规划提供了更多的计算机数据支持。国内外学者已经对如何将这些数据应用到城市规划中做了一些尝试。Steven(2001)利用人口普查中的住房数据对土地利用和开放空间设施的布局进行了研究;Mark(2010)利用基于报纸数据进行文本分析,对土地利用和社会变化的关系进行了探究;Rob(2013)基于Flickr图片数据对地理类型聚类特征进了研究;王树亮(2001)利用GPS数据和网络数据分析了城市和乡村区域的土地使用情况;钮心毅(2008)依托GIS技术通过分析资源、环境和经济数据进行土地利用的情景模拟,提出了一种功能分区规划方案生成的方法;刘耀林(2010)利用基础统计数据和空间数据进行用地适宜性评价,提出了一种土地利用分区和布局的方法;陶佩(2014)利用手机数据的呼叫量和通话量对社会功能与用地性质划分的关系进行了研究。在大数据时代,多样的互联网数据是城市功能的直接反映,利用这些数据对城市功能和用地性质的研究将有助于提升城市规划的层次,并且丰富规划技术的手段。但是上述技术方案仍然不能很好的解决建设用地的快速识别。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于地址解析数据的建设用地类型快速识别方法。
为了到达上述目的,本发明采用以下技术方案:
一种基于地址解析数据的建设用地类型快速识别方法,其特征在于,包括下述步骤:
S1、研究数据的挖掘,利用现有开放平台的地址解析工具对所挖掘的各项数据进行地址解析,并通过GIS系统将网络数据和传统数据统一空间落位和坐标校正,进行分类用地的功能强度测定和用地性质的综合评定;
S2、对传统数据进行地址解析,获取其地理信息;
S3、基于地址解析数据的类型和特征,通过各类数据的综合评价实现对各类建设用地的功能强度测定和用地性质的综合评价,具体包括:
S3.1、各类建设用地的功能强度测定,在现状道路网的基础上,以道路中心线划分的街块单元作为各类数据的空间落位单元,在GIS系统中分别统计空间单元内不同用地性质的设施数量,首先针对各类用地性质中对不同数据源采取熵值赋权法进行归一化处理和权重计算,然后按照不同数据源之间的权重进行标准值叠加,最后通过计算单元汇总的标准值与空间单元面积的比值得到各类用地性质的功能强度分布情况;
S3.2、各类建设用地性质的综合评定,在获得各类用地功能强度测定的基础上,将空间单元内各类用地功能强度高于平均值0.5个标准差的用地功能定义为该空间单元的显著功能;
S4、在建设用地功能强度测定和用地性质的综合评价之后,对生成的用地类型划分图分别进行用地识别率和用地识别准确率的判断,当它同时满足这两个要求时即可判定基于地址解析数据的建设用地类型快速识别完成。
优选的,步骤S1中是基于新浪开放平台的用地识别数据获取和/或基于百度LBS开放平台的用地识别数据获取;
S1.1、基于新浪开放平台的用地识别数据获取的具体步骤为:
S1.1.1、根据要求填写新浪微博微博开放平台相关网页信息,获取App Key和App Secret;
S1.1.2、登陆新浪微博开放平台数据获取界面,输入数据获取所需的参数,点击调用接口,得到返回结果;
S1.1.3、选择地理信息接口中的place/nearby/pois接口,根据相关请求参数的要求编写URL请求,配置查询中心点的经纬度、查询范围、数据排序方式、单页返回记录条数、返回数据的起始和终止页数信息,并运用抓取新浪微博签到数据的Python工具批量获取所述数据;
S1.1.4、数据获取需要说明的是新浪开放平台有限时访问次数,数据获取中止是需等限制取消才能继续运行,将返回的数据进行编码格式转换之后,数据获取完成,其中,数据信息主要包括签到地址、分类及代码、签到数量、签到人数、经纬度、照片数量;
S1.2、基于百度LBS开放平台的用地识别数据获取;通过百度LBS开放平台的地址服务接口,结合Locoy Spider数据获取软件获取一定范围内的设施地理信息、设施名称、评论数量、评论分数,具体为:
S1.2.1、申请获取百度LBS开放平台API接口密钥;
S1.2.2、设置相关的URL请求参数;
S1.2.3、将配置好的URL请求参数在浏览器中打开,获取搜索对象的数量;
S1.2.4、将拼写合格的地址解析URL请求导入Locoy Spider工具,设置好采集标签和文本模板后开始对进行百度用地数据的获取,获取的数据信息包括设施名称、设施经纬度、地址、评论数量以及评分。
优选的,步骤S2中,通过百度LBS开放平台中的Geocoding API的服务功能,对传统数据进行地址解析,其具体方法为:
S2.1、申请获取百度LBS开放平台API接口密钥;
S2.2、根据相关的参数要求和获得的接口密钥,编写地址解析的URL请求;
S2.3、根据地址数据拼写地址解析的URL请求,并将拼写合格的地址解析URL请求存为TXT文本格式批量导入Locoy Spider工具,设置好采集标签和文本模板后开始利用LocoySpider工具对带有地址信息的数据进行批量地址坐标解析,从而得到其地理信息。
优选的,步骤S3.1中,各类建设用地的功能强度测定模型为:
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中的Hi为第i个单元的用地功能强度,αk为第k类数据要素的权重,Pik为第i个单元内第k类数据要素的标准值,Si为第i个单元的建设用地面积,其中i=1,2,…,m;k=1,2,…,n;具体如下:
S3.1.1、将各项数据要素标准化处理,假设第k项数据要素在空间单元i中的设施数量为βik,首先定义
f ik = ( β ik + 1 ) / Σ i = 1 m ( β ik + 1 ) - - - ( 2 )
式中:i=1,2,…,m;k=1,2,…,n;
由于当fik=0时,ln(fik)无意义,所以在计算标准值Pik时需对fik进行修正,进而得到重新定义的各单元内不同要素的标准值Pik
Pik=fik·ln(fik)   (3)
S3.1.2、根据熵权法确定各类数据要素的权重;
首先定义第k要素的熵值为γk
γ k = - 1 ln ( m ) Σ i = 1 m ( P ik ) - - - ( 4 )
式中:(i=1,2,…,m;k=1,2,…,n);
利用上述修正后的熵值评价指标进而得到不同数据要素的权重:
α k = γ k / Σ k n γ k - - - ( 5 )
式中:(k=1,2,…,n);
S3.1.3、计算各单元的用地功能强度;
将上述计算得到各类数据要素的标准值Pik按照权重关系αk进行叠加计算,通过计算单元内各数据要素的标准值总和与单元建设用地面积Si的比值,得到各单元的用地功能强度,
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中:(i=1,2,…,m;k=1,2,…,n)。
优选的,各类建设用地的功能强度测定包括对居住功能强度测定、公共管理与公共服务设施的功能强度测定、商业服务业设施的功能强度测定、工业的功能强度测定、物流仓储的功能强度测定、道路与交通设施的功能强度测定、公用设施的功能强度测定以及绿地与广场的功能强度测定。
优选的,步骤S3.2中,各类建设用地性质的综合评定的具体方法为:
S3.2.1、合并用地,计算单元用地功能强度的平均值,
在八类用地功能强度的基础上,分别将公用设施和道路交通设施、工业和物流仓储设施进行归并,得到六类用地的功能强度Gik
计算六类用地的平均值:
Q i = Σ k = 1 6 G ik 6 - - - ( 6 )
式中:i=1,2,…,m;k=1,2,…,6;
S3.2.2、计算单元用地功能强度的标准差
δ i = 1 m Σ i = 1 m ( G ik - Q i ) 2 - - - ( 7 )
式中:i=1,2,…,m
S3.2.3、判断单元用地功能强度的显著性
R ik = G ik - Q i - 1 2 δ i - - - ( 8 )
式中:i=1,2,…,m;k=1,2,…,6
若Gik>0且Rik≥0,则判定单元内该类用地功能显著;反之,则不显著;
S3.2.4、用地性质的综合评定,在得到各单元用地性质显著性的基础上,根据用地主导功能、用地依从关系、用地兼容性以及航拍影像图方式对用地进行判定。
优选的,步骤S3.2.4中,所述判定如下:
居住用地:将单元内只有一种显著性用地功能、且为居住用地功能的单元判定为居住用地;
居住混合用地:将单元内有两种或两种以上显著性用地功能、且其中包含居住用地功能的单元判定为居住混合用地;
公共管理与公共服务设施用地:将单元内只有一种显著性用地功能、且为公共服务用地功能的单元判定为公共管理与公共服务设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为公共服务用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为公共管理与公共服务设施用地;
商业服务业设施用地:将单元内只有一种显著性用地功能、且为商业用地功能的单元判定为商业服务业设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为商业用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为商业服务业设施用地;
公共服务和商业混合用地:将单元内有两种显著性用地功能、且为公共服务用地功能和商业用地功能的单元判定为公共服务和商业混合用地;
绿地与广场用地:将单元内只有一种显著性用地功能、且为绿地与广场用地功能的单元判定为绿地与广场用地;此外,将单元内有两种或两种以上显著性用地功能、且为绿地与广场用地功能与工业仓储、市政道路用地功能混合的单元判定为绿地与广场用地;
工业仓储混合用地:将单元内只有一种显著性用地功能、且为工业用地功能或者物流仓储用地功能的单元判定为工业仓储混合用地;
公用设施与道路交通设施混合用地:将单元内只有一种显著性用地功能、且为公用设施用地功能或者道路交通设施用地功能的单元判定为公用设施与道路交通设施混合用地;
其他混合用地:将单元内有两种或两种以上显著性用地功能的其他单元判定为其他混合用地;
未能判别用地性质的用地:将没有显著性用地功能的单元判定为未能判别用地性质的用地。
优选的,城市建设用地性质识别率的校核方法为:
在城市各类建设用地性质的功能强度测定和用地性质综合评定的基础上,得到城市各类建设用地性质的综合评定图,分别统计未能判别用地性质的空间单元数量n和建设用地空间单元的数量m,计算建设用地性质的识别率:
θ = m - n m * 100 % - - - ( 9 )
若建设用地性质的识别率θ≥80%,则说明用地识别率合格;反之,则不合格,需重新划分空间单元或补充相关用地识别数据之后重新进行计算分析;
城市建设用地性质识别准确率的校核方法为:
在生成的建设用地性质划分图中划定一定的取样范围,其中取样范围的面积不应小于总建设用地面积的10%,通过第三方获取该范围的现状用地性质分布图,或者借助航拍影像图和电子卫星图来绘制该取样范围内的现状用地性质分布图,通过比较二者之间的重合面积来计算用地性质识别的准确率。
优选的,城市建设用地性质识别准确率的校核具体操作方法为:
(1)绘制取样范围现状用地
在GIS系统中新增“自绘用地类型”字段,区别于快速识别用地类型,并根据航拍影像图和电子影像图,在对应的空间单元录入用地属性,得到自绘现状用地分析图;
(2)统计重合用地单元,计算用地性质识别的准确率
在GIS系统中新增一个字段,将用地性质一致的空间单元标记为“K=0”,将用地性质不一致的空间单元标记为“K=1”,分别统计取样范围内用地单元的总面积和用地性质不一致的空间单元面积,通过计算取样范围内用地性质一致的面积与用地总面积的比值得到用地性质识别的准确率μ,具体计算公式为:
μ = Σ i = 1 m S i - Σ i = 1 m S i K i Σ i = 1 m S i * 100 % - - - ( 10 )
式中:(i=1,2,…,m);
定义当μ≥80%时,即可判定建设用地性质综合评定的准确率合格;反之,则不合格,需通过数据纠错或者校核的方式重新进行计算分析。
本发明与现有技术相比,具有如下优点和有益效果:
1、发明提供的是一种基于地址解析数据的建设用地类型快速识别方法,与传统的实地勘察和调研进行绘制现状用地性质分析图相比,大大缩减了时间成本和人力成本,提供了一种更为便捷、快速的现状用地类型识别方法。现实中,一块城市建设用地往往是多种功能的混合,而不是单一性质的用地,本方法在现行城市建设用地分类的基础上,提出了多种混合用地的概念,更加符合建设用地的实际承载功能。
2、本发明建立在地址解析数据的基础上完成的,建设用地性质识别的识别率和准确率与数据源密切相关。对于地址解析数据准确、丰富的城市或区域而言,能够对其建设用地性质实现快速识别;反之,对于数据缺失的区域则会有一定的瓶颈。同时,如何将这种研究方法运用到指导城市用地功能布局、城市用地混合方式等也有待进一步研究。
附图说明
图1是基于地址解析数据的建设用地性质快速识别方法的具体实现技术流程图;
图2是居住功能强度测定图;
图3是公共管理与公共服务设施的功能强度测定图;
图4是商业服务业设施的功能强度测定图;
图5是工业的功能强度测定图;
图6是物流仓储的功能强度测定图;
图7是道路与交通设施的功能强度测定图;
图8是公用设施的功能强度测定图;
图9是绿地与广场的功能强度测定图;
图10是建设用地性质综合划分图。
具体实施方式
下面结合实施例及附图对本发明作进一步详细的描述,但本发明的实施方式不限于此。
实施例
本发明是一种以城市(区域)边界、建设用地范围和现状道路网作为建设用地类型识别的工作底图,以网络开放的地址解析数据和传统的地址解析数据结合的方式,通过计算分析得到城市各类建设用地的功能强度测定和用地性质综合评定(如图1所示)。
本发明的最大特色在于利用地址解析数据实现了快速识别建设用地类型,其中包括了研究数据的挖掘、传统数据的地址解析、建设用地功能强度测定的计算分析方法、建设用地性质综合评定的计算分析方法以及建设用地性质的校核检验方式,具体包括如下步骤:
1、研究数据的挖掘
本发明以网络数据作为主要的数据来源,包括百度开放平台数据、新浪微博开放平台数据等,并辅以企业名录等数据以丰富数据来源。本发明根据最新的《城市用地分类与规划建设用地标准》,将城市建设用地分为居住用地(R)、公共管理与公共服务设施用地(A)、商业服务业设施用地(B)、工业用地(M)、物流仓储用地(W)、道路与交通设施用地(S)、公用设施用地(U)、绿地与广场用地(G)八类用地展开研究,并针对不同类型的用地分别选取不同的数据来源。本发明利用百度开放平台的地址解析工具对企业名录等数据进行地址解析,并通过GIS系统将网络数据和传统数据统一空间落位和坐标校正,进行分类用地的功能强度测定和用地性质的综合评定。
1.1、基于新浪开放平台的用地识别数据获取
通过新浪微博开放平台API数据服务中的微博接口和地理信息接口(http://open.weibo.com/wiki/2/place/nearby/pois),获取一定范围内微博签到点的地址信息、分类代码、签到数量等信息,具体操作步骤为:
(1)根据要求填写新浪微博微博开放平台相关网页信息,获取App Key和App Secret,此步骤不直接获取数据,但为数据获取权限的必要步骤。
(2)登陆新浪微博开放平台数据获取界面,输入数据获取所需的参数,点击调用接口,即可在得到返回结果。
(3)选择地理信息接口中的place/nearby/pois接口,根据相关请求参数的要求编写URL请求,配置查询中心点的经纬度、查询范围、数据排序方式、单页返回记录条数、返回数据的起始和终止页数等相关参数信息,并运用作者编写的抓取新浪微博签到数据的Python工具批量获取所需数据。
(4)数据获取需要说明的是新浪开放平台有限时访问次数,数据获取中止是需等限制取消才能继续运行。将返回的数据进行编码格式转换之后,数据获取完成。其中,数据信息主要包括签到地址、分类及代码、签到数量、签到人数、经纬度、照片数量等。
1.2、基于百度LBS开放平台的用地识别数据获取
通过百度LBS开放平台的地址服务接口,结合Locoy Spider数据获取软件获取一定范围内的设施地理信息、设施名称、评论数量、评论分数等。具体操作步骤为:
(1)申请获取百度LBS开放平台API接口密钥;
(2)设置相关的URL请求参数,包括密钥号码、搜索对象(如公园、KTV等)、矩形搜索范围的经纬度坐标(URL请求参数的示例为http://api.map.baidu.com/place/v2/search?ak=密钥号码&output=json&query=搜索对象&page_size=1&page_num=0&scope=2&bounds=坐标一,坐标二)。
(3)将配置好的URL请求参数在浏览器中打开,获取搜索对象的数量。需特别说明的是,受百度开放平台的接口限制,每次URL请求的搜索对象数量不能超过760条,一旦目标单元中的对象数量超过该值,则需缩小单元搜索范围。
(4)将拼写合格的地址解析URL请求导入Locoy Spider工具,设置好采集标签和文本模板后开始对进行百度用地数据的获取,获取的数据信息包括设施名称、设施经纬度、地址、评论数量、评分等。
2、传统数据的地址解析
通过百度LBS开放平台中的Geocoding API的服务功能,对企业名录等传统数据进行地址解析,获取其地理信息。需要特别说明的是,获取的地址解析信息存在一定的偏差,在后期数据的空间落位的过程中需要进行筛选和纠正。具体操作步骤为:
(1)申请获取百度LBS开放平台API接口密钥;
(2)根据相关的参数要求和获得的接口密钥,编写地址解析的URL请求;
(3)根据地址数据拼写地址解析的URL请求,并将拼写合格的地址解析URL请求存为TXT文本格式批量导入Locoy Spider工具,设置好采集标签和文本模板后开始对进行地址数据的批量解析利用Locoy Spider工具对传统的数据进行批量地址解析,从而得到其地理信息。
3、完成基础数据的收集和工作底图的处理之后,根据城市建设用地性质的类型将获取的数据分为相应的八类进行整理,在GIS系统中进行空间落位,并进行坐标转换和数据纠偏。以现状道路中心线对现状建设用地进行划分,将形成的街块单元作为数据落位的空间单元。需要特别说明的是,由于部分空间单元缺乏相关的地址解析数据,此时将部分缺失地址解析数据且道路网较为密集的街块单元进行合并,提高建设用地性质的识别率。
在此基础上,基于地址解析数据的类型和特征,本发明通过各类数据的综合评价实现对各类建设用地的功能强度测定和用地性质的综合评价,具体包括两个方面:
第一、各类建设用地的功能强度测定。在现状道路网的基础上,以道路中心线划分的街块单元作为各类数据的空间落位单元,在GIS系统中分别统计空间单元内不同用地性质的设施数量。首先针对各类用地性质中对不同数据源采取熵值赋权法进行归一化处理和权重计算,然后按照不同数据源之间的权重进行标准值叠加,最后通过计算单元汇总的标准值与空间单元面积的比值得到各类用地性质的功能强度分布情况。
第二、各类建设用地性质的综合评定。在获得各类用地功能强度测定的基础上,将空间单元内各类用地功能强度高于平均值0.5个标准差的用地功能定义为该空间单元的显著功能。为了更真实地反应现状建设用地的使用情况,本研究根据建设用地兼容性情况将各单元用地性质重新分为居住用地(R)、居住混合用地(R+)、公共管理与公共服务设施用地(A)、商业服务业设施用地(B)、公共服务和商业混合用地(A/B)、工业仓储用地(M/W)、公用设施与道路交通设施用地(S/U)、其他混合用地(O)和未能判别用地性质的用地(N)等九类用地,从而得到现状建设用地性质的综合评定。
3.1、城市各类建设用地的功能强度测定
在建设用地的功能强度测定方面,从各类建设用地的性质特征入手,分别选取不同的数据源作为评价测定的要素(见表1),以道路中心线划分的街块单元作为空间落位单元,并对单元内不同数据源的原子化数据进行汇总统计。
表1各类建设用地功能强度测定的主要数据源
在此基础上,对按单元汇总之后的绝对数据值采取熵值赋权法进行归一化处理和权重计算,解决不同数据源造成的量纲不一致的问题。然后按照不同数据源之间的权重进行标准值叠加,最后通过计算单元汇总的标准值与空间单元面积的比值得到各类用地的功能强度分布情况。
各类建设用地的功能强度测定模型为:
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中的Hi为第i个单元的用地功能强度,αk为第k类数据要素的权重,Pik为第i个单元内第k类数据要素的标准值,Si为第i个单元的建设用地面积(其中i=1,2,…,m;k=1,2,…,n)。
具体计算步骤如下:
①将各项数据要素标准化处理
由于各类数据要素的量纲和数量级均不一样,所以需对各类要素进行标准化处理。假设第k项数据要素在空间单元i中的设施数量为βik,首先定义
f ik = ( β ik + 1 ) / Σ i = 1 m ( β ik + 1 ) - - - ( 2 )
式中:(i=1,2,…,m;k=1,2,…,n)。
由于当fik=0时,ln(fik)无意义,所以在计算标准值Pik时需对fik进行修正,进而得到重新定义的各单元内不同要素的标准值Pik
Pik=fik·ln(fik)   (3)
②根据熵权法确定各类数据要素的权重
首先定义第k要素的熵值为γk
γ k = - 1 ln ( m ) Σ i = 1 m ( P ik ) - - - ( 4 )
式中:(i=1,2,…,m;k=1,2,…,n)。
利用上述修正后的熵值评价指标进而得到不同数据要素的权重:
α k = γ k / Σ k n γ k - - - ( 5 )
式中:(k=1,2,…,n)。
③计算各单元的用地功能强度
将上述计算得到各类数据要素的标准值Pik按照权重关系αk进行叠加计算,通过计算单元内各数据要素的标准值总和与单元建设用地面积Si的比值,得到各单元的用地功能强度。
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中:(i=1,2,…,m;k=1,2,…,n)。
3.1.1、居住功能强度测定
居住功能强度测定选取了百度开放平台数据和2014年企业名录数据,分别通过“住区”和“居委会”的空间分布特征来判定居住用地的分布情况(见表2)。
表2居住功能强度测定的主要数据
以广州市天河区为例,首先通过在百度开发平台中的搜索“小区”、“村”等关键词,获得一定范围内的住区点数据,并将该点数据以划分好的空间单元在GIS系统中进行落位和汇总。然后,筛选出2014年企业名录中“居委会”和“村委会”的相关数据,利用百度LBS开放平台中进行地址解析。将地址解析完毕的企业名录数据导入在GIS系统中进行空间落位和坐标纠偏,并以300米为半径,将覆盖的空间单元统一赋值(本研究将覆盖单元统一赋值为区内百度数据的平均值),与百度数据一样再按空间单元进行汇总。
在此基础之上,利用熵值赋权法公式(2)和公式(3)将上述按单元汇总的百度数据和企业名录数据进行归一化处理,得到这两类数据的标准值Pik,并利用熵值赋权法公式(4)和公式(5)可得百度开放平台数据和企业名录数据的权重α1和α2,分别为0.5005和0.4995。
最后,利用用地功能强度公式(1)将这两类数据要素按照空间单元和权重关系进行叠加运算,通过计算叠加之后的标准值总和与建设用地的面积Si的比值得到各单元的居住用地功能强度Gi,在本案例中选取了天河区的南部用地作为成果的展示,如图2所示。
3.1.2、公共管理与公共服务设施的功能强度测定
公共管理与公共服务设施的功能强度测定选取了百度开放平台数据、新浪微博签到数据和2014年企业名录数据,通过公共管理与公共服务设施的空间分布特征来判定公共管理与公共服务设施用地的分布情况(见表3)。
表3公共管理与公共服务设施功能强度测定的主要数据
以广州市天河区为例,首先通过在百度开发平台中的搜索“医院”、“大学”、“中学”、“小学”、“图书馆”、“游泳馆”、“剧院”等关键词,获得各类设施的点数据。考虑到天河区高校众多的特殊性,在本研究中单独将“大学”作为单独的数据要素提取出来,与其他数据分为两类进行空间落位。
其次,将新浪微博签到数据中分类标签为“政府机构”、“税务”、“警察局”、“法院”、“敬老院”、“校园生活”、“博物馆”、“图书馆”、“文化宫”、“展览馆”、“中学”、“小学”等公共管理与公共服务设施筛选出来,并在GIS系统中进行空间落位和坐标纠偏,按照空间单元进行汇总。
然后,将企业名录数据中,将行业分类为“卫生、社会保障和社会福利业”、“公共管理和社会组织”、“文化、体育”、“教育”等企业数据筛选出来,并在百度LBS开发平台中进行地址解析,将解析后的数据导入GIS系统中进行坐标纠偏和单元汇总。
利用熵值赋权法公式(2)和公式(3),将单元汇总的绝对点数据进行归一化,得到以上四类数据要素的标准值Pik,按照熵值赋权法计算公式(4)和公式(5)得到百度“大学”数据α1、百度其他数据α2、微博签到数据α3、企业名录数据α4之间的权重关系为0.2550、0.2482、0.2485、0.2483。
最后,利用用地功能强度计算公式(1)将四类要素的标准值按照权重关系进行叠加运算,各个单元的汇总标准值与单元建设用地面积的比值即为公共管理与公共服务设施用地的功能强度Gi,如图3所示。
3.1.3、商业服务业设施的功能强度测定
商业服务业设施的功能强度测定选取了百度开放平台数据和新浪微博签到数据,通过选择一些商业用地内较具有代表性的商业设施数据来判定商业用地的功能强度(见表4),由于企业名录数据中的商业设施数据较为复杂,在商业服务业设施用地的功能强度中并未选取。
表4商业服务业设施功能强度测定的主要数据
以广州市天河区为例,在百度开放平台搜索天河区范围内的“餐饮”、“超市”、“旅馆”、“批发市场”、“商场”、“银行”、“KTV”、“网吧”、“电影院”、“足疗”、“棋牌”、“酒吧”、“咖啡厅”等关键词,可以得到天河区内的商业设施数据。
将新浪微博签到数据中分类标签为“餐饮美食”、“咖啡厅”、“茶艺馆”、“甜品店”、“菜系”、“汽车维修”、“购物服务”、“商场”、“专卖店”、“家具建材市场”、“美容美发”、“宾馆”等商业设施数据筛选出来,并与百度数据一起在GIS系统中进行坐标纠偏和单元汇总。
然后,利用熵值赋权法公式(2)、公式(3)、公式(4)和公式(5)得到百度数据和微博签到数据的标准值Pik和两类数据的权重关系,其中百度数据权重α1和微博签到数据权重α2均为0.5。
最后,通过用地功能强度计算公式(1)将各类数据的标准值按照权重进行叠加并除以单元建设用地面积Si,则可以得到商业服务业设施用地的功能强度Gi,如图4所示。
3.1.4、工业的功能强度测定
工业的功能强度测定选择百度开放平台数据和新浪微博签到数据(见表5)。以广州市天河区为例,百度数据选择以“工厂”为关键词的数据、新浪微博签到数据选择分类标签为“产业园”的数据,并在GIS系统中进行空间落位和坐标纠偏。需要特别说明的是,天河区内的工业用地较少,所以相关地址解析数据也会减少。
表5工业功能强度测定的主要数据
在此基础上,利用熵权法计算公式(2)、公式(3)、公式(4)和公式(5)将两类原子数据归一化处理,并得到百度数据的权重α1和微博签到数据权重α2,α1和α2为0.4926、0.5074。
最后,利用用地功能强度计算公式(1)将两类数据的标准值按照权重关系进行叠加,并除以单元建设用地面积Si,得到工业用地的功能强度Gi,如图5所示。
3.1.5、物流仓储的功能强度测定
物流仓储用地的功能强度测定选取百度开放平台数据和2014年企业名录数据(见表6)。
表6物流仓储功能强度测定的主要数据
以广州市天河区为例,在百度开放平台中获取关键词为“仓库”和“物流”的相关数据,需要特别说明的是通过搜索关键词为“物流”得到的相关数据,只有少量的物流仓库属于物流仓储用地,大部分属于商业设施的物流营运网点,应将其进行筛选剔除。
在进行地址解析之后的2014年企业名录数据中,将行业分类代码为“57装卸搬运和其他运输服务业”和“58仓储业”的数据筛选出来,并将一些物流企业办公的商业设施数据进行剔除。
然后,将以上两类数据分别导入GIS系统中进行空间落位和坐标纠偏,并按照空间单元进行汇总统计。在此基础上,利用熵值赋权法归一化公式(2)和公式(3)将绝对数值进行归一化处理,并利用公式(4)和公式(5)进行权重计算,得到百度数据权重α1和企业名录数据权重α2分别为0.5002、0.4998。
最后,利用用地功能强度计算公式(1)得到物流仓储用地的功能强度Gi(如图6所示)。
3.1.6、道路与交通设施的功能强度测定
道路与交通设施的功能强度测定选取百度开放平台数据、新浪微博签到数据和2014年企业名录数据。由于本研究是以道路为工作底图,所以部分道路用地需通过航拍图或者卫星图进行绘制识别(见表7)。
表7道路与交通设施功能强度测定的主要数据
以广州市天河区为例,在百度开放平台中获取关键词为“客运站”、“火车站”、“码头”和“停车场”的相关数据,需要特别说明的是通过搜索关键词为“停车场”得到的相关数据,只有少量的公交站场、大型社会停车场属于道路与交通设施用地,大部分停车场属于其他性质用地的附属用地,应将其进行剔除。
在获取的新浪微博签到数据中,将分类标签为“飞机场”、“长途汽车站”和“火车站”的相关数据筛选出来,并剔除类似“火车站附近”的其他设施数据。
在进行地址解析后的2014年企业名录数据中,将行业分类为“51铁路运输业”、“52道路运输业”、“53城市公共交通业”、“54水上运输业”、“55航空运输业”的数据筛选出来,并将除码头或者站场之外的设施数据进行剔除。
然后,将以上三类数据导入GIS中进行空间落位和坐标纠偏,并按照空间单元进行汇总统计。利用熵值赋权法归一化公式(2)和公式(3)将绝对数值进行归一化处理,并利用公式(4)和公式(5)进行权重计算,得到百度数据权重α1、新浪微博数据权重α2、企业名录数据权重α3分别为0.3499、0.3258和0.3243。
最后,利用利用用地功能强度计算公式(1)得到道路与交通设施用地的功能强度Gi(如图7所示)。
3.1.7、公用设施的功能强度测定
公用设施的功能强度测定选取百度开放平台数据和2014年企业名录数据(见表8)。
表8公用设施功能强度测定的主要数据
以广州市天河区为例,在百度开发平台中搜索关键词为“加油站”、“垃圾站”、“消防站”、“水厂”等公用设施,同时将新浪微博中分类标签为“加油站”的数据筛选出来。将两类数据导入GIS系统中进行空间落位和坐标纠偏,并按照空间单元进行汇总统计。
然后利用熵值赋权法公式(2)、公式(3)、公式(4)和公式(5)将绝对数值归一化处理和计算权重,得到百度数据权重α1和企业名录数据权重α2分别为0.4947、0.5053。
最后,利用用地功能强度计算公式(1)得到公用设施用地的功能强度Gi(如图8所示)。
3.1.8、绿地与广场的功能强度测定
绿地与广场用地的功能强度测定选取百度开放平台数据和新浪微博签到数据(见表9)。
表9绿地与广场功能强度测定的主要数据
以广州市天河区为例,在百度开发平台中搜索关键词为“公园”的设施数据,同时将新浪微博中分类标签为“公园”、“动物园”、“城市广场”、“植物园”等数据筛选出来。将两类数据导入GIS系统中进行空间落位和坐标纠偏,并按照空间单元进行汇总。
然后利用熵值赋权法公式(2)、公式(3)、公式(4)和公式(5)将绝对数值归一化处理和计算权重,得到百度数据权重α1和企业名录数据权重α2分别为0.4947、0.5053。最后,利用利用用地功能强度计算公式(1)得到绿地与广场用地的功能强度Gi(如图9所示)。
3.2、城市各类建设用地性质的综合评定
在完成城市各类建设用地的功能强度测定的基础上,采用均方差的计算方法对各单元的用地性质作显著性判定。在现有的城市建设用地性质分类的基础上,根据用地兼容性特征和依从关系重新提出新的用地性质分类,主要包括:居住用地(R)、居住混合用地(R+)、公共管理与公共服务设施用地(A)、商业服务业设施用地(B)、公共服务和商业混合用地(A/B)、绿地与广场用地(G)、工业仓储混合用地(M/W)、公用设施与道路交通设施混合用地(S/U)、其他混合用地(O)和未能判别用地性质的用地(N)等九类用地。
需要特别说明的是,由于居住用地与其他用地的混合程度最高,在此提出了居住混合用地(R+);商业用地和公服用地的混合也是一种较为常见的类型,在此提出了公共服务和商业混合用地(A/B);此外,由于公用设施用地、道路交通设施用地、工业用地和物流仓储用地的数量较少、样本数据也较为缺乏,在此重新分为工业仓储混合用地(M/W)、公用设施与道路交通设施混合用地(S/U);对于其他各种复杂的混合用地在本研究中不作进一步的细分,在此统一归为其他混合用地(O)。
建设用地性质显著性判定和综合评定的具体步骤如下:
(1)合并用地,计算单元用地功能强度的平均值
在八类用地功能强度的基础上,分别将公用设施用地和道路交通设施用地、工业用地和物流仓储用地进行归并,得到六类用地的功能强度Gik
计算六类用地的平均值:
Q i = Σ k = 1 6 G ik 6 - - - ( 6 )
式中:(i=1,2,…,m;k=1,2,…,6)
(2)计算单元用地功能强度的标准差
δ i = 1 m Σ i = 1 m ( G ik - Q i ) 2 - - - ( 7 )
式中:(i=1,2,…,m)
(3)判断单元用地功能强度的显著性
R ik = G ik - Q i - 1 2 δ i - - - ( 8 )
式中:(i=1,2,…,m;k=1,2,…,6)
若Gik>0且Rik≥0,则判定单元内该类用地功能显著;反之,则不显著。
(4)用地性质的综合评定
①在得到各单元用地性质显著性的基础上,可根据用地主导功能、用地依从关系、用地兼容性以及航拍影像图等方式对用地进行判定。
②居住用地(R):将单元内只有一种显著性用地功能、且为居住用地功能的单元判定为居住用地。
③居住混合用地(R+):将单元内有两种或两种以上显著性用地功能、且其中包含居住用地功能的单元判定为居住混合用地。
④公共管理与公共服务设施用地(A):将单元内只有一种显著性用地功能、且为公共服务用地功能的单元判定为公共管理与公共服务设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为公共服务用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为公共管理与公共服务设施用地。
⑤商业服务业设施用地(B):将单元内只有一种显著性用地功能、且为商业用地功能的单元判定为商业服务业设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为商业用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为商业服务业设施用地。
⑥公共服务和商业混合用地(A/B):将单元内有两种显著性用地功能、且为公共服务用地功能和商业用地功能的单元判定为公共服务和商业混合用地。
⑦绿地与广场用地(G):将单元内只有一种显著性用地功能、且为绿地与广场用地功能的单元判定为绿地与广场用地;此外,将单元内有两种或两种以上显著性用地功能、且为绿地与广场用地功能与工业仓储、市政道路用地功能混合的单元判定为绿地与广场用地。
⑥工业仓储混合用地(M/W):将单元内只有一种显著性用地功能、且为工业用地功能或者物流仓储用地功能的单元判定为工业仓储混合用地。
⑦公用设施与道路交通设施混合用地(S/U):将单元内只有一种显著性用地功能、且为公用设施用地功能或者道路交通设施用地功能的单元判定为公用设施与道路交通设施混合用地。
⑧其他混合用地(O):将单元内有两种或两种以上显著性用地功能的其他单元判定为其他混合用地。
⑨未能判别用地性质的用地(N):将没有显著性用地功能的单元判定为未能判别用地性质的用地。
在此基础之上,将各单元的用地分类信息导入GIS系统中的空间单元进行分类显示,借助卫星航拍影像图和电子地图对难以识别的混合用地单元进行辅助判定,得到城市各类建设用地类型划分图(如图10所示)。
4、城市各类建设用地性质的校核;在建设用地性质快速识别完成之后,对生成的用地类型划分图分别进行用地识别率和用地识别准确率的判断,当它同时满足这两个要求时即可判定基于地址解析数据的建设用地类型快速识别完成。
4.1、城市建设用地性质识别率的校
在城市各类建设用地性质的功能强度测定和用地性质综合评定的基础上,得到城市各类建设用地性质的综合评定图。分别统计未能判别用地性质的空间单元数量n和建设用地空间单元的数量m,计算建设用地性质的识别率:
θ = m - n m * 100 % - - - ( 9 )
本研究定义若建设用地性质的识别率θ≥80%,则说明用地识别率合格;反之,则不合格,需重新划分空间单元或补充相关用地识别数据之后重新进行计算分析。
以广州市天河区为例,其建设用地性质识别的空间单元数量为847个,其中未能判别用地性质的空间单元数量为12个,计算可得其建设用地性质的识别率θ为98.58%,符合要求。
4.2、城市建设用地性质识别准确率的校核
在生成的建设用地性质划分图中划定一定的取样范围,其中取样范围的面积不应小于总建设用地面积的10%。通过第三方获取该范围的现状用地性质分布图,或者借助航拍影像图和电子卫星图来绘制该取样范围内的现状用地性质分布图。通过比较二者之间的重合面积来计算用地性质识别的准确率。具体操作步骤为:
①绘制取样范围现状用地
在GIS系统中新增“自绘用地类型”字段,区别于快速识别用地类型,并根据航拍影像图和电子影像图,在对应的空间单元录入用地属性,得到自绘现状用地分析图,需要特殊说明的是,由于本研究在建设用地性质识别中提出了新的用地分类标准,在自绘的现状用地图应采用同样的分类标准。
②统计重合用地单元,计算用地性质识别的准确率
在GIS系统中新增一个字段,将用地性质一致的空间单元标记为“K=0”,将用地性质不一致的空间单元标记为“K=1”,分别统计取样范围内用地单元的总面积和用地性质不一致的空间单元面积,通过计算取样范围内用地性质一致的面积与用地总面积的比值得到用地性质识别的准确率μ,具体计算公式为:
μ = Σ i = 1 m S i - Σ i = 1 m S i K i Σ i = 1 m S i * 100 % - - - ( 10 )
式中:(i=1,2,…,m)。
本研究定义当μ≥80%时,即可判定建设用地性质综合评定的准确率合格;反之,则不合格,需通过数据纠错或者校核的方式重新进行计算分析。
以广州市天河区为例,天河区建设用地面积为1096391.10㎡,划定取样范围面积为132161.56㎡,超过总建设用地面积的10%。通过地址解析数据可以得到天河区内建设用地的性质,另外通过航拍影像图和第三方提供的相关规划图纸,可以在GIS系统中重新生成现状建设用地性质分析图。
然后,通过在GIS系统中比较两张用地图的一致性,计算准确率。在此需要特别说明的是,由于天河区内花城广场的地面为绿地,地下为商业,在快速识别的结果中将其归为商业用地,自绘的用地现状图将其归为绿地,在此应将花城广场用地性质识别视为具有一致性;另外,由于体育西小区、体育东小区均为开放式的商住混合用地,在快速识别的结果中将其归为商业用地,自绘的用地现状图将其归为居住用地,在此也应将其用地性质识别视为具有一致性。
最后,根据公式(10)分别统计取样范围内用地性质一致的空间单元面积和空间单元总面积分别为132161.56㎡和158564.04㎡,计算二者的比值得到建设用地性质识别的准确率μ=83.35%,校核合格。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (9)

1.一种基于地址解析数据的建设用地类型快速识别方法,其特征在于,包括下述步骤:
S1、研究数据的挖掘,利用现有开放平台的地址解析工具对所挖掘的各项数据进行地址解析,并通过GIS系统将网络数据和传统数据统一空间落位和坐标校正,进行分类用地的功能强度测定和用地性质的综合评定;
S2、对传统数据进行地址解析,获取其地理信息;
S3、基于地址解析数据的类型和特征,通过各类数据的综合评价实现对各类建设用地的功能强度测定和用地性质的综合评价,具体包括:
S3.1、各类建设用地的功能强度测定,在现状道路网的基础上,以道路中心线划分的街块单元作为各类数据的空间落位单元,在GIS系统中分别统计空间单元内不同用地性质的设施数量,首先针对各类用地性质中对不同数据源采取熵值赋权法进行归一化处理和权重计算,然后按照不同数据源之间的权重进行标准值叠加,最后通过计算单元汇总的标准值与空间单元面积的比值得到各类用地性质的功能强度分布情况;
S3.2、各类建设用地性质的综合评定,在获得各类用地功能强度测定的基础上,将空间单元内各类用地功能强度高于平均值0.5个标准差的用地功能定义为该空间单元的显著功能;
S4、在建设用地功能强度测定和用地性质的综合评价之后,对生成的用地类型划分图分别进行用地识别率和用地识别准确率的判断,当它同时满足这两个要求时即可判定基于地址解析数据的建设用地类型快速识别完成。
2.根据权利要求1所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,步骤S1中是基于新浪开放平台的用地识别数据获取和/或基于百度LBS开放平台的用地识别数据获取;
S1.1、基于新浪开放平台的用地识别数据获取的具体步骤为:
S1.1.1、根据要求填写新浪微博微博开放平台相关网页信息,获取App Key和App Secret;
S1.1.2、登陆新浪微博开放平台数据获取界面,输入数据获取所需的参数,点击调用接口,得到返回结果;
S1.1.3、选择地理信息接口中的place/nearby/pois接口,根据相关请求参数的要求编写URL请求,配置查询中心点的经纬度、查询范围、数据排序方式、单页返回记录条数、返回数据的起始和终止页数信息,并运用抓取新浪微博签到数据的Python工具批量获取所述数据;
S1.1.4、数据获取需要说明的是新浪开放平台有限时访问次数,数据获取中止是需等限制取消才能继续运行,将返回的数据进行编码格式转换之后,数据获取完成,其中,数据信息主要包括签到地址、分类及代码、签到数量、签到人数、经纬度、照片数量;
S1.2、基于百度LBS开放平台的用地识别数据获取;通过百度LBS开放平台的地址服务接口,结合Locoy Spider数据获取软件获取一定范围内的设施地理信息、设施名称、评论数量、评论分数,具体为:
S1.2.1、申请获取百度LBS开放平台API接口密钥;
S1.2.2、设置相关的URL请求参数;
S1.2.3、将配置好的URL请求参数在浏览器中打开,获取搜索对象的数量;
S1.2.4、将拼写合格的地址解析URL请求导入Locoy Spider工具,设置好采集标签和文本模板后开始对进行百度用地数据的获取,获取的数据信息包括设施名称、设施经纬度、地址、评论数量以及评分。
3.根据权利要求1所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,步骤S2中,通过百度LBS开放平台中的Geocoding API的服务功能,对传统数据进行地址解析,其具体方法为:
S2.1、申请获取百度LBS开放平台API接口密钥;
S2.2、根据相关的参数要求和获得的接口密钥,编写地址解析的URL请求;
S2.3、根据地址数据拼写地址解析的URL请求,并将拼写合格的地址解析URL请求存为TXT文本格式批量导入Locoy Spider工具,设置好采集标签和文本模板后开始利用LocoySpider工具对带有地址信息的数据进行批量地址坐标解析,从而得到其地理信息。
4.根据权利要求1所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,步骤S3.1中,各类建设用地的功能强度测定模型为:
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中的Hi为第i个单元的用地功能强度,αk为第k类数据要素的权重,Pik为第i个单元内第k类数据要素的标准值,Si为第i个单元的建设用地面积,其中i=1,2,…,m;k=1,2,…,n;具体如下:
S3.1.1、将各项数据要素标准化处理,假设第k项数据要素在空间单元i中的设施数量为βik,首先定义
f ik = ( β ik + 1 ) / Σ i = 1 m ( β ik + 1 ) - - - ( 2 )
式中:i=1,2,…,m;k=1,2,…,n;
由于当fik=0时,ln(fik)无意义,所以在计算标准值Pik时需对fik进行修正,进而得到重新定义的各单元内不同要素的标准值Pik
Pik=fik·ln(fik)   (3)
S3.1.2、根据熵权法确定各类数据要素的权重;
首先定义第k要素的熵值为γk
γ k = - 1 ln ( m ) Σ i = 1 m ( P ik ) - - - ( 4 )
式中:(i=1,2,…,m;k=1,2,…,n);
利用上述修正后的熵值评价指标进而得到不同数据要素的权重:
α k = γ k / Σ k n γ k - - - ( 5 )
式中:(k=1,2,…,n);
S3.1.3、计算各单元的用地功能强度;
将上述计算得到各类数据要素的标准值Pik按照权重关系αk进行叠加计算,通过计算单元内各数据要素的标准值总和与单元建设用地面积Si的比值,得到各单元的用地功能强度,
G i = Σ k = 1 n α k P ik S i - - - ( 1 )
式中:(i=1,2,…,m;k=1,2,…,n)。
5.根据权利要求1或4所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,各类建设用地的功能强度测定包括对居住功能强度测定、公共管理与公共服务设施的功能强度测定、商业服务业设施的功能强度测定、工业的功能强度测定、物流仓储的功能强度测定、道路与交通设施的功能强度测定、公用设施的功能强度测定以及绿地与广场的功能强度测定。
6.根据权利要求5所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,步骤S3.2中,各类建设用地性质的综合评定的具体方法为:
S3.2.1、合并用地,计算单元用地功能强度的平均值,
在八类用地功能强度的基础上,分别将公用设施和道路交通设施、工业和物流仓储设施进行归并,得到六类用地的功能强度Gik
计算六类用地的平均值:
Q i = Σ k = 1 6 G ik 6 - - - ( 6 )
式中:i=1,2,…,m;k=1,2,…,6;
S3.2.2、计算单元用地功能强度的标准差
δ i = 1 m Σ i = 1 m ( G ik - Q i ) 2 - - - ( 7 )
式中:i=1,2,…,m
S3.2.3、判断单元用地功能强度的显著性
R ik = G ik - Q i - 1 2 δ i - - - ( 8 )
式中:i=1,2,…,m;k=1,2,…,6
若Gik>0且Rik≥0,则判定单元内该类用地功能显著;反之,则不显著;
S3.2.4、用地性质的综合评定,在得到各单元用地性质显著性的基础上,根据用地主导功能、用地依从关系、用地兼容性以及航拍影像图方式对用地进行判定。
7.根据权利要求6所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,步骤S3.2.4中,所述判定如下:
居住用地:将单元内只有一种显著性用地功能、且为居住用地功能的单元判定为居住用地;
居住混合用地:将单元内有两种或两种以上显著性用地功能、且其中包含居住用地功能的单元判定为居住混合用地;
公共管理与公共服务设施用地:将单元内只有一种显著性用地功能、且为公共服务用地功能的单元判定为公共管理与公共服务设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为公共服务用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为公共管理与公共服务设施用地;
商业服务业设施用地:将单元内只有一种显著性用地功能、且为商业用地功能的单元判定为商业服务业设施用地;此外,将单元内有两种或两种以上显著性用地功能、且为商业用地功能与绿地、工业仓储、市政道路用地功能混合的单元判定为商业服务业设施用地;
公共服务和商业混合用地:将单元内有两种显著性用地功能、且为公共服务用地功能和商业用地功能的单元判定为公共服务和商业混合用地;
绿地与广场用地:将单元内只有一种显著性用地功能、且为绿地与广场用地功能的单元判定为绿地与广场用地;此外,将单元内有两种或两种以上显著性用地功能、且为绿地与广场用地功能与工业仓储、市政道路用地功能混合的单元判定为绿地与广场用地;
工业仓储混合用地:将单元内只有一种显著性用地功能、且为工业用地功能或者物流仓储用地功能的单元判定为工业仓储混合用地;
公用设施与道路交通设施混合用地:将单元内只有一种显著性用地功能、且为公用设施用地功能或者道路交通设施用地功能的单元判定为公用设施与道路交通设施混合用地;
其他混合用地:将单元内有两种或两种以上显著性用地功能的其他单元判定为其他混合用地;
未能判别用地性质的用地:将没有显著性用地功能的单元判定为未能判别用地性质的用地。
8.根据权利要求1所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,城市建设用地性质识别率的校核方法为:
在城市各类建设用地性质的功能强度测定和用地性质综合评定的基础上,得到城市各类建设用地性质的综合评定图,分别统计未能判别用地性质的空间单元数量u和建设用地空间单元的数量m,计算建设用地性质的识别率:
θ = m - n m * 100 % - - - ( 9 )
若建设用地性质的识别率θ≥80%,则说明用地识别率合格;反之,则不合格,需重新划分空间单元或补充相关用地识别数据之后重新进行计算分析;
城市建设用地性质识别准确率的校核方法为:
在生成的建设用地性质划分图中划定一定的取样范围,其中取样范围的面积不应小于总建设用地面积的10%,通过第三方获取该范围的现状用地性质分布图,或者借助航拍影像图和电子卫星图来绘制该取样范围内的现状用地性质分布图,通过比较二者之间的重合面积来计算用地性质识别的准确率。
9.根据权利要求8所述的基于地址解析数据的建设用地类型快速识别方法,其特征在于,城市建设用地性质识别准确率的校核具体操作方法为:
(1)绘制取样范围现状用地
在GIS系统中新增“自绘用地类型”字段,区别于快速识别用地类型,并根据航拍影像图和电子影像图,在对应的空间单元录入用地属性,得到自绘现状用地分析图;
(2)统计重合用地单元,计算用地性质识别的准确率
在GIS系统中新增一个字段,将用地性质一致的空间单元标记为“K=0”,将用地性质不一致的空间单元标记为“K=1”,分别统计取样范围内用地单元的总面积和用地性质不一致的空间单元面积,通过计算取样范围内用地性质一致的面积与用地总面积的比值得到用地性质识别的准确率μ,具体计算公式为:
μ = Σ i = 1 m S i - Σ i = 1 m S i K i Σ i = 1 m S i * 100 % - - - ( 10 )
式中:(i=1,2,…,m);
定义当μ≥80%时,即可判定建设用地性质综合评定的准确率合格;反之,则不合格,需通过数据纠错或者校核的方式重新进行计算分析。
CN201510128347.9A 2015-03-23 2015-03-23 一种基于地址解析数据的建设用地类型快速识别方法 Active CN104750799B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201510128347.9A CN104750799B (zh) 2015-03-23 2015-03-23 一种基于地址解析数据的建设用地类型快速识别方法
PCT/CN2016/082559 WO2016150407A1 (zh) 2015-03-23 2016-05-18 一种基于地址解析数据的建设用地类型快速识别方法
SG11201707620RA SG11201707620RA (en) 2015-03-23 2016-05-18 Method for recognizing construction land use type based on address resolution data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510128347.9A CN104750799B (zh) 2015-03-23 2015-03-23 一种基于地址解析数据的建设用地类型快速识别方法

Publications (2)

Publication Number Publication Date
CN104750799A true CN104750799A (zh) 2015-07-01
CN104750799B CN104750799B (zh) 2018-04-13

Family

ID=53590483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510128347.9A Active CN104750799B (zh) 2015-03-23 2015-03-23 一种基于地址解析数据的建设用地类型快速识别方法

Country Status (3)

Country Link
CN (1) CN104750799B (zh)
SG (1) SG11201707620RA (zh)
WO (1) WO2016150407A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016150407A1 (zh) * 2015-03-23 2016-09-29 华南理工大学 一种基于地址解析数据的建设用地类型快速识别方法
CN107766415A (zh) * 2017-09-08 2018-03-06 华南理工大学 基于用电数据的城镇低效工业用地快速识别方法
CN109029333A (zh) * 2018-07-18 2018-12-18 浙江地科土地勘测规划设计有限公司 一种土地面积校对方法
CN109977323A (zh) * 2019-03-13 2019-07-05 南京大学 一种基于电子地图的通勤数据批量采集方法
CN110070279A (zh) * 2019-04-10 2019-07-30 广东省城乡规划设计研究院 基于多源数据的用地效率量化评估方法、系统和存储介质
CN110196916A (zh) * 2019-05-05 2019-09-03 华南理工大学 一种道路类型识别方法
CN111209355A (zh) * 2019-10-31 2020-05-29 浙江中测新图地理信息技术有限公司 企业亩均效益专题地图可视化制图方法
CN111414449A (zh) * 2020-03-26 2020-07-14 江苏省基础地理信息中心 一种基于多源数据的地块单元信息画像方法
CN111984436A (zh) * 2020-08-25 2020-11-24 中央广播电视总台 一种数据采集系统
CN112419124A (zh) * 2020-11-19 2021-02-26 广州市城市规划勘测设计研究院 一种低效工业用地的快速识别方法、装置及其存储介质
CN115069592A (zh) * 2022-07-25 2022-09-20 青岛锐智智能装备科技有限公司 一种用于称重式分级机的自动化控制系统
CN115630876A (zh) * 2022-12-06 2023-01-20 北京市城市规划设计研究院 城市腾退空间再利用评估方法及装置

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106600063B (zh) * 2016-12-16 2022-03-18 东北电力大学 一种基于模糊粗糙集理论和时空信息的空间负荷预测方法
CN111339619B (zh) * 2018-11-15 2023-04-28 中国市政工程华北设计研究总院有限公司 一种基于改进pso算法的lid系统设计方法
CN109558473B (zh) * 2018-12-06 2023-07-14 佛山科学技术学院 一种基于gis的道路交通设施信息管理系统及其建模方法
CN110490507B (zh) * 2019-07-04 2022-08-12 丰图科技(深圳)有限公司 一种物流网络的新增线路检测方法、装置及设备
CN110428146A (zh) * 2019-07-11 2019-11-08 陕西华地勘察设计咨询有限公司 一种城镇低效用地精准识别与智能规划系统
CN110852479A (zh) * 2019-10-12 2020-02-28 上海市政工程设计研究总院(集团)有限公司 一种基于人口覆盖率的公共服务设施服务半径评价方法
CN111461197A (zh) * 2020-03-27 2020-07-28 国网上海市电力公司 一种基于特征提取的空间负荷分布规律研究方法
CN111523804B (zh) * 2020-04-23 2023-05-19 南京工业大学 一种基于实景三维的应急避难场所效能评估方法
CN111797188B (zh) * 2020-06-28 2024-03-01 武汉大学 一种基于开源地理空间矢量数据的城市功能区定量识别方法
CN112036636A (zh) * 2020-08-28 2020-12-04 国网福建省电力有限公司经济技术研究院 一种以电能终端消费为主的综合能源负荷预测方法
CN112732843B (zh) * 2021-01-15 2024-03-01 首都师范大学 一种村庄功能类型的识别方法及装置
CN113377891B (zh) * 2021-06-30 2023-11-03 中国测绘科学研究院 一种面向空间矢量数据图斑面积的平差方法
CN113674122B (zh) * 2021-07-22 2024-09-27 华设设计集团股份有限公司 一种适用高并发出行数据的城市居民出行规律快速提取方法
CN116187624B (zh) * 2023-04-23 2023-08-01 中国城市建设研究院有限公司 一种公共设施建设地址判定方法、装置、存储介质及终端
CN118505788B (zh) * 2024-07-12 2024-09-24 山东省国土空间数据和遥感技术研究院(山东省海域动态监视监测中心) 一种建设项目占用现状地类面积的确定方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1959714A (zh) * 2006-11-24 2007-05-09 中国科学院上海技术物理研究所 基于遥感影像的城市基础生态环境时空分析评价方法
CN101114277A (zh) * 2007-08-21 2008-01-30 南京大学 一种利用地理信息系统与遥感技术进行生态功能区划的方法
JP2011090354A (ja) * 2009-10-20 2011-05-06 Nippon Telegr & Teleph Corp <Ntt> 有名度スコア算出装置、その方法及びプログラム
CN103324749A (zh) * 2013-07-05 2013-09-25 福建邮科通信技术有限公司 一种基于标准文本地址的空间化解析及纠偏方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104750799B (zh) * 2015-03-23 2018-04-13 华南理工大学 一种基于地址解析数据的建设用地类型快速识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1959714A (zh) * 2006-11-24 2007-05-09 中国科学院上海技术物理研究所 基于遥感影像的城市基础生态环境时空分析评价方法
CN101114277A (zh) * 2007-08-21 2008-01-30 南京大学 一种利用地理信息系统与遥感技术进行生态功能区划的方法
JP2011090354A (ja) * 2009-10-20 2011-05-06 Nippon Telegr & Teleph Corp <Ntt> 有名度スコア算出装置、その方法及びプログラム
CN103324749A (zh) * 2013-07-05 2013-09-25 福建邮科通信技术有限公司 一种基于标准文本地址的空间化解析及纠偏方法

Non-Patent Citations (6)

* Cited by examiner, † Cited by third party
Title
PIJANOWSKI,BRYAN C.等: "A Big Data Urban Growth Simulation At A National Scale:Configuring The GIS And Neural Network Based Land Transformation Model To Run In A High Performance Computing(HPC) Environment", 《ENVIRONMENTAL MODELING & SOFTWARE》 *
刘振鑫: "应用城市冠层模式与WRF模式耦合研究城市化效应", 《中国博士学位论文全文数据库 基础科学辑》 *
杨俊等: "大连金石滩旅游度假区居住用地的空间分异", 《地理研究》 *
许艳等: "江苏海岸带滩涂围垦区土地利用类型变化研究", 《自然资源学报》 *
阿依苏力坦·麦麦提艾力: "博斯腾湖流域土地利用/覆被变化及其驱动因子分析", 《中国优秀硕士学位论文全文数据库 基础科学辑》 *
高迎春等: "石家庄城市土地利用增长研究", 《地理科学进展》 *

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2016150407A1 (zh) * 2015-03-23 2016-09-29 华南理工大学 一种基于地址解析数据的建设用地类型快速识别方法
CN107766415A (zh) * 2017-09-08 2018-03-06 华南理工大学 基于用电数据的城镇低效工业用地快速识别方法
CN109029333A (zh) * 2018-07-18 2018-12-18 浙江地科土地勘测规划设计有限公司 一种土地面积校对方法
CN109977323B (zh) * 2019-03-13 2021-09-03 南京大学 一种基于电子地图的通勤数据批量采集方法
CN109977323A (zh) * 2019-03-13 2019-07-05 南京大学 一种基于电子地图的通勤数据批量采集方法
CN110070279A (zh) * 2019-04-10 2019-07-30 广东省城乡规划设计研究院 基于多源数据的用地效率量化评估方法、系统和存储介质
CN110070279B (zh) * 2019-04-10 2020-04-14 广东省城乡规划设计研究院 基于多源数据的用地效率量化评估方法、系统和存储介质
CN110196916A (zh) * 2019-05-05 2019-09-03 华南理工大学 一种道路类型识别方法
CN110196916B (zh) * 2019-05-05 2022-11-18 华南理工大学 一种道路类型识别方法
CN111209355A (zh) * 2019-10-31 2020-05-29 浙江中测新图地理信息技术有限公司 企业亩均效益专题地图可视化制图方法
CN111209355B (zh) * 2019-10-31 2023-12-22 浙江中测时空科技有限公司 企业亩均效益专题地图可视化制图方法
CN111414449A (zh) * 2020-03-26 2020-07-14 江苏省基础地理信息中心 一种基于多源数据的地块单元信息画像方法
CN111414449B (zh) * 2020-03-26 2023-08-25 江苏省基础地理信息中心 一种基于多源数据的地块单元信息画像方法
CN111984436A (zh) * 2020-08-25 2020-11-24 中央广播电视总台 一种数据采集系统
CN112419124B (zh) * 2020-11-19 2022-04-01 广州市城市规划勘测设计研究院 一种低效工业用地的快速识别方法、装置及其存储介质
CN112419124A (zh) * 2020-11-19 2021-02-26 广州市城市规划勘测设计研究院 一种低效工业用地的快速识别方法、装置及其存储介质
CN115069592A (zh) * 2022-07-25 2022-09-20 青岛锐智智能装备科技有限公司 一种用于称重式分级机的自动化控制系统
CN115069592B (zh) * 2022-07-25 2022-11-11 青岛锐智智能装备科技有限公司 一种用于称重式分级机的自动化控制系统
CN115630876A (zh) * 2022-12-06 2023-01-20 北京市城市规划设计研究院 城市腾退空间再利用评估方法及装置

Also Published As

Publication number Publication date
WO2016150407A1 (zh) 2016-09-29
CN104750799B (zh) 2018-04-13
SG11201707620RA (en) 2017-10-30

Similar Documents

Publication Publication Date Title
CN104750799A (zh) 一种基于地址解析数据的建设用地类型快速识别方法
US8996523B1 (en) Forming quality street addresses from multiple providers
CN108881346B (zh) 面向位置服务的网络空间实体资源可视化方法及系统
Hu et al. Extraction and monitoring approach of dynamic urban commercial area using check-in data from Weibo
Liu et al. A generalized framework for measuring pedestrian accessibility around the world using open data
CN107133900B (zh) 城市土地混合利用特征格网计算方法及装置
CN111401692B (zh) 一种度量城市空间功能紧凑度的方法
CN105893544A (zh) 一种基于poi业态数据生成城市空间大数据地图的方法
KR102184048B1 (ko) Gis 기반 토지 이용 계획 검토 시스템 및 방법
CN104679942B (zh) 一种基于数据挖掘的建设用地承载效率测度方法
Yin et al. A deep learning approach for rooftop geocoding
CN111260182A (zh) 自然资源资产审计实地核查取证的方法、装置及存储介质
Foulser-Piggott et al. Using remote sensing for building damage assessment: GEOCAN study and validation for 2011 Christchurch earthquake
Pafi et al. Measuring the accessibility of urban green areas
Wang et al. X-index: A novel flow-based locational measure for quantifying centrality
Cetl et al. A comparison of address geocoding techniques–case study of the city of Zagreb, Croatia
Deng et al. Quantitative comparison of open-source data for fine-grain mapping of land use
Yagoub Assessment of OpenStreetMap (OSM) Data: The Case of Abu Dhabi City, United Arab Emirates
Misra et al. Site suitability analysis for urban development: a review
CN115796629A (zh) 传统村落活力量化评价方法及系统、电子设备、存储介质
Muzaffar et al. Quality assessment of volunteered geographic information for educational planning
CN107092611A (zh) 一种位置信息的确定、信息推送方法和设备
Kanapaka et al. A survey of tools for visualizing geo spatial data
Meire et al. A bimodal accessibility analysis of Australia through application programming interfaces
KR20140136085A (ko) 위치기반 정보의 매핑방법 및 그러한 매핑을 통한 정보수집방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant