Nothing Special   »   [go: up one dir, main page]

JP5382599B2 - 秘匿化アドレスマッチング処理システム - Google Patents

秘匿化アドレスマッチング処理システム Download PDF

Info

Publication number
JP5382599B2
JP5382599B2 JP2009281371A JP2009281371A JP5382599B2 JP 5382599 B2 JP5382599 B2 JP 5382599B2 JP 2009281371 A JP2009281371 A JP 2009281371A JP 2009281371 A JP2009281371 A JP 2009281371A JP 5382599 B2 JP5382599 B2 JP 5382599B2
Authority
JP
Japan
Prior art keywords
address
data
information
coordinates
density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009281371A
Other languages
English (en)
Other versions
JP2011123712A (ja
Inventor
敦志 田代
Original Assignee
敦志 田代
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 敦志 田代 filed Critical 敦志 田代
Priority to JP2009281371A priority Critical patent/JP5382599B2/ja
Publication of JP2011123712A publication Critical patent/JP2011123712A/ja
Application granted granted Critical
Publication of JP5382599B2 publication Critical patent/JP5382599B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Instructional Devices (AREA)
  • Storage Device Security (AREA)

Description

本発明は、個人情報を秘匿化して外部提供する際に、個人情報を構成する住所情報の秘匿化をコンピュータ上で行うことを目的としたソフトウエア、及びその秘匿化ソフトウエアを適用したアドレスマッチングによる情報処理を行うシステムに関する。
顧客データ等の個人情報は、個人情報保護法に基づいた厳しい管理を必要とすることから、これらの大量なデータを用いた解析(データマイニング)は、組織内で対応が可能な一部の企業を除くと手つかずの状態であり、多くのデータが解析されず眠ったままの状態にある。これまで個人情報に関連するデータを外部提供する場合、データを保有する機関において個人情報から個人データを分離して、残った個人識別情報を信託機関に提供し識別子により管理することで非個人化を行い、外部機関に提供する方法が知られていた。
特開2000-324094号公報
しかしながら、このような複雑なプロセスから成るシステム下で個人情報を外部提供するには、時間とコストがかかることが予想される。また、組織内で高度な解析を行う場合においても専門スタッフの確保を含めコストがかかり、一部の企業を除くとマーケティング等に関するデータマイニングを組織の内部で実施する事は難しい。さらに、データを外部提供する際の秘匿化に関しても、個人情報保護を担保する定められたルールが存在しないのが現状である。
一方で、大量のデータからマーケティング等に関する空間解析を実施する場合には、個人が持つ住所情報を住所座標に変える事で、カーネル密度関数等を利用して個人に付随した情報を元にGIS(地理情報システム)により特定集団の分布地図を作成する方法が実用化されており、この場合は正確に個人の住所情報を特定する必要がない。したがって、このような条件下で個人情報の秘匿化を行う場合、氏名を削除した後に個人が特定されないよう住所情報を住所座標に変換することが可能と考えられる。
変換によって得られた住所座標から個人が特定されないためには、個人が存在する地域の特性が大きく関わる。例えば、過疎地域における個人の位置情報は過密地域における位置情報と比較してより厳密な抽象化が求められる。例をあげると ○町△丁目X番地□号において、○町△丁目X番地を代表する住所座標で十分秘匿化される場合と、○町△丁目を代表する住所座標でないと十分秘匿化されない場合など、地域の特性や解析目的により要求されるアドレスマッチングの処理レベルも種々のケースが想定される。
そこで、本発明は個人情報を外部提供できる状態まで秘匿化する際に、コンピュータ上で地域の特性を考慮した最適の住所情報の抽象化プロセスを加え、外部機関において解析に支障をきたさない程度まで個人情報を秘匿化処理するシステムの実現を目的とする。
以上の課題を解決するため、国勢調査等で公表されている人口密度や世帯密度を元にした丁目単位等の密度分布地図をベースに位置情報の抽象化レベルを複数定め、アドレスマッチング処理をレベル別に実施可能とする。これらの基礎データを元に、解析目的に応じて地域の特性に合ったアドレスマッチングの処理レベルを自動的に判断し、コンピュータ上で種々の抽象化手法を用いたデータ処理を行うソフトウエアをシステム上で実行することで、外部提供する際に個人が特定されないよう秘匿化処理する。
本発明に基づくシステムを導入することで、企業のみならず自治体が保有する個人情報についても、法を遵守した上で外部委託機関において個人情報に付随するデータの空間解析が低いコストで可能となり、現状把握と解決すべき問題への介入等、多くの部署において保有データの有効活用が期待できる。
本システムにおける個人情報を含むデータの流れである。 住所情報から住所座標データへの抽象化処理方法である。 地域密度レベルに基づいた住所情報の抽象化処理方法の一例である。 住所情報を処理し、秘匿化された住所座標の一例である。 位置特定処理手段における抽象化処理方法である。
本発明の実施方法について図を用いて説明する。データ保有機関aが管理する個人情報が含まれた内部データを、解析を行う外部機関bに提供するまでの流れを図1に示す。個人情報を保有する機関aは、購入もしくはレンタルで本システムにおいて使用するソフトウエアをあらかじめ組織内部のサーバ装置1にロードし、個人情報の秘匿化処理についてプライベートLANの端末より指示が受けられる状態とする。
LANに接続された端末からの指示で、データベース2より対象となるファイルのデータから氏名を削除し、代わりに管理用IDが付与されたデータファイルを作成する。この操作の後に、あらかじめロードされた秘匿化ソフトウエアを用いて住所情報の抽象化処理をサーバ装置1で実施する。
秘匿化ソフトウエアによる住所データの処理過程を図2に示す。対象となるデータは、アドレスマッチング処理について指示を受ける入力手段20より住所座標を特定する位置特定処理手段21に送られ、位置辞書22を用いて位置特定処理手段21に設けた住所参照テーブル上で住所座標データを特定し、必要な抽象化処理を行った後に住所座標データとして出力手段23より出力する。
個人の住所情報を地域密度に対応した住所座標に抽象化して変換するアドレスマッチングについて説明する。位置辞書22内に住所に対応した位置座標データと国勢調査に基づいた人口密度や世帯密度等より得られた地域の密度レベルデータを格納し、位置特定処理手段21に設けた、図3に示す住所欄と地域密度欄、座標欄からなる住所参照テーブルにおいて、個人の住所情報と地域密度別の住所座標(緯度経度等)の対応づけを行う。
住所座標の抽象化について図3で一例を示す。あらかじめ町字、丁目、番地、号まで可能な限り詳細な住所座標を設定し、地域密度が標準的な地域においては、詳細なアドレスマッチングを行った後、緯度経度の小数点N(図3ではN=5)桁以下(A,B)を乱数変換(C,D)する。人口密度の高い地域においては個人が特定され難いことから、詳細なアドレスマッチング処理を行った後に、必要に応じて緯度経度の小数点N+1桁以下をランダムに座標変換する。一方人口密度の低い地域においては、個人が特定され易い事を考慮して、同様のアドレスマッチング処理した後に、緯度経度の小数点以下N-1桁以下をランダムに座標変換する。このようにコンピュータ上で国勢調査に基づいた人口密度や世帯密度より得られた地域の密度レベルデータを元にアドレスマッチング精度を自動的に判断し、個人が特定されず解析に支障をきたさない必要十分なレベルで住所情報を抽象化処理する。
実際の住所に相当する位置座標 (x座標、y座標)を (x1、y1)とすると、抽象化処理をした後の座標 (x2、y2)との距離のずれSは、以下の計算式より近似値が求められる。R0:平均曲率半径(引数は )m0:座標系の原点における縮尺係数
10進法表示された緯度経度において、仮に小数点以下5桁目を乱数表示すると、図4に示すように実際の座標と最大100m程度のずれが生じる。個人が特定されないよう住所を座標変換して大量のデータから空間解析を行う場合、解析目的にもよるがこの値を超えないずれは、都道府県単位の解析を行う場合において結果に大きな影響を与えないと考えられ、過疎地を除けば、住所情報の抽象化レベルとして適当な情報処理と考えられる。さらに、人口密集地域を含む市区町村単位の解析を行う場合であれば、小数点以下6桁目の乱数表示により実際とのずれを最小にして精度の高い空間解析も可能であり、本発明におけるアドレスマッチングレベルの設定は、解析目的と人口密度や世帯密度といった地域特性に応じて変更することが可能である。
位置特定処理手段21において、地域の密度レベルデータを元に住所情報を抽象化処理する他の方法を、図5に示す。Cに示すように、実際の座標A1を一定の範囲rにあるAの位置にランダムに座標変換する以外に、Dに示すように実際の座標B1を番地や号レベルのエリアを代表とする座標B(重心座標等)に変換処理する方法等がある。
最初のアドレスマッチングで、番地、号までマッチングできない場合は、最も近いレベルのデータを暫定的に出力し、空間解析への影響の有無を判断できるよう非マッチングデータとし、必要に応じて再処理できるようグループ化する
秘匿化処理が終わったデータは、アドレスマッチング処理のエラー等について検証した後に、共有IDにより匿名化データベース3で管理し、インターネットもしくはフラッシュメモリー等の記録媒体により専門的な解析を行う外部機関bのデータベース4に提供を行う。
外部機関bにおいて空間解析を実施し、はずれ値や非マッチングデータを含め不適切な秘匿化処理が疑われるデータについては、共有IDにより照会し必要に応じて個人情報を保有する機関aのシステム上でデータの再処理を行い匿名化データベース3の修正を行う。外部機関bは、完成した匿名化データベース3より作成されたデータベース4を用いて、依頼を受けたマーケティング等の解析を実施する。
1 サーバ装置
2 個人情報が含まれたデータベース
3 匿名化データベース
4 外部機関データベース
5 秘匿化を行う外部機関
a データ保有機関
b 解析を行う外部機関
20 入力手段
21 位置特定処理手段
22 位置辞書
23 出力手段
r 一定の範囲
A1 実際の座標
A 変換後の座標
B1 実際の座標
B 変換後の座標
C 一定の範囲にランダムに配置する抽象化
D エリアを代表する座標に配置する抽象化

Claims (1)

  1. アドレスマッチング処理の対象となる住所が帰属する地域の人口密度や世帯密度の特性に応じて、出力する住所座標データに関する秘匿化のレベルを個人が特定されないよう自動的に判断することを特徴としたアドレスマッチング処理システム。
JP2009281371A 2009-12-11 2009-12-11 秘匿化アドレスマッチング処理システム Expired - Fee Related JP5382599B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009281371A JP5382599B2 (ja) 2009-12-11 2009-12-11 秘匿化アドレスマッチング処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009281371A JP5382599B2 (ja) 2009-12-11 2009-12-11 秘匿化アドレスマッチング処理システム

Publications (2)

Publication Number Publication Date
JP2011123712A JP2011123712A (ja) 2011-06-23
JP5382599B2 true JP5382599B2 (ja) 2014-01-08

Family

ID=44287533

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009281371A Expired - Fee Related JP5382599B2 (ja) 2009-12-11 2009-12-11 秘匿化アドレスマッチング処理システム

Country Status (1)

Country Link
JP (1) JP5382599B2 (ja)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6125153B2 (ja) * 2012-04-27 2017-05-10 Kddi株式会社 位置情報匿名化装置、位置情報匿名化方法およびプログラム
JP2014109647A (ja) * 2012-11-30 2014-06-12 Intec Inc サービス提供システム
US9361480B2 (en) * 2014-03-26 2016-06-07 Alcatel Lucent Anonymization of streaming data
JP6355577B2 (ja) * 2015-03-03 2018-07-11 Kddi株式会社 匿名化装置、方法及びプログラム
JP6409185B2 (ja) * 2016-01-06 2018-10-24 国際航業株式会社 個別基礎情報秘匿化プログラム、及び個別基礎情報秘匿化装置
JP2018109838A (ja) * 2016-12-28 2018-07-12 富士通株式会社 情報処理装置、情報処理システム、プログラム、及び情報処理方法
WO2018198676A1 (ja) * 2017-04-28 2018-11-01 株式会社キーソフト 情報処理システム
JP6705998B1 (ja) * 2019-06-05 2020-06-03 キヤノンマーケティングジャパン株式会社 サーバ装置、サーバ装置の制御方法、プログラム、正規品判定システム、及び正規品判定システムの制御方法
JP7421099B2 (ja) * 2019-06-05 2024-01-24 キヤノンマーケティングジャパン株式会社 サーバ装置、サーバ装置の制御方法、プログラム、正規品判定システム、及び正規品判定システムの制御方法
JP7458863B2 (ja) * 2020-04-06 2024-04-01 株式会社ブログウォッチャー 情報処理装置、情報処理方法、情報処理プログラム
JP7490424B2 (ja) * 2020-04-06 2024-05-27 株式会社ブログウォッチャー 情報処理装置、情報処理方法、情報処理プログラム
JP7422595B2 (ja) * 2020-04-06 2024-01-26 株式会社ブログウォッチャー 情報処理装置、情報処理方法、情報処理プログラム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002314477A (ja) * 2001-04-11 2002-10-25 Nec Corp 情報提供システム、その方法及びそれに用いる利用者端末並びにそのプログラム
JP2007287102A (ja) * 2006-04-20 2007-11-01 Mitsubishi Electric Corp データ変換装置
JP4956455B2 (ja) * 2008-01-29 2012-06-20 株式会社日立製作所 情報管理装置、プログラム及び情報管理方法。

Also Published As

Publication number Publication date
JP2011123712A (ja) 2011-06-23

Similar Documents

Publication Publication Date Title
JP5382599B2 (ja) 秘匿化アドレスマッチング処理システム
US11080423B1 (en) System for simulating a de-identified healthcare data set and creating simulated personal data while retaining profile of authentic data
US20140164303A1 (en) Method of answering questions and scoring answers using structured knowledge mined from a corpus of data
CN110597816A (zh) 数据处理方法、装置、计算机设备和计算机可读存储介质
Ho et al. Forecasting hospital emergency department patient volume using internet search data
WO2019153598A1 (zh) 客户风险等级管理方法、服务器及计算机可读存储介质
CN109446837B (zh) 基于敏感信息的文本审核方法、设备及可读存储介质
CN110674360B (zh) 一种用于数据的溯源方法和系统
CN113364753B (zh) 反爬虫方法、装置、电子设备及计算机可读存储介质
CN113626865A (zh) 一种防止泄露敏感信息的数据共享开放方法及系统
CN112732567B (zh) 基于ip的mock数据测试方法、装置、电子设备及存储介质
CN113946690A (zh) 潜在客户挖掘方法、装置、电子设备及存储介质
Zhang et al. Ambulance deployment with relocation through robust optimization
CN111930897B (zh) 专利检索方法、装置、电子设备及计算机可读存储介质
CN115936895A (zh) 基于人工智能的风险评估方法、装置、设备及存储介质
CN113901166B (zh) 电子地图构建方法、装置、设备及存储介质
US11335043B1 (en) Tracking environmental contaminants
Helderop et al. ‘Unmasking’masked address data: A medoid geocoding solution
CN112199483A (zh) 信息录入辅助方法、装置、电子设备及存储介质
Adeyelure Geographical information system readiness assessment framework in the south african private health sector for pre-to post-covid-19 pandemic management
CN112950154B (zh) 流程信息匹配方法、装置、设备及存储介质
CN112561500B (zh) 基于用户数据的薪酬数据生成方法、装置、设备及介质
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN114298321A (zh) 联合建模方法、装置、电子设备及存储介质
KR102489574B1 (ko) 가명정보 파일을 판별하기 위한 정보집합물 내에 삽입된 서명을 포함하는 가명정보 파일의 생성 및 판별 방법, 장치 및 컴퓨터프로그램

Legal Events

Date Code Title Description
A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20121205

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121205

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20130228

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130312

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130424

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130730

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130809

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20130917

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130921

R150 Certificate of patent or registration of utility model

Ref document number: 5382599

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees