JP2018067279A - データプロパティ認識のための装置、プログラム、及び方法 - Google Patents
データプロパティ認識のための装置、プログラム、及び方法 Download PDFInfo
- Publication number
- JP2018067279A JP2018067279A JP2016233527A JP2016233527A JP2018067279A JP 2018067279 A JP2018067279 A JP 2018067279A JP 2016233527 A JP2016233527 A JP 2016233527A JP 2016233527 A JP2016233527 A JP 2016233527A JP 2018067279 A JP2018067279 A JP 2018067279A
- Authority
- JP
- Japan
- Prior art keywords
- data
- data entry
- feature vector
- property
- model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/25—Integrating or interfacing systems involving database management systems
- G06F16/256—Integrating or interfacing systems involving database management systems in federated or virtual databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/30—Arrangements for executing machine instructions, e.g. instruction decode
- G06F9/30181—Instruction operation extension or modification
- G06F9/30192—Instruction operation extension or modification according to data descriptor, e.g. dynamic data typing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/04—Inference or reasoning models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V40/00—Recognition of biometric, human-related or animal-related patterns in image or video data
- G06V40/10—Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
- G06V40/12—Fingerprints or palmprints
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
- H04N5/765—Interface circuits between an apparatus for recording and another apparatus
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
最小値、
最大値、
第1の四分位値(first quartile value)、
第3の四分位値(third quartile value)、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ。
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白文字数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合。
エントリの数、
最小数値、
最大数値、
第1の四分位数値(first quartile numerical value)、
第3の四分位数値(third quartile numerical value)、
中央数値、
数値の平均、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日。
(付記1) データプロパティ認識装置であって、
記憶ユニットと、
モデルデータ取得プロセッサであって、複数のデータエントリモデルセットを取得するよう構成され、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、モデルデータ取得プロセッサと、
特徴ベクトル生成プロセッサであって、データエントリ入力セットを受信し、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記の認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記データエントリ入力セットから前記の選択した統計的特徴セットの各々の値を生成し、前記の生成した統計的特徴の値から成る特徴ベクトルを出力するよう構成される、特徴ベクトル生成プロセッサと、
を有し、
前記モデルデータ取得プロセッサは、前記取得した複数のデータエントリモデルセットの各々について、データエントリ入力セットとして、前記特徴ベクトル生成プロセッサに前記データエントリモデルセットを提出し、前記特徴ベクトル生成プロセッサにより出力される前記特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別したプロパティに関連付けて前記特徴ベクトルを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて前記提出された特徴ベクトルを、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットについて、前記特徴ベクトル生成プロセッサにより出力される特徴ベクトルと比較するための特徴ベクトル基準セットとして、格納するよう構成される、
データプロパティ認識装置。
(付記2) クエリプロセッサであって、前記クエリプロセッサは、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、前記データエントリクエリセットを前記特徴ベクトル生成プロセッサに提出し、前記出力された特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記出力された特徴ベクトルについて前記格納された特徴ベクトル基準セットの間で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表されるデータプロパティとして認識し、前記認識したデータプロパティを出力するよう構成される、クエリプロセッサ、
を更に有する付記1に記載のデータプロパティ認識装置。
(付記3) 前記クエリプロセッサは、前記データエントリクエリセット及び前記認識されたデータプロパティを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記データエントリクエリセットを、認識されたデータエントリセットとして、前記認識されたデータプロパティに関連付けて格納するよう構成される、
付記2に記載のデータプロパティ認識装置。
(付記4) 前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて及び前記特徴ベクトルが生成された前記個々のデータエントリモデルセットに関連付けて、前記特徴ベクトル基準セットを格納するよう構成される、
付記1に記載のデータプロパティ認識装置。
(付記5) 基準特徴ベクトル更新プロセッサであって、前記記憶ユニットに格納された前記認識されたデータエントリセットの提出により、前記提出された認識されたデータエントリセットと同じ識別されたプロパティに関連付けて格納されたデータエントリ基準セットの各々と他の認識されたデータエントリセットの各々とを有するデータエントリ合成セットを編成し、前記特徴ベクトル生成プロセッサに前記データエントリ合成セットを提出し、更新基準特徴ベクトルとして前記特徴ベクトル生成プロセッサにより出力された前記特徴ベクトルを得て、前記識別されたプロパティと関連付けて格納された前記特徴ベクトル基準セットの中に存在する特徴ベクトルを、前記更新基準特徴ベクトルで置き換えるよう構成される、基準特徴ベクトル更新プロセッサ、
を更に有する付記3又は4に記載のデータプロパティ認識装置。
(付記6) 前記の実行される比較は、前記出力される特徴ベクトルと前記格納された特徴ベクトル基準セットの各々との間であり、前記比較は、
前記基準セットからの前記特徴ベクトルにより表される前記データエントリセットのデータ型を、前記出力される特徴ベクトルにより表される前記データエントリクエリセットのデータ型と比較するステップと、
前記データ型が異なる場合、数学的比較により前記基準セットから前記特徴ベクトルを除外するステップと、
前記データ型が同じ場合、前記出力される特徴ベクトルと前記基準セットからの前記特徴ベクトルとの間の数学的比較を実行して、類似性値を得るステップと、
を有し、
最大類似性値が得られた特徴ベクトルは、前記最良一致特徴ベクトルである、
付記3に記載のデータプロパティ認識装置。
(付記7) 数値型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
最小値、
最大値、
第1の四分位値、
第3の四分位値、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記8) 文字列型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記9) 数値時系列型であるとして認識されたデータ値入力セットの前記統計的特徴セットは、
データ値の数、
エントリの数、
最小数値、
最大数値、
第1の四分位数値、
第3の四分位数値、
中央数値、
数値の平均値、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日、
の中からの2以上を有する、付記1に記載のデータプロパティ認識装置。
(付記10) 前記複数のサポートされるデータ型は、数値、文字列、及び数値時系列型を有する、付記1に記載のデータプロパティ認識装置。
(付記11) 第1のデータソースからの複数のデータエントリモデルセットの指定と更なるデータソースからの複数のデータエントリクエリセットの指定とを、ユーザから受け付けるユーザインタフェースと、
付記3に記載のデータプロパティ認識装置であって、前記複数のデータエントリモデルセットは前記ユーザにより指定される、データプロパティ認識装置と、
データプロパティリコンシレーションプロセッサであって、前記記憶ユニットに、前記第1のデータソースのコピー及び前記更なるデータソースの各々のコピーを提出するよう構成され、認識されたデータプロパティが前記クエリプロセッサにより出力された前記データエントリクエリセットは、前記個々の認識されたデータプロパティと関連付けて格納される、データプロパティリコンシレーションプロセッサと、
を有するデータセットリコンシレーション装置。
(付記12) 複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する方法。
(付記13) 前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、複数のサポートされるデータ型の中から前記データエントリクエリセットに共通のデータ型を認識し、前記データエントリクエリセットの前記認識されたデータ型に依存して、データエントリ入力セットを表す統計的特徴セットのうちの1つを選択し、前記データエントリクエリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成された統計的特徴の値から成る特徴ベクトルを出力するステップであって、前記複数のサポートされるデータ型は、数値型、文字列型、及び数値時系列型を有する、ステップと、
前記データエントリクエリセットについて出力された前記特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記データエントリクエリセットについて出力された前記特徴ベクトルに対して、前記格納された特徴ベクトル基準セットの中で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表される認識されたデータプロパティとして認識し、前記認識されたデータプロパティを出力するステップと、
を更に有する付記12に記載の方法。
(付記14) コンピュータプログラムであって、コンピューティング装置により実行されると、前記コンピューティング装置に方法を実行させ、前記方法は、
複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する、コンピュータプログラム。
12 モデルデータ取得プロセッサ
18 クエリプロセッサ
14 特徴ベクトル生成プロセッサ
16 記憶ユニット
Claims (14)
- データプロパティ認識装置であって、
記憶ユニットと、
モデルデータ取得プロセッサであって、複数のデータエントリモデルセットを取得するよう構成され、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、モデルデータ取得プロセッサと、
特徴ベクトル生成プロセッサであって、データエントリ入力セットを受信し、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記の認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記データエントリ入力セットから前記の選択した統計的特徴セットの各々の値を生成し、前記の生成した統計的特徴の値から成る特徴ベクトルを出力するよう構成される、特徴ベクトル生成プロセッサと、
を有し、
前記モデルデータ取得プロセッサは、前記取得した複数のデータエントリモデルセットの各々について、データエントリ入力セットとして、前記特徴ベクトル生成プロセッサに前記データエントリモデルセットを提出し、前記特徴ベクトル生成プロセッサにより出力される前記特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別したプロパティに関連付けて前記特徴ベクトルを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて前記提出された特徴ベクトルを、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットについて、前記特徴ベクトル生成プロセッサにより出力される特徴ベクトルと比較するための特徴ベクトル基準セットとして、格納するよう構成される、
データプロパティ認識装置。 - クエリプロセッサであって、前記クエリプロセッサは、前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、前記データエントリクエリセットを前記特徴ベクトル生成プロセッサに提出し、前記出力された特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記出力された特徴ベクトルについて前記格納された特徴ベクトル基準セットの間で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表されるデータプロパティとして認識し、前記認識したデータプロパティを出力するよう構成される、クエリプロセッサ、
を更に有する請求項1に記載のデータプロパティ認識装置。 - 前記クエリプロセッサは、前記データエントリクエリセット及び前記認識されたデータプロパティを前記記憶ユニットに提出するよう構成され、
前記記憶ユニットは、前記データエントリクエリセットを、認識されたデータエントリセットとして、前記認識されたデータプロパティに関連付けて格納するよう構成される、
請求項2に記載のデータプロパティ認識装置。 - 前記記憶ユニットは、前記個々の識別されたプロパティに関連付けて及び前記特徴ベクトルが生成された前記個々のデータエントリモデルセットに関連付けて、前記特徴ベクトル基準セットを格納するよう構成される、
請求項1に記載のデータプロパティ認識装置。 - 基準特徴ベクトル更新プロセッサであって、前記記憶ユニットに格納された前記認識されたデータエントリセットの提出により、前記提出された認識されたデータエントリセットと同じ識別されたプロパティに関連付けて格納されたデータエントリ基準セットの各々と他の認識されたデータエントリセットの各々とを有するデータエントリ合成セットを編成し、前記特徴ベクトル生成プロセッサに前記データエントリ合成セットを提出し、更新基準特徴ベクトルとして前記特徴ベクトル生成プロセッサにより出力された前記特徴ベクトルを得て、前記識別されたプロパティと関連付けて格納された前記特徴ベクトル基準セットの中に存在する特徴ベクトルを、前記更新基準特徴ベクトルで置き換えるよう構成される、基準特徴ベクトル更新プロセッサ、
を更に有する請求項3又は4に記載のデータプロパティ認識装置。 - 前記の実行される比較は、前記出力される特徴ベクトルと前記格納された特徴ベクトル基準セットの各々との間であり、前記比較は、
前記基準セットからの前記特徴ベクトルにより表される前記データエントリセットのデータ型を、前記出力される特徴ベクトルにより表される前記データエントリクエリセットのデータ型と比較するステップと、
前記データ型が異なる場合、数学的比較により前記基準セットから前記特徴ベクトルを除外するステップと、
前記データ型が同じ場合、前記出力される特徴ベクトルと前記基準セットからの前記特徴ベクトルとの間の数学的比較を実行して、類似性値を得るステップと、
を有し、
最大類似性値が得られた特徴ベクトルは、前記最良一致特徴ベクトルである、
請求項3に記載のデータプロパティ認識装置。 - 数値型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
最小値、
最大値、
第1の四分位値、
第3の四分位値、
中央値、
平均値、
標準偏差、
分散、
最も繰り返されるデータエントリ、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 文字列型であるとして認識されたデータエントリ入力セットの前記統計的特徴セットは、
データエントリの数、
データエントリのアルファベット、
データエントリ当たりの平均文字数、
データエントリ当たりの平均空白数、
データエントリ当たりの平均ピリオド数、
データエントリ当たりの平均コンマ数、
データエントリ当たりの平均セミコロン数、
最も繰り返されるデータエントリ、
最長共通サブストリング、
ユニークなエントリの割合、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 数値時系列型であるとして認識されたデータ値入力セットの前記統計的特徴セットは、
データ値の数、
エントリの数、
最小数値、
最大数値、
第1の四分位数値、
第3の四分位数値、
中央数値、
数値の平均値、
標準偏差、
分散、
共分散、
歪度、
尖度、
開始日、
終了日、
の中からの2以上を有する、請求項1に記載のデータプロパティ認識装置。 - 前記複数のサポートされるデータ型は、数値、文字列、及び数値時系列型を有する、請求項1に記載のデータプロパティ認識装置。
- 第1のデータソースからの複数のデータエントリモデルセットの指定と更なるデータソースからの複数のデータエントリクエリセットの指定とを、ユーザから受け付けるユーザインタフェースと、
請求項3に記載のデータプロパティ認識装置であって、前記複数のデータエントリモデルセットは前記ユーザにより指定される、データプロパティ認識装置と、
データプロパティリコンシレーションプロセッサであって、前記記憶ユニットに、前記第1のデータソースのコピー及び前記更なるデータソースの各々のコピーを提出するよう構成され、認識されたデータプロパティが前記クエリプロセッサにより出力された前記データエントリクエリセットは、前記個々の認識されたデータプロパティと関連付けて格納される、データプロパティリコンシレーションプロセッサと、
を有するデータセットリコンシレーション装置。 - 複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する方法。 - 前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットを得て、複数のサポートされるデータ型の中から前記データエントリクエリセットに共通のデータ型を認識し、前記データエントリクエリセットの前記認識されたデータ型に依存して、データエントリ入力セットを表す統計的特徴セットのうちの1つを選択し、前記データエントリクエリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成された統計的特徴の値から成る特徴ベクトルを出力するステップであって、前記複数のサポートされるデータ型は、数値型、文字列型、及び数値時系列型を有する、ステップと、
前記データエントリクエリセットについて出力された前記特徴ベクトルと前記格納された特徴ベクトル基準セットとの間の比較を実行して、前記データエントリクエリセットについて出力された前記特徴ベクトルに対して、前記格納された特徴ベクトル基準セットの中で最良一致特徴ベクトルを識別し、前記最良一致特徴ベクトルに関連付けて格納された前記識別されたプロパティを、前記データエントリクエリセットの中の前記個々のデータエントリにより表される認識されたデータプロパティとして認識し、前記認識されたデータプロパティを出力するステップと、
を更に有する請求項12に記載の方法。 - コンピュータプログラムであって、コンピューティング装置により実行されると、前記コンピューティング装置に方法を実行させ、前記方法は、
複数のデータエントリモデルセットを取得するステップであって、各々の個々のデータエントリモデルセットは、前記データエントリモデルセットに共通の識別されたプロパティを個々に表す複数のデータエントリであり、及び前記データ要素モデルセットに共通のデータ型である、ステップと、
データエントリ入力セットとして前記取得された複数のデータエントリモデルセットの各々について、複数のサポートされるデータ型の中から前記データエントリ入力セットに共通のデータ型を認識し、前記認識したデータ型に依存して前記データエントリ入力セットを表す統計的特徴セットを選択し、前記複数のデータエントリセットから前記選択された統計的特徴セットの各々の値を生成し、前記生成した統計的特徴の値から成る特徴ベクトルを出力するステップと、
前記取得した複数のデータエントリモデルセットの各々について、前記出力された特徴ベクトルを得て、前記データエントリモデルセットに共通の前記識別されたプロパティと関連付けて前記出力された特徴ベクトルを記憶ユニットに提出するステップと、
前記個々のデータエントリにより共通に表されるプロパティの識別情報が捜し出されるデータエントリクエリセットのために生成された特徴ベクトルと比較するための特徴ベクトル基準セットとして、前記個々の識別されたプロパティと関連付けて前記提出された特徴ベクトルを格納するステップと、
を有する、コンピュータプログラム。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE102016220771 | 2016-10-21 | ||
DE102016220771.7 | 2016-10-21 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018067279A true JP2018067279A (ja) | 2018-04-26 |
JP7100422B2 JP7100422B2 (ja) | 2022-07-13 |
Family
ID=57708417
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016233527A Active JP7100422B2 (ja) | 2016-10-21 | 2016-11-30 | データプロパティ認識のための装置、プログラム、及び方法 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10430440B2 (ja) |
EP (1) | EP3312778A1 (ja) |
JP (1) | JP7100422B2 (ja) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10803034B2 (en) * | 2016-11-23 | 2020-10-13 | Amazon Technologies, Inc. | Global column indexing in a graph database |
EP3407206B1 (en) | 2017-05-22 | 2021-08-04 | Fujitsu Limited | Reconciled data storage system |
EP3407207A1 (en) | 2017-05-22 | 2018-11-28 | Fujitsu Limited | System, method, and program for reconciling input datasets with a model ontology |
US11474978B2 (en) * | 2018-07-06 | 2022-10-18 | Capital One Services, Llc | Systems and methods for a data search engine based on data profiles |
US11068259B2 (en) | 2019-01-04 | 2021-07-20 | T-Mobile Usa, Inc. | Microservice-based dynamic content rendering |
US10983767B2 (en) * | 2019-01-04 | 2021-04-20 | T-Mobile Usa, Inc. | Microservice-based software development |
CN110298743A (zh) * | 2019-06-21 | 2019-10-01 | 深圳前海微众银行股份有限公司 | 车辆质押物状态预警方法、装置、设备及存储介质 |
CN111580890A (zh) * | 2020-05-18 | 2020-08-25 | 北京字节跳动网络技术有限公司 | 用于处理特征的方法、装置、电子设备和计算机可读介质 |
JP7525374B2 (ja) | 2020-11-12 | 2024-07-30 | 株式会社ジェイテクトサーモシステム | 加熱装置 |
CN114741381B (zh) * | 2022-04-14 | 2023-04-14 | 郑州轻工业大学 | 基于关联依赖的数据清洗方法 |
CN116029571B (zh) * | 2023-03-29 | 2023-06-16 | 肯特智能技术(深圳)股份有限公司 | 基于元宇宙的数据处理方法及相关装置 |
US12117980B1 (en) * | 2023-09-11 | 2024-10-15 | Oracle International Corporation | Auto recognition of big data computation engine for optimized query runs on cloud platforms |
Family Cites Families (76)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR111574A (ja) | 1973-12-13 | 1900-01-01 | ||
US6990453B2 (en) | 2000-07-31 | 2006-01-24 | Landmark Digital Services Llc | System and methods for recognizing sound and music signals in high noise and distortion |
PT1504445E (pt) | 2002-04-25 | 2008-11-24 | Landmark Digital Services Llc | Emparelhamento de padrões áudio robusto e invariante |
US20040006559A1 (en) | 2002-05-29 | 2004-01-08 | Gange David M. | System, apparatus, and method for user tunable and selectable searching of a database using a weigthted quantized feature vector |
US6961736B1 (en) | 2002-05-31 | 2005-11-01 | Adobe Systems Incorporated | Compact color feature vector representation |
US7081579B2 (en) | 2002-10-03 | 2006-07-25 | Polyphonic Human Media Interface, S.L. | Method and system for music recommendation |
EP1561176A2 (en) | 2002-11-01 | 2005-08-10 | Koninklijke Philips Electronics N.V. | Improved audio data fingerprint searching |
US8005919B2 (en) | 2002-11-18 | 2011-08-23 | Aol Inc. | Host-based intelligent results related to a character stream |
US20050060350A1 (en) | 2003-09-15 | 2005-03-17 | Baum Zachariah Journey | System and method for recommendation of media segments |
TW594510B (en) | 2003-11-05 | 2004-06-21 | Ind Tech Res Inst | Method and system of automatic service composition |
US7797198B1 (en) | 2004-01-27 | 2010-09-14 | Amazon Technologies, Inc. | Providing an invocable composite network service based on multiple other invocable constituent network services |
US7433835B2 (en) | 2004-01-27 | 2008-10-07 | Amazon Technologies, Inc. | Providing a marketplace for web services |
US7558822B2 (en) | 2004-06-30 | 2009-07-07 | Google Inc. | Accelerating user interfaces by predicting user actions |
US7823123B2 (en) | 2004-07-13 | 2010-10-26 | The Mitre Corporation | Semantic system for integrating software components |
US7324976B2 (en) | 2004-07-19 | 2008-01-29 | Amazon Technologies, Inc. | Automatic authorization of programmatic transactions |
JP4476786B2 (ja) | 2004-11-10 | 2010-06-09 | 株式会社東芝 | 検索装置 |
US8195693B2 (en) | 2004-12-16 | 2012-06-05 | International Business Machines Corporation | Automatic composition of services through semantic attribute matching |
US7734515B1 (en) | 2005-08-17 | 2010-06-08 | Amazon Technologies, Inc. | Generating new invocable composite network services based on multiple other invocable constituent network services |
US7949529B2 (en) | 2005-08-29 | 2011-05-24 | Voicebox Technologies, Inc. | Mobile systems and methods of supporting natural language human-machine interactions |
WO2008015417A1 (en) | 2006-07-31 | 2008-02-07 | British Telecommunications Public Limited Company | Automatic composition of web services based on syntactiv and semantic rules |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8122045B2 (en) | 2007-02-27 | 2012-02-21 | International Business Machines Corporation | Method for mapping a data source to a data target |
US8312426B2 (en) | 2008-01-07 | 2012-11-13 | International Business Machines Corporation | Method and system for simplified service composition in web environment |
CN101262374A (zh) | 2008-04-22 | 2008-09-10 | 北京邮电大学 | 一种服务注册的方法和装置 |
US8344233B2 (en) | 2008-05-07 | 2013-01-01 | Microsoft Corporation | Scalable music recommendation by search |
US8660924B2 (en) | 2009-04-30 | 2014-02-25 | Navera, Inc. | Configurable interactive assistant |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
EP2781595B1 (en) | 2010-02-03 | 2018-04-11 | Samsung Life Public Welfare Foundation | Method for proliferating stem cells by activating c-MET/HGF signalling |
US8391590B2 (en) | 2010-03-04 | 2013-03-05 | Flashscan3D, Llc | System and method for three-dimensional biometric data feature detection and recognition |
US8386929B2 (en) | 2010-06-22 | 2013-02-26 | Microsoft Corporation | Personal assistant for task utilization |
CN102385858B (zh) | 2010-08-31 | 2013-06-05 | 国际商业机器公司 | 情感语音合成方法和系统 |
US8666998B2 (en) | 2010-09-14 | 2014-03-04 | International Business Machines Corporation | Handling data sets |
KR20120052610A (ko) | 2010-11-16 | 2012-05-24 | 삼성전자주식회사 | 신경망 학습을 통한 동작 인식 방법 및 장치 |
US9064006B2 (en) | 2012-08-23 | 2015-06-23 | Microsoft Technology Licensing, Llc | Translating natural language utterances to keyword search queries |
US9146917B2 (en) | 2011-07-15 | 2015-09-29 | International Business Machines Corporation | Validating that a user is human |
RU2542937C2 (ru) | 2011-09-30 | 2015-02-27 | Эпл Инк. | Использование контекстной информации для облегчения обработки команд в виртуальном помощнике |
US8655989B2 (en) | 2011-10-14 | 2014-02-18 | Sap Ag | Business network access protocol for the business network |
KR101910576B1 (ko) | 2011-11-08 | 2018-12-31 | 삼성전자주식회사 | 인공신경망을 이용하여 신속하게 입력 패턴을 분류하는 방법 및 장치 |
KR101912165B1 (ko) | 2011-12-09 | 2018-10-29 | 삼성전자주식회사 | 스파이킹 뉴런 기반 작업 기억 장치 |
US8788269B2 (en) | 2011-12-15 | 2014-07-22 | Microsoft Corporation | Satisfying specified intent(s) based on multimodal request(s) |
US9177168B2 (en) | 2012-03-19 | 2015-11-03 | Alcatel Lucent | Method of modifying access control for web services using query languages |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
EP2704029A1 (en) | 2012-09-03 | 2014-03-05 | Agfa Healthcare | Semantic data warehouse |
KR20140066640A (ko) | 2012-11-23 | 2014-06-02 | 삼성전자주식회사 | 다국어 음향 모델 구축 장치 및 이의 다국어 음향 모델 구축 방법, 그리고 그 방법을 수행하는 프로그램이 기록된 컴퓨터 판독 가능 매체 |
EP2736042A1 (en) | 2012-11-23 | 2014-05-28 | Samsung Electronics Co., Ltd | Apparatus and method for constructing multilingual acoustic model and computer readable recording medium for storing program for performing the method |
US20140201629A1 (en) | 2013-01-17 | 2014-07-17 | Microsoft Corporation | Collaborative learning through user generated knowledge |
IN2013CH00359A (ja) | 2013-01-28 | 2015-08-07 | Samsung R & D Inst India Bangalore Private Ltd | |
US9268617B1 (en) | 2013-03-11 | 2016-02-23 | Ca, Inc. | Bus-based dynamic evaluation with dynamic data lookups |
US11470036B2 (en) | 2013-03-14 | 2022-10-11 | Microsoft Technology Licensing, Llc | Email assistant for efficiently managing emails |
US9031933B2 (en) | 2013-04-03 | 2015-05-12 | International Business Machines Corporation | Method and apparatus for optimizing the evaluation of semantic web queries |
US9501503B2 (en) | 2013-05-09 | 2016-11-22 | Microsoft Technology Licensing, Llc | Inferring entity attribute values |
US9081411B2 (en) | 2013-05-10 | 2015-07-14 | Sri International | Rapid development of virtual personal assistant applications |
US9491063B2 (en) | 2013-05-15 | 2016-11-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Method and apparatus for providing network services orchestration |
CN105122353B (zh) | 2013-05-20 | 2019-07-09 | 英特尔公司 | 用于语音识别的计算装置和用于计算装置上的语音识别的方法 |
CN110442699A (zh) | 2013-06-09 | 2019-11-12 | 苹果公司 | 操作数字助理的方法、计算机可读介质、电子设备和系统 |
US9299331B1 (en) | 2013-12-11 | 2016-03-29 | Amazon Technologies, Inc. | Techniques for selecting musical content for playback |
EP2894587B1 (en) | 2014-01-09 | 2019-01-09 | Fujitsu Limited | Stored data access controller |
CN105934916B (zh) | 2014-02-23 | 2021-01-08 | 英特尔公司 | 向所部署装置编制和管理服务 |
US9473944B2 (en) | 2014-02-24 | 2016-10-18 | Microsoft Technology Licensing, Llc | Local personal daemon |
US9984158B2 (en) | 2014-03-18 | 2018-05-29 | Axis Ab | Finding services in a service-oriented architecture (SOA) network |
US9705995B2 (en) | 2014-03-18 | 2017-07-11 | Axis Ab | Capability monitoring in a service oriented architecture |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US20160044380A1 (en) | 2014-06-12 | 2016-02-11 | Bertrand Barrett | Personal helper bot system |
WO2015191965A2 (en) | 2014-06-13 | 2015-12-17 | Convida Wireless, Llc | Automated service profiling and orchestration |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
KR102239714B1 (ko) | 2014-07-24 | 2021-04-13 | 삼성전자주식회사 | 신경망 학습 방법 및 장치, 데이터 처리 장치 |
EP2977918A1 (en) | 2014-07-24 | 2016-01-27 | Tata Consultancy Services Limited | A system and method for executing a sparql query |
US9836701B2 (en) | 2014-08-13 | 2017-12-05 | Microsoft Technology Licensing, Llc | Distributed stage-wise parallel machine learning |
US20160063874A1 (en) | 2014-08-28 | 2016-03-03 | Microsoft Corporation | Emotionally intelligent systems |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US10698585B2 (en) | 2014-08-29 | 2020-06-30 | Nuance Communications, Inc. | Virtual assistant development system |
US20160070580A1 (en) | 2014-09-09 | 2016-03-10 | Microsoft Technology Licensing, Llc | Digital personal assistant remote invocation |
CN104202416A (zh) | 2014-09-16 | 2014-12-10 | 浪潮(北京)电子信息产业有限公司 | 一种云操作系统下的服务编排系统及方法 |
US10210246B2 (en) | 2014-09-26 | 2019-02-19 | Oracle International Corporation | Techniques for similarity analysis and data enrichment using knowledge sources |
US10152558B2 (en) | 2014-12-23 | 2018-12-11 | Intel Corporation | Graph operations |
CN105357143B (zh) | 2015-11-27 | 2019-10-01 | 华为技术有限公司 | 一种转发方法及服务路由中继节点 |
-
2016
- 2016-11-30 JP JP2016233527A patent/JP7100422B2/ja active Active
- 2016-12-23 EP EP16206620.3A patent/EP3312778A1/en not_active Ceased
-
2017
- 2017-08-17 US US15/679,296 patent/US10430440B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
EP3312778A1 (en) | 2018-04-25 |
US10430440B2 (en) | 2019-10-01 |
JP7100422B2 (ja) | 2022-07-13 |
US20180113926A1 (en) | 2018-04-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7100422B2 (ja) | データプロパティ認識のための装置、プログラム、及び方法 | |
Hartig et al. | Publishing and consuming provenance metadata on the web of linked data | |
Dimou et al. | Assessing and refining mappingsto rdf to improve dataset quality | |
US20180113888A1 (en) | Apparatus program & method for data property recognition | |
CN112037920A (zh) | 医疗知识图谱构建方法、装置、设备及存储介质 | |
EP3671526B1 (en) | Dependency graph based natural language processing | |
US20060235899A1 (en) | Method of migrating legacy database systems | |
KR102345410B1 (ko) | 빅데이터 지능형 수집 방법 및 장치 | |
Spoth et al. | Adaptive schema databases | |
US9053207B2 (en) | Adaptive query expression builder for an on-demand data service | |
Niu et al. | Interoperability for Provenance-aware Databases using {PROV} and {JSON} | |
Bryl et al. | Interlinking and knowledge fusion | |
US10866944B2 (en) | Reconciled data storage system | |
US10896227B2 (en) | Data processing system, data processing method, and data structure | |
Bogatu et al. | Towards automatic data format transformations: Data wrangling at scale | |
Arasu et al. | Towards a domain independent platform for data cleaning | |
US11327994B2 (en) | Arranging converted operation history information | |
Sazontev et al. | An extensible approach for materialized big data integration in distributed computation environments | |
Unbehauen et al. | SPARQL update queries over R2RML mapped data sources | |
Alian et al. | Unsupervised learning blocking keys technique for indexing Arabic entity resolution | |
WO2020139447A1 (en) | Cataloging database metadata using a probabilistic signature matching process | |
Wang et al. | Research on Web Query Translation based on Ontology. | |
US20240168728A1 (en) | Identification of relevant code block within relevant software package for a query | |
Ramulu et al. | A Read and Write Enhanced Platform-R2R Ingression for RDF-to-RDB | |
KR20170088466A (ko) | 그래프 데이터에 대한 부분 매칭 시스템 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170804 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190807 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200422 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200512 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200710 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20201027 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20210127 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20210803 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220412 |
|
C22 | Notice of designation (change) of administrative judge |
Free format text: JAPANESE INTERMEDIATE CODE: C22 Effective date: 20220510 |
|
C23 | Notice of termination of proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C23 Effective date: 20220517 |
|
C03 | Trial/appeal decision taken |
Free format text: JAPANESE INTERMEDIATE CODE: C03 Effective date: 20220614 |
|
C30A | Notification sent |
Free format text: JAPANESE INTERMEDIATE CODE: C3012 Effective date: 20220614 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220701 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7100422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |