JP2010128894A - データベース生成装置、データベース生成方法及びコンピュータプログラム - Google Patents
データベース生成装置、データベース生成方法及びコンピュータプログラム Download PDFInfo
- Publication number
- JP2010128894A JP2010128894A JP2008304312A JP2008304312A JP2010128894A JP 2010128894 A JP2010128894 A JP 2010128894A JP 2008304312 A JP2008304312 A JP 2008304312A JP 2008304312 A JP2008304312 A JP 2008304312A JP 2010128894 A JP2010128894 A JP 2010128894A
- Authority
- JP
- Japan
- Prior art keywords
- data
- rule information
- identification rule
- information
- item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】識別規則情報を複数準備しておき、データに応じて選択することにより、異なるデータ形式を有する複数の表データが存在する場合であっても、新たなデータベースを正しく生成することができるデータベース生成装置、データベース生成方法及びコンピュータプログラムを提供する。
【解決手段】一又は複数の電子文書ファイルを取得し、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける。指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶しておき、一の識別規則情報の選択を受け付ける。選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し、識別された項目部分及びデータ部分を集約して新たなデータベースを生成する。
【選択図】図3
【解決手段】一又は複数の電子文書ファイルを取得し、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける。指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶しておき、一の識別規則情報の選択を受け付ける。選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し、識別された項目部分及びデータ部分を集約して新たなデータベースを生成する。
【選択図】図3
Description
本発明は、異なるデータ形式を有する複数の表データが存在する場合であっても、容易に新たなデータベースを生成することができるデータベース生成装置、データベース生成方法及びコンピュータプログラムに関する。
関係データベースを生成する場合、事前に生成されている表データを利用することが多い。表データのデータベース項目が一致している場合には、複数の表データをマージすることにより容易に新たなデータベースを生成することができる。
しかし、表データのデータ形式が標準化されていない場合、表データのデータ形式は作成者に依存しており、また同一のアプリケーションであっても使用するソフトウェアプログラムによってデータベース項目の相違、データベース項目の配列順序の相違等が存在しており、そのままマージすることができない。斯かる問題を解決するべく、従来は中間ファイルフォーマットを用いて、データベース項目が相違している、あるいはデータベース項目の配列順序が相違している複数の表データをマージした表データで構成された新たなデータベースを生成している。
例えば特許文献1では、表データの中間ファイルフォーマットとして良く用いられているCSVファイルを介して、複数の表データから1つのデータベースを生成しているデータベース管理システムが開示されている。
特開2006−059135号公報
しかし、特許文献1のように、CSVファイルを介して複数の表データをマージする場合、どのデータベース項目が相違しているか、どのデータベース項目の配列順序が相違しているか等に関する情報を事前に知っておく必要が有り、これらの情報に応じて適切な変換手順を設定せずには、所望の表データを生成することができないという問題点があった。
また、表データの項目が階層化されている場合、例えば表データの罫線構造等を解析することにより、項目部分とデータ部分とを識別することができる。しかし、アンケート形式のデータのように単一項目である場合、数値列のみで構成されたデータ列である場合等には、項目部分とデータ部分とを自動認識することは困難であった。
本発明は斯かる事情に鑑みてなされたものであり、識別規則情報を複数準備しておき、データに応じて選択することにより、異なるデータ形式を有する複数の表データが存在する場合であっても、新たなデータベースを正しく生成することができるデータベース生成装置、データベース生成方法及びコンピュータプログラムを提供することを目的とする。
上記目的を達成するために第1発明に係るデータベース生成装置は、表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置において、一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段と、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける領域指定受付手段と、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶する識別規則情報記憶手段と、一の識別規則情報の選択を受け付ける識別規則情報選択受付手段と、選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する識別手段と、識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成するデータベース生成手段とを備えることを特徴とする。
また、第2発明に係るデータベース生成装置は、第1発明において、前記識別規則情報は、前記表データ中で階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報とを少なくとも含むことを特徴とする。
次に、上記目的を達成するために第3発明に係るデータベース生成方法は、表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なデータベース生成方法において、一又は複数の前記電子文書ファイルを取得し、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付け、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶し、一の識別規則情報の選択を受け付け、選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し、識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成することを特徴とする。
また、第4発明に係るデータベース生成方法は、第3発明において、前記識別規則情報は、前記表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報とを少なくとも含むことを特徴とする。
次に、上記目的を達成するために第5発明に係るコンピュータプログラムは、表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なコンピュータプログラムにおいて、前記データベース生成装置を、一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける領域指定受付手段、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶する識別規則情報記憶手段、一の識別規則情報の選択を受け付ける識別規則情報選択受付手段、選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する識別手段、及び識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成するデータベース生成手段として機能させることを特徴とする。
また、第6発明に係るコンピュータプログラムは、第5発明において、前記識別規則情報は、前記表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報とを少なくとも含むことを特徴とする。
第1発明、第3発明、及び第5発明では、一又は複数の電子文書ファイルを取得し、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける。指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶しておき、一の識別規則情報の選択を受け付ける。選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し、識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成する。指定を受け付けた領域に適応した識別規則情報の選択を受け付けることができるので、項目部分とデータ部分とを識別することが困難なデータ形式を有する電子文書ファイルであっても、確実に項目部分とデータ部分とを識別することができ、複数の表データに基づく新たなデータベースを容易に生成することが可能となる。
第2発明、第4発明、及び第6発明では、識別規則情報は、表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報とを少なくとも含む。第一の識別規則情報により通常の表データを、第二の識別規則情報によりアンケート形式のデータを、それぞれ項目部分とデータ部分とに正しく識別することができる。
本発明によれば、指定を受け付けた領域に適応した識別規則情報の選択を受け付けることができるので、項目部分とデータ部分とを識別することが困難なデータ形式を有する電子文書ファイルであっても、確実に項目部分とデータ部分とを識別することができ、複数の表データに基づく新たなデータベースを容易に生成することが可能となる。
以下、本発明の実施の形態に係るデータベース生成装置について、図面に基づいて具体的に説明する。以下の実施の形態は、特許請求の範囲に記載された発明を限定するものではなく、実施の形態の中で説明されている特徴的事項の組み合わせの全てが解決手段の必須事項であるとは限らないことは言うまでもない。
また、本発明は多くの異なる態様にて実施することが可能であり、実施の形態の記載内容に限定して解釈されるべきものではない。実施の形態を通じて同じ要素には同一の符号を付している。
以下の実施の形態では、コンピュータシステムにコンピュータプログラムを導入したデータベース生成装置について説明するが、当業者であれば明らかな通り、本発明はその一部をコンピュータで実行することが可能なコンピュータプログラムとして実施することができる。したがって、本発明は、データベース生成装置というハードウェアとしての実施の形態、ソフトウェアとしての実施の形態、又はソフトウェアとハードウェアとの組み合わせの実施の形態をとることができる。コンピュータプログラムは、ハードディスク、DVD、CD、光記憶装置、磁気記憶装置等の任意のコンピュータで読み取ることが可能な記録媒体に記録することができる。
図1は、本発明の実施の形態に係るデータベース生成装置の構成例を示すブロック図である。本発明の実施の形態に係るデータベース生成装置1は、少なくともCPU(中央演算装置)11、メモリ12、記憶装置13、I/Oインタフェース14、ビデオインタフェース15、可搬型ディスクドライブ16、通信インタフェース17及び上述したハードウェアを接続する内部バス18で構成されている。
CPU11は、内部バス18を介してデータベース生成装置1の上述したようなハードウェア各部と接続されており、上述したハードウェア各部の動作を制御するとともに、記憶装置13に記憶されているコンピュータプログラム100に従って、種々のソフトウェア的機能を実行する。メモリ12は、SRAM、SDRAM等の揮発性メモリで構成され、コンピュータプログラム100の実行時にロードモジュールが展開され、コンピュータプログラム100の実行時に発生する一時的なデータ等を記憶する。
記憶装置13は、内蔵される固定型記憶装置(ハードディスク)、SRAM等の揮発性メモリ、ROM等の不揮発性メモリ等で構成されている。記憶装置13に記憶されているコンピュータプログラム100は、プログラム及びデータ等の情報を記録したDVD、CD−ROM等の可搬型記録媒体90から、可搬型ディスクドライブ16によりダウンロードされ、実行時には記憶装置13からメモリ12へ展開して実行される。もちろん、通信インタフェース17を介してネットワーク2に接続されている外部のコンピュータからダウンロードされたコンピュータプログラムであっても良い。
また記憶装置13は、電子文書ファイル記憶部131、識別規則情報記憶部132、及びデータベース記憶部133を備えている。電子文書ファイル記憶部131には、表データを含み、新たなデータベースを生成するための基礎となる電子文書ファイルを記憶する。
識別規則情報記憶部132には、表データの項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶する。例えば罫線の構造等を解析した階層に基づいて項目部分とデータ部分とを識別する識別規則情報であっても良いし、アンケート形式のデータのような一対の組データ(項目部分とデータ部分とが対になったデータ)として識別する識別規則情報であっても良い。識別規則情報記憶部132は、表データの形式に応じて多様な識別規則情報を記憶することができる。
データベース記憶部133には、複数の電子文書ファイルに含まれる表データをマージして新たに生成されたデータベースを記憶する。
通信インタフェース17は内部バス18に接続されており、インターネット、LAN、WAN等の外部のネットワーク2に接続されることにより、外部のコンピュータ等とデータ送受信を行うことが可能となっている。電子文書ファイル記憶部131は、データベース生成装置1の記憶装置13に備えることに限定されるものではなく、外部のコンピュータの記憶装置に記憶されることによりネットワーク2上に点在していても良い。
I/Oインタフェース14は、キーボード21、マウス22等のデータ入力媒体と接続され、データの入力を受け付ける。また、ビデオインタフェース15は、CRTモニタ、LCD等の表示装置23と接続され、所定の画像を表示する。
図2は、本発明の実施の形態に係るデータベース生成装置1の機能ブロック図である。電子文書ファイル取得部201は、一又は複数の表データを含む電子文書ファイルを取得する。電子文書ファイルは、記憶装置13の電子文書ファイル記憶部131に記憶されている電子文書ファイルを読み出しても良いし、ネットワーク2を介して外部のコンピュータから読み出しても良い。また、キーボード21、マウス22等の入力装置を介して入力を受け付けても良い。
領域指定受付部202は、取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける。電子文書ファイルのどの領域について項目部分とデータ部分とを識別するのか明確に指示するためである。領域の指定の受け付けは、マウス22等によるドラッグ操作により受け付ける。
識別規則情報選択受付部203は、識別規則情報記憶部132に記憶されている複数の識別規則情報の中から、一の識別規則情報の選択を受け付ける。識別規則情報の選択の受け付けは、マウス22によるクリック操作、キーボード21によるキーイン操作等により受け付ける。
選択対象となる識別規則情報は、例えば表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報であっても良いし、表データ中で、一対の組データを認識する規則に関する情報であっても良い。また、データ列のみのデータを表データとして認識するための規則に関する情報であっても良い。
識別部204は、選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する。データベース生成部205は、複数の識別された項目部分及びデータ部分に基づいて複数の項目と該項目に対応するデータ列を特定し、複数の項目を集約して新たなデータベースを生成する。
なお、表データが階層を有するか否かを判断する階層判断部206を設けて、階層を有するか否かに応じて識別規則情報を選択できるようにしても良い。このようにすることで、大部分の表データは項目部分とデータ部分とを自動的に識別することが可能となる。
図3は、本発明の実施の形態に係るデータベース生成装置1のCPU11のデータベース生成処理の手順を示すフローチャートである。図3において、データベース生成装置1のCPU11は、一又は複数の表データを含む電子文書ファイルを取得する(ステップS301)。電子文書ファイルは、記憶装置13の電子文書ファイル記憶部131に記憶されている電子文書ファイルを読み出しても良いし、ネットワーク2を介して外部のコンピュータから読み出しても良い。また、キーボード21、マウス22等の入力装置を介して入力を受け付けても良い。
CPU11は、取得した一又は複数の電子文書ファイルの中で、項目部分とデータ部分とを識別する対象となる所定の領域の指定を受け付ける(ステップS302)。これにより、電子文書ファイルのどの領域について項目部分とデータ部分とを識別するのか明確にすることができる。領域の指定の受け付けは、マウス22等によるドラッグ操作により受け付ける。
CPU11は、識別規則情報記憶部132に記憶されている複数の識別規則情報の中から、一の識別規則情報の選択を受け付ける(ステップS303)。識別規則情報の選択の受け付けは、マウス22によるクリック操作、キーボード21によるキーイン操作等により受け付ける。
ユーザは、指定を受け付けた領域に複数項目を有する表データが含まれるか否か、一対の組データが含まれるか否か、データ列のみが含まれるか否か等に応じて、識別規則情報を選択する。指定を受け付けた領域に適応した識別規則情報を容易に選択することができるので、誤識別するおそれを排除することができ、項目部分とデータ部分とを正しく識別することができる。
CPU11は、選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し(ステップS304)、項目ごとに対応するデータ列を特定する。CPU11は、新たなデータベースを生成する生成指示を受け付けたか否かを判断する(ステップS305)。データベースの生成指示には、集約する項目を特定する情報も含まれる。CPU11が、生成指示を受け付けていないと判断した場合(ステップS305:NO)、CPU11は、処理をステップS302へ戻して、上述した処理を繰り返す。
CPU11が、生成指示を受け付けたと判断した場合(ステップS305:YES)、CPU11は、複数の識別された項目部分及びデータ部分に基づいて、複数の項目を集約して新たなデータベースを生成し(ステップS306)、データベース記憶部133に記憶する。新たなデータベースの生成方法は特に限定されるものではなく、周知の複数の表データの集約方法を用いれば何でも良い。
図4は、表データを所定の識別規則情報に従って識別する処理の例示図である。図4(a)は表データの具体例であり、ハッチングされている表領域41を識別処理の範囲として指定を受け付ける。指定の受付は、マウス22によるドラッグ操作により行われる。
識別規則情報として、項目の階層構造を解析して識別する規則に関する情報(第一の識別規則情報)を選択するべく、例えば「表データ」ボタンを画面上のいずれかの位置に配置しておき、マウス22等でのクリック操作を受け付けた場合、項目の階層構造を解析して識別する規則に関する情報の選択を受け付けたと判断することができる。この場合、表データ中で階層を有する部分を項目部分42と識別し、項目部分42の最下位階層以降の部分をデータ部分43と識別する。
したがって、図4(b)に示すように項目部分42は上位階層として項目「NO」、「単位」、「測定結果」が抽出され、項目「測定結果」の下位階層の項目として「最小」、「最大」、「平均」、「標準偏差」が抽出される。
図5は、アンケート形式のデータを所定の識別規則情報に従って識別する処理の例示図である。図5(a)はアンケート形式のデータの具体例であり、ハッチングされている領域51を識別処理の範囲として指定を受け付ける。指定の受付は、マウス22によるドラッグ操作により行われる。
図4と同様、表データとして項目の階層構造を解析して識別する規則に関する情報を選択するべく、例えば「表データ」ボタンを画面上のいずれかの位置に配置しておき、マウス22等でのクリック操作を受け付けた場合、表データ中で階層を有する部分を項目部分52と識別し、項目部分52の最下位階層以降の部分をデータ部分53と識別する。
したがって、図5(b)に示すように項目部分52は上位階層として項目「現住所」が抽出され、項目「現住所」の下位階層の項目として「郵便番号」、「533−0000」が抽出される。これでは、アンケート形式のデータの場合、最初の組データが項目であると誤識別され、正しいデータベースを生成することができない。
そこで、アンケート形式のデータの場合には、アンケート形式のデータに応じた識別規則情報を選択することができるようにする。図6は、アンケート形式のデータに対応した識別規則情報に従って識別する処理の例示図である。
図6(a)に示すように、表データの場合と同様に、アンケート形式のデータ部分を含むハッチングされている領域61を識別処理の範囲として指定を受け付ける。指定の受付は、マウス22によるドラッグ操作により行われる。
識別規則情報として、図4とは異なり、単一項目を一括して追加する規則に関する情報(第二の識別規則情報)を選択するべく、例えば「単一項目一括追加」ボタンを画面上のいずれかの位置に配置しておき、マウス22等でのクリック操作を受け付けた場合、単一項目を一括して追加する規則に関する情報の選択を受け付けたと判断することができる。この場合、階層構造の有無にかかわらず項目のみを抽出し、図6(b)に示すように、階層「現住所」の下位に階層「郵便番号」、「住所」、「電話番号」が項目部分62として識別され、それぞれ一対の組データになっている部分、すなわち「郵便番号」と「533−0000」との組、「住所」と「大阪市東淀川区」との組、「電話番号」と「06−6379−0000」との組等がデータ部分63として識別される。
上述した2つの識別規則情報の他、例えば数値のみのデータ列についても識別規則情報の設定次第では表データとして識別しうる。図7は、数値のみのデータ列に対応した識別規則情報に従って識別する処理の例示図である。
図7(a)に示すように複数行及び複数列の数値のみのデータ列が含まれる場合、項目部分は特定することはできない。しかし、アプリケーションによっては、数値のみのデータ列の配列順序自体に意味を持たせることが有効な場合が生じうる。例えば液晶画面上のピクセルごとの輝度値測定を行う場合等には、欠陥の有無を検出した上で平均輝度値等を算出しないとパネル寿命の算定、パネル製造精度の判定等において誤った判断をするおそれがある。
そこで、図7(b)に示すように、アプリケーションに応じた項目枠を当てはめる識別規則情報を適用することにより、単なる数値のみのデータ列がピクセルごとの数値へと意味づけをすることができる。したがって、単なる数値のデータ列が、新たに付与した項目に対応したデータ列として識別することができる。
以上のように本実施の形態によれば、指定を受け付けた領域に適応した識別規則情報の選択を受け付けることができるので、項目部分とデータ部分とを識別することが困難なデータ形式を有する電子文書ファイルであっても、確実に項目部分とデータ部分とを識別することができ、複数の表データに基づく新たなデータベースを容易に生成することが可能となる。
なお、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲内であれば多種の変更、改良等が可能である。例えば、識別規則情報は上述した識別規則情報に限定されるものではなく、使用状況、用いるアプリケーション等に応じて柔軟に変えることができる。また、画面イメージを介した操作についてもマウス22を用いる操作に限定されるものではなく、画面の構成、配置についても同一の機能を担保することができれば特に限定されるものではない。
1 データベース生成装置
2 ネットワーク
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 電子文書ファイル記憶部
132 識別規則情報記憶部
133 データベース記憶部
2 ネットワーク
11 CPU
12 メモリ
13 記憶装置
14 I/Oインタフェース
15 ビデオインタフェース
16 可搬型ディスクドライブ
17 通信インタフェース
18 内部バス
23 表示装置
90 可搬型記録媒体
100 コンピュータプログラム
131 電子文書ファイル記憶部
132 識別規則情報記憶部
133 データベース記憶部
Claims (6)
- 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置において、
一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段と、
取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける領域指定受付手段と、
指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶する識別規則情報記憶手段と、
一の識別規則情報の選択を受け付ける識別規則情報選択受付手段と、
選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する識別手段と、
識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成するデータベース生成手段と
を備えることを特徴とするデータベース生成装置。 - 前記識別規則情報は、
前記表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、
前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報と
を少なくとも含むことを特徴とする請求項1記載のデータベース生成装置。 - 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なデータベース生成方法において、
一又は複数の前記電子文書ファイルを取得し、
取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付け、
指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶し、
一の識別規則情報の選択を受け付け、
選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別し、
識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成することを特徴とするデータベース生成方法。 - 前記識別規則情報は、
前記表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、
前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報と
を少なくとも含むことを特徴とする請求項3記載のデータベース生成方法。 - 表データが含まれる一又は複数の電子文書ファイル中から抽出したデータに基づいて新たなデータベースを生成するデータベース生成装置で実行することが可能なコンピュータプログラムにおいて、
前記データベース生成装置を、
一又は複数の前記電子文書ファイルを取得する電子文書ファイル取得手段、
取得した一又は複数の電子文書ファイルの所定の領域の指定を受け付ける領域指定受付手段、
指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する規則に関する情報である識別規則情報を複数記憶する識別規則情報記憶手段、
一の識別規則情報の選択を受け付ける識別規則情報選択受付手段、
選択を受け付けた識別規則情報に基づいて、指定を受け付けた領域に含まれる項目部分とデータ部分とを識別する識別手段、及び
識別された項目部分及びデータ部分を複数集約して新たなデータベースを生成するデータベース生成手段
として機能させることを特徴とするコンピュータプログラム。 - 前記識別規則情報は、
前記表データ中で、階層を有する部分を項目部分と認識し、該項目部分の最下位階層以降の部分をデータ部分と認識する規則に関する情報である第一の識別規則情報と、
前記表データ中で、一対の組データを認識する規則に関する情報である第二の識別規則情報と
を少なくとも含むことを特徴とする請求項5記載のコンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008304312A JP2010128894A (ja) | 2008-11-28 | 2008-11-28 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008304312A JP2010128894A (ja) | 2008-11-28 | 2008-11-28 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010128894A true JP2010128894A (ja) | 2010-06-10 |
Family
ID=42329231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008304312A Pending JP2010128894A (ja) | 2008-11-28 | 2008-11-28 | データベース生成装置、データベース生成方法及びコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010128894A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5220207B1 (ja) * | 2012-01-12 | 2013-06-26 | 株式会社ダイショウ | 登記データ取得装置とこれに用いる記録媒体、登記データ取得システム、並びに登記データ取得方法 |
JP5220209B1 (ja) * | 2012-02-20 | 2013-06-26 | 株式会社ダイショウ | 登記データ取得装置とこれに用いる記録媒体、および登記データ取得方法 |
-
2008
- 2008-11-28 JP JP2008304312A patent/JP2010128894A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5220207B1 (ja) * | 2012-01-12 | 2013-06-26 | 株式会社ダイショウ | 登記データ取得装置とこれに用いる記録媒体、登記データ取得システム、並びに登記データ取得方法 |
JP2014132373A (ja) * | 2012-01-12 | 2014-07-17 | Daisho:Kk | 登記データ取得装置とこれに用いる記録媒体、登記データ取得システム、並びに登記データ取得方法 |
JP5220209B1 (ja) * | 2012-02-20 | 2013-06-26 | 株式会社ダイショウ | 登記データ取得装置とこれに用いる記録媒体、および登記データ取得方法 |
JP2014132375A (ja) * | 2012-02-20 | 2014-07-17 | Daisho:Kk | 登記データ取得装置とこれに用いる記録媒体、および登記データ取得方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20100057667A1 (en) | Detection rule-generating facility | |
US10514890B2 (en) | Test case and data selection using a sampling methodology | |
US10884703B2 (en) | Optimized construction of a sample imprint for selecting a sample dataset for comparison testing | |
JP6237168B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2006153628A (ja) | 分析データ管理装置及び分析データ管理プログラム | |
US20150199196A1 (en) | Systems and methods for multi-tiered format registration for applications | |
US10795807B2 (en) | Parallel testing and reporting system | |
US11650217B2 (en) | Data processing system for analytical instrument, and data processing program for analytical instrument | |
JP5149525B2 (ja) | プロジェクト管理支援装置およびその方法 | |
US20080071593A1 (en) | Business process editor, business process editing method, and computer product | |
JP2010128894A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP5910216B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6552162B2 (ja) | 情報処理装置、情報処理方法、およびプログラム | |
JP6421568B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6123519B2 (ja) | 情報処理装置及び情報処理プログラム | |
US20170069117A1 (en) | Information processing apparatus, information processing method, and non-transitory computer readable medium | |
JP6869082B2 (ja) | テストケースを選択する計算機及びテストケースの選択方法 | |
JP2010128892A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム | |
JP2007241347A (ja) | プログラムの品質管理装置、及びプログラムの品質管理レポートの生成方法 | |
US7979476B2 (en) | Information processing apparatus, control method therefor, program, and storage medium | |
JP2010244439A (ja) | チェックリスト生成装置、チェックリスト生成方法及びチェックリスト生成プログラム | |
JP2009205372A (ja) | 情報処理装置及び情報処理方法及びプログラム | |
US10678862B2 (en) | Information processing apparatus, method, and non-transitory computer readable medium for searching business processes and related documents | |
JP2008009966A (ja) | 業務プロセス設定装置及び業務プロセス設定方法 | |
JP2010097263A (ja) | データベース生成装置、データベース生成方法及びコンピュータプログラム |