JPH0944508A

JPH0944508A - データベース自然言語インタフェース装置および方法

Info

Publication number: JPH0944508A
Application number: JP7191605A
Authority: JP
Inventors: Kazuo Sumita; 一男住田; Toshihiko Manabe; 俊彦真鍋; Kazushige Takahashi; 一重高橋
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1995-07-27
Filing date: 1995-07-27
Publication date: 1997-02-14

Abstract

(57)【要約】【課題】データベースの表構成を記述したデータベース
スキーマ知識のみの参照で検索処理を実現するデータベ
ース自然言語インタフェース装置を提供する。【解決手段】データベースシステムとユーザとの間に介
在してユーザのデータベースアクセスを支援するデータ
ベースインタフェース装置であって、入力された日本語
文を形態素解析する文解析部１１と、この形態素解析結
果に含まれるデータベースアクセスの表層表現パターン
を抽出し数式に変換するパターン処理部１２と、データ
ベースの表構成を記述したデータベーススキーマ知識に
基づいて形態素解析された各語間の関係を抽出する関係
抽出部１４と、変換された数式および抽出された各語間
の関係からデータベースの検索コマンドを生成するコマ
ンド生成部１６とを具備してなることを特徴とする。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】この発明は、ユーザからの自
然言語による問い合わせを受理してデータベースの検索
コマンドを自動的に生成することにより、リレーショナ
ルデータベースやオブジェクト指向データベースなどの
データベースに対して、ユーザが自然言語により検索を
実施することを可能とするデータベース自然言語インタ
フェース装置および方法に係り、特にデータベースの表
構成を記述したデータベーススキーマ知識のみの参照で
検索処理を実現することにより可搬性を飛躍的に向上さ
せるデータベース自然言語インタフェース装置および方
法に関する。

【０００２】

【従来の技術】近年、ネットワークによる計算機相互間
の結合が進むにつれて、様々なデータベースをアクセス
する機会が増えてきている。通常、ユーザがデータベー
スをアクセスして必要なデータを取り出すような場合に
は、そのデータベースを形式的なコマンドでアクセスす
る必要がある。たとえば、現在の主流なデータベースで
あるリレーショナルデータベースでは、ＳＱＬ（Ｓtruc
tured Ｑuery Ｌanguage ）というコマンド体系が存在
し、このコマンドの形式に基づいてユーザはデータベー
スにアクセスすることになる。ＳＱＬの一例を以下に示
す。

【０００３】 select 従業員表．電話番号 from 従業員表，部署表 where 従業員表．氏名＝“田中一郎” and 部署表．部署名＝“第１営業” and 従業員表．部署コード＝部署表．部署コードこの例では、「従業員表」という表が、その従業員の
「氏名」、「電話番号」および所属している部署を同定
する「部署コード」という属性をもち、一方、「部署
表」という表が、「部署コード」および「部署名」とい
う属性をもっているという前提で記述したコマンドであ
る。そして、このコマンドは、「第１営業」に所属して
いる「田中一郎」という人の「電話番号」を問い合わせ
るコマンドである。

【０００４】この例で明らかなように、電話番号を問い
合わせるといった簡単な検索であっても、ユーザは、上
記のような複雑な検索コマンドをキーボード入力しなけ
ればならない。

【０００５】また、この例では「従業員表」が、「部署
名」を属性としてもたなかったが、「従業員表」が、そ
の属性として「電話番号」、「氏名」および「部署名」
をもっていた場合には、以下のようなコマンドで上述と
同様の情報にアクセスすることになる。

【０００６】この例でも明らかなように、従来では、表それぞれがど
のような属性をもっているのかを、ユーザ自身が意識す
ることなしにデータにアクセスすることは不可能であっ
た。

【０００７】さらに、ユーザの知りたい情報が１つのデ
ータベースシステム内で得られるとは限らない。すなわ
ち、必要とするデータベースシステムごとにアクセスコ
マンドの形式が異なることもある。このような場合に
は、ユーザは個々のデータベースシステムに対応したコ
マンド形式を習得している必要があり、また個々のデー
タベースの表の種類やその属性についてもあらかじめ認
識しておかなければならない。

【０００８】これまでにおいても、上述した問題点のう
ちの複雑なコマンドを習得しなければならないという点
に対しては、自然言語による問い合わせを可能にするこ
とによりデータベースへのアクセスを容易にしようとす
る試みがなされてきた。しかしながら、これまでの自然
言語インタフェースにおいては、ユーザの入力する自然
言語を処理してＳＱＬコマンドに変換するために、対象
とするデータベースと密接に関連した非常に精密な知識
ベースをあらかじめ構築しておく必要があるといった問
題があった。また、この知識ベースは、セマンティック
ネットワーク、フレームおよびスキーマなどと通称され
る複雑な構造をもつ枠組で記述するのが従来取られて来
た手法である。

【０００９】また、このような知識ベースの構築のみな
らず、同時に自然言語を処理する際の文解析に必要とな
る単語辞書の各語彙と、知識ベース中の各概念とをあら
かじめリンクづけておく必要がある。

【００１０】一般に、上述した知識ベースの構築には非
常な専門性を要し、また、単語辞書の各語彙と、知識ベ
ース中の概念とのリンクづけには非常な手間が必要とな
っていた。そして、取り扱うデータベースが代わると、
それに応じて知識ベースと単語辞書とを再構築しなけれ
ばならず、非常な手間となるために、自然言語インタフ
ェースの可搬性向上の妨げとなっていた。

【００１１】

【発明が解決しようとする課題】上述したように、たと
えばユーザがリレーショナルデータベースにアクセスす
る場合には、表それぞれがどのような属性をもっている
のかを認識していなければならず、かつ複雑なコマンド
形式を習得していなければならないといった問題があっ
た。

【００１２】また、従来の自然言語による問い合わせを
可能とする自然言語インタフェースでは、複雑な構造を
もつ知識ベースなどを構築しておく必要があるために、
可搬性が著しく低いといった問題があった。

【００１３】本発明は上記実情に鑑みてなされたもので
あり、データベースの表構成を記述したデータベースス
キーマ知識のみの参照で検索処理を実現することにより
可搬性を飛躍的に向上させるデータベース自然言語イン
タフェース装置および方法を提供することを目的とす
る。

【００１４】

【課題を解決するための手段】本発明のデータベース自
然言語インタフェース装置は、データベースシステムと
ユーザとの間に介在してユーザのデータベースアクセス
を支援するデータベースインタフェース装置であって、
入力された日本語文を形態素解析する形態素解析手段
と、この形態素解析結果に含まれるデータベースアクセ
スの表層表現パターンを抽出し数式に変換するパターン
処理手段と、前記データベースの表構成を記述したデー
タベーススキーマ知識に基づいて前記形態素解析された
各語間の関係を抽出する関係抽出手段と、前記変換され
た数式および前記抽出された各語間の関係から前記デー
タベースの検索コマンドを生成するコマンド生成手段と
を具備してなることを特徴とする。

【００１５】本発明のデータベース自然言語インタフェ
ース装置によれば、ユーザにより入力された自然言語に
よる問い合わせは、まず、形態素解析手段により形態素
解析される。そして、パターン処理手段が、この形態素
解析の結果からデータベースアクセスの表層表現パター
ンを抽出し数式に変換する。なお、ここでいうデータベ
ースアクセスの表層表現パターンとは、データベース中
の表の属性についての条件を記述する文の表現パターン
をいう。

【００１６】また、関係抽出手段は、形態素解析手段に
より形態素解析された各語間の関係を、データベースの
表構成を記述したデータベーススキーマ知識に基づいて
抽出する。そして、コマンド生成手段が、変換された数
式および抽出された各語間の関係からデータベースの検
索コマンドを生成する。

【００１７】これにより、データベースに依存する知識
として、データベースの表に関する構成を記述した知識
のみに基づいて自然言語文を処理することのできる頑健
な自然言語インタフェースを実現でき、その可搬性を飛
躍的に向上させることが可能となる。

【００１８】また、本発明のデータベース自然言語イン
タフェース装置は、前記入力された日本語文に含まれる
語または語のならびに対し、前記データベーススキーマ
知識に記述された表層表現の中から最も近似する表層表
現を検出する同義語検出手段をさらに具備してなること
を特徴とする。これにより、ユーザはデータベーススキ
ーマ知識中に記述された言語表現に必要以上にとらわれ
ることがなくなり、その操作性は飛躍的に向上する。

【００１９】

【発明の実施の形態】以下図面を参照して本発明の実施
形態について説明する。（第１実施形態）まず、本発明の第１の実施形態につい
て説明する。

【００２０】図１に同実施形態の機器構成を示す。図１
に示すように、同実施形態に係る計算機システム６は、
計算機システム６全体の制御や各種処理を司るＣＰＵ
１、プログラムならびにデータを格納する半導体メモ
リ、磁気ディスクならびに光ディスクなどの記憶部２、
ユーザからの自然言語入力を受理するキーボードなどの
入力部３、検索の結果をユーザに呈示するディスプレイ
などの出力部４、およびデータベースを格納するデータ
ベース格納部５からなる。

【００２１】図２に同実施形態の機能構成を示す。図２
に示すように、同実施形態のデータベース自然言語イン
タフェース装置は、入力文の形態素解析を行なう文解析
部１１、「〜が〜以上」といったデータベース特有の表
現、すなわち表層表現を文中から抽出して数式に変換す
るパターン処理部１２、これらの表層表現のパターンを
格納しておくパターン辞書１３、入力文中の各語相互間
の関係を求める関係抽出部１４、データベース中の各表
がどのような属性を持っているのか、または表層的な表
現ではどのように記述するのかなどの情報を格納したデ
ータベーススキーマ知識格納部１５、解析した言語の関
係からＳＱＬコマンドを生成するコマンド生成部１６、
および省略された情報を補完する省略補完部１７からな
る。

【００２２】図３に同実施形態での入力文の一例および
その文解析結果を示す。文解析における形態素処理は、
図３に示すように、単語区切りのない日本語入力文に対
して各単語の区切りを検出する処理であり、機械翻訳シ
ステムなどの要素モジュールとしてすでに実現されてい
る技術である。

【００２３】図４にパターン辞書１３に格納されている
パターンの例を示す。これらのパターンは、たとえば
「給与が１００万円以上」といったデータベースアクセ
ス特有の表現を、「ｅ（［給与］，（［給与］＞＝［１
００万，円］））」といった数式に変換するための変換
規則を記述したものである。

【００２４】図４の（１）において、NPは名詞句、Num
は数値表現などのように、データの意味を示す品詞をそ
れぞれ表現しており、たとえば、NPには具体的にどのよ
うな品詞列が相当するのかは、図４の（２）の「NP→
［N(),N() ］」のようにパターン辞書１３内の別の行で
表現されている。

【００２５】図５にパターン処理部１２によるパターン
辞書１３に記述されているパターンと入力文とのマッチ
ング処理の動作手順を示す。なお、このマッチング処理
は再帰的な処理であり、図５において、Ｎはパターン辞
書１３に記述されているすべてのパターンの総数、Ｍｉ
はパターンｉ中の右辺のノードの数（たとえば、図４の
（１）のパターンでは４）を示している。

【００２６】また、図５においてＲＥＴＵＲＮ０はマ
ッチング処理に失敗したことを、ＲＥＴＵＲＮ１はマ
ッチング処理に成功したことをそれぞれ表している。そ
して、変数ｉはマッチング処理中のパターンの番号を、
変数ｊはパターンｉ中のノードの番号を、変数ｋは入力
文中のノード番号をそれぞれ表している。

【００２７】ここで、パターン側でマッチングしようと
するノードが終端記号（図４の（１）の「格付（が）」
や「名（以上）」など）であって、パターン中のノード
ｊと入力文のノードｋとが等しい場合には（図５のステ
ップＡ７のＹ）、ｋおよびｊをともに１つづつ増やして
（図５のステップＡ８，ステップＡ１３）、入力文のノ
ード列およびパターン中のノード列のそれぞれ次のノー
ド同士のマッチングを行なっていく。一方、このパター
ンがメタ記号（図４の（１）の「NP(x) 」や「Num (x)
」など）の場合には（図５のステップＡ９のＹ）、マ
ッチングが終了した以降の入力文のノード列に対して、
メタ記号を左辺に持つパターンルール（たとえば図４の
（２）など）とマッチングするかどうかの処理を再帰的
に行なっていく（図５のステップＡ１０）。

【００２８】この図５に示した再帰的な動作手順によ
り、マッチングに成功した場合には、マッチングに成功
した入力文のノード列とパターン側のノード列とを比較
して、パターン側の変数部分に対応する入力文側のノー
ド列とユニフィケーションすることにより、パターンの
左辺側の式をインスタンシエートする。たとえば、図３
に示した入力文では、図４の（１）のパターンにマッチ
ングする。そして、変数Ｘには「給与」が、変数Ｙには
「１００万，円」がそれぞれ照合する。そこで、これら
のユニフィケーションを行うことにより、図６に示すよ
うなノード列を得ることができることになる。

【００２９】次に、関係抽出部１４について説明する。
図７にデータベーススキーマ知識格納部１５に格納され
たデータベーススキーマ知識の一部を例示する。

【００３０】図７において、「instance」は、ある言語
表現が、ある表の属性に設定可能であることを表現して
おり、図７の例では、「ＬＭＧ」という表現が「部署」
という属性に設定可能であることを示している。

【００３１】また、「predicate 」は、ある言語表現が
ある属性に対して述語として機能することを表現してお
り、図７の例では「部署（ｘ）」という述語が「empdep
t 」や「dept」といった表に設定可能であることを示し
ている。

【００３２】「label 」は、ある言語表現が，ある表の
属性に対応することを表現しており、図７の例では「名
前」という表現は、「emp 」や「dept」の「name」とい
う属性に対応することを示している。

【００３３】「interface 」は、データベース中の実際
の表を表しており、その表がどのような属性を有してい
るかを示している。図７の例では、「emp 」という表は
「name」、「salary」、「dept＿coded 」、および「pr
oj＿code」という属性をもつことを示している。

【００３４】「aggregation view」は、異なる２つの表
を仮想的に１つの表と見なす定義を表現している。図７
の例では「empdept 」は「emp 」、「dept」、「proj」
の３つの表を組み合わせた表であることを示している。

【００３５】「inherit 」は、どの表の属性を継承する
のかを示しており、「join」は２つの表のジョインを取
ることを示している。図７の例では「emp 」と「dept」
の２つの表を「dept＿code」という属性でジョインする
ことを示している。

【００３６】図８乃至図１０に関係抽出部１４の動作手
順を示す。関係抽出部１４では、パターン処理を終えた
ノード列（図３で例を示した）に対し、データベースス
キーマ知識格納部１５に格納されたデータベーススキー
マ知識の記述にしたがって各ノード間の関係を求める。

【００３７】図９および図１０は２つのノード間の関係
を求める動作手順（図８のステップＢ６の詳細）を示す
フローチャートである。ここでは、ノードｉとノードｊ
の関係を求める処理を行なう。

【００３８】まず、関係抽出部１４は、この２つのノー
ドのうち片方のノードが他方の属性であるかどうかをチ
ェックして（図９のステップＣ１）、属性である場合に
は（図９のステップＣ１のＹ）、２つのノード間で「ha
s-attr」という関係づけを行ない、関係候補記憶エリア
（図１の記憶部２に設けられる）に格納する（図９のス
テップＣ２）。関係が「has-attr」であることの検知
は、データベーススキーマ知識部で、「label 」の記
述、「interface 」または「aggrregation view 」の記
述をたどることによって行なわれる。たとえば、「人」
と「給与」というノードについて見てみると、「人」→
「empdept 」と、「給与」→「（empdept,emp ）salar
y」とから、「salary」が「empdept 」の属性になって
いることがわかるので、「人 has-attr 給与」という関
係ペアが得られることになる。

【００３９】次に、関係抽出部１４は、この２つのノー
ドをともに属性にもつ表が存在するかどうかをチェック
する（図９のステップＣ３）。ここで、表が見つかった
場合には（図９のステップＣ３のＹ）、その見つかった
表をＥとすると、２つの関係ペアを図９のステップＣ５
に示すように会計候補記憶エリアに格納する。たとえ
ば、「給与」および「名前」の２つのノードを見てみる
と、「給与」→「(empdept,emp)salary 」と「名前」→
「(emp,dept)name」とから、ともに表「emp 」の属性で
あることが検出され、「emp has-attr 給与」と「emp
has-attr 名前」とが格納されることになる。

【００４０】そして、関係抽出部１４は、一方のノード
がインスタンスであるかどうかをチェックして（図９の
ステップＣ６）、インスタンスである場合には（図９の
ステップＣ６のＹ）、そのインスタンスが設定される属
性を求め（図９のステップＣ７）、その属性がもう一方
のノードの属性となる場合に（図９のステップＣ８，Ｃ
９のＹ）、関係候補格納エリアに関係ペアを格納する
（図１０のステップＣ１０）。たとえば、「人」および
「ＬＭＧ」の２つのノードを考えてみると、データベー
ススキーマ知識によれば、「ＬＭＧ」は「部署」のイン
スタンスと定義されている。「部署」が「人」の属性と
なることは、「部署」→「(empdept,emp)dept ＿nam
e」、および「人」→「empdept 」であることから明ら
かとなり、「人has-pred 部署」と「部署 has-inst Ｌ
ＭＧ」とが格納されることになる。

【００４１】次に、関係抽出部１４は、一方のノードが
式であるかどうかをチェックして（図１０のステップＣ
１１）、式である場合には（図１０のステップＣ１１の
Ｙ）、さらにもう一方のノードの属性になるかどうかを
チェックし（図１０のステップＣ１３）、そうである場
合には（図１０のステップＣ１３のＹ）、情報を関係候
補記憶エリアに格納する（図１０のステップＣ１４）。
たとえば、「ｅ（[ 給与］，（［給与] ＞＝［１００
万，円］））と「人」の場合に、「給与」と「人」との
間の関係を求めると、「人 has-attr 給与」であるの
で、「人 has-attr給与」と「給与 is （給与＞＝円(10
00000))」とが格納されることになる。

【００４２】図１１に図６に示した文に対して関係抽出
部１５による処理を施した結果を示す。図１１で、破線
は２つのノードの間の関係が抽出された関係ペアの集合
の区切りを示しており、たとえば１行目と２行目とは１
組のノード間の関係抽出で求められたことを表現してい
る。

【００４３】「給与」と「名前」との間の関係として
は、「emp 」および「empdept 」の２つの表それぞれで
ともに属性となるので、「emp has-attr 給与」および
「emphas-attr 名前」と、「empdept has-attr 給
与」および「empdept has-attr名前」との２つの可能性
が格納されている。

【００４４】図１２に優先度の高い関係ペアの組合わせ
候補を探す際のコマンド生成部１６の動作手順を示す。
ここでの処理は、ペナルティを付与していくことで最終
的にペナルティの少ない関係候補の組合わせを求めるも
のである。

【００４５】また、関係ぺアのマージ処理では、「emp
has-attr 給与」および「人 has-ttr給与」における
「emp 」と「人」とのように、よりプリミティブな表に
関する関係ペアだけを残す処理を行なう。

【００４６】たとえば、図１１の関係候補から組合わせ
を一つ取り出すと、以下の通りになる。人 has-attr 給与 emp has-attr 給与 emp has-attr 名前給与 is 給与＞＝円 (1000000) ここで、「empdept has-attr 給与」および「empdept
has-attr 名前」が取り出されないのは、「emp has-at
tr 給与」および「emp has-attr 名前」に対立する候
補であるからである（同じノード間の可能性として関係
抽出されている）。

【００４７】また、「人 has-attr 名前」が取り出され
ないのは、ノード１と３、およびノード１と５に関する
関係候補が取り出されており、それらと競合するノード
３と５の候補を取り出されないようにしているためであ
る。

【００４８】図１３に関係候補の組合わせについて優先
度づけした結果を示す。コマンド生成部１６では、関係
候補の組合わせの中で優先度の高い組合わせから、ＳＱ
Ｌコマンドを生成する。すなわち、以下のような生成規
則により組合わせ中の関係ペアの組合わせから生成可能
である。「Ａ has-attr Ｂ」，「Ｂ is Ｃ」→(from Ａ)(where
Ｃ) 「Ａ has-attr Ｂ」→(select Ｂ)(fromＡ) 「Ａ has-pred Ｂ」，「Ｂ has-inst Ｃ」→(from Ａ)
(where Ｂ (Ｃ)) たとえば、図１３の（１）の場合、「emp has-attr 給与」，「給与 is 給与 >= 円 (10
00000)」→ (from emp)(where 給与 >= 円 (1000000)) 「emp has-attr 名前」→ (select 名前)(from emp) が生成され、これらをマージすることにより、 (select 名前) (from emp) (where 給与 >= 円（１００００００））を生成することができる。

【００４９】また、省略補完部１７は、「給与が１００
万円以上の人」というような文をユーザが入力した直後
に「５０万円では」といったような入力をした場合に省
略を補完する処理であり、従来の自然言語インタフェー
スにおいても行なわれていた処理である。

【００５０】これにより、本データベースの構成に関す
る知識（データベーススキーマ知識）のみがデータベー
スに依存する部分となり、可搬性の優れたデータベース
アクセス用の自然言語インタフェースを提供できること
になる。

【００５１】（第２実施形態）次に、本発明の第２の実
施形態について説明する。図１４に同実施形態の機能構
成を示す。

【００５２】上述した第１実施形態のデータベース自然
言語インタフェース装置と、同実施形態のデータベース
自然言語インタフェース装置との相違点は、図１４に示
すように、同義語検出部１８および同義語辞書１９をそ
の構成要素としてさらに具備している点にある。

【００５３】この同義語検出部１８では、同義語または
同義語表現の検出を行い、データベーススキーマ知識中
に記述されていない言語表現を、記述されている言語表
現にマッピングする処理を行なう。たとえば、データベ
ーススキーマ知識中に「年休取得日」とあり、入力文で
「年休を取った日」といった入力がされた場合に、文字
列の一致する度合によってデータベーススキーマ知識中
から「年休取得日」を見つけ出す。

【００５４】図１５に同義語検出部１８の動作手順を示
す。なお、このとき、データベーススキーマ中のラベル
はあらかじめ形態素解析辞書に登録されており、かつ形
態素解析部は最長一致の語で単語分割しているものと仮
定する。そして、同義語検出部１８は、入力文の形態素
ノード列の各ノードについて処理を行なっていく。

【００５５】ここでは、ノードのインデックスをｉで表
現しており、ノードｉがデータベーススキーマ中に定義
されていれば（図１５のステップＥ３のＹ）、そのノー
ドをそのまま出力する（図１５のステップＥ４）。一
方、ノードｉがデータベーススキーマ中に定義されてい
ないときは（図１５のステップＥ３のＮ）、ノードｉの
同義語が同義語辞書中に存在し、かつデータベーススキ
ーマ知識で定義されているかどうかをチェックして（図
１５のステップＥ５）、定義されていればその同義語を
出力する（図１５のステップＥ６）。

【００５６】一方、同義語が存在しない場合（図１５の
ステップＥ５のＮ）、部分的な形態素列に含まれる自立
語すべてについて、その各語に含まれる文字をすべて含
むような語がデータベーススキーマ知識のラベルにあれ
ば、その最長の表現を見つけ出力する（図１５のステッ
プＥ８）。

【００５７】この処理により、たとえばデータベースス
キーマ知識中のラベルに「年休取得日」が登録されてお
り、形態素列の側で「年休，を，取っ，た，日」という
列が与えられたようなときに、その対応を取ることがで
きる。なぜならば、「年休」についてはそのすべての文
字が、「取っ」については「取」が、「日」については
「年休取得日」が「日」を含んでいるからである。

【００５８】なお、これら照合するラベルが複数存在す
る場合には、そのことをユーザ呈示して、ユーザ自身に
選択させるようにしても構わない。これによりユーザは
データベーススキーマ知識中に記述された言語表現に必
要以上にとらわれることがなくなり、その操作性は飛躍
的に向上する。

【００５９】

【発明の効果】以上詳述したように、本発明のデータベ
ース自然言語インタフェース装置および方法によれば、
データベースの構成に関する簡単な知識のみに基づい
て、ユーザの自然言語入力を処理する頑健な自然言語イ
ンタフェースを実現することができるため、その可搬性
を飛躍的に向上させることが可能となる。また、ユーザ
はデータベーススキーマ知識中に記述された言語表現に
必要以上にとらわれることがなくなり、その操作性は飛
躍的に向上する。

【図面の簡単な説明】

【図１】本発明の第１実施形態の機器構成を示す図。

【図２】第１実施形態の機能構成を示す図。

【図３】第１実施形態での入力文の一例およびその文解
析結果を示す図。

【図４】第１実施形態のパターン辞書に格納されている
パターンの例を示す図。

【図５】第１実施形態のパターン処理部によるパターン
辞書に記述されているパターンと入力文とのマッチング
処理の動作手順を示すフローチャート。

【図６】第１実施形態のパターン処理結果を示す図。

【図７】第１実施形態のデータベーススキーマ知識格納
部に格納されたデータベーススキーマ知識の一部を例示
する図。

【図８】第１実施形態の関係抽出部の動作手順を示すフ
ローチャート。

【図９】第１実施形態の２つのノード間の関係を求める
動作手順を示すフローチャート。

【図１０】第１実施形態の２つのノード間の関係を求め
る動作手順を示すフローチャート。

【図１１】第１実施形態の関係抽出部による処理を施し
た結果を示す図。

【図１２】第１実施形態の優先度の高い関係ペアの組合
わせ候補を探す際のコマンド生成部の動作手順を示すフ
ローチャート。

【図１３】関係候補の組合わせについて優先度づけした
結果を示す図。

【図１４】第２実施形態の機器構成を示す図。

【図１５】第２実施形態の同義語検出部の動作手順を示
すフローチャート。

【符号の説明】

１…ＣＰＵ、２…記憶部、３…入力部、４…出力部、５
…データベース格納部、６…計算機システム、１１…文
解釈部、１２…パターン処理部、１３…パターン辞書、
１４…関係抽出部、１５…データベーススキーマ知識格
納部、１６…コマンド生成部、１７…省略補間部、１８
…同義語検出部、１９…同義語辞書。

Claims

【特許請求の範囲】

【請求項１】データベースシステムとユーザとの間に
介在してユーザのデータベースアクセスを支援するデー
タベースインタフェース装置であって、入力された日本語文を形態素解析する形態素解析手段
と、この形態素解析結果に含まれるデータベースアクセ
スの表層表現パターンを抽出し数式に変換するパターン
処理手段と、前記データベースの表構成を記述したデー
タベーススキーマ知識に基づいて前記形態素解析された
各語間の関係を抽出する関係抽出手段と、前記変換され
た数式および前記抽出された各語間の関係から前記デー
タベースの検索コマンドを生成するコマンド生成手段と
を具備してなることを特徴とするデータベース自然言語
インタフェース装置。
【請求項２】前記入力された日本語文に含まれる語ま
たは語のならびに対し、前記データベーススキーマ知識
に記述された表層表現の中から最も近似する表層表現を
検出する同義語検出手段をさらに具備してなることを特
徴とする請求項１記載のデータベース自然言語インタフ
ェース装置。
【請求項３】データベースシステムとユーザとの間に
介在してユーザのデータベースアクセスを支援するデー
タベースインタフェース方法であって、入力された日本語文を形態素解析し、この形態素解析結
果に含まれるデータベースアクセスの表層表現パターン
を抽出して数式に変換し、前記データベースの表構成を
記述したデータベーススキーマ知識に基づいて前記形態
素解析された各語間の関係を抽出し、前記変換した数式
および前記抽出した各語間の関係から前記データベース
の検索コマンドを生成することを特徴とするデータベー
ス自然言語インタフェース方法。