Nothing Special   »   [go: up one dir, main page]

JPH0944508A - データベース自然言語インタフェース装置および方法 - Google Patents

データベース自然言語インタフェース装置および方法

Info

Publication number
JPH0944508A
JPH0944508A JP7191605A JP19160595A JPH0944508A JP H0944508 A JPH0944508 A JP H0944508A JP 7191605 A JP7191605 A JP 7191605A JP 19160595 A JP19160595 A JP 19160595A JP H0944508 A JPH0944508 A JP H0944508A
Authority
JP
Japan
Prior art keywords
database
data base
natural language
pattern
user
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7191605A
Other languages
English (en)
Inventor
Kazuo Sumita
一男 住田
Toshihiko Manabe
俊彦 真鍋
Kazushige Takahashi
一重 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP7191605A priority Critical patent/JPH0944508A/ja
Publication of JPH0944508A publication Critical patent/JPH0944508A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】データベースの表構成を記述したデータベース
スキーマ知識のみの参照で検索処理を実現するデータベ
ース自然言語インタフェース装置を提供する。 【解決手段】データベースシステムとユーザとの間に介
在してユーザのデータベースアクセスを支援するデータ
ベースインタフェース装置であって、入力された日本語
文を形態素解析する文解析部11と、この形態素解析結
果に含まれるデータベースアクセスの表層表現パターン
を抽出し数式に変換するパターン処理部12と、データ
ベースの表構成を記述したデータベーススキーマ知識に
基づいて形態素解析された各語間の関係を抽出する関係
抽出部14と、変換された数式および抽出された各語間
の関係からデータベースの検索コマンドを生成するコマ
ンド生成部16とを具備してなることを特徴とする。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、ユーザからの自
然言語による問い合わせを受理してデータベースの検索
コマンドを自動的に生成することにより、リレーショナ
ルデータベースやオブジェクト指向データベースなどの
データベースに対して、ユーザが自然言語により検索を
実施することを可能とするデータベース自然言語インタ
フェース装置および方法に係り、特にデータベースの表
構成を記述したデータベーススキーマ知識のみの参照で
検索処理を実現することにより可搬性を飛躍的に向上さ
せるデータベース自然言語インタフェース装置および方
法に関する。
【0002】
【従来の技術】近年、ネットワークによる計算機相互間
の結合が進むにつれて、様々なデータベースをアクセス
する機会が増えてきている。通常、ユーザがデータベー
スをアクセスして必要なデータを取り出すような場合に
は、そのデータベースを形式的なコマンドでアクセスす
る必要がある。たとえば、現在の主流なデータベースで
あるリレーショナルデータベースでは、SQL(Struc
tured Query Language )というコマンド体系が存在
し、このコマンドの形式に基づいてユーザはデータベー
スにアクセスすることになる。SQLの一例を以下に示
す。
【0003】 select 従業員表.電話番号 from 従業員表,部署表 where 従業員表.氏名=“田中一郎” and 部署表.部署名=“第1営業” and 従業員表.部署コード=部署表.部署コード この例では、「従業員表」という表が、その従業員の
「氏名」、「電話番号」および所属している部署を同定
する「部署コード」という属性をもち、一方、「部署
表」という表が、「部署コード」および「部署名」とい
う属性をもっているという前提で記述したコマンドであ
る。そして、このコマンドは、「第1営業」に所属して
いる「田中一郎」という人の「電話番号」を問い合わせ
るコマンドである。
【0004】この例で明らかなように、電話番号を問い
合わせるといった簡単な検索であっても、ユーザは、上
記のような複雑な検索コマンドをキーボード入力しなけ
ればならない。
【0005】また、この例では「従業員表」が、「部署
名」を属性としてもたなかったが、「従業員表」が、そ
の属性として「電話番号」、「氏名」および「部署名」
をもっていた場合には、以下のようなコマンドで上述と
同様の情報にアクセスすることになる。
【0006】 この例でも明らかなように、従来では、表それぞれがど
のような属性をもっているのかを、ユーザ自身が意識す
ることなしにデータにアクセスすることは不可能であっ
た。
【0007】さらに、ユーザの知りたい情報が1つのデ
ータベースシステム内で得られるとは限らない。すなわ
ち、必要とするデータベースシステムごとにアクセスコ
マンドの形式が異なることもある。このような場合に
は、ユーザは個々のデータベースシステムに対応したコ
マンド形式を習得している必要があり、また個々のデー
タベースの表の種類やその属性についてもあらかじめ認
識しておかなければならない。
【0008】これまでにおいても、上述した問題点のう
ちの複雑なコマンドを習得しなければならないという点
に対しては、自然言語による問い合わせを可能にするこ
とによりデータベースへのアクセスを容易にしようとす
る試みがなされてきた。しかしながら、これまでの自然
言語インタフェースにおいては、ユーザの入力する自然
言語を処理してSQLコマンドに変換するために、対象
とするデータベースと密接に関連した非常に精密な知識
ベースをあらかじめ構築しておく必要があるといった問
題があった。また、この知識ベースは、セマンティック
ネットワーク、フレームおよびスキーマなどと通称され
る複雑な構造をもつ枠組で記述するのが従来取られて来
た手法である。
【0009】また、このような知識ベースの構築のみな
らず、同時に自然言語を処理する際の文解析に必要とな
る単語辞書の各語彙と、知識ベース中の各概念とをあら
かじめリンクづけておく必要がある。
【0010】一般に、上述した知識ベースの構築には非
常な専門性を要し、また、単語辞書の各語彙と、知識ベ
ース中の概念とのリンクづけには非常な手間が必要とな
っていた。そして、取り扱うデータベースが代わると、
それに応じて知識ベースと単語辞書とを再構築しなけれ
ばならず、非常な手間となるために、自然言語インタフ
ェースの可搬性向上の妨げとなっていた。
【0011】
【発明が解決しようとする課題】上述したように、たと
えばユーザがリレーショナルデータベースにアクセスす
る場合には、表それぞれがどのような属性をもっている
のかを認識していなければならず、かつ複雑なコマンド
形式を習得していなければならないといった問題があっ
た。
【0012】また、従来の自然言語による問い合わせを
可能とする自然言語インタフェースでは、複雑な構造を
もつ知識ベースなどを構築しておく必要があるために、
可搬性が著しく低いといった問題があった。
【0013】本発明は上記実情に鑑みてなされたもので
あり、データベースの表構成を記述したデータベースス
キーマ知識のみの参照で検索処理を実現することにより
可搬性を飛躍的に向上させるデータベース自然言語イン
タフェース装置および方法を提供することを目的とす
る。
【0014】
【課題を解決するための手段】本発明のデータベース自
然言語インタフェース装置は、データベースシステムと
ユーザとの間に介在してユーザのデータベースアクセス
を支援するデータベースインタフェース装置であって、
入力された日本語文を形態素解析する形態素解析手段
と、この形態素解析結果に含まれるデータベースアクセ
スの表層表現パターンを抽出し数式に変換するパターン
処理手段と、前記データベースの表構成を記述したデー
タベーススキーマ知識に基づいて前記形態素解析された
各語間の関係を抽出する関係抽出手段と、前記変換され
た数式および前記抽出された各語間の関係から前記デー
タベースの検索コマンドを生成するコマンド生成手段と
を具備してなることを特徴とする。
【0015】本発明のデータベース自然言語インタフェ
ース装置によれば、ユーザにより入力された自然言語に
よる問い合わせは、まず、形態素解析手段により形態素
解析される。そして、パターン処理手段が、この形態素
解析の結果からデータベースアクセスの表層表現パター
ンを抽出し数式に変換する。なお、ここでいうデータベ
ースアクセスの表層表現パターンとは、データベース中
の表の属性についての条件を記述する文の表現パターン
をいう。
【0016】また、関係抽出手段は、形態素解析手段に
より形態素解析された各語間の関係を、データベースの
表構成を記述したデータベーススキーマ知識に基づいて
抽出する。そして、コマンド生成手段が、変換された数
式および抽出された各語間の関係からデータベースの検
索コマンドを生成する。
【0017】これにより、データベースに依存する知識
として、データベースの表に関する構成を記述した知識
のみに基づいて自然言語文を処理することのできる頑健
な自然言語インタフェースを実現でき、その可搬性を飛
躍的に向上させることが可能となる。
【0018】また、本発明のデータベース自然言語イン
タフェース装置は、前記入力された日本語文に含まれる
語または語のならびに対し、前記データベーススキーマ
知識に記述された表層表現の中から最も近似する表層表
現を検出する同義語検出手段をさらに具備してなること
を特徴とする。これにより、ユーザはデータベーススキ
ーマ知識中に記述された言語表現に必要以上にとらわれ
ることがなくなり、その操作性は飛躍的に向上する。
【0019】
【発明の実施の形態】以下図面を参照して本発明の実施
形態について説明する。 (第1実施形態)まず、本発明の第1の実施形態につい
て説明する。
【0020】図1に同実施形態の機器構成を示す。図1
に示すように、同実施形態に係る計算機システム6は、
計算機システム6全体の制御や各種処理を司るCPU
1、プログラムならびにデータを格納する半導体メモ
リ、磁気ディスクならびに光ディスクなどの記憶部2、
ユーザからの自然言語入力を受理するキーボードなどの
入力部3、検索の結果をユーザに呈示するディスプレイ
などの出力部4、およびデータベースを格納するデータ
ベース格納部5からなる。
【0021】図2に同実施形態の機能構成を示す。図2
に示すように、同実施形態のデータベース自然言語イン
タフェース装置は、入力文の形態素解析を行なう文解析
部11、「〜が〜以上」といったデータベース特有の表
現、すなわち表層表現を文中から抽出して数式に変換す
るパターン処理部12、これらの表層表現のパターンを
格納しておくパターン辞書13、入力文中の各語相互間
の関係を求める関係抽出部14、データベース中の各表
がどのような属性を持っているのか、または表層的な表
現ではどのように記述するのかなどの情報を格納したデ
ータベーススキーマ知識格納部15、解析した言語の関
係からSQLコマンドを生成するコマンド生成部16、
および省略された情報を補完する省略補完部17からな
る。
【0022】図3に同実施形態での入力文の一例および
その文解析結果を示す。文解析における形態素処理は、
図3に示すように、単語区切りのない日本語入力文に対
して各単語の区切りを検出する処理であり、機械翻訳シ
ステムなどの要素モジュールとしてすでに実現されてい
る技術である。
【0023】図4にパターン辞書13に格納されている
パターンの例を示す。これらのパターンは、たとえば
「給与が100万円以上」といったデータベースアクセ
ス特有の表現を、「e([給与],([給与]>=[1
00万,円]))」といった数式に変換するための変換
規則を記述したものである。
【0024】図4の(1)において、NPは名詞句、Num
は数値表現などのように、データの意味を示す品詞をそ
れぞれ表現しており、たとえば、NPには具体的にどのよ
うな品詞列が相当するのかは、図4の(2)の「NP→
[N(),N() ]」のようにパターン辞書13内の別の行で
表現されている。
【0025】図5にパターン処理部12によるパターン
辞書13に記述されているパターンと入力文とのマッチ
ング処理の動作手順を示す。なお、このマッチング処理
は再帰的な処理であり、図5において、Nはパターン辞
書13に記述されているすべてのパターンの総数、Mi
はパターンi中の右辺のノードの数(たとえば、図4の
(1)のパターンでは4)を示している。
【0026】また、図5においてRETURN 0はマ
ッチング処理に失敗したことを、RETURN 1はマ
ッチング処理に成功したことをそれぞれ表している。そ
して、変数iはマッチング処理中のパターンの番号を、
変数jはパターンi中のノードの番号を、変数kは入力
文中のノード番号をそれぞれ表している。
【0027】ここで、パターン側でマッチングしようと
するノードが終端記号(図4の(1)の「格付(が)」
や「名(以上)」など)であって、パターン中のノード
jと入力文のノードkとが等しい場合には(図5のステ
ップA7のY)、kおよびjをともに1つづつ増やして
(図5のステップA8,ステップA13)、入力文のノ
ード列およびパターン中のノード列のそれぞれ次のノー
ド同士のマッチングを行なっていく。一方、このパター
ンがメタ記号(図4の(1)の「NP(x) 」や「Num (x)
」など)の場合には(図5のステップA9のY)、マ
ッチングが終了した以降の入力文のノード列に対して、
メタ記号を左辺に持つパターンルール(たとえば図4の
(2)など)とマッチングするかどうかの処理を再帰的
に行なっていく(図5のステップA10)。
【0028】この図5に示した再帰的な動作手順によ
り、マッチングに成功した場合には、マッチングに成功
した入力文のノード列とパターン側のノード列とを比較
して、パターン側の変数部分に対応する入力文側のノー
ド列とユニフィケーションすることにより、パターンの
左辺側の式をインスタンシエートする。たとえば、図3
に示した入力文では、図4の(1)のパターンにマッチ
ングする。そして、変数Xには「給与」が、変数Yには
「100万,円」がそれぞれ照合する。そこで、これら
のユニフィケーションを行うことにより、図6に示すよ
うなノード列を得ることができることになる。
【0029】次に、関係抽出部14について説明する。
図7にデータベーススキーマ知識格納部15に格納され
たデータベーススキーマ知識の一部を例示する。
【0030】図7において、「instance」は、ある言語
表現が、ある表の属性に設定可能であることを表現して
おり、図7の例では、「LMG」という表現が「部署」
という属性に設定可能であることを示している。
【0031】また、「predicate 」は、ある言語表現が
ある属性に対して述語として機能することを表現してお
り、図7の例では「部署(x)」という述語が「empdep
t 」や「dept」といった表に設定可能であることを示し
ている。
【0032】「label 」は、ある言語表現が,ある表の
属性に対応することを表現しており、図7の例では「名
前」という表現は、「emp 」や「dept」の「name」とい
う属性に対応することを示している。
【0033】「interface 」は、データベース中の実際
の表を表しており、その表がどのような属性を有してい
るかを示している。図7の例では、「emp 」という表は
「name」、「salary」、「dept_coded 」、および「pr
oj_code」という属性をもつことを示している。
【0034】「aggregation view」は、異なる2つの表
を仮想的に1つの表と見なす定義を表現している。図7
の例では「empdept 」は「emp 」、「dept」、「proj」
の3つの表を組み合わせた表であることを示している。
【0035】「inherit 」は、どの表の属性を継承する
のかを示しており、「join」は2つの表のジョインを取
ることを示している。図7の例では「emp 」と「dept」
の2つの表を「dept_code」という属性でジョインする
ことを示している。
【0036】図8乃至図10に関係抽出部14の動作手
順を示す。関係抽出部14では、パターン処理を終えた
ノード列(図3で例を示した)に対し、データベースス
キーマ知識格納部15に格納されたデータベーススキー
マ知識の記述にしたがって各ノード間の関係を求める。
【0037】図9および図10は2つのノード間の関係
を求める動作手順(図8のステップB6の詳細)を示す
フローチャートである。ここでは、ノードiとノードj
の関係を求める処理を行なう。
【0038】まず、関係抽出部14は、この2つのノー
ドのうち片方のノードが他方の属性であるかどうかをチ
ェックして(図9のステップC1)、属性である場合に
は(図9のステップC1のY)、2つのノード間で「ha
s-attr」という関係づけを行ない、関係候補記憶エリア
(図1の記憶部2に設けられる)に格納する(図9のス
テップC2)。関係が「has-attr」であることの検知
は、データベーススキーマ知識部で、「label 」の記
述、「interface 」または「aggrregation view 」の記
述をたどることによって行なわれる。たとえば、「人」
と「給与」というノードについて見てみると、「人」→
「empdept 」と、「給与」→「(empdept,emp )salar
y」とから、「salary」が「empdept 」の属性になって
いることがわかるので、「人 has-attr 給与」という関
係ペアが得られることになる。
【0039】次に、関係抽出部14は、この2つのノー
ドをともに属性にもつ表が存在するかどうかをチェック
する(図9のステップC3)。ここで、表が見つかった
場合には(図9のステップC3のY)、その見つかった
表をEとすると、2つの関係ペアを図9のステップC5
に示すように会計候補記憶エリアに格納する。たとえ
ば、「給与」および「名前」の2つのノードを見てみる
と、「給与」→「(empdept,emp)salary 」と「名前」→
「(emp,dept)name」とから、ともに表「emp 」の属性で
あることが検出され、「emp has-attr 給与」と「emp
has-attr 名前」とが格納されることになる。
【0040】そして、関係抽出部14は、一方のノード
がインスタンスであるかどうかをチェックして(図9の
ステップC6)、インスタンスである場合には(図9の
ステップC6のY)、そのインスタンスが設定される属
性を求め(図9のステップC7)、その属性がもう一方
のノードの属性となる場合に(図9のステップC8,C
9のY)、関係候補格納エリアに関係ペアを格納する
(図10のステップC10)。たとえば、「人」および
「LMG」の2つのノードを考えてみると、データベー
ススキーマ知識によれば、「LMG」は「部署」のイン
スタンスと定義されている。「部署」が「人」の属性と
なることは、「部署」→「(empdept,emp)dept _nam
e」、および「人」→「empdept 」であることから明ら
かとなり、「人has-pred 部署」と「部署 has-inst L
MG」とが格納されることになる。
【0041】次に、関係抽出部14は、一方のノードが
式であるかどうかをチェックして(図10のステップC
11)、式である場合には(図10のステップC11の
Y)、さらにもう一方のノードの属性になるかどうかを
チェックし(図10のステップC13)、そうである場
合には(図10のステップC13のY)、情報を関係候
補記憶エリアに格納する(図10のステップC14)。
たとえば、「e([ 給与],([給与] >=[100
万,円]))と「人」の場合に、「給与」と「人」との
間の関係を求めると、「人 has-attr 給与」であるの
で、「人 has-attr給与」と「給与 is (給与>=円(10
00000))」とが格納されることになる。
【0042】図11に図6に示した文に対して関係抽出
部15による処理を施した結果を示す。図11で、破線
は2つのノードの間の関係が抽出された関係ペアの集合
の区切りを示しており、たとえば1行目と2行目とは1
組のノード間の関係抽出で求められたことを表現してい
る。
【0043】「給与」と「名前」との間の関係として
は、「emp 」および「empdept 」の2つの表それぞれで
ともに属性となるので、「emp has-attr 給与」および
「emphas-attr 名前」と、「empdept has-attr 給
与」および「empdept has-attr名前」との2つの可能性
が格納されている。
【0044】図12に優先度の高い関係ペアの組合わせ
候補を探す際のコマンド生成部16の動作手順を示す。
ここでの処理は、ペナルティを付与していくことで最終
的にペナルティの少ない関係候補の組合わせを求めるも
のである。
【0045】また、関係ぺアのマージ処理では、「emp
has-attr 給与」および「人 has-ttr給与」における
「emp 」と「人」とのように、よりプリミティブな表に
関する関係ペアだけを残す処理を行なう。
【0046】たとえば、図11の関係候補から組合わせ
を一つ取り出すと、以下の通りになる。 人 has-attr 給与 emp has-attr 給与 emp has-attr 名前 給与 is 給与 >= 円 (1000000) ここで、「empdept has-attr 給与」および「empdept
has-attr 名前」が取り出されないのは、「emp has-at
tr 給与」および「emp has-attr 名前」に対立する候
補であるからである(同じノード間の可能性として関係
抽出されている)。
【0047】また、「人 has-attr 名前」が取り出され
ないのは、ノード1と3、およびノード1と5に関する
関係候補が取り出されており、それらと競合するノード
3と5の候補を取り出されないようにしているためであ
る。
【0048】図13に関係候補の組合わせについて優先
度づけした結果を示す。コマンド生成部16では、関係
候補の組合わせの中で優先度の高い組合わせから、SQ
Lコマンドを生成する。すなわち、以下のような生成規
則により組合わせ中の関係ペアの組合わせから生成可能
である。 「A has-attr B」,「B is C」→(from A)(where
C) 「A has-attr B」→(select B)(fromA) 「A has-pred B」,「B has-inst C」→(from A)
(where B (C)) たとえば、図13の(1)の場合、 「emp has-attr 給与」,「給与 is 給与 >= 円 (10
00000)」→ (from emp)(where 給与 >= 円 (1000000)) 「emp has-attr 名前」→ (select 名前)(from emp) が生成され、これらをマージすることにより、 (select 名前) (from emp) (where 給与 >= 円 (1000000)) を生成することができる。
【0049】また、省略補完部17は、「給与が100
万円以上の人」というような文をユーザが入力した直後
に「50万円では」といったような入力をした場合に省
略を補完する処理であり、従来の自然言語インタフェー
スにおいても行なわれていた処理である。
【0050】これにより、本データベースの構成に関す
る知識(データベーススキーマ知識)のみがデータベー
スに依存する部分となり、可搬性の優れたデータベース
アクセス用の自然言語インタフェースを提供できること
になる。
【0051】(第2実施形態)次に、本発明の第2の実
施形態について説明する。図14に同実施形態の機能構
成を示す。
【0052】上述した第1実施形態のデータベース自然
言語インタフェース装置と、同実施形態のデータベース
自然言語インタフェース装置との相違点は、図14に示
すように、同義語検出部18および同義語辞書19をそ
の構成要素としてさらに具備している点にある。
【0053】この同義語検出部18では、同義語または
同義語表現の検出を行い、データベーススキーマ知識中
に記述されていない言語表現を、記述されている言語表
現にマッピングする処理を行なう。たとえば、データベ
ーススキーマ知識中に「年休取得日」とあり、入力文で
「年休を取った日」といった入力がされた場合に、文字
列の一致する度合によってデータベーススキーマ知識中
から「年休取得日」を見つけ出す。
【0054】図15に同義語検出部18の動作手順を示
す。なお、このとき、データベーススキーマ中のラベル
はあらかじめ形態素解析辞書に登録されており、かつ形
態素解析部は最長一致の語で単語分割しているものと仮
定する。そして、同義語検出部18は、入力文の形態素
ノード列の各ノードについて処理を行なっていく。
【0055】ここでは、ノードのインデックスをiで表
現しており、ノードiがデータベーススキーマ中に定義
されていれば(図15のステップE3のY)、そのノー
ドをそのまま出力する(図15のステップE4)。一
方、ノードiがデータベーススキーマ中に定義されてい
ないときは(図15のステップE3のN)、ノードiの
同義語が同義語辞書中に存在し、かつデータベーススキ
ーマ知識で定義されているかどうかをチェックして(図
15のステップE5)、定義されていればその同義語を
出力する(図15のステップE6)。
【0056】一方、同義語が存在しない場合(図15の
ステップE5のN)、部分的な形態素列に含まれる自立
語すべてについて、その各語に含まれる文字をすべて含
むような語がデータベーススキーマ知識のラベルにあれ
ば、その最長の表現を見つけ出力する(図15のステッ
プE8)。
【0057】この処理により、たとえばデータベースス
キーマ知識中のラベルに「年休取得日」が登録されてお
り、形態素列の側で「年休,を,取っ,た,日」という
列が与えられたようなときに、その対応を取ることがで
きる。なぜならば、「年休」についてはそのすべての文
字が、「取っ」については「取」が、「日」については
「年休取得日」が「日」を含んでいるからである。
【0058】なお、これら照合するラベルが複数存在す
る場合には、そのことをユーザ呈示して、ユーザ自身に
選択させるようにしても構わない。これによりユーザは
データベーススキーマ知識中に記述された言語表現に必
要以上にとらわれることがなくなり、その操作性は飛躍
的に向上する。
【0059】
【発明の効果】以上詳述したように、本発明のデータベ
ース自然言語インタフェース装置および方法によれば、
データベースの構成に関する簡単な知識のみに基づい
て、ユーザの自然言語入力を処理する頑健な自然言語イ
ンタフェースを実現することができるため、その可搬性
を飛躍的に向上させることが可能となる。また、ユーザ
はデータベーススキーマ知識中に記述された言語表現に
必要以上にとらわれることがなくなり、その操作性は飛
躍的に向上する。
【図面の簡単な説明】
【図1】本発明の第1実施形態の機器構成を示す図。
【図2】第1実施形態の機能構成を示す図。
【図3】第1実施形態での入力文の一例およびその文解
析結果を示す図。
【図4】第1実施形態のパターン辞書に格納されている
パターンの例を示す図。
【図5】第1実施形態のパターン処理部によるパターン
辞書に記述されているパターンと入力文とのマッチング
処理の動作手順を示すフローチャート。
【図6】第1実施形態のパターン処理結果を示す図。
【図7】第1実施形態のデータベーススキーマ知識格納
部に格納されたデータベーススキーマ知識の一部を例示
する図。
【図8】第1実施形態の関係抽出部の動作手順を示すフ
ローチャート。
【図9】第1実施形態の2つのノード間の関係を求める
動作手順を示すフローチャート。
【図10】第1実施形態の2つのノード間の関係を求め
る動作手順を示すフローチャート。
【図11】第1実施形態の関係抽出部による処理を施し
た結果を示す図。
【図12】第1実施形態の優先度の高い関係ペアの組合
わせ候補を探す際のコマンド生成部の動作手順を示すフ
ローチャート。
【図13】関係候補の組合わせについて優先度づけした
結果を示す図。
【図14】第2実施形態の機器構成を示す図。
【図15】第2実施形態の同義語検出部の動作手順を示
すフローチャート。
【符号の説明】
1…CPU、2…記憶部、3…入力部、4…出力部、5
…データベース格納部、6…計算機システム、11…文
解釈部、12…パターン処理部、13…パターン辞書、
14…関係抽出部、15…データベーススキーマ知識格
納部、16…コマンド生成部、17…省略補間部、18
…同義語検出部、19…同義語辞書。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 データベースシステムとユーザとの間に
    介在してユーザのデータベースアクセスを支援するデー
    タベースインタフェース装置であって、 入力された日本語文を形態素解析する形態素解析手段
    と、この形態素解析結果に含まれるデータベースアクセ
    スの表層表現パターンを抽出し数式に変換するパターン
    処理手段と、前記データベースの表構成を記述したデー
    タベーススキーマ知識に基づいて前記形態素解析された
    各語間の関係を抽出する関係抽出手段と、前記変換され
    た数式および前記抽出された各語間の関係から前記デー
    タベースの検索コマンドを生成するコマンド生成手段と
    を具備してなることを特徴とするデータベース自然言語
    インタフェース装置。
  2. 【請求項2】 前記入力された日本語文に含まれる語ま
    たは語のならびに対し、前記データベーススキーマ知識
    に記述された表層表現の中から最も近似する表層表現を
    検出する同義語検出手段をさらに具備してなることを特
    徴とする請求項1記載のデータベース自然言語インタフ
    ェース装置。
  3. 【請求項3】 データベースシステムとユーザとの間に
    介在してユーザのデータベースアクセスを支援するデー
    タベースインタフェース方法であって、 入力された日本語文を形態素解析し、この形態素解析結
    果に含まれるデータベースアクセスの表層表現パターン
    を抽出して数式に変換し、前記データベースの表構成を
    記述したデータベーススキーマ知識に基づいて前記形態
    素解析された各語間の関係を抽出し、前記変換した数式
    および前記抽出した各語間の関係から前記データベース
    の検索コマンドを生成することを特徴とするデータベー
    ス自然言語インタフェース方法。
JP7191605A 1995-07-27 1995-07-27 データベース自然言語インタフェース装置および方法 Pending JPH0944508A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7191605A JPH0944508A (ja) 1995-07-27 1995-07-27 データベース自然言語インタフェース装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7191605A JPH0944508A (ja) 1995-07-27 1995-07-27 データベース自然言語インタフェース装置および方法

Publications (1)

Publication Number Publication Date
JPH0944508A true JPH0944508A (ja) 1997-02-14

Family

ID=16277426

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7191605A Pending JPH0944508A (ja) 1995-07-27 1995-07-27 データベース自然言語インタフェース装置および方法

Country Status (1)

Country Link
JP (1) JPH0944508A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017111708A (ja) * 2015-12-18 2017-06-22 富士通株式会社 アウトカム達成登録プログラム、アウトカム達成登録方法、および情報処理装置
JP2021530818A (ja) * 2018-07-25 2021-11-11 オラクル・インターナショナル・コーポレイション 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017111708A (ja) * 2015-12-18 2017-06-22 富士通株式会社 アウトカム達成登録プログラム、アウトカム達成登録方法、および情報処理装置
JP2021530818A (ja) * 2018-07-25 2021-11-11 オラクル・インターナショナル・コーポレイション 自律型エージェントおよびシソーラスを用いるデータベースのための自然言語インターフェイス

Similar Documents

Publication Publication Date Title
KR101732342B1 (ko) 신뢰 질의 시스템 및 방법
US6957213B1 (en) Method of utilizing implicit references to answer a query
US6243670B1 (en) Method, apparatus, and computer readable medium for performing semantic analysis and generating a semantic structure having linked frames
US7174507B2 (en) System method and computer program product for obtaining structured data from text
US9448995B2 (en) Method and device for performing natural language searches
CN110377715A (zh) 基于法律知识图谱的推理式精准智能问答方法
JP4953468B2 (ja) オントロジーデータのインポート/エクスポートのための方法および装置
CN104657440B (zh) 结构化查询语句生成系统及方法
US20100145902A1 (en) Methods and systems to train models to extract and integrate information from data sources
JP3266586B2 (ja) データ分析システム
JP2000315216A (ja) 自然言語検索方法および装置
CN116628173B (zh) 一种基于关键字提取的智能客服信息生成系统及生成方法
WO2020233386A1 (zh) 基于aiml的智能问答方法、装置、计算机设备及存储介质
CN112035506A (zh) 一种语义识别方法及其设备
US20220083879A1 (en) Inferring a comparative advantage of multi-knowledge representations
CN112925563A (zh) 一种面向代码重用的源代码推荐方法
JP2020190970A (ja) 文書処理装置およびその方法、プログラム
CN112507089A (zh) 一种基于知识图谱的智能问答引擎及其实现方法
CN117271558A (zh) 语言查询模型构建方法、查询语言获取方法及相关装置
Kanburoğlu et al. Text-to-SQL: A methodical review of challenges and models
JP2000020537A (ja) テキスト検索装置及びテキスト検索プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2000276487A (ja) 事例蓄積・検索装置、並びに事例蓄積方法および事例検索方法、並びに事例蓄積プログラムを記録したコンピュータで読取可能な記録媒体および事例検索プログラムを記録したコンピュータで読取可能な記録媒体
JP3612769B2 (ja) 情報検索装置および情報検索方法
JP3617096B2 (ja) 関係表現抽出装置および関係表現検索装置、関係表現抽出方法、関係表現検索方法
CN112732743A (zh) 一种基于中文自然语言的数据分析方法及装置