Nothing Special   »   [go: up one dir, main page]

JP3009636B2 - 音声言語解析装置 - Google Patents

音声言語解析装置

Info

Publication number
JP3009636B2
JP3009636B2 JP9125400A JP12540097A JP3009636B2 JP 3009636 B2 JP3009636 B2 JP 3009636B2 JP 9125400 A JP9125400 A JP 9125400A JP 12540097 A JP12540097 A JP 12540097A JP 3009636 B2 JP3009636 B2 JP 3009636B2
Authority
JP
Japan
Prior art keywords
partial
tree
dependency
likelihood
syntax
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP9125400A
Other languages
English (en)
Other versions
JPH1097535A (ja
Inventor
寿幸 竹澤
直哉 荒川
逞 森元
Original Assignee
株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社エイ・ティ・アール音声翻訳通信研究所 filed Critical 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority to JP9125400A priority Critical patent/JP3009636B2/ja
Publication of JPH1097535A publication Critical patent/JPH1097535A/ja
Application granted granted Critical
Publication of JP3009636B2 publication Critical patent/JP3009636B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、自動口述筆記装
置、人間とコンピュータが対話する対話システム、自動
翻訳システムなどに用いられる音声言語解析装置に関す
る。
【0002】
【従来の技術及び発明が解決しようとする課題】音声認
識部が音声認識結果を文単位の形態素列として言語解析
部に出力し、言語解析部が単一化文法で解析する音声言
語翻訳システム(以下、第1の従来例という。)が、文
献1「竹沢寿幸ほか,“ATR音声言語翻訳実験システ
ムASURA”,情報処理学会第46回全国大会,6B
−5,1993年3月」において開示されている。しか
しながら、この第1の従来例においては、音声認識部は
音声認識結果を文単位の形態素列として言語解析部に出
力しているために、音声認識部と言語解析部で構文解析
が二度行われ効率が悪い。さらに、言語解析部で統計的
な選好をとりいれていないこととあいまって、非文法的
な発話に対して頑健でないという問題点があった。
【0003】話し言葉の機械処理においては、非文法的
な表現、言いよどみなどの「非流暢性」(disfluency)
のために通常の句構造解析が失敗することがしばしばあ
る。こうした「流暢でない」発話でも、もしそれらが意
味的に解釈可能であれば、解析できるような頑健な構文
及び意味解析過程の実現が望まれる。ここで「非流暢
性」には、言い直し、「あのー」や「えーと」などの間
投詞の挿入、助詞などの省略といった現象がある。これ
らの現象の分析については、例えば、文献2「伝康晴,
“話し言葉における非文法的現象とその機械処理”,人
工知能学会研究会資料,SIG−SLUD−9503,
1996年」において開示されている。
【0004】近年、音声認識と句構造解析を統合して音
声認識率の向上を図ることが試みられているが、句構造
解析を音声入力に施す場合、発話の「非流暢性」や文末
の不明確さなどから発話を文よりも短い単位で句構造解
析することがよい場合がある。文献3「竹澤寿幸ほか,
“自然発話の言語現象と音声認識用日本語文法”,情報
処理学会音声言語情報処理研究会資料,6−5,199
5年」は、自然な発話中にあらわれる短いポーズで区切
られた区間が文脈自由文法で記述可能である場合が多い
ことを報告している。このような文より小さい発話単位
の句構造は文より小さい単位の木構造、すなわち部分構
文木(以下、部分木という。)となる。これらの部分木
を併合して文の解析結果を得ることができれば、音声認
識から文の解析まで統合した形の音声言語処理を実現で
き、また計算資源の経済という点からも有利である。
【0005】本発明の目的は以上の問題点を解決し、構
文的制約を満足していない発話の認識及び、構文及び意
味解析を、頑健に、かつ効率良く行う音声言語解析装置
を提供することにある。
【0006】
【課題を解決するための手段】本発明に係る請求項1記
載の音声言語解析装置は、入力された発話音声に基づい
て、部分発話毎に形態素解析及び所定の構文規則を参照
した構文解析を行うことにより、部分構文木を出力する
音声認識手段と、部分構文木の接続に関する制約と、所
定のコーパスから得られた各部分構文木が別の単語に係
るときの依存確率とに基づいて、上記音声認識手段から
出力される部分構文木を併合して、構文及び意味解析結
果を出力する部分木併合処理手段とを備えたことを特徴
とする。
【0007】また、請求項2記載の音声言語解析装置
は、請求項1記載の音声言語解析装置において、上記部
分木併合処理手段は、所定のコーパスから得られた、各
部分構文木が別の単語に係るときの依存確率に基づい
て、各部分構文木と後続する複数の部分構文木中のすべ
ての単語の組み合わせに対する依存尤度を計算する計算
手段と、上記計算手段によって計算されたすべての部分
構文木と単語の組み合わせに対する依存尤度を、記憶装
置上で依存尤度が大きい順序で並べ換えて上記記憶装置
に記憶する並べ換え手段と、上記並べ換え手段によって
並べ換えられた部分構文木と単語の組み合わせのうち、
最大の依存尤度を有する部分構文木と単語の組み合わせ
に対して、係り先の単語が用言である場合用言に用言に
係り得る格が予め決定されかつ同一の複数の格が同一の
用言に係り得ないという部分構文木の接続に関する制約
に基づいて、係り得るか否かの判定を行い、上記制約を
満たして係り得る部分構文木と単語の組み合わせを併合
する併合手段とを備えたことを特徴とする。
【0008】さらに、請求項3記載の音声言語解析装置
は、請求項2記載の音声言語解析装置において、上記依
存確率は、上記コーパスに基づいて得られた、処理対象
の部分構文木が係り先の単語に係り得る統計的確率と、
上記コーパスに基づいて得られた、処理対象の部分構文
木と係り先の単語との相互の位置関係に依存した尤度
と、上記コーパスに基づいて得られた、処理対象の部分
構文木の後に文末が来る文末確率との積で表されること
を特徴とする。
【0009】
【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。自然な話し言葉を対象に
通常の句構造解析を行なおうとすると、非文法的な表現
に対しては全体の構造が得られず、しばしば断片的な部
分木構造の集まりを得る。本発明に係る実施形態では、
これらの部分木構造を併合して、文全体の構造解析を与
える音声言語解析装置について説明する。ここで、頑健
な併合処理を実現するために統計的方法を用いた。その
ための統計データは旅行会話コーパスから得た。本実施
形態では、併合方法について詳細後述するとともに、文
節単位に分解された木構造データベースを本方法に基づ
いて再構成する実験結果について述べる。本実施形態で
は、併合方法について詳細を後述する。
【0010】本発明に係る実施形態は、通常の句構造解
析による処理が困難であるような話し言葉の言語現象を
統計的に解析する方法を用いた音声言語解析装置であ
る。例えば、自然な話し言葉を機械で処理しようとする
場合、非文法的な表現、言いよどみなどのために通常の
句構造解析は文全体の解析結果をもたらさないことがあ
る。このような場合でも、句構造解析の結果として、発
話入力中の形態素、文節、句、節などを要素とする木構
造を得ることができる。複数のこのような木構造が意味
上1つの文を構成する(あるいは1つの述語に支配され
る)と考えられる場合、それらを併合して処理できれ
ば、意味の解析あるいは翻訳処理に役立つ。この論文で
部分木とは、このような文より小さい単位の木構造を指
し、部分木併合とは部分木を併合して文に相当する構造
を作るようなプロセスを指す。このような文より小さい
発話単位の句構造は文より小さい単位の木構造、すなわ
ち部分木となり、これらの部分木を併合して文の解析結
果を得ることができれば、音声認識から文の解析まで統
合した形の音声言語処理を実現でき、また計算資源の経
済という点からも有利である。
【0011】ここで提案する方法においては、句構造解
析が出力する部分木を依存(係り受け)構造に変換した
ものを併合の対象とし、統計的に依存関係を持つ可能性
の高い部分木同士を併合する。各部分木と、それが依存
可能な他の部分木中の表現との間の依存確率を依存構造
解析を施したコーパスから抽出して、併合のための選好
情報として用いる。また、それらの部分木の相互位置
や、文末が想定される位置なども依存尤度を計算するた
めに用いる。
【0012】図1は、本発明に係る一実施形態である音
声言語解析装置の構成を示すブロック図である。図1に
おいて、発話音声はマイクロホン10に入力されて、音
声信号に変換された後、音声認識部1に入力される。音
声認識部1は、入力される音声信号に対して、例えばL
PC分析などの音声分析を実行して例えばケプストラム
係数や対数パワーなどの音響的特徴パラメータを抽出し
た後、当該音響的特徴パラメータに基づいて、例えば音
素HMM(音素隠れマルコフモデル)を用いて発話音声
に対応する音素列を音声認識する。さらに、音声認識部
1は、音声認識部1は、音声認識された音素列に基づい
て、部分発話毎に、形態素解析及び、例えば語彙と文法
規則を予め記憶する構文規則メモリ20内の構文規則を
参照した構文解析を行うことにより、部分発話毎に部分
構文木を出力する。
【0013】音声認識部1における部分木の出力は次の
ように行う。音素列のLRパージングにおいて還元(re
duce)処理を施した結果、受理(accept)に至らない候
補であっても、次の条件を満たすものは部分解リストに
つないで残しておく。 (条件1)シンボル系列すべてが還元処理されている。 (条件2)文法経歴が、同じシンボル系列が還元処理さ
れている別の部分解の文法経歴の部分集合ではない。 条件1は最低1つの単語(形態素)とならないかぎり部
分木として残さないことを意味する。条件2は、
【数1】(<副詞句> −> <副詞>) のような構文規則により多くの似た候補が残ることを避
けるためのものである。部分解リストに登録された複数
の解(部分木)は、ビーム探索により枝刈り(prunin
g)されないがぎり、認識結果候補として出力される。
【0014】次いで、部分木併合処理部2は、部分構文
木の接続に関する制約と、所定のコーパスから得られた
各部分木が別の単語に係るときの依存確率とに基づい
て、上記音声認識部1から出力される部分構文木を併合
して、構文及び意味解析結果を出力する。ここで、部分
木併合処理部2においては、所定のコーパスから得られ
た、各部分木が別の単語に係るときの依存確率に基づい
て、各部分木と後続する複数の部分木中のすべての単語
の組み合わせに対する依存尤度を計算し、上記計算され
たすべての部分木と単語の組み合わせに対する依存尤度
を、並べかえメモリ42上で依存尤度が大きい順序で並
べ換えて記憶し、並べ換えられた部分木と単語の組み合
わせのうち、最大の依存尤度を有する部分木と単語の組
み合わせに対して、係り先の単語が用言である場合用言
に用言に係り得る格が予め決定されかつ同一の複数の格
が同一の用言に係り得ないという部分木の接続に関する
制約に基づいて、係り得るか否かの判定を行い、上記制
約を満たして係り得る部分木と単語の組み合わせを併合
する。また、上記依存確率は、好ましくは、上記コーパ
スに基づいて得られた、処理対象の部分木が係り先の単
語に係り得る統計的確率と、上記コーパスに基づいて得
られた、処理対象の部分木と係り先の単語との相互の位
置関係に依存した尤度と、上記コーパスに基づいて得ら
れた、処理対象の部分木の後に文末が来る文末確率との
積で表される。
【0015】図2に、図1の音声言語解析装置の動作例
を示す。図2に示すように、音声認識部1によって、入
力された発話音声は、部分構文木群((1)〜(3))
に変換された後、当該部分構文木群が部分木併合処理部
2によって、構文及び意味解析結果に変換される。この
図で、矢印で連結されている部分が1つの木(部分木)
であるが、部分構文木(1)及び(2)のように1単語
で1部分構文木を構成するものもあれば、部分構文木
(3)のように2文節で1部分構文木を構成するものも
ある。
【0016】本実施形態の音声言語解析装置において、
音声認識部1と、部分木併合処理部2とは、例えばデジ
タル計算機によって構成され、構文規則メモリ20は、
例えばハードディスクメモリによって構成される。な
お、当該実施形態において、前終端記号バイグラムや句
構造規則のバイグラムや部分構文木間の依存尤度などを
表わす統計情報を選好情報として用いてもよい。ここ
で、「句構造規則のバイグラム」については、文献4
「K.Kita al.,“Continuously Spoken Sentence Recogn
ition by HMM-LR",ICSLP-92,pp.305-308,1992年」にお
いて開示されている。
【0017】次いで、音声認識部1の処理の実施形態に
ついて述べる。当該実施形態において、音声認識部1
は、部分木、言い換えれば部分解を出力するための構文
解析手法としてLR構文解析法を用いる。表1に、この
手法のための文法の記述例を示す。表1に示す文法は
「節」を単位として文法を記述している。
【0018】
【表1】 文法の記述例 ─────────────────────────────────── (<start> <−−> (<節>)) (<節> <−−> (<述語>)) (<節> <−−> (<後置詞句>)) (<節> <−−> (<副詞句>)) (<節> <−−> (<連体修飾句>)) (<節> <−−> (<名詞>)) (<節> <−−> (<数詞>)) (<節> <−−> (<複合語>)) (<節> <−−> (<感動詞>)) (<節> <−−> (<間投詞>)) (<述語> <−−> (<動詞句>)) (<述語> <−−> (<動詞>)) (<動詞> <−−> (<サ変名詞> <補助動詞>)) (<動詞句> <−−> (<動詞> <助動詞>)) (<後置詞句> <−−> (<名詞> <助詞>)) (<副詞句> <−−> (<副詞>)) (<名詞> <−−> (<複合語>)) (<副詞> <−−> (i m a)) ;; 今 (<名詞> <−−> (ny uu y oo k u sh i t i h o t e r u)) ;; ニューヨークシティホテル (<複合語> <−−> (r o Q py a k u n i g oo sh i ts u)) ;; 六百二号室 (<助詞> <−−> (n i)) ;; に (<サ変名詞> <−−> (t a i z a i)) ;; 滞在 (<補助動詞> <−−> (sh i)) ;; し (<助動詞> <−−> (t e i m a s u)) ;; ています (<間投詞> <−−> (a n oo)) ;; あのー (<名詞> <−−> (w a t a sh i)) ;; わたし (<名詞> <−−> (s o ch i r a)) ;; そちら (<助詞> <−−> (n o)) ;; の (<名詞> <−−> (s e k i)) ;; せき (<サ変名詞> <−−> (y o y a k u)) ;; よやく (<助動詞> <−−> (t a i N d e s u g a)) ;; たいんですが (<助詞> <−−> (w a)) ;; は (<名詞> <−−> (s u z u k i)) ;; 鈴木 (<助詞> <−−> (t o)) ;; と (<動詞> <−−> (m oo sh i)) ;; 申し (<助動詞> <−−> (m a s u)) ;; ます (<名詞> <−−> (h a N b aa g u)) ;; ハンバーグ (<名詞> <−−> (h a N b aa g aa)) ;; ハンバーガー (<助詞> <−−> (o)) ;; を (<サ変名詞> <−−> (ch uu m o N)) ;; 注文 (<助動詞> <−−> (t a N d e s u)) ;; たんです ───────────────────────────────────
【0019】HMM音素認識とLR構文解析手法を組み
合わせたHMM−LR連続音声認識法では、還元処理を
施した結果、文として受理に至る候補のみを保存し、ビ
ーム探索を行なっていた。当該の実施形態では、部分
木、言い換えれば部分解を出力するために、受理に至ら
ない候補であっても、部分解セルリストにつなぐことに
より、処理過程で残しておく。もちろん従来通り受理さ
れた候補も残し、両者をまとめてビーム探索による枝刈
りを実施する。そして、スコアの高いものを認識結果と
して出力する。
【0020】ここで、すべての部分解を部分解セルリス
トにつないでしまうと、例えば
【数2】(<副詞句> <−−> (<副詞>)) という構文規則により多くの似た候補が残ってしまう。
似た部分木の例を表2に示す。
【0021】
【表2】 似た部分木の例 ────── 節 │ 副詞句 │ 副詞 │ 今 ────── 副詞句 │ 副詞 │ 今 ────── 副詞 │ 今 ──────
【0022】「今」という副詞が副詞句まであがってい
るものとそうでないものがある。このような場合は一番
大きな部分木を保存し、それ以外はその部分部分木と表
現できる。そこで、あるセルの文法履歴が、同じシンボ
ル系列が還元処理されている別のセルの文法履歴の部分
部分木ではない場合に限って、部分解セルリストにつな
ぎ、処理の効率化を図っている。
【0023】次いで、部分木併合処理部2の処理の実施
形態について説明する。この実施形態では、入力として
依存構造木(部分木)の列を用いる。従って、本実施形
態では、音声認識部1が構文解析で生成された句構造
(部分)木を依存構造(部分)木に変換する。句構造
(部分)木を依存構造(部分)木に変換するために、句
構造中の文法的なヘッドを決定する規則を利用する。依
存構造においては、部分木の併合は、部分木間の依存関
係を発見することと同値になる。
【0024】例文「今ニューヨークシティホテル▼六百
二号室に滞在しています」の依存構造を図2(下段)に
示す。依存関係は矢印で示されている。なお、<TLO
C>,<ADJUNCT>,<LOCT>は依存関係の
種類を示すラベルである。
【0025】例文「今ニューヨークシティホテル▼六百
二号室に滞在しています」に対応する3つの部分木の依
存構造を図2(上段)に示す。ポーズ区切り「▼」の存
在により、それ以降の部分が、それ以前の部分とは異な
る部分木となっている。また、副詞(「今」)と名詞
(「ニューヨークシティホテル」)を連接する文法規則
が存在しないために「今ニューヨークシティホテル」の
部分は2つの部分木になる。部分木併合により、図2
(上段)には見られない依存関係が作り出され、図2
(下段)に現われる。
【0026】依存構造木を入力とする部分木併合のため
に、次のようなアルゴリズムを用いることができる。 <ステップSS1>各部分木と後続する部分木(複数)
中のすべての単語との組み合わせに対して依存尤度を計
算する。 <ステップSS2>ステップSS1で依存尤度を計算し
た組み合わせのうち、一定値以上の依存尤度をもつもの
を依存尤度順に並べ、それらを順に併合する。用言の係
り受け併合にあたっては、格フレームのチェックを行
う。
【0027】上記のアルゴリズムの動作を以下の例によ
って説明する。このプロセスがどう動くかを例を用いて
見てみよう。 例:「私、ハンバーグを、ハンバーガーを、注文したん
です。」 この文を読点のところで分割したものから作った部分木
を併合することを考える。まず、代名詞の「私」及び
「を」で終わる2つの文節は用言「注文」へ依存すると
いう可能性に対し高い尤度が統計的に与えられる。この
例では言い直しが現われているが、「ハンバーガーを」
と「注文した」が距離的に近いために「ハンバーグを」
と「注文した」より強い依存尤度が与えられ、まず「ハ
ンバーガーを」と「注文した」の併合が行われる。この
併合により「注文した」の「を」格が消費されてしまう
ため「ハンバーグを」が「注文した」に係るという解釈
は格フレームチェックにより却下され「ハンバーグを」
は係り先なしのゴミと判定される。
【0028】次いで、依存尤度の計算について説明す
る。本実施形態においては、依存尤度は3つの尤度関数
(それぞれ0以上1以下の値を取る)の積とした。以
下、各関数について説明する。
【0029】(A)統語的構成による依存関係の統計的
整合性に関する関数 これは一種のバイグラム尤度関数であり、依存元候補の
トップにある文節(あるいは文節より小さな部分構造)
と依存先候補(通常は単語)のノードそれぞれの見出し
及び品詞パターンから、それらが依存関係にある尤度を
返す。ここで、依存先は係り先と同義語であり、依存元
は係り元と同義語である。尤度は、コーパス中で依存候
補対のパターンが依存元候補が先行する形で同一文中に
生起した場合に依存が成立する条件付き確率PRであ
る。この確率PRは依存候補対の依存元及び依存先パタ
ーンをPPとすると次式で表わされる。
【0030】
【数3】PR=(PPが実際に依存関係にある回数)/
(PPが同じ文中で依存元パターンが先行する形で現れ
る回数)
【0031】この確率値PRは併合処理とは別に統計を
取り、あらかじめテーブルに格納しておいたものを用い
る(詳細後述)。見出し情報は意味情報を含んでいるか
ら、意味と依存の関係も、この方法によりコーパス中に
現われる組み合わせの範囲内であれば捉えることができ
る。尤度テーブル検索の際のパターンマッチングは一種
の最長一致法による。以下に図3の例を用いて説明を試
みる。
【0032】例:「予約を」が「キャンセル」に依存す
る尤度を所定の尤度データベースから求める。図3の例
では依存候補対のパターンを上段が見出し、下段が品詞
という形で示す。各段階で、パターンが尤度データベー
ス中にあれば、当該尤度データベース中の尤度を用い、
見つからなければ次の段階へ進む。
【0033】上記確率値PRは、所定のコーパスから、
処理対象の部分木が依存先の単語に係り得る統計的確率
として計算される。
【0034】(B)依存先候補の位置に依存した尤度の
関数 依存元候補の部分木及び依存先候補の単語との相互の位
置関係又は依存先候補の文末との位置関係から依存尤度
を計算する。このために学習用テキストデータを含むテ
キストデータベースであるコーパスから次に示すよう
に、依存関係の物理的な距離のヒストグラムを取り利用
する。
【0035】(1)依存先トップノードと依存元の品詞
から、依存関係が常に隣接関係である(例えば助動詞と
動詞との直接依存関係)とヒストグラムにより判断でき
れば、隣接している依存関係候補には尤度1を与え、隣
接していない依存関係候補には尤度0を与える。 (2)上記ヒストグラムから依存関係が隣接しない依存
関係を持つと判断される場合、尤度として指数関数ex
p(−kλd)を用いる。ここで、λは上記ヒストグラ
ムから得られる依存関係の種類に関する平均依存距離の
逆数であり、dは依存関係候補間の距離であり、kは予
め決められた定数である。この尤度設定より近い部分木
同士が優先的に併合される。 (3)感動詞や接続詞など文全体に係る語は、依存構造
解析では文の最後の表現に依存することが多いため、本
実施形態では、接続詞、感動詞などを文末表現に係ると
想定した。よって、それらの語には依存先候補が文末表
現である確率(次項(C)参照。)を依存尤度として与
える。
【0036】当該依存先候補の位置に依存した尤度は、
所定のコーパスから、処理対象の部分木と依存先の単語
との相互の位置関係に依存した尤度として計算される。
【0037】(C)文末確率の関数 音声言語処理においては、1人が続けて複数の文を発話
することもあり、文末は常に明確ではない。依存関係は
文末を超えて成り立たないから、文末が依存関係候補の
間にある確率が大きくなると、それらの候補の間の依存
関係尤度はその分小さくなる。従って、文末確率に応じ
た依存尤度は2つの部分木(依存候補対)の間に文末が
来ない確率として定義される。依存元候補と依存先候補
の間に部分木の切れ目がいくつかあるとすると、尤度は
それらの各々の切れ目に文末が来ない確率(1−文末が
来る確率)の積になる。各部分木間に文末が来る文末確
率は、先行する部分木の最後の語の品詞と次の部分木の
最初の語の品詞の関数とし、コーパスから抽出された統
計データを用いて計算する。
【0038】上記文末確率は、所定のコーパスから、処
理対象の部分木の後に文末が来る文末確率として計算さ
れる。
【0039】次いで、格フレームチェックについて説明
する。用言(動詞、形容詞)には、係り得る格が決まっ
ていて、さらに同じ格を複数係ることはできないという
制約がある。すなわち、当該制約は、係り先の単語が用
言である場合用言に用言に係り得る格が予め決定されか
つ同一の複数の格が同一の用言に係り得ないということ
である。部分木併合の際にもこれらの制約を考慮するこ
とが望ましい。今回の実験では、コーパス中に出現する
各用言について格助詞「が、を、に」に関する表層格パ
ターンを調査し、併合過程で各用言にそれらの格助詞に
支配される表現が係りうるかどうかをチェックするよう
にした。また、同じ表層格を持つ表現が同じ用言に複数
個係ることを禁止した(この際、係助詞の持つ格の多義
性も考慮した)。その他、受け身、使役、さらに助動詞
「たい」に支配される動詞の格パターンの変化にも考慮
して実験を行った。
【0040】次いで、コーパスから抽出するデータにつ
いて説明する。上記の併合過程で利用するデータのう
ち、コーパスから抽出するものをまとめると次のように
なる。ここで使用するコーパスは、本出願人が所有する
音声言語データベース(例えば、文献5「T.Morimoto e
t al.,“A Speech and Language Database for SpeechT
ranslation Research",Proceeding of ICSLP '94 pp.17
91-1794,1994年」参照。)(旅行会話:375会話、1
3647文)に依存構造解析を行ったものであるこの依
存構造解析は、人手で検査修正を行った正解である。
【0041】そして、依存構造データベース中のすべて
の依存関係を調べ、依存元パターンと依存先パターンが
同じ文中で依存元パターンが先行する形で現れた場合
に。上記数2を用いて依存関係が成立する確率PRを求
める。依存先パターンは原則的に部分木のノード(=
語)の見出し及び品詞対である。依存元パターンは文節
あるいは文節内構造である。例えば、「私は行く」とい
う表現に対し、依存先パターンとしては(「行く」・動
詞)と(「は」・係助詞)の2つが得られ、依存元パタ
ーンとしては(「は」・係助詞(「私」・代名詞))及
び(「私」・代名詞)の2つが得られる。なお、スパー
スデータ問題を回避するために自立語の見出しをワイル
ドカード「*」で置き換えたものについても統計を取っ
た。
【0042】さらに、2つの品詞が互いに依存関係にあ
る場合の相互の距離のヒストグラムを求めた。多くの機
能語(例えば助詞)の場合、直前の語にのみ依存を受け
るが、動詞などは係り受けの形で遠距離の依存関係を持
つ。上で述べたように、コーパスから得られた依存距離
の情報は、依存尤度を計算するために用いられる。
【0043】ここで、文末モデルは2つの品詞の間に文
末が来る確率をコーパスから求めた。また、コーパス中
に現われる用言が表層格「が」、「を」、「に」を取り
得るかどうかを調べ、併合の際の制約として利用した。
例えば、動詞「会う」は格助詞「が」「を」「に」を取
る。
【0044】図4は、図1の部分木併合処理部2の構成
の詳細を示すブロック図である。図4において、部分木
併合処理部2は、併合処理を実行するMPUなどのディ
ジタル計算機である演算制御装置である併合処理コント
ローラ30を備えるとともに、併合処理コントローラ3
0には、(a)併合処理を実行するときに用いる処理メ
モリ31と、(b)依存先候補の位置による尤度の計算
に用いられる距離減衰率テーブル32と、(c)格フレ
ームチェックに用いられる格フレームテーブル33と、
(d)文末確率を計算するために用いられる文末/文
頭、品詞統計ファイル34と、(e)統語的構成による
依存関係の統計的整合性を計算するために用いられる依
存確率テーブル35とが接続される。また、併合処理コ
ントローラ30には、(f)音声認識部1から出力され
る部分構文木の結果を記憶する入力ファイル21と、
(g)併合処理コントローラ30から出力される構文及
び意味解析結果を記憶する出力ファイル22とが接続さ
れる。さらに、処理メモリ31は、部分木メモリ41
と、並べかえメモリ42と、依存尤度メモリ43と、必
須格リストメモリ44とを備える。ここで、処理メモリ
31は例えばハードディスクメモリで構成され、21、
22、32乃至35で示されるこれらのファイル、テー
ブル及びファイルは例えばハードディスクメモリなどの
記憶装置に記憶される。
【0045】さらに、図4の部分木併合処理部2内の各
テーブル及びファイルのレコード形式とレコード例を示
す。依存先候補の位置による尤度の計算に用いられる距
離減衰率テーブル32を表3に示し、格フレームチェッ
クに用いられる格フレームテーブル33を表4に示す。
また、文末確率を計算するために用いられる文末/文
頭、品詞統計ファイル34を表5に示し、統語的構成に
よる依存関係の統計的整合性を計算するために用いられ
る依存確率テーブル35を表6に示す。これらの各テー
ブル及びファイルは、本特許出願人が所有する旅行会話
のデータベースのコーパスに基づいて所定の文法的解析
を行うことにより得られたものであって、所定の依存関
係解析木の形式で記述された文法的解析データである。
【0046】
【表3】 距離減衰率テーブル ─────────────────────────── レコード形式 ::= (依存品詞 被依存品詞 平均依存距離) ─────────────────────────── レコード例: (<人名> <連体助詞> 0) (<副詞> <サ変名詞> 396/287) (<接続詞> <補助動詞語幹> 412/51) (<接続助詞> <本動詞> 657/260) (<係助詞> <本動詞> 1347/664) (<格助詞> <本動詞> 6028/7099) ───────────────────────────
【0047】
【表4】 格フレームテーブル ─────────────────────────────────── レコード形式 ::= (単語 格フレーム群) 単語 ::= (見出し 品詞) 格フレーム群 ::= ('格フレーム群 (格フレーム*)) 格フレーム ::= ('格フレーム (格スロット*)) 格スロット ::= (格助詞 {+, -}) ─────────────────────────────────── レコード例: ((放送 <サ変名詞>) (格フレーム群 ((格フレーム ((が -)))))) ((一泊 <サ変名詞>) (格フレーム群 ((格フレーム ((が -) (に -)))))) ((払 <本動詞>) (格フレーム群 ((格フレーム ((が -) (を -))) (格フレーム ((が -) (に -)))))) ((控え <本動詞>) (格フレーム群 ((格フレーム ((が -) (に -)))))) ((飾 <本動詞>) (格フレーム群 ((格フレーム ((が -) (を -)))))) ───────────────────────────────────
【0048】
【表5】 文末/文頭、品詞統計ファイル ────────────────────────────── レコード形式 ::= (文末品詞 文頭品詞 (文末頻度 全体頻度)) レコード例: (終助詞 本動詞 (71 100)) (普通名詞 間投詞 (3 48)) (人名 普通名詞 (3 23)) (接尾辞 接続詞 (17 53)) (普通名詞 人名 (7 27)) (接続詞 間投詞 (1 209)) (感動詞 住所名 (1 1)) ──────────────────────────────
【0049】
【表6】 依存確率テーブル ─────────────────────────────────── レコード形式 ::= [['係り受け出現回数 N] ['パターン出現回数 N] ['依存先 [['品詞 品詞] ['見出し 見出し]]] ['依存元 [['ヘッド [['品詞 品詞] ['見出し 見出し]]] ['引数 [['ヘッド [['品詞 品詞] ['見出し 見出し]]]]]]]] ─────────────────────────────────── レコード例: ─────────────────────────────────── [[係り受け出現回数 3] [パターン出現回数 3] [依存先 [[品詞 <補助動詞語幹>] [見出し ございま]]] [依存元 [[ヘッド [[品詞 <助動詞>] [見出し で]]] [引数 [[ヘッド [[品詞 <固有名詞>] [見出し ニューヨークシティホテル]]]]]]]] ─────────────────────────────────── [[係り受け出現回数 14] [パターン出現回数 25] [依存先 [[品詞 <終助詞>] [見出し が]]] [依存元 [[ヘッド [[品詞 <助動詞語幹>] [見出し で]]] [引数 [[ヘッド [[品詞 <準体助詞>] [見出し の]]]]]]]] ─────────────────────────────────── [[係り受け出現回数 10] [パターン出現回数 10] [依存先 [[品詞 <本動詞>] [見出し し]]] [依存元 [[ヘッド [[品詞 <格助詞>] [見出し を]]] [引数 [[ヘッド [[品詞 <サ変名詞>] [見出し 予約]]]]]]]] ───────────────────────────────────
【0050】図5は、図4の部分木併合処理部によって
実行される1発話単位の併合処理を示すフローチャート
である。図5に示すように、まず、ステップS11にお
いて1発話分の部分木を、音声認識部1からの出力を格
納する入力ファイル21から処理メモリ31内の部分木
メモリ41に読み込む。次いで、ステップS12におい
て、処理対象の部分木に対して、文末/文頭、品詞統計
ファイル34を参照して、各部分木の後に文末が来る文
末確率を計算する。そして、ステップS13において、
各用言について、用言が常に要求する格である必須格の
リストを求めて必須格リストメモリ44に記憶する。さ
らに、ステップS14において、詳細上述したように、
上記のステップSS1のごとく、各部分木と後続する複
数の部分木中のすべての単語の組み合わせに対して依存
尤度を計算して依存尤度メモリ43に記憶し、ステップ
S15において、依存尤度を計算した組み合わせのう
ち、一定値以上の依存尤度を大きい順に並べて並べかえ
メモリ42に記憶する。
【0051】次いで、ステップS16において、まだ併
合されていない単語の組み合わせがあるか否かが判断さ
れ、あるときはステップS17に進む一方、無いときは
ステップS22に進んで部分木の併合処理結果を出力フ
ァイル22に出力して、当該併合処理を終了する。
【0052】ステップS17では、最大尤度を有する組
み合わせは格助詞の用言依存か否かが判断され、依存す
るときはステップS18に進む一方、依存しないときは
ステップS20に進む。ステップS18では、必須格リ
ストメモリ44内の必須格リストを参照して、最大尤度
を有する組み合わせの格フレームをチェックし、上述の
格フレームチェック時の制約を満たすか否かが判断され
る。制約を満たさないときはステップS21に進む一
方、制約を満たすときはステップS19で格助詞の格を
必須格リストメモリ44から削除した後、ステップS2
0に進む。ステップS20では、当該組み合わせを併合
する併合処理を実行して、ステップS16に戻る。ま
た、ステップS21では、当該組み合わせを並べかえメ
モリ42から取り除いた後、ステップS16に戻る。
【0053】以上説明したように、本発明に係る本実施
形態によれば、入力された発話音声に基づいて、部分発
話毎に形態素解析及び所定の構文規則を参照した構文解
析を行うことにより、部分構文木を出力し、次いで、部
分構文木の接続に関する制約と、所定のコーパスから得
られた各部分木が別の単語に係るときの依存確率とに基
づいて、上記出力される部分構文木を併合して、構文及
び意味解析結果を出力する。これにより、構文的制約を
満足していない発話の認識及び、構文及び意味解析を頑
健に行うことができる。また、音声認識手段から部分木
併合処理手段に対して、部分木で受け渡しをするため、
処理効率がよく、従来例に比較して高速で処理すること
ができる。
【0054】
【発明の効果】以上詳述したように本発明に係る請求項
1記載の音声言語解析装置においては、入力された発話
音声に基づいて、部分発話毎に形態素解析及び所定の構
文規則を参照した構文解析を行うことにより、部分構文
木を出力する音声認識手段と、部分構文木の接続に関す
る制約と、所定のコーパスから得られた各部分構文木が
別の単語に係るときの依存確率とに基づいて、上記音声
認識手段から出力される部分構文木を併合して、構文及
び意味解析結果を出力する部分木併合処理手段とを備え
る。従って、本発明によれば、構文的制約を満足してい
ない発話の認識及び、構文及び意味解析を頑健に行い、
かつ、音声認識手段から部分木併合処理手段に対して、
部分木で受け渡しをするため、処理効率がよい音声言語
解析装置を提供することができる。
【0055】また、請求項2記載の音声言語解析装置に
おいては、請求項1記載の音声言語解析装置において、
上記部分木併合処理手段は、所定のコーパスから得られ
た、各部分構文木が別の単語に係るときの依存確率に基
づいて、各部分構文木と後続する複数の部分構文木中の
すべての単語の組み合わせに対する依存尤度を計算する
計算手段と、上記計算手段によって計算されたすべての
部分構文木と単語の組み合わせに対する依存尤度を、記
憶装置上で依存尤度が大きい順序で並べ換えて上記記憶
装置に記憶する並べ換え手段と、上記並べ換え手段によ
って並べ換えられた部分構文木と単語の組み合わせのう
ち、最大の依存尤度を有する部分構文木と単語の組み合
わせに対して、係り先の単語が用言である場合用言に用
言に係り得る格が予め決定されかつ同一の複数の格が同
一の用言に係り得ないという部分構文木の接続に関する
制約に基づいて、係り得るか否かの判定を行い、上記制
約を満たして係り得る部分構文木と単語の組み合わせを
併合する併合手段とを備える。従って、本発明によれ
ば、構文的制約を満足していない発話の認識及び、構文
及び意味解析を頑健に行い、かつ、音声認識手段から部
分木併合処理手段に対して、部分木で受け渡しをするた
め、処理効率がよい音声言語解析装置を提供することが
できる。また、上記部分木併合処理手段の処理を容易に
かつ自動的に効率良く行うことができる。
【0056】さらに、請求項3記載の音声言語解析装置
においては、請求項1記載の音声言語解析装置におい
て、上記依存確率は、上記コーパスに基づいて得られ
た、処理対象の部分構文木が係り先の単語に係り得る統
計的確率と、上記コーパスに基づいて得られた、処理対
象の部分構文木と係り先の単語との相互の位置関係に依
存した尤度と、上記コーパスに基づいて得られた、処理
対象の部分構文木の後に文末が来る文末確率との積で表
される。従って、本発明によれば、構文的制約を満足し
ていない発話の認識及び、構文及び意味解析を頑健に行
い、かつ、音声認識手段から部分木併合処理手段に対し
て、部分木で受け渡しをするため、処理効率がよい音声
言語解析装置を提供することができる。また、上記部分
木併合処理手段の処理を容易にかつ自動的に効率良く行
うことができる。
【図面の簡単な説明】
【図1】 本発明に係る一実施形態である音声言語解析
装置の構成を示すブロック図である。
【図2】 図1の音声言語解析装置の動作例を示す図で
ある。
【図3】 図1の部分木併合処理部における尤度テーブ
ル検索の際のパターンマッチングの処理例を示す図であ
る。
【図4】 図1の部分木併合処理部の構成の詳細を示す
ブロック図である。
【図5】 図4の部分木併合処理部によって実行される
1発話単位の併合処理を示すフローチャートである。
【符号の説明】
1…音声認識部、 2…部分木併合処理部、 10…マイクロホン、 20…構文規則メモリ、 21…入力ファイル、 22…出力ファイル、 30…併合処理コントローラ、 31…処理メモリ、 32…距離減衰率テーブル、 33…格フレームテーブル、 34…文末/文頭、品詞統計ファイル、 35…依存確率テーブル、 41…部分木メモリ、 42…並べかえメモリ、 43…依存尤度メモリ、 44…必須格リストメモリ。
フロントページの続き (72)発明者 森元 逞 京都府相楽郡精華町大字乾谷小字三平谷 5番地 株式会社エイ・ティ・アール音 声翻訳通信研究所内 (56)参考文献 特開 平1−214973(JP,A) 荒川、外、「統計的手法による部分木 併合」、電子情報通信学会技術研究報 告、1996年5月17日、NLC96−8、 p.47−54 竹澤、外、「部分木を単位とする構文 規則と前終端記号のバイグラムを利用し た連続音声認識」、電子情報通信学会技 術研究報告、1995年、NLC95−54(S P95−89)、p.55−62 田代、外、「音声言語処理のための部 分木併合手法」、情報処理学会研究報 告、1995年、第95巻、第89号(NL− 109)、p.27−32 竹澤、外、「部分木に基づく構文規則 と前終端記号バイグラムを併用する対話 音声認識手法」、電子情報通信学会論文 誌D−▲II▼、1996年12月、Vol. J79−D−▲II▼、No.12、p. 2078−2085 (58)調査した分野(Int.Cl.7,DB名) G06F 17/27 G06F 17/28 G10L 3/00 561 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力された発話音声に基づいて、部分発
    話毎に形態素解析及び所定の構文規則を参照した構文解
    析を行うことにより、部分構文木を出力する音声認識手
    段と、 部分構文木の接続に関する制約と、所定のコーパスから
    得られた各部分構文木が別の単語に係るときの依存確率
    とに基づいて、上記音声認識手段から出力される部分構
    文木を併合して、構文及び意味解析結果を出力する部分
    木併合処理手段とを備えたことを特徴とする音声言語解
    析装置。
  2. 【請求項2】 上記部分木併合処理手段は、 所定のコーパスから得られた、各部分構文木が別の単語
    に係るときの依存確率に基づいて、各部分構文木と後続
    する複数の部分構文木中のすべての単語の組み合わせに
    対する依存尤度を計算する計算手段と、 上記計算手段によって計算されたすべての部分構文木と
    単語の組み合わせに対する依存尤度を、記憶装置上で依
    存尤度が大きい順序で並べ換えて上記記憶装置に記憶す
    る並べ換え手段と、 上記並べ換え手段によって並べ換えられた部分構文木と
    単語の組み合わせのうち、最大の依存尤度を有する部分
    構文木と単語の組み合わせに対して、係り先の単語が用
    言である場合用言に用言に係り得る格が予め決定されか
    つ同一の複数の格が同一の用言に係り得ないという部分
    構文木の接続に関する制約に基づいて、係り得るか否か
    の判定を行い、上記制約を満たして係り得る部分構文木
    と単語の組み合わせを併合する併合手段とを備えたこと
    を特徴とする請求項1記載の音声言語解析装置。
  3. 【請求項3】 上記依存確率は、上記コーパスに基づい
    て得られた、処理対象の部分構文木が係り先の単語に係
    り得る統計的確率と、 上記コーパスに基づいて得られた、処理対象の部分構文
    木と係り先の単語との相互の位置関係に依存した尤度
    と、 上記コーパスに基づいて得られた、処理対象の部分構文
    木の後に文末が来る文末確率との積で表されることを特
    徴とする請求項2記載の音声言語解析装置。
JP9125400A 1996-05-16 1997-05-15 音声言語解析装置 Expired - Lifetime JP3009636B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9125400A JP3009636B2 (ja) 1996-05-16 1997-05-15 音声言語解析装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP12144996 1996-05-16
JP8-121449 1996-05-16
JP9125400A JP3009636B2 (ja) 1996-05-16 1997-05-15 音声言語解析装置

Publications (2)

Publication Number Publication Date
JPH1097535A JPH1097535A (ja) 1998-04-14
JP3009636B2 true JP3009636B2 (ja) 2000-02-14

Family

ID=26458802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9125400A Expired - Lifetime JP3009636B2 (ja) 1996-05-16 1997-05-15 音声言語解析装置

Country Status (1)

Country Link
JP (1) JP3009636B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7031923B1 (en) 2000-03-06 2006-04-18 International Business Machines Corporation Verbal utterance rejection using a labeller with grammatical constraints
JP4105841B2 (ja) * 2000-07-11 2008-06-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識方法、音声認識装置、コンピュータ・システムおよび記憶媒体
JP2004334193A (ja) * 2003-05-01 2004-11-25 Microsoft Corp 音声認識および自然言語理解のための複合統計/ルール・ベース文法モデルを有するシステム
US7603267B2 (en) * 2003-05-01 2009-10-13 Microsoft Corporation Rules-based grammar for slots and statistical model for preterminals in natural language understanding system
JPWO2012023450A1 (ja) * 2010-08-19 2013-10-28 日本電気株式会社 テキスト処理システム、テキスト処理方法およびテキスト処理プログラム
KR101627402B1 (ko) * 2014-03-26 2016-06-03 포항공과대학교 산학협력단 자연어를 점진적으로 분석하는 장치와 이를 이용한 적응적인 응답 장치 및 방법
JP2017058804A (ja) * 2015-09-15 2017-03-23 株式会社東芝 検出装置、方法およびプログラム

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
田代、外、「音声言語処理のための部分木併合手法」、情報処理学会研究報告、1995年、第95巻、第89号(NL−109)、p.27−32
竹澤、外、「部分木に基づく構文規則と前終端記号バイグラムを併用する対話音声認識手法」、電子情報通信学会論文誌D−▲II▼、1996年12月、Vol.J79−D−▲II▼、No.12、p.2078−2085
竹澤、外、「部分木を単位とする構文規則と前終端記号のバイグラムを利用した連続音声認識」、電子情報通信学会技術研究報告、1995年、NLC95−54(SP95−89)、p.55−62
荒川、外、「統計的手法による部分木併合」、電子情報通信学会技術研究報告、1996年5月17日、NLC96−8、p.47−54

Also Published As

Publication number Publication date
JPH1097535A (ja) 1998-04-14

Similar Documents

Publication Publication Date Title
US6442524B1 (en) Analyzing inflectional morphology in a spoken language translation system
US6374224B1 (en) Method and apparatus for style control in natural language generation
US5878390A (en) Speech recognition apparatus equipped with means for removing erroneous candidate of speech recognition
US6282507B1 (en) Method and apparatus for interactive source language expression recognition and alternative hypothesis presentation and selection
US6278968B1 (en) Method and apparatus for adaptive speech recognition hypothesis construction and selection in a spoken language translation system
US6243669B1 (en) Method and apparatus for providing syntactic analysis and data structure for translation knowledge in example-based language translation
US6223150B1 (en) Method and apparatus for parsing in a spoken language translation system
US6266642B1 (en) Method and portable apparatus for performing spoken language translation
US6356865B1 (en) Method and apparatus for performing spoken language translation
US7321850B2 (en) Language transference rule producing apparatus, language transferring apparatus method, and program recording medium
JP2003505778A (ja) 音声制御ユーザインタフェース用の認識文法作成の特定用途を有する句ベースの対話モデル化
US7379870B1 (en) Contextual filtering
Kirchhoff et al. Novel speech recognition models for Arabic
JP2000200273A (ja) 発話意図認識装置
Arısoy et al. A unified language model for large vocabulary continuous speech recognition of Turkish
JP2003515777A (ja) 会話中の典型的な誤り用の相補的言語モデルを用いる音声認識
JP3009636B2 (ja) 音声言語解析装置
JP3441400B2 (ja) 言語変換規則作成装置、及びプログラム記録媒体
Maskey et al. A phrase-level machine translation approach for disfluency detection using weighted finite state transducers
JPS61285570A (ja) 音声入力装置
KR20050101694A (ko) 문법적 제약을 갖는 통계적인 음성 인식 시스템 및 그 방법
JP3059413B2 (ja) 自然言語理解装置及び自然言語理解システム
Lee Structural features of Chinese language–Why Chinese spoken language processing is special and where we are
Isotani et al. Speech-to-speech translation software on PDAs for travel conversation
JP2999727B2 (ja) 音声認識装置