JP3009636B2

JP3009636B2 - 音声言語解析装置

Info

Publication number: JP3009636B2
Application number: JP9125400A
Authority: JP
Inventors: 寿幸竹澤; 直哉荒川; 逞森元
Original assignee: 株式会社エイ・ティ・アール音声翻訳通信研究所
Priority date: 1996-05-16
Filing date: 1997-05-15
Publication date: 2000-02-14
Anticipated expiration: 2017-05-15
Also published as: JPH1097535A

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、自動口述筆記装
置、人間とコンピュータが対話する対話システム、自動
翻訳システムなどに用いられる音声言語解析装置に関す
る。

【０００２】

【従来の技術及び発明が解決しようとする課題】音声認
識部が音声認識結果を文単位の形態素列として言語解析
部に出力し、言語解析部が単一化文法で解析する音声言
語翻訳システム（以下、第１の従来例という。）が、文
献１「竹沢寿幸ほか，“ＡＴＲ音声言語翻訳実験システ
ムＡＳＵＲＡ”，情報処理学会第４６回全国大会，６Ｂ
−５，１９９３年３月」において開示されている。しか
しながら、この第１の従来例においては、音声認識部は
音声認識結果を文単位の形態素列として言語解析部に出
力しているために、音声認識部と言語解析部で構文解析
が二度行われ効率が悪い。さらに、言語解析部で統計的
な選好をとりいれていないこととあいまって、非文法的
な発話に対して頑健でないという問題点があった。

【０００３】話し言葉の機械処理においては、非文法的
な表現、言いよどみなどの「非流暢性」（disfluency）
のために通常の句構造解析が失敗することがしばしばあ
る。こうした「流暢でない」発話でも、もしそれらが意
味的に解釈可能であれば、解析できるような頑健な構文
及び意味解析過程の実現が望まれる。ここで「非流暢
性」には、言い直し、「あのー」や「えーと」などの間
投詞の挿入、助詞などの省略といった現象がある。これ
らの現象の分析については、例えば、文献２「伝康晴，
“話し言葉における非文法的現象とその機械処理”，人
工知能学会研究会資料，ＳＩＧ−ＳＬＵＤ−９５０３，
１９９６年」において開示されている。

【０００４】近年、音声認識と句構造解析を統合して音
声認識率の向上を図ることが試みられているが、句構造
解析を音声入力に施す場合、発話の「非流暢性」や文末
の不明確さなどから発話を文よりも短い単位で句構造解
析することがよい場合がある。文献３「竹澤寿幸ほか，
“自然発話の言語現象と音声認識用日本語文法”，情報
処理学会音声言語情報処理研究会資料，６−５，１９９
５年」は、自然な発話中にあらわれる短いポーズで区切
られた区間が文脈自由文法で記述可能である場合が多い
ことを報告している。このような文より小さい発話単位
の句構造は文より小さい単位の木構造、すなわち部分構
文木（以下、部分木という。）となる。これらの部分木
を併合して文の解析結果を得ることができれば、音声認
識から文の解析まで統合した形の音声言語処理を実現で
き、また計算資源の経済という点からも有利である。

【０００５】本発明の目的は以上の問題点を解決し、構
文的制約を満足していない発話の認識及び、構文及び意
味解析を、頑健に、かつ効率良く行う音声言語解析装置
を提供することにある。

【０００６】

【課題を解決するための手段】本発明に係る請求項１記
載の音声言語解析装置は、入力された発話音声に基づい
て、部分発話毎に形態素解析及び所定の構文規則を参照
した構文解析を行うことにより、部分構文木を出力する
音声認識手段と、部分構文木の接続に関する制約と、所
定のコーパスから得られた各部分構文木が別の単語に係
るときの依存確率とに基づいて、上記音声認識手段から
出力される部分構文木を併合して、構文及び意味解析結
果を出力する部分木併合処理手段とを備えたことを特徴
とする。

【０００７】また、請求項２記載の音声言語解析装置
は、請求項１記載の音声言語解析装置において、上記部
分木併合処理手段は、所定のコーパスから得られた、各
部分構文木が別の単語に係るときの依存確率に基づい
て、各部分構文木と後続する複数の部分構文木中のすべ
ての単語の組み合わせに対する依存尤度を計算する計算
手段と、上記計算手段によって計算されたすべての部分
構文木と単語の組み合わせに対する依存尤度を、記憶装
置上で依存尤度が大きい順序で並べ換えて上記記憶装置
に記憶する並べ換え手段と、上記並べ換え手段によって
並べ換えられた部分構文木と単語の組み合わせのうち、
最大の依存尤度を有する部分構文木と単語の組み合わせ
に対して、係り先の単語が用言である場合用言に用言に
係り得る格が予め決定されかつ同一の複数の格が同一の
用言に係り得ないという部分構文木の接続に関する制約
に基づいて、係り得るか否かの判定を行い、上記制約を
満たして係り得る部分構文木と単語の組み合わせを併合
する併合手段とを備えたことを特徴とする。

【０００８】さらに、請求項３記載の音声言語解析装置
は、請求項２記載の音声言語解析装置において、上記依
存確率は、上記コーパスに基づいて得られた、処理対象
の部分構文木が係り先の単語に係り得る統計的確率と、
上記コーパスに基づいて得られた、処理対象の部分構文
木と係り先の単語との相互の位置関係に依存した尤度
と、上記コーパスに基づいて得られた、処理対象の部分
構文木の後に文末が来る文末確率との積で表されること
を特徴とする。

【０００９】

【発明の実施の形態】以下、図面を参照して本発明に係
る実施形態について説明する。自然な話し言葉を対象に
通常の句構造解析を行なおうとすると、非文法的な表現
に対しては全体の構造が得られず、しばしば断片的な部
分木構造の集まりを得る。本発明に係る実施形態では、
これらの部分木構造を併合して、文全体の構造解析を与
える音声言語解析装置について説明する。ここで、頑健
な併合処理を実現するために統計的方法を用いた。その
ための統計データは旅行会話コーパスから得た。本実施
形態では、併合方法について詳細後述するとともに、文
節単位に分解された木構造データベースを本方法に基づ
いて再構成する実験結果について述べる。本実施形態で
は、併合方法について詳細を後述する。

【００１０】本発明に係る実施形態は、通常の句構造解
析による処理が困難であるような話し言葉の言語現象を
統計的に解析する方法を用いた音声言語解析装置であ
る。例えば、自然な話し言葉を機械で処理しようとする
場合、非文法的な表現、言いよどみなどのために通常の
句構造解析は文全体の解析結果をもたらさないことがあ
る。このような場合でも、句構造解析の結果として、発
話入力中の形態素、文節、句、節などを要素とする木構
造を得ることができる。複数のこのような木構造が意味
上１つの文を構成する（あるいは１つの述語に支配され
る）と考えられる場合、それらを併合して処理できれ
ば、意味の解析あるいは翻訳処理に役立つ。この論文で
部分木とは、このような文より小さい単位の木構造を指
し、部分木併合とは部分木を併合して文に相当する構造
を作るようなプロセスを指す。このような文より小さい
発話単位の句構造は文より小さい単位の木構造、すなわ
ち部分木となり、これらの部分木を併合して文の解析結
果を得ることができれば、音声認識から文の解析まで統
合した形の音声言語処理を実現でき、また計算資源の経
済という点からも有利である。

【００１１】ここで提案する方法においては、句構造解
析が出力する部分木を依存（係り受け）構造に変換した
ものを併合の対象とし、統計的に依存関係を持つ可能性
の高い部分木同士を併合する。各部分木と、それが依存
可能な他の部分木中の表現との間の依存確率を依存構造
解析を施したコーパスから抽出して、併合のための選好
情報として用いる。また、それらの部分木の相互位置
や、文末が想定される位置なども依存尤度を計算するた
めに用いる。

【００１２】図１は、本発明に係る一実施形態である音
声言語解析装置の構成を示すブロック図である。図１に
おいて、発話音声はマイクロホン１０に入力されて、音
声信号に変換された後、音声認識部１に入力される。音
声認識部１は、入力される音声信号に対して、例えばＬ
ＰＣ分析などの音声分析を実行して例えばケプストラム
係数や対数パワーなどの音響的特徴パラメータを抽出し
た後、当該音響的特徴パラメータに基づいて、例えば音
素ＨＭＭ（音素隠れマルコフモデル）を用いて発話音声
に対応する音素列を音声認識する。さらに、音声認識部
１は、音声認識部１は、音声認識された音素列に基づい
て、部分発話毎に、形態素解析及び、例えば語彙と文法
規則を予め記憶する構文規則メモリ２０内の構文規則を
参照した構文解析を行うことにより、部分発話毎に部分
構文木を出力する。

【００１３】音声認識部１における部分木の出力は次の
ように行う。音素列のＬＲパージングにおいて還元（re
duce）処理を施した結果、受理（accept）に至らない候
補であっても、次の条件を満たすものは部分解リストに
つないで残しておく。（条件１）シンボル系列すべてが還元処理されている。（条件２）文法経歴が、同じシンボル系列が還元処理さ
れている別の部分解の文法経歴の部分集合ではない。条件１は最低１つの単語（形態素）とならないかぎり部
分木として残さないことを意味する。条件２は、

【数１】（＜副詞句＞ −＞＜副詞＞）のような構文規則により多くの似た候補が残ることを避
けるためのものである。部分解リストに登録された複数
の解（部分木）は、ビーム探索により枝刈り（prunin
g）されないがぎり、認識結果候補として出力される。

【００１４】次いで、部分木併合処理部２は、部分構文
木の接続に関する制約と、所定のコーパスから得られた
各部分木が別の単語に係るときの依存確率とに基づい
て、上記音声認識部１から出力される部分構文木を併合
して、構文及び意味解析結果を出力する。ここで、部分
木併合処理部２においては、所定のコーパスから得られ
た、各部分木が別の単語に係るときの依存確率に基づい
て、各部分木と後続する複数の部分木中のすべての単語
の組み合わせに対する依存尤度を計算し、上記計算され
たすべての部分木と単語の組み合わせに対する依存尤度
を、並べかえメモリ４２上で依存尤度が大きい順序で並
べ換えて記憶し、並べ換えられた部分木と単語の組み合
わせのうち、最大の依存尤度を有する部分木と単語の組
み合わせに対して、係り先の単語が用言である場合用言
に用言に係り得る格が予め決定されかつ同一の複数の格
が同一の用言に係り得ないという部分木の接続に関する
制約に基づいて、係り得るか否かの判定を行い、上記制
約を満たして係り得る部分木と単語の組み合わせを併合
する。また、上記依存確率は、好ましくは、上記コーパ
スに基づいて得られた、処理対象の部分木が係り先の単
語に係り得る統計的確率と、上記コーパスに基づいて得
られた、処理対象の部分木と係り先の単語との相互の位
置関係に依存した尤度と、上記コーパスに基づいて得ら
れた、処理対象の部分木の後に文末が来る文末確率との
積で表される。

【００１５】図２に、図１の音声言語解析装置の動作例
を示す。図２に示すように、音声認識部１によって、入
力された発話音声は、部分構文木群（（１）〜（３））
に変換された後、当該部分構文木群が部分木併合処理部
２によって、構文及び意味解析結果に変換される。この
図で、矢印で連結されている部分が１つの木（部分木）
であるが、部分構文木（１）及び（２）のように１単語
で１部分構文木を構成するものもあれば、部分構文木
（３）のように２文節で１部分構文木を構成するものも
ある。

【００１６】本実施形態の音声言語解析装置において、
音声認識部１と、部分木併合処理部２とは、例えばデジ
タル計算機によって構成され、構文規則メモリ２０は、
例えばハードディスクメモリによって構成される。な
お、当該実施形態において、前終端記号バイグラムや句
構造規則のバイグラムや部分構文木間の依存尤度などを
表わす統計情報を選好情報として用いてもよい。ここ
で、「句構造規則のバイグラム」については、文献４
「K.Kita al.,“Continuously Spoken Sentence Recogn
ition by HMM-LR",ICSLP-92,pp.305-308,1992年」にお
いて開示されている。

【００１７】次いで、音声認識部１の処理の実施形態に
ついて述べる。当該実施形態において、音声認識部１
は、部分木、言い換えれば部分解を出力するための構文
解析手法としてＬＲ構文解析法を用いる。表１に、この
手法のための文法の記述例を示す。表１に示す文法は
「節」を単位として文法を記述している。

【００１８】

【表１】文法の記述例 ─────────────────────────────────── （＜ｓｔａｒｔ＞＜−−＞（＜節＞））（＜節＞＜−−＞（＜述語＞））（＜節＞＜−−＞（＜後置詞句＞））（＜節＞＜−−＞（＜副詞句＞））（＜節＞＜−−＞（＜連体修飾句＞））（＜節＞＜−−＞（＜名詞＞））（＜節＞＜−−＞（＜数詞＞））（＜節＞＜−−＞（＜複合語＞））（＜節＞＜−−＞（＜感動詞＞））（＜節＞＜−−＞（＜間投詞＞））（＜述語＞＜−−＞（＜動詞句＞））（＜述語＞＜−−＞（＜動詞＞））（＜動詞＞＜−−＞（＜サ変名詞＞＜補助動詞＞））（＜動詞句＞＜−−＞（＜動詞＞＜助動詞＞））（＜後置詞句＞＜−−＞（＜名詞＞＜助詞＞））（＜副詞句＞＜−−＞（＜副詞＞））（＜名詞＞＜−−＞（＜複合語＞））（＜副詞＞＜−−＞（i m a））；；今（＜名詞＞＜−−＞（ny uu y oo k u sh i t i h o t e r u））；；ニューヨークシティホテル（＜複合語＞＜−−＞（r o Q py a k u n i g oo sh i ts u））；；六百二号室（＜助詞＞＜−−＞（n i））；；に（＜サ変名詞＞＜−−＞（t a i z a i））；；滞在（＜補助動詞＞＜−−＞（sh i））；；し（＜助動詞＞＜−−＞（t e i m a s u））；；ています（＜間投詞＞＜−−＞（a n oo））；；あのー（＜名詞＞＜−−＞（w a t a sh i））；；わたし（＜名詞＞＜−−＞（s o ch i r a））；；そちら（＜助詞＞＜−−＞（n o））；；の（＜名詞＞＜−−＞（s e k i））；；せき（＜サ変名詞＞＜−−＞（y o y a k u））；；よやく（＜助動詞＞＜−−＞（t a i N d e s u g a））；；たいんですが（＜助詞＞＜−−＞（w a））；；は（＜名詞＞＜−−＞（s u z u k i））；；鈴木（＜助詞＞＜−−＞（t o））；；と（＜動詞＞＜−−＞（m oo sh i））；；申し（＜助動詞＞＜−−＞（m a s u））；；ます（＜名詞＞＜−−＞（h a N b aa g u））；；ハンバーグ（＜名詞＞＜−−＞（h a N b aa g aa））；；ハンバーガー（＜助詞＞＜−−＞（o））；；を（＜サ変名詞＞＜−−＞（ch uu m o N））；；注文（＜助動詞＞＜−−＞（t a N d e s u））；；たんです ───────────────────────────────────

【００１９】ＨＭＭ音素認識とＬＲ構文解析手法を組み
合わせたＨＭＭ−ＬＲ連続音声認識法では、還元処理を
施した結果、文として受理に至る候補のみを保存し、ビ
ーム探索を行なっていた。当該の実施形態では、部分
木、言い換えれば部分解を出力するために、受理に至ら
ない候補であっても、部分解セルリストにつなぐことに
より、処理過程で残しておく。もちろん従来通り受理さ
れた候補も残し、両者をまとめてビーム探索による枝刈
りを実施する。そして、スコアの高いものを認識結果と
して出力する。

【００２０】ここで、すべての部分解を部分解セルリス
トにつないでしまうと、例えば

【数２】（＜副詞句＞＜−−＞（＜副詞＞））という構文規則により多くの似た候補が残ってしまう。
似た部分木の例を表２に示す。

【００２１】

【表２】似た部分木の例 ────── 節 │ 副詞句 │ 副詞 │ 今 ────── 副詞句 │ 副詞 │ 今 ────── 副詞 │ 今 ──────

【００２２】「今」という副詞が副詞句まであがってい
るものとそうでないものがある。このような場合は一番
大きな部分木を保存し、それ以外はその部分部分木と表
現できる。そこで、あるセルの文法履歴が、同じシンボ
ル系列が還元処理されている別のセルの文法履歴の部分
部分木ではない場合に限って、部分解セルリストにつな
ぎ、処理の効率化を図っている。

【００２３】次いで、部分木併合処理部２の処理の実施
形態について説明する。この実施形態では、入力として
依存構造木（部分木）の列を用いる。従って、本実施形
態では、音声認識部１が構文解析で生成された句構造
（部分）木を依存構造（部分）木に変換する。句構造
（部分）木を依存構造（部分）木に変換するために、句
構造中の文法的なヘッドを決定する規則を利用する。依
存構造においては、部分木の併合は、部分木間の依存関
係を発見することと同値になる。

【００２４】例文「今ニューヨークシティホテル▼六百
二号室に滞在しています」の依存構造を図２（下段）に
示す。依存関係は矢印で示されている。なお、＜ＴＬＯ
Ｃ＞，＜ＡＤＪＵＮＣＴ＞，＜ＬＯＣＴ＞は依存関係の
種類を示すラベルである。

【００２５】例文「今ニューヨークシティホテル▼六百
二号室に滞在しています」に対応する３つの部分木の依
存構造を図２（上段）に示す。ポーズ区切り「▼」の存
在により、それ以降の部分が、それ以前の部分とは異な
る部分木となっている。また、副詞（「今」）と名詞
（「ニューヨークシティホテル」）を連接する文法規則
が存在しないために「今ニューヨークシティホテル」の
部分は２つの部分木になる。部分木併合により、図２
（上段）には見られない依存関係が作り出され、図２
（下段）に現われる。

【００２６】依存構造木を入力とする部分木併合のため
に、次のようなアルゴリズムを用いることができる。＜ステップＳＳ１＞各部分木と後続する部分木（複数）
中のすべての単語との組み合わせに対して依存尤度を計
算する。＜ステップＳＳ２＞ステップＳＳ１で依存尤度を計算し
た組み合わせのうち、一定値以上の依存尤度をもつもの
を依存尤度順に並べ、それらを順に併合する。用言の係
り受け併合にあたっては、格フレームのチェックを行
う。

【００２７】上記のアルゴリズムの動作を以下の例によ
って説明する。このプロセスがどう動くかを例を用いて
見てみよう。例：「私、ハンバーグを、ハンバーガーを、注文したん
です。」この文を読点のところで分割したものから作った部分木
を併合することを考える。まず、代名詞の「私」及び
「を」で終わる２つの文節は用言「注文」へ依存すると
いう可能性に対し高い尤度が統計的に与えられる。この
例では言い直しが現われているが、「ハンバーガーを」
と「注文した」が距離的に近いために「ハンバーグを」
と「注文した」より強い依存尤度が与えられ、まず「ハ
ンバーガーを」と「注文した」の併合が行われる。この
併合により「注文した」の「を」格が消費されてしまう
ため「ハンバーグを」が「注文した」に係るという解釈
は格フレームチェックにより却下され「ハンバーグを」
は係り先なしのゴミと判定される。

【００２８】次いで、依存尤度の計算について説明す
る。本実施形態においては、依存尤度は３つの尤度関数
（それぞれ０以上１以下の値を取る）の積とした。以
下、各関数について説明する。

【００２９】（Ａ）統語的構成による依存関係の統計的
整合性に関する関数これは一種のバイグラム尤度関数であり、依存元候補の
トップにある文節（あるいは文節より小さな部分構造）
と依存先候補（通常は単語）のノードそれぞれの見出し
及び品詞パターンから、それらが依存関係にある尤度を
返す。ここで、依存先は係り先と同義語であり、依存元
は係り元と同義語である。尤度は、コーパス中で依存候
補対のパターンが依存元候補が先行する形で同一文中に
生起した場合に依存が成立する条件付き確率ＰＲであ
る。この確率ＰＲは依存候補対の依存元及び依存先パタ
ーンをＰＰとすると次式で表わされる。

【００３０】

【数３】ＰＲ＝（ＰＰが実際に依存関係にある回数）／
（ＰＰが同じ文中で依存元パターンが先行する形で現れ
る回数）

【００３１】この確率値ＰＲは併合処理とは別に統計を
取り、あらかじめテーブルに格納しておいたものを用い
る（詳細後述）。見出し情報は意味情報を含んでいるか
ら、意味と依存の関係も、この方法によりコーパス中に
現われる組み合わせの範囲内であれば捉えることができ
る。尤度テーブル検索の際のパターンマッチングは一種
の最長一致法による。以下に図３の例を用いて説明を試
みる。

【００３２】例：「予約を」が「キャンセル」に依存す
る尤度を所定の尤度データベースから求める。図３の例
では依存候補対のパターンを上段が見出し、下段が品詞
という形で示す。各段階で、パターンが尤度データベー
ス中にあれば、当該尤度データベース中の尤度を用い、
見つからなければ次の段階へ進む。

【００３３】上記確率値ＰＲは、所定のコーパスから、
処理対象の部分木が依存先の単語に係り得る統計的確率
として計算される。

【００３４】（Ｂ）依存先候補の位置に依存した尤度の
関数依存元候補の部分木及び依存先候補の単語との相互の位
置関係又は依存先候補の文末との位置関係から依存尤度
を計算する。このために学習用テキストデータを含むテ
キストデータベースであるコーパスから次に示すよう
に、依存関係の物理的な距離のヒストグラムを取り利用
する。

【００３５】（１）依存先トップノードと依存元の品詞
から、依存関係が常に隣接関係である（例えば助動詞と
動詞との直接依存関係）とヒストグラムにより判断でき
れば、隣接している依存関係候補には尤度１を与え、隣
接していない依存関係候補には尤度０を与える。（２）上記ヒストグラムから依存関係が隣接しない依存
関係を持つと判断される場合、尤度として指数関数ｅｘ
ｐ（−ｋλｄ）を用いる。ここで、λは上記ヒストグラ
ムから得られる依存関係の種類に関する平均依存距離の
逆数であり、ｄは依存関係候補間の距離であり、ｋは予
め決められた定数である。この尤度設定より近い部分木
同士が優先的に併合される。（３）感動詞や接続詞など文全体に係る語は、依存構造
解析では文の最後の表現に依存することが多いため、本
実施形態では、接続詞、感動詞などを文末表現に係ると
想定した。よって、それらの語には依存先候補が文末表
現である確率（次項（Ｃ）参照。）を依存尤度として与
える。

【００３６】当該依存先候補の位置に依存した尤度は、
所定のコーパスから、処理対象の部分木と依存先の単語
との相互の位置関係に依存した尤度として計算される。

【００３７】（Ｃ）文末確率の関数音声言語処理においては、１人が続けて複数の文を発話
することもあり、文末は常に明確ではない。依存関係は
文末を超えて成り立たないから、文末が依存関係候補の
間にある確率が大きくなると、それらの候補の間の依存
関係尤度はその分小さくなる。従って、文末確率に応じ
た依存尤度は２つの部分木（依存候補対）の間に文末が
来ない確率として定義される。依存元候補と依存先候補
の間に部分木の切れ目がいくつかあるとすると、尤度は
それらの各々の切れ目に文末が来ない確率（１−文末が
来る確率）の積になる。各部分木間に文末が来る文末確
率は、先行する部分木の最後の語の品詞と次の部分木の
最初の語の品詞の関数とし、コーパスから抽出された統
計データを用いて計算する。

【００３８】上記文末確率は、所定のコーパスから、処
理対象の部分木の後に文末が来る文末確率として計算さ
れる。

【００３９】次いで、格フレームチェックについて説明
する。用言（動詞、形容詞）には、係り得る格が決まっ
ていて、さらに同じ格を複数係ることはできないという
制約がある。すなわち、当該制約は、係り先の単語が用
言である場合用言に用言に係り得る格が予め決定されか
つ同一の複数の格が同一の用言に係り得ないということ
である。部分木併合の際にもこれらの制約を考慮するこ
とが望ましい。今回の実験では、コーパス中に出現する
各用言について格助詞「が、を、に」に関する表層格パ
ターンを調査し、併合過程で各用言にそれらの格助詞に
支配される表現が係りうるかどうかをチェックするよう
にした。また、同じ表層格を持つ表現が同じ用言に複数
個係ることを禁止した（この際、係助詞の持つ格の多義
性も考慮した）。その他、受け身、使役、さらに助動詞
「たい」に支配される動詞の格パターンの変化にも考慮
して実験を行った。

【００４０】次いで、コーパスから抽出するデータにつ
いて説明する。上記の併合過程で利用するデータのう
ち、コーパスから抽出するものをまとめると次のように
なる。ここで使用するコーパスは、本出願人が所有する
音声言語データベース（例えば、文献５「T.Morimoto e
t al.,“A Speech and Language Database for SpeechT
ranslation Research",Proceeding of ICSLP '94 pp.17
91-1794,1994年」参照。）（旅行会話：３７５会話、１
３６４７文）に依存構造解析を行ったものであるこの依
存構造解析は、人手で検査修正を行った正解である。

【００４１】そして、依存構造データベース中のすべて
の依存関係を調べ、依存元パターンと依存先パターンが
同じ文中で依存元パターンが先行する形で現れた場合
に。上記数２を用いて依存関係が成立する確率ＰＲを求
める。依存先パターンは原則的に部分木のノード（＝
語）の見出し及び品詞対である。依存元パターンは文節
あるいは文節内構造である。例えば、「私は行く」とい
う表現に対し、依存先パターンとしては（「行く」・動
詞）と（「は」・係助詞）の２つが得られ、依存元パタ
ーンとしては（「は」・係助詞（「私」・代名詞））及
び（「私」・代名詞）の２つが得られる。なお、スパー
スデータ問題を回避するために自立語の見出しをワイル
ドカード「＊」で置き換えたものについても統計を取っ
た。

【００４２】さらに、２つの品詞が互いに依存関係にあ
る場合の相互の距離のヒストグラムを求めた。多くの機
能語（例えば助詞）の場合、直前の語にのみ依存を受け
るが、動詞などは係り受けの形で遠距離の依存関係を持
つ。上で述べたように、コーパスから得られた依存距離
の情報は、依存尤度を計算するために用いられる。

【００４３】ここで、文末モデルは２つの品詞の間に文
末が来る確率をコーパスから求めた。また、コーパス中
に現われる用言が表層格「が」、「を」、「に」を取り
得るかどうかを調べ、併合の際の制約として利用した。
例えば、動詞「会う」は格助詞「が」「を」「に」を取
る。

【００４４】図４は、図１の部分木併合処理部２の構成
の詳細を示すブロック図である。図４において、部分木
併合処理部２は、併合処理を実行するＭＰＵなどのディ
ジタル計算機である演算制御装置である併合処理コント
ローラ３０を備えるとともに、併合処理コントローラ３
０には、（ａ）併合処理を実行するときに用いる処理メ
モリ３１と、（ｂ）依存先候補の位置による尤度の計算
に用いられる距離減衰率テーブル３２と、（ｃ）格フレ
ームチェックに用いられる格フレームテーブル３３と、
（ｄ）文末確率を計算するために用いられる文末／文
頭、品詞統計ファイル３４と、（ｅ）統語的構成による
依存関係の統計的整合性を計算するために用いられる依
存確率テーブル３５とが接続される。また、併合処理コ
ントローラ３０には、（ｆ）音声認識部１から出力され
る部分構文木の結果を記憶する入力ファイル２１と、
（ｇ）併合処理コントローラ３０から出力される構文及
び意味解析結果を記憶する出力ファイル２２とが接続さ
れる。さらに、処理メモリ３１は、部分木メモリ４１
と、並べかえメモリ４２と、依存尤度メモリ４３と、必
須格リストメモリ４４とを備える。ここで、処理メモリ
３１は例えばハードディスクメモリで構成され、２１、
２２、３２乃至３５で示されるこれらのファイル、テー
ブル及びファイルは例えばハードディスクメモリなどの
記憶装置に記憶される。

【００４５】さらに、図４の部分木併合処理部２内の各
テーブル及びファイルのレコード形式とレコード例を示
す。依存先候補の位置による尤度の計算に用いられる距
離減衰率テーブル３２を表３に示し、格フレームチェッ
クに用いられる格フレームテーブル３３を表４に示す。
また、文末確率を計算するために用いられる文末／文
頭、品詞統計ファイル３４を表５に示し、統語的構成に
よる依存関係の統計的整合性を計算するために用いられ
る依存確率テーブル３５を表６に示す。これらの各テー
ブル及びファイルは、本特許出願人が所有する旅行会話
のデータベースのコーパスに基づいて所定の文法的解析
を行うことにより得られたものであって、所定の依存関
係解析木の形式で記述された文法的解析データである。

【００４６】

【表３】距離減衰率テーブル ─────────────────────────── レコード形式 ::= (依存品詞被依存品詞平均依存距離) ─────────────────────────── レコード例： (<人名> <連体助詞> 0) (<副詞> <サ変名詞> 396/287) (<接続詞> <補助動詞語幹> 412/51) (<接続助詞> <本動詞> 657/260) (<係助詞> <本動詞> 1347/664) (<格助詞> <本動詞> 6028/7099) ───────────────────────────

【００４７】

【表４】格フレームテーブル ─────────────────────────────────── レコード形式 ::= (単語格フレーム群) 単語 ::= (見出し品詞) 格フレーム群 ::= ('格フレーム群 (格フレーム*)) 格フレーム ::= ('格フレーム (格スロット*)) 格スロット ::= (格助詞 {+, -}) ─────────────────────────────────── レコード例： ((放送 <サ変名詞>) (格フレーム群 ((格フレーム ((が -)))))) ((一泊 <サ変名詞>) (格フレーム群 ((格フレーム ((が -) (に -)))))) ((払 <本動詞>) (格フレーム群 ((格フレーム ((が -) (を -))) (格フレーム ((が -) (に -)))))) ((控え <本動詞>) (格フレーム群 ((格フレーム ((が -) (に -)))))) ((飾 <本動詞>) (格フレーム群 ((格フレーム ((が -) (を -)))))) ───────────────────────────────────

【００４８】

【表５】文末／文頭、品詞統計ファイル ────────────────────────────── レコード形式 ::= (文末品詞文頭品詞 (文末頻度全体頻度)) レコード例： (終助詞本動詞 (71 100)) (普通名詞間投詞 (3 48)) (人名普通名詞 (3 23)) (接尾辞接続詞 (17 53)) (普通名詞人名 (7 27)) (接続詞間投詞 (1 209)) (感動詞住所名 (1 1)) ──────────────────────────────

【００４９】

【表６】依存確率テーブル ─────────────────────────────────── レコード形式 ::= [['係り受け出現回数 N] ['パターン出現回数 N] ['依存先 [['品詞品詞] ['見出し見出し]]] ['依存元 [['ヘッド [['品詞品詞] ['見出し見出し]]] ['引数 [['ヘッド [['品詞品詞] ['見出し見出し]]]]]]]] ─────────────────────────────────── レコード例： ─────────────────────────────────── [[係り受け出現回数 3] [パターン出現回数 3] [依存先 [[品詞 <補助動詞語幹>] [見出しございま]]] [依存元 [[ヘッド [[品詞 <助動詞>] [見出しで]]] [引数 [[ヘッド [[品詞 <固有名詞>] [見出しニューヨークシティホテル]]]]]]]] ─────────────────────────────────── [[係り受け出現回数 14] [パターン出現回数 25] [依存先 [[品詞 <終助詞>] [見出しが]]] [依存元 [[ヘッド [[品詞 <助動詞語幹>] [見出しで]]] [引数 [[ヘッド [[品詞 <準体助詞>] [見出しの]]]]]]]] ─────────────────────────────────── [[係り受け出現回数 10] [パターン出現回数 10] [依存先 [[品詞 <本動詞>] [見出しし]]] [依存元 [[ヘッド [[品詞 <格助詞>] [見出しを]]] [引数 [[ヘッド [[品詞 <サ変名詞>] [見出し予約]]]]]]]] ───────────────────────────────────

【００５０】図５は、図４の部分木併合処理部によって
実行される１発話単位の併合処理を示すフローチャート
である。図５に示すように、まず、ステップＳ１１にお
いて１発話分の部分木を、音声認識部１からの出力を格
納する入力ファイル２１から処理メモリ３１内の部分木
メモリ４１に読み込む。次いで、ステップＳ１２におい
て、処理対象の部分木に対して、文末／文頭、品詞統計
ファイル３４を参照して、各部分木の後に文末が来る文
末確率を計算する。そして、ステップＳ１３において、
各用言について、用言が常に要求する格である必須格の
リストを求めて必須格リストメモリ４４に記憶する。さ
らに、ステップＳ１４において、詳細上述したように、
上記のステップＳＳ１のごとく、各部分木と後続する複
数の部分木中のすべての単語の組み合わせに対して依存
尤度を計算して依存尤度メモリ４３に記憶し、ステップ
Ｓ１５において、依存尤度を計算した組み合わせのう
ち、一定値以上の依存尤度を大きい順に並べて並べかえ
メモリ４２に記憶する。

【００５１】次いで、ステップＳ１６において、まだ併
合されていない単語の組み合わせがあるか否かが判断さ
れ、あるときはステップＳ１７に進む一方、無いときは
ステップＳ２２に進んで部分木の併合処理結果を出力フ
ァイル２２に出力して、当該併合処理を終了する。

【００５２】ステップＳ１７では、最大尤度を有する組
み合わせは格助詞の用言依存か否かが判断され、依存す
るときはステップＳ１８に進む一方、依存しないときは
ステップＳ２０に進む。ステップＳ１８では、必須格リ
ストメモリ４４内の必須格リストを参照して、最大尤度
を有する組み合わせの格フレームをチェックし、上述の
格フレームチェック時の制約を満たすか否かが判断され
る。制約を満たさないときはステップＳ２１に進む一
方、制約を満たすときはステップＳ１９で格助詞の格を
必須格リストメモリ４４から削除した後、ステップＳ２
０に進む。ステップＳ２０では、当該組み合わせを併合
する併合処理を実行して、ステップＳ１６に戻る。ま
た、ステップＳ２１では、当該組み合わせを並べかえメ
モリ４２から取り除いた後、ステップＳ１６に戻る。

【００５３】以上説明したように、本発明に係る本実施
形態によれば、入力された発話音声に基づいて、部分発
話毎に形態素解析及び所定の構文規則を参照した構文解
析を行うことにより、部分構文木を出力し、次いで、部
分構文木の接続に関する制約と、所定のコーパスから得
られた各部分木が別の単語に係るときの依存確率とに基
づいて、上記出力される部分構文木を併合して、構文及
び意味解析結果を出力する。これにより、構文的制約を
満足していない発話の認識及び、構文及び意味解析を頑
健に行うことができる。また、音声認識手段から部分木
併合処理手段に対して、部分木で受け渡しをするため、
処理効率がよく、従来例に比較して高速で処理すること
ができる。

【００５４】

【発明の効果】以上詳述したように本発明に係る請求項
１記載の音声言語解析装置においては、入力された発話
音声に基づいて、部分発話毎に形態素解析及び所定の構
文規則を参照した構文解析を行うことにより、部分構文
木を出力する音声認識手段と、部分構文木の接続に関す
る制約と、所定のコーパスから得られた各部分構文木が
別の単語に係るときの依存確率とに基づいて、上記音声
認識手段から出力される部分構文木を併合して、構文及
び意味解析結果を出力する部分木併合処理手段とを備え
る。従って、本発明によれば、構文的制約を満足してい
ない発話の認識及び、構文及び意味解析を頑健に行い、
かつ、音声認識手段から部分木併合処理手段に対して、
部分木で受け渡しをするため、処理効率がよい音声言語
解析装置を提供することができる。

【００５５】また、請求項２記載の音声言語解析装置に
おいては、請求項１記載の音声言語解析装置において、
上記部分木併合処理手段は、所定のコーパスから得られ
た、各部分構文木が別の単語に係るときの依存確率に基
づいて、各部分構文木と後続する複数の部分構文木中の
すべての単語の組み合わせに対する依存尤度を計算する
計算手段と、上記計算手段によって計算されたすべての
部分構文木と単語の組み合わせに対する依存尤度を、記
憶装置上で依存尤度が大きい順序で並べ換えて上記記憶
装置に記憶する並べ換え手段と、上記並べ換え手段によ
って並べ換えられた部分構文木と単語の組み合わせのう
ち、最大の依存尤度を有する部分構文木と単語の組み合
わせに対して、係り先の単語が用言である場合用言に用
言に係り得る格が予め決定されかつ同一の複数の格が同
一の用言に係り得ないという部分構文木の接続に関する
制約に基づいて、係り得るか否かの判定を行い、上記制
約を満たして係り得る部分構文木と単語の組み合わせを
併合する併合手段とを備える。従って、本発明によれ
ば、構文的制約を満足していない発話の認識及び、構文
及び意味解析を頑健に行い、かつ、音声認識手段から部
分木併合処理手段に対して、部分木で受け渡しをするた
め、処理効率がよい音声言語解析装置を提供することが
できる。また、上記部分木併合処理手段の処理を容易に
かつ自動的に効率良く行うことができる。

【００５６】さらに、請求項３記載の音声言語解析装置
においては、請求項１記載の音声言語解析装置におい
て、上記依存確率は、上記コーパスに基づいて得られ
た、処理対象の部分構文木が係り先の単語に係り得る統
計的確率と、上記コーパスに基づいて得られた、処理対
象の部分構文木と係り先の単語との相互の位置関係に依
存した尤度と、上記コーパスに基づいて得られた、処理
対象の部分構文木の後に文末が来る文末確率との積で表
される。従って、本発明によれば、構文的制約を満足し
ていない発話の認識及び、構文及び意味解析を頑健に行
い、かつ、音声認識手段から部分木併合処理手段に対し
て、部分木で受け渡しをするため、処理効率がよい音声
言語解析装置を提供することができる。また、上記部分
木併合処理手段の処理を容易にかつ自動的に効率良く行
うことができる。

【図面の簡単な説明】

【図１】本発明に係る一実施形態である音声言語解析
装置の構成を示すブロック図である。

【図２】図１の音声言語解析装置の動作例を示す図で
ある。

【図３】図１の部分木併合処理部における尤度テーブ
ル検索の際のパターンマッチングの処理例を示す図であ
る。

【図４】図１の部分木併合処理部の構成の詳細を示す
ブロック図である。

【図５】図４の部分木併合処理部によって実行される
１発話単位の併合処理を示すフローチャートである。

【符号の説明】

１…音声認識部、２…部分木併合処理部、１０…マイクロホン、２０…構文規則メモリ、２１…入力ファイル、２２…出力ファイル、３０…併合処理コントローラ、３１…処理メモリ、３２…距離減衰率テーブル、３３…格フレームテーブル、３４…文末／文頭、品詞統計ファイル、３５…依存確率テーブル、４１…部分木メモリ、４２…並べかえメモリ、４３…依存尤度メモリ、４４…必須格リストメモリ。

フロントページの続き (72)発明者森元逞京都府相楽郡精華町大字乾谷小字三平谷５番地株式会社エイ・ティ・アール音声翻訳通信研究所内 (56)参考文献特開平１−214973（ＪＰ，Ａ) 荒川、外、「統計的手法による部分木併合」、電子情報通信学会技術研究報告、1996年５月17日、ＮＬＣ96−８、ｐ．47−54 竹澤、外、「部分木を単位とする構文規則と前終端記号のバイグラムを利用した連続音声認識」、電子情報通信学会技術研究報告、1995年、ＮＬＣ95−54（ＳＰ95−89）、ｐ．55−62 田代、外、「音声言語処理のための部分木併合手法」、情報処理学会研究報告、1995年、第95巻、第89号（ＮＬ− 109）、ｐ．27−32 竹澤、外、「部分木に基づく構文規則と前終端記号バイグラムを併用する対話音声認識手法」、電子情報通信学会論文誌Ｄ−▲ＩＩ▼、1996年12月、Ｖｏｌ. Ｊ79−Ｄ−▲ＩＩ▼、Ｎｏ．12、ｐ. 2078−2085 (58)調査した分野(Int.Cl.⁷，ＤＢ名) G06F 17/27 G06F 17/28 G10L 3/00 561 ＪＩＣＳＴファイル（ＪＯＩＳ)

Claims

(57)【特許請求の範囲】

【請求項１】入力された発話音声に基づいて、部分発
話毎に形態素解析及び所定の構文規則を参照した構文解
析を行うことにより、部分構文木を出力する音声認識手
段と、部分構文木の接続に関する制約と、所定のコーパスから
得られた各部分構文木が別の単語に係るときの依存確率
とに基づいて、上記音声認識手段から出力される部分構
文木を併合して、構文及び意味解析結果を出力する部分
木併合処理手段とを備えたことを特徴とする音声言語解
析装置。
【請求項２】上記部分木併合処理手段は、所定のコーパスから得られた、各部分構文木が別の単語
に係るときの依存確率に基づいて、各部分構文木と後続
する複数の部分構文木中のすべての単語の組み合わせに
対する依存尤度を計算する計算手段と、上記計算手段によって計算されたすべての部分構文木と
単語の組み合わせに対する依存尤度を、記憶装置上で依
存尤度が大きい順序で並べ換えて上記記憶装置に記憶す
る並べ換え手段と、上記並べ換え手段によって並べ換えられた部分構文木と
単語の組み合わせのうち、最大の依存尤度を有する部分
構文木と単語の組み合わせに対して、係り先の単語が用
言である場合用言に用言に係り得る格が予め決定されか
つ同一の複数の格が同一の用言に係り得ないという部分
構文木の接続に関する制約に基づいて、係り得るか否か
の判定を行い、上記制約を満たして係り得る部分構文木
と単語の組み合わせを併合する併合手段とを備えたこと
を特徴とする請求項１記載の音声言語解析装置。
【請求項３】上記依存確率は、上記コーパスに基づい
て得られた、処理対象の部分構文木が係り先の単語に係
り得る統計的確率と、上記コーパスに基づいて得られた、処理対象の部分構文
木と係り先の単語との相互の位置関係に依存した尤度
と、上記コーパスに基づいて得られた、処理対象の部分構文
木の後に文末が来る文末確率との積で表されることを特
徴とする請求項２記載の音声言語解析装置。