JP6150268B2 - 単語登録装置及びそのためのコンピュータプログラム - Google Patents
単語登録装置及びそのためのコンピュータプログラム Download PDFInfo
- Publication number
- JP6150268B2 JP6150268B2 JP2012191971A JP2012191971A JP6150268B2 JP 6150268 B2 JP6150268 B2 JP 6150268B2 JP 2012191971 A JP2012191971 A JP 2012191971A JP 2012191971 A JP2012191971 A JP 2012191971A JP 6150268 B2 JP6150268 B2 JP 6150268B2
- Authority
- JP
- Japan
- Prior art keywords
- character string
- speech recognition
- speech
- word
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004590 computer program Methods 0.000 title claims description 12
- 238000000034 method Methods 0.000 claims description 188
- 230000008569 process Effects 0.000 claims description 166
- 238000012545 processing Methods 0.000 claims description 99
- 238000012937 correction Methods 0.000 claims description 84
- 230000004044 response Effects 0.000 claims description 28
- 238000006243 chemical reaction Methods 0.000 claims description 19
- 238000013519 translation Methods 0.000 description 134
- 230000006870 function Effects 0.000 description 22
- 230000007704 transition Effects 0.000 description 12
- 240000000220 Panda oleosa Species 0.000 description 11
- 235000016496 Panda oleosa Nutrition 0.000 description 10
- 230000015572 biosynthetic process Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 238000010079 rubber tapping Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000013500 data storage Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 3
- 239000003814 drug Substances 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
Images
Landscapes
- Machine Translation (AREA)
Description
〈概略〉
─全体構成(図1)─
図1を参照して、この発明に係る音声翻訳システム100は、インターネット102に接続された、クライアントからの音声翻訳要求に応答して音声翻訳サービスを提供するサーバ106と、インターネット102に接続可能で、サーバ106による音声翻訳サービスを利用するためのアプリケーションがインストールされた携帯型端末104とを含む。この実施の形態では、携帯型端末104は自分で音声翻訳は行なわず、もっぱらサーバ106の音声翻訳サービスを利用するものとする。サーバ106は、端末ごと(又はユーザごと)の辞書を後述する方法により保守する。後述するように、音声翻訳を携帯型端末又はコンピュータでスタンドアロンで実行する場合もある。そうした場合には、以下に述べるサーバでの処理をそうした携帯型端末又はコンピュータで実現する必要があるが、その方法については、以下の実施の形態から当業者には容易に理解できるであろう。例えば、以下の実施の形態で単語登録の対象となっているユーザ辞書は、サーバではなく、ユーザ側の携帯型端末又はコンピュータに備えられていてもよい。
図2を参照して、音声翻訳サービスを利用するための携帯型端末104のアプリケーション画面130は、大きく分けて5つの領域に分割されている。すなわち、音声翻訳サービスの対象となっている言語の対(ソース言語とターゲット言語)を表示するための言語表示領域140、ソース言語の音声で入力された文の音声認識結果、又はテキスト入力結果を表示するための入力テキスト表示領域150、音声認識された文を自動翻訳した結果のテキストが表示される翻訳結果表示領域170、翻訳結果を元の言語に逆翻訳した文を表示する逆翻訳領域160、及び音声翻訳システムの利用状況を表示するステータス領域180である。
以下、この実施の形態において、ユーザ辞書に単語を登録する際の携帯型端末104の表示及びユーザの操作について説明する。ここでは、音声認識で誤認識された単語をユーザがタップする(すなわち、選択する)と、その単語を認識し直して修正候補のリストを生成し、その中から正しい認識結果(以下、正しい認識結果を「正解」と呼ぶ。)をユーザに選択させる。選択された修正候補の文字列をユーザ辞書に登録する。こうした処理を実行するために、携帯型端末104、サーバ106がどのような構成となっているかについては後述する。
誤認識された単語を修正し辞書に登録するための2つめの方法は、誤認識された単語の一部をドラッグすることである。図4(A)を参照して、図3(A)の場合と同様、「スカイライナー」という発話が携帯型端末104における音声認識で単語200(「スキャナー」)に誤認識された場合を例にとる。図4(B)を参照して、ユーザは、誤認識された単語の中の任意の位置でドラッグを開始し、矢印214で示されるように、その単語の中で、誤認識された部分を含むようにドラッグし、任意の位置212でドラッグを終了する。ドラッグされた位置に存在する文字列216は反転表示される。
図5を参照して、音声翻訳システム100を用いた音声翻訳の際の、携帯型端末104とサーバ106との間の典型的な通信シーケンスを説明する。最初に、携帯型端末104で音声入力220を行ない、その音声と、音声翻訳の言語の組合せ等の情報と、センサの集合から得られた情報とを含む音声翻訳リクエスト221をサーバ106に送信する。サーバ106は、この音声翻訳リクエスト221を受信すると音声翻訳処理222を行なう。音声翻訳処理222は、音声認識処理と、音声認識結果に対する自動翻訳処理と、自動翻訳の結果に対応する音声合成処理とを含む。音声認識結果は、音声認識の結果得られた形態素列を含む。各形態素には、元の音声データにおけるそれら形態素の発話の開始時刻及び終了時刻が付されている。音声翻訳処理222の結果223は携帯型端末104に送信される。携帯型端末104は、受信した音声認識及び自動翻訳の結果を表示し、合成音声を発声する処理224を実行する。もしも所望の結果が得られたなら、これで音声翻訳は終了である。
─携帯型端末104(図6)─
図6を参照して、携帯型端末104は、所定のプログラムを実行して携帯型端末104の各部を制御することにより、種々の機能を実現するためのプロセッサ250と、プロセッサ250が実行するプログラム、及びそのプログラムの実行に必要なデータを記憶し、プロセッサ250の作業領域としても機能するメモリ252と、プロセッサ250と後述する各種センサ等との間のインターフェイス254とを含む。以下に説明する構成要素は、いずれも、インターフェイス254を介してプロセッサ250と通信可能である。
上記実施の形態に係るサーバ106は、コンピュータハードウェアと、そのコンピュータハードウェア上で実行されるコンピュータプログラムとにより実現できる。図7はこのサーバ106を構成するコンピュータシステム330の外観を示し、図8はコンピュータシステム330の内部構成を示す。
─携帯型端末104(図9‐図12)─
携帯型端末104で実行される音声認識ソフトウェア(ソフト)の状態遷移を図9に示す。図9において、楕円は状態を示し、矩形は携帯型端末104が実行する処理を示す。同じく図9において、実線の矢印は何らかのイベントが発生したことに伴う状態遷移を表し、破線の矢印はイベントの発生ではなく携帯型端末104が実行する処理の終了に伴う状態遷移又は次の処理への移行を表す。図9を参照して、このソフトが起動されると、メモリ上に所定の領域を確保し初期化したりする処理と、アプリケーション画面130の初期画面を表示する処理とを実行してイベント待ち状態に移行する初期状態400になる。ここでマイクボタン182が押されたり、ユーザが携帯型端末104を耳に当てたりするイベント402が発生すると、音声入力状態404となる。
携帯型端末104の機能を実現する各種プログラムのうち、図9に示すような状態遷移を実現して音声翻訳サービスを利用するためのアプリケーションは、図10に示すような制御構造を持つ。図10には、本発明と特に関連しない機能(例えば図2に示す設定ボタン142が押されたときに実行される処理)等に関する部分は説明を理解しやすくするために図示していない。
サーバ106を構成するコンピュータのハードウェアにより実行されることにより、音声翻訳サービスの各機能を実現するためのプログラムは,以下のような制御構造を持つ。このプログラムは、コンピュータ340を、上記実施の形態に係る音声翻訳サーバの各機能部として機能させるための複数の命令を含む。この動作を行なわせるのに必要な基本的機能のいくつかはコンピュータ340上で動作するオペレーティングシステム(OS)若しくはサードパーティのプログラム、又は、コンピュータ340にインストールされる各種プログラミングツールキットのモジュール若しくはフレームワークにより提供される。したがって、このプログラムはこの実施の形態のシステム及び方法を実現するのに必要な命令を必ずしも全て含まなくてよい。このプログラムは、命令の内容にしたがい、所望の結果が得られるように制御されたやり方で適切な機能又はプログラミングツールキット内の適切なプログラムツールを呼出すことにより、上記したシステムとしての機能を実現する命令のみを含んでいればよい。このように、適宜必要な命令又は一連の命令の集合を必要に応じて適宜記憶装置から読出して実行する際のコンピュータシステム330の動作は周知である。したがってここではその詳細な説明は繰返さない。
─概要─
─音声翻訳─
携帯型端末104等には、図2に示すような音声翻訳アプリケーションを予め配布しておく。本実施の形態では、携帯型端末104が接続可能なサーバ106は、音声翻訳アプリケーションにより固定されているものとする。もちろん、サーバ106が複数個あるなら、ユーザがそれらの中から所望のものを選択するようにしてもよい。サーバ106の音声翻訳サービスを利用しようとする場合のユーザの操作、並びに携帯型端末104及びサーバ106の動作を説明する。これに先立ち、ユーザは、図2の設定ボタン142を操作することで設定画面を呼出し、自分が利用しようとするソース言語とターゲット言語との組合せを選択しておく必要がある。
すなわち、ユーザは、入力テキスト表示領域150(図2)に表示された入力テキスト158のうち、誤っている部分をタップするか、又は誤っている部分の一部をドラッグする。ここでは、最初に、タップされた場合の携帯型端末104の動作を説明し、次にドラッグされた場合の携帯型端末104の動作を説明する。
図13を参照して、この単語を受信したサーバ106は、処理562→処理600→処理602から処理608までという経路を経て、修正後の単語をユーザ辞書に登録し、修正後の単語と、元の音声データのうちで、修正された単語に対応する部分を学習データとして学習用データ蓄積装置380に蓄積する。サーバ106はさらに、修正後の単語を用いて音声認識結果を修正して翻訳し、その翻訳結果の合成音声を生成し、さらに翻訳結果の逆翻訳を生成して携帯型端末104に送信する。
〈概略〉
上記第1の実施の形態では、通常の音声認識装置372で誤認識した形態素について、超大語彙音声認識装置374で音声認識をし直すことにより、誤認識を修正し、さらに正しい音声認識結果をユーザ辞書に登録する。超大語彙音声認識装置374が用いる語彙は、音声認識装置372の持つ辞書の語彙よりはるかに大きく、修正時の音声認識で正しい単語が認識され、その単語が辞書に登録される可能性が高い。しかし、超大語彙音声認識装置374の辞書に登録されていない単語が発話内に存在する場合、超大語彙音声認識装置374での音声認識も失敗し、その単語を辞書に登録することもできないという問題がある。
図14を参照して、本実施の形態に係る音声翻訳システムの携帯型端末で、音声認識システムで誤認識された形態素は以下のように修正される。
図15を参照して、修正対象の形態素をドラッグにより指定する際の操作について説明する。図15(A)を参照して、ユーザが「京成臼井駅に参ります。」と発声したにもかかわらず、「臼井駅」が「線行き」として誤認識されたものとする。図15(A)の文字列660がこの誤認識箇所である。
─サーバ(図16)─
この第2の実施の形態に係る音声認識サービスを提供するサーバのハードウェアは、第1の実施の形態と同様である。ただし、図16に示すように、このサーバを構成するコンピュータシステム700は、第1の実施の形態のコンピュータシステム330の構成に加え、上記した未知語対応の音声認識機能を実現する未知語対応音声認識装置702を含む。未知語対応音声認識装置702は、入力される音声について、与えられる音声データについて、音素単位で音声認識を実行する。未知語対応音声認識装置702は、このようにして認識された音素列に対応する文字列(ここでは仮名文字列)を、その音素列の尤度とともに出力する機能を持つ。
携帯型端末104のハードウェア構成は第1の実施の形態の場合と同様である。ただし、図17に示すように、メモリ252には日本語の入力を行なうためのいわゆる日本語インプット・メソッド(IM)プログラムと、そのための仮名漢字変換辞書とが記憶されている。
─携帯型端末(図18及び図19)─
図18を参照して、この実施の形態に係る携帯型端末104により実行されるプログラムは、図10に示す第1の実施の形態で実行されるプログラムとほぼ同一だが、ユーザが修正文字候補のいずれかを選択したときに実行される処理486と処理488との間に、IMを用いてさらに修正文字列を決定する処理710が実行される点で図10に示されるものと異なっている。
図20を参照して、この第2の実施の形態に係るサーバが実行するプログラムも、図13に示す第1の実施の形態のサーバ106により実行されるプログラムと同様の構成を持つが、携帯型端末104から修正依頼を受信したときに実行される処理584の後、図13の処理586に代えて、未知語対応音声認識装置702を用いて修正対象となった音声データについて1文字ずつ音声認識を行なう処理730と、処理730により得られた文字列のうち、正しい文字列である可能性の高いものから所定個数(ここではM個とし、選択されたM個の候補をMベストと呼ぶ。)決定する処理732と、処理584で得られたNベストリスト及び処理732で得られたMベストリストからなるリスト(ここではこのリストを「(N+M)ベストリスト」と呼ぶ。)をクライアントに送信する処理734とを含む点で異なっている。
図21を参照して、この第2の実施の形態の音声翻訳システムでの携帯型端末104とサーバ106との間のデータの送受信のシーケンスは、図5に示す第1の実施の形態のものとほぼ同様である。ただし、処理228の超大語彙音声認識装置374による音声認識の後に、未知語対応音声認識装置702を用いた音声認識の処理740が行なわれ、両者の結果である(N+M)ベストリスト742がまとめて携帯型端末104に送信される点と、携帯型端末104で、図13に示す処理230に代えて、(N+M)ベストリスト742の中から単語を選択するユーザ入力を受け、それが超大語彙音声認識装置の出力であるか否かにしたがって、直ちにその単語を含む再翻訳リクエスト231をサーバ106に送信する処理と、IMによる単語確定処理744を行ない、確定後の単語を含む再翻訳リクエスト231をサーバ106に送信する処理とを選択的に実行する処理746が行なわれる点で第1の実施の形態の場合と異なっている。
上記実施の形態では、音声翻訳リクエストに応答して行なわれる音声認識では、基本辞書とユーザ辞書とが用いられ、ユーザ辞書に効率的に単語を登録するためのものであった。しかし、こうした例は基本辞書がユーザによって変更できないという制限があるときのものである。基本辞書にユーザが語彙を登録できるのであれば、基本辞書に単語を登録するために上記した実施の形態のような仕組みを採用できる。
106 サーバ、 130 アプリケーション画面、 158 入力テキスト
330, 700 コンピュータシステム、 372 音声認識装置
374 超大語彙音声認識装置、 702 未知語対応音声認識装置
Claims (4)
- 表示面を持つ表示装置、及び、当該表示面上の位置を指定するポインティングデバイスを用い、単語辞書に単語を登録する単語登録装置であって、
当該単語登録装置は、前記単語辞書を用いて音声認識を行なう第1の音声認識手段、及び、前記第1の音声認識手段と異なる第2の音声認識手段とともに用いられ、
前記第1の音声認識手段による音声認識の結果を前記第1の音声認識手段から受け、前記表示面上に文字列として表示するための音声認識結果の表示手段と、
前記表示手段により表示された文字列中で、修正すべき箇所を、前記ポインティングデバイスを用いたユーザの入力に応答して特定するための修正箇所の特定手段と、
前記第1の音声認識手段による音声認識の対象となった音声データのうち、前記特定手段により特定された箇所に基づいて定められる音声区間について、前記第2の音声認識手段に対し、音声認識によって修正文字列候補を生成することを依頼するための第1の修正依頼手段と、
前記第1の修正依頼手段による依頼に応答して前記第2の音声認識手段が出力する修正文字列候補を前記表示面に表示し、当該表示面上の位置をユーザが前記ポインティングデバイスで指定したことに応答して、当該指定された位置を含む領域に表示された文字列候補を選択するための修正文字列選択手段と、
前記修正文字列選択手段により選択された文字列候補及び対応する音標文字列を、前記単語辞書に登録するための処理を実行するための辞書登録処理手段とを含み、
前記第2の音声認識手段は、
前記第1の音声認識手段よりも大語彙の音声認識が可能な大語彙音声認識手段と、
与えられた音声データを音声認識し、前記単語辞書に登録されていない単語を音標文字列として認識し出力する音標文字出力手段とを含み、
前記辞書登録処理手段は、
前記選択された文字列候補が前記大語彙音声認識手段により出力された文字列であることに応答して、前記修正文字列選択手段により選択された文字列候補及び対応する音標文字列を、前記第1の音声認識手段のための単語辞書に登録するための処理を実行するための第1の追加手段と、
前記選択された文字列候補が前記音標文字出力手段の出力であることに応答して、ユーザ操作にしたがって当該文字列候補を表意文字を含む文字列に変換し出力するための文字列変換手段と、
前記文字列変換手段により出力された前記文字列及び対応する音標文字列を前記単語辞書に登録するための処理を実行するための第2の追加手段とを含む、単語登録装置。 - 前記第1の修正依頼手段は、前記第1の音声認識手段による音声認識の対象となった音声データのうち、前記特定手段により特定された箇所に基づいて対応する音声範囲を定め、当該音声範囲の前後のそれぞれN1個及びN2個(ただしN1及びN2はいずれも0以上の整数)の音声単位分だけ範囲を拡大した音声区間について、前記第2の音声認識手段に対し、音声認識によって修正文字列候補を生成することを依頼するための手段を含む、請求項1に記載の単語登録装置。
- 前記修正箇所の特定手段は、
前記音声認識結果により表示された文字列中で、前記表示面上でユーザにより指定された位置を含む領域に表示されている文字列、又は前記表示面上でユーザによりドラッグされた範囲を含む領域に表示されている文字列を修正すべき文字列として特定するための手段を含む、請求項1又は請求項2に記載の単語登録装置。 - 表示面を持つ表示装置、及び、前記表示面上の位置を指定するポインティングデバイスが接続されるコンピュータにより実行されると、当該コンピュータを、前記表示装置及び前記ポインティングデバイスを用いて、単語辞書に単語を登録する単語登録装置として動作させるためのコンピュータプログラムであって、
当該単語登録装置は、前記単語辞書を用いて音声認識を行なう第1の音声認識手段、及び、前記第1の音声認識手段と異なる第2の音声認識手段とともに用いられ、
当該コンピュータプログラムは、前記コンピュータを、
前記第1の音声認識手段による音声認識の結果を前記第1の音声認識手段から受け、前記表示面上に文字列として表示するための音声認識結果の表示手段と、
前記表示手段により表示された文字列中で、修正すべき箇所を前記ポインティングデバイスを用いたユーザの入力に応答して特定するための修正箇所の特定手段と、
前記第1の音声認識手段による音声認識の対象となった音声データのうち、前記特定手段により特定された箇所に基づいて定められる音声区間について、前記第2の音声認識手段に対し、音声認識によって修正文字列候補を生成することを依頼するための第1の修正依頼手段と、
前記第1の修正依頼手段による依頼に応答して前記第2の音声認識手段が出力する修正文字列候補を前記表示面上に表示し、当該表示面上の位置をユーザが前記ポインティングデバイスで指定したことに応答して、当該指定された位置を含む領域に表示された文字列候補を選択するための修正文字列選択手段と、
前記修正文字列選択手段により選択された文字列候補及び対応する音標文字列を、前記単語辞書に登録するための処理を実行するための辞書登録処理手段として機能させ、
前記第2の音声認識手段は、
前記第1の音声認識手段よりも大語彙の音声認識が可能な大語彙音声認識手段と、
与えられた音声データを音声認識し、前記単語辞書に登録されていない単語を音標文字列として認識し出力する音標文字出力手段とを含み、
前記辞書登録処理手段は、
前記選択された文字列候補が前記大語彙音声認識手段により出力された文字列であることに応答して、前記修正文字列選択手段により選択された文字列候補及び対応する音標文字列を、前記第1の音声認識手段のための単語辞書に登録するための処理を実行するための第1の追加手段と、
前記選択された文字列候補が前記音標文字出力手段の出力であることに応答して、ユーザ操作にしたがって当該文字列候補を表意文字を含む文字列に変換し出力するための文字列変換手段と、
前記文字列変換手段により出力された前記文字列及び対応する音標文字列を前記単語辞書に登録するための処理を実行するための第2の追加手段とを含む、コンピュータプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012191971A JP6150268B2 (ja) | 2012-08-31 | 2012-08-31 | 単語登録装置及びそのためのコンピュータプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012191971A JP6150268B2 (ja) | 2012-08-31 | 2012-08-31 | 単語登録装置及びそのためのコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014048506A JP2014048506A (ja) | 2014-03-17 |
JP6150268B2 true JP6150268B2 (ja) | 2017-06-21 |
Family
ID=50608233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012191971A Active JP6150268B2 (ja) | 2012-08-31 | 2012-08-31 | 単語登録装置及びそのためのコンピュータプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6150268B2 (ja) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6334354B2 (ja) * | 2014-09-30 | 2018-05-30 | 株式会社東芝 | 機械翻訳装置、方法およびプログラム |
JP6767102B2 (ja) * | 2015-10-14 | 2020-10-14 | 凸版印刷株式会社 | 情報処理装置、および、情報処理プログラム |
US10152965B2 (en) * | 2016-02-03 | 2018-12-11 | Google Llc | Learning personalized entity pronunciations |
US10896293B2 (en) * | 2016-07-26 | 2021-01-19 | Sony Corporation | Information processing apparatus and information processing method |
JP6526608B2 (ja) * | 2016-09-06 | 2019-06-05 | 株式会社東芝 | 辞書更新装置およびプログラム |
JP6703925B2 (ja) * | 2016-10-07 | 2020-06-03 | 富士通エフ・アイ・ピー株式会社 | 見積装置、プログラム |
US11694675B2 (en) | 2018-02-20 | 2023-07-04 | Sony Corporation | Information processing apparatus, information processing system, and information processing method |
JP6601826B1 (ja) * | 2018-08-22 | 2019-11-06 | Zホールディングス株式会社 | 分割プログラム、分割装置、及び分割方法 |
JP6601827B1 (ja) * | 2018-08-22 | 2019-11-06 | Zホールディングス株式会社 | 結合プログラム、結合装置、及び結合方法 |
JP6807586B1 (ja) * | 2020-01-30 | 2021-01-06 | ベルフェイス株式会社 | 情報処理装置、情報処理方法及びプログラム |
WO2024111387A1 (ja) * | 2022-11-24 | 2024-05-30 | 日本電気株式会社 | 処理装置、処理方法、及び記録媒体 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000056795A (ja) * | 1998-08-03 | 2000-02-25 | Fuji Xerox Co Ltd | 音声認識装置 |
JP2007033901A (ja) * | 2005-07-27 | 2007-02-08 | Nec Corp | 音声認識システム、音声認識方法、および音声認識用プログラム |
WO2007097390A1 (ja) * | 2006-02-23 | 2007-08-30 | Nec Corporation | 音声認識システム、音声認識結果出力方法、及び音声認識結果出力プログラム |
JP5046589B2 (ja) * | 2006-09-05 | 2012-10-10 | 日本電気通信システム株式会社 | 電話システムと通話補助方法とプログラム |
DE112007002665B4 (de) * | 2006-12-15 | 2017-12-28 | Mitsubishi Electric Corp. | Spracherkennungssystem |
JP4709887B2 (ja) * | 2008-04-22 | 2011-06-29 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果訂正装置および音声認識結果訂正方法、ならびに音声認識結果訂正システム |
JP5238395B2 (ja) * | 2008-07-31 | 2013-07-17 | 株式会社エヌ・ティ・ティ・ドコモ | 言語モデル作成装置および言語モデル作成方法 |
JP4845955B2 (ja) * | 2008-12-11 | 2011-12-28 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識結果訂正装置および音声認識結果訂正方法 |
JP5231484B2 (ja) * | 2010-05-19 | 2013-07-10 | ヤフー株式会社 | 音声認識装置、音声認識方法、プログラム、及びプログラムを配信する情報処理装置 |
-
2012
- 2012-08-31 JP JP2012191971A patent/JP6150268B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2014048506A (ja) | 2014-03-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6150268B2 (ja) | 単語登録装置及びそのためのコンピュータプログラム | |
US11972227B2 (en) | Lexicon development via shared translation database | |
US10817673B2 (en) | Translating languages | |
US11450313B2 (en) | Determining phonetic relationships | |
JP7111682B2 (ja) | 非表音文字体系を使用する言語のための音声支援型アプリケーションプロトタイプの試験中の音声コマンドマッチング | |
JP4559946B2 (ja) | 入力装置、入力方法および入力プログラム | |
JP4481972B2 (ja) | 音声翻訳装置、音声翻訳方法及び音声翻訳プログラム | |
TWI266280B (en) | Multimodal disambiguation of speech recognition | |
US8972268B2 (en) | Enhanced speech-to-speech translation system and methods for adding a new word | |
EP2849178A2 (en) | Enhanced speech-to-speech translation system and method | |
JP2008210132A (ja) | 原言語による音声を目的言語に翻訳する装置、方法およびプログラム | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
JP5396530B2 (ja) | 音声認識装置および音声認識方法 | |
JP5160594B2 (ja) | 音声認識装置および音声認識方法 | |
EP3241123B1 (en) | Voice recognition-based dialing | |
JP2004334207A (ja) | 日本語および中国語音声認識システムのトレーニングのための動的な発音の補助 | |
JP6334589B2 (ja) | 定型フレーズ作成装置及びプログラム、並びに、会話支援装置及びプログラム | |
JP6340839B2 (ja) | 音声合成装置、合成音声編集方法及び合成音声編集用コンピュータプログラム | |
JP4208819B2 (ja) | 音声合成辞書登録方法および装置 | |
JP2020118872A (ja) | 情報入力システム及び方法 | |
JP2008102422A (ja) | 言語処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160920 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20161107 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170425 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170517 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6150268 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |