JPWO2007097176A1 - 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム - Google Patents
音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム Download PDFInfo
- Publication number
- JPWO2007097176A1 JPWO2007097176A1 JP2008501662A JP2008501662A JPWO2007097176A1 JP WO2007097176 A1 JPWO2007097176 A1 JP WO2007097176A1 JP 2008501662 A JP2008501662 A JP 2008501662A JP 2008501662 A JP2008501662 A JP 2008501662A JP WO2007097176 A1 JPWO2007097176 A1 JP WO2007097176A1
- Authority
- JP
- Japan
- Prior art keywords
- speech recognition
- text data
- dictionary
- language model
- creation support
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 29
- 230000008569 process Effects 0.000 claims description 11
- 230000000877 morphologic effect Effects 0.000 claims description 10
- 239000013598 vector Substances 0.000 claims description 7
- 239000000284 extract Substances 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 description 23
- 238000010586 diagram Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 238000009826 distribution Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000945 filler Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
- G10L15/065—Adaptation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Machine Translation (AREA)
Abstract
Description
62 音素/状態列変換部
63 状態/特徴列変換部
64 最適単語列サーチ部
65 テキストデータ比較部
71 入力装置
72 音声認識辞書作成支援プログラム
73 データ処理装置
74 記憶装置
101 テキスト解析部
102 仮想的音声認識処理部
103 更新処理部
104、741 背景辞書記憶部
105、742 認識辞書記憶部
106、743 言語モデル記憶部
107、744 音響モデル記憶部
108 テキストデータ
201 テキスト解析手段
202 出現頻度計数手段
203 更新手段
204 背景辞書記憶手段
205 認識辞書記憶手段
206 言語モデル記憶手段
301 文字列比較手段
302 未知語抽出手段
303 更新手段
305 認識辞書記憶手段
306 言語モデル記憶手段
Claims (10)
- 辞書、言語モデル及び音響モデルを記憶する記憶部と、
テキストデータについて形態素解析処理を施すテキスト解析部と、
前記テキスト解析部により解析された解析済みテキストデータについて前記辞書、言語モデル及び音響モデルを用いて仮想的音声認識結果テキストデータを生成するとともに、前記解析済みテキストデータと前記仮想的音声認識結果テキストデータとの相違箇所を抽出する仮想的音声認識処理部と、
前記相違箇所に基づいて、前記辞書又は前記言語モデルの少なくとも一方を修正する更新処理部と、
を備えたことを特徴とする音声認識辞書作成支援システム。 - 前記仮想的音声認識処理部は、前記解析済みテキストデータから音響パラメータを要素とする特徴ベクトルの系列を生成し、仮想的に音声認識処理を実行することにより音声認識結果テキストデータを生成すること、
を特徴とする請求項1に記載の音声認識辞書作成支援システム。 - 前記記憶部は、認識単位を構成する状態等要素間の距離又は類似度テーブルを記憶し、
前記仮想的音声認識処理部は、前記解析済みテキストデータから前記認識単位の系列を生成し、前記辞書及び言語モデルから、距離の総和最小又は類似度の総和最大となる単語列を探索することにより前記仮想的音声認識結果テキストデータを生成すること、
を特徴とする請求項1又は2に記載の音声認識辞書作成支援システム。 - 前記記憶部は、認識単位を構成する状態等要素間の距離又は類似度テーブルを記憶し、
前記仮想的音声認識処理部は、前記解析済みテキストデータから前記要素の系列を生成し、前記辞書及び言語モデルから、距離の総和最小又は類似度の総和最大となる単語列を探索することにより前記仮想的音声認識結果テキストデータを生成すること、
を特徴とする請求項1又は2に記載の音声認識辞書作成支援システム。 - 前記更新処理部は、前記解析済みテキストデータ及び前記仮想的音声認識結果テキストデータの相違箇所に基づき、前記辞書に、前記解析済みテキストデータ側に出現している語句を追加すること、
を特徴とする請求項1乃至4いずれか一に記載の音声認識辞書作成支援システム。 - 前記更新処理部は、前記解析済みテキストデータ及び前記仮想的音声認識結果テキストデータの相違箇所に基づき、前記解析済みテキストデータ側に出現している単語又は単語列の優先度が高くなるように、前記言語モデルを修正すること、
を特徴とする請求項1乃至4いずれか一に記載の音声認識辞書作成支援システム。 - 前記更新処理部は、前記解析済みテキストデータ及び前記仮想的音声認識結果テキストデータの相違箇所に基づき、前記仮想的音声認識結果テキストデータ側に出現している単語又は単語列の優先度が低くなるように、前記言語モデルを修正すること、
を特徴とする請求項1乃至4いずれか一に記載の音声認識辞書作成支援システム。 - 前記更新処理部は、前記解析済みテキストデータ及び仮想的音声認識結果テキストデータにおける単語又は単語列の出現頻度に応じて前記優先度の増減量を制御すること、
を特徴とする請求項6又は7に記載の音声認識辞書作成支援システム。 - コンピュータを用いた音声認識辞書作成支援方法であって、
前記コンピュータが、テキストデータについて形態素解析処理を施すテキスト解析ステップと、
前記コンピュータが、前記テキスト解析ステップにて出力された解析済みテキストデータに基づいて、所定の記憶装置に保持された辞書、言語モデル及び音響モデルを用いて仮想的音声認識結果テキストデータを生成するステップと、
前記コンピュータが、前記解析済みテキストデータと、前記仮想的音声認識結果テキストデータと、を比較し相違箇所を抽出するステップと、
前記コンピュータが、前記相違箇所に基づいて前記辞書又は前記言語モデルの少なくとも一方を修正する更新ステップと、を含むこと、
を特徴とする音声認識辞書作成支援方法。 - テキストデータについて形態素解析処理を施すテキスト解析処理と、
前記テキスト解析処理にて出力された解析済みテキストデータに基づいて、所定の記憶装置に保持された辞書、言語モデル及び音響モデルを用いて仮想的音声認識結果テキストデータを生成する処理と、
前記解析済みテキストデータと、前記仮想的音声認識結果テキストデータと、を比較し相違箇所を抽出する仮想的音声認識処理と、
前記相違箇所に基づいて、前記辞書又は前記言語モデルの少なくとも一方を修正する更新処理と、を音声認識辞書作成支援システムを構成するコンピュータに実行させるためのプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008501662A JP5040909B2 (ja) | 2006-02-23 | 2007-02-02 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006046812 | 2006-02-23 | ||
JP2006046812 | 2006-02-23 | ||
JP2008501662A JP5040909B2 (ja) | 2006-02-23 | 2007-02-02 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
PCT/JP2007/051778 WO2007097176A1 (ja) | 2006-02-23 | 2007-02-02 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2007097176A1 true JPWO2007097176A1 (ja) | 2009-07-09 |
JP5040909B2 JP5040909B2 (ja) | 2012-10-03 |
Family
ID=38437215
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008501662A Active JP5040909B2 (ja) | 2006-02-23 | 2007-02-02 | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム |
Country Status (4)
Country | Link |
---|---|
US (1) | US8719021B2 (ja) |
JP (1) | JP5040909B2 (ja) |
CN (1) | CN101432801B (ja) |
WO (1) | WO2007097176A1 (ja) |
Families Citing this family (55)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4897737B2 (ja) * | 2008-05-12 | 2012-03-14 | 日本電信電話株式会社 | 単語追加装置、単語追加方法、そのプログラム |
US8301446B2 (en) * | 2009-03-30 | 2012-10-30 | Adacel Systems, Inc. | System and method for training an acoustic model with reduced feature space variation |
JP5471106B2 (ja) * | 2009-07-16 | 2014-04-16 | 独立行政法人情報通信研究機構 | 音声翻訳システム、辞書サーバ装置、およびプログラム |
US9045098B2 (en) * | 2009-12-01 | 2015-06-02 | Honda Motor Co., Ltd. | Vocabulary dictionary recompile for in-vehicle audio system |
JP5796496B2 (ja) * | 2010-01-29 | 2015-10-21 | 日本電気株式会社 | 入力支援システム、方法、およびプログラム |
EP2586193A4 (en) * | 2010-06-28 | 2014-03-26 | Nokia Corp | METHOD AND APPARATUS FOR ACCESSING MULTIMEDIA CONTENT HAVING SUBTITLE DATA |
US8484024B2 (en) * | 2011-02-24 | 2013-07-09 | Nuance Communications, Inc. | Phonetic features for speech recognition |
US11062615B1 (en) | 2011-03-01 | 2021-07-13 | Intelligibility Training LLC | Methods and systems for remote language learning in a pandemic-aware world |
US10019995B1 (en) | 2011-03-01 | 2018-07-10 | Alice J. Stiebel | Methods and systems for language learning based on a series of pitch patterns |
US8676580B2 (en) * | 2011-08-16 | 2014-03-18 | International Business Machines Corporation | Automatic speech and concept recognition |
US9824479B2 (en) * | 2011-12-08 | 2017-11-21 | Timur N. Bekmambetov | Method of animating messages |
CN103165129B (zh) * | 2011-12-13 | 2015-07-01 | 北京百度网讯科技有限公司 | 一种优化语音识别声学模型的方法及系统 |
JP5787780B2 (ja) * | 2012-01-25 | 2015-09-30 | 株式会社東芝 | 書き起こし支援システムおよび書き起こし支援方法 |
JP6019604B2 (ja) * | 2012-02-14 | 2016-11-02 | 日本電気株式会社 | 音声認識装置、音声認識方法、及びプログラム |
US9489940B2 (en) * | 2012-06-11 | 2016-11-08 | Nvoq Incorporated | Apparatus and methods to update a language model in a speech recognition system |
CN103680498A (zh) * | 2012-09-26 | 2014-03-26 | 华为技术有限公司 | 一种语音识别方法和设备 |
US9035884B2 (en) | 2012-10-17 | 2015-05-19 | Nuance Communications, Inc. | Subscription updates in multiple device language models |
US20140316783A1 (en) * | 2013-04-19 | 2014-10-23 | Eitan Asher Medina | Vocal keyword training from text |
US20180317019A1 (en) | 2013-05-23 | 2018-11-01 | Knowles Electronics, Llc | Acoustic activity detecting microphone |
TWI508057B (zh) * | 2013-07-15 | 2015-11-11 | Chunghwa Picture Tubes Ltd | 語音辨識系統以及方法 |
US20160004502A1 (en) * | 2013-07-16 | 2016-01-07 | Cloudcar, Inc. | System and method for correcting speech input |
JP2015060095A (ja) * | 2013-09-19 | 2015-03-30 | 株式会社東芝 | 音声翻訳装置、音声翻訳方法およびプログラム |
US9508345B1 (en) | 2013-09-24 | 2016-11-29 | Knowles Electronics, Llc | Continuous voice sensing |
CN103578465B (zh) * | 2013-10-18 | 2016-08-17 | 威盛电子股份有限公司 | 语音辨识方法及电子装置 |
US9953634B1 (en) | 2013-12-17 | 2018-04-24 | Knowles Electronics, Llc | Passive training for automatic speech recognition |
CN103903615B (zh) * | 2014-03-10 | 2018-11-09 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US9437188B1 (en) | 2014-03-28 | 2016-09-06 | Knowles Electronics, Llc | Buffered reprocessing for multi-microphone automatic speech recognition assist |
CN107112012B (zh) | 2015-01-07 | 2020-11-20 | 美商楼氏电子有限公司 | 用于音频处理的方法和系统及计算机可读存储介质 |
JP6516585B2 (ja) * | 2015-06-24 | 2019-05-22 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America | 制御装置、その方法及びプログラム |
US10152298B1 (en) * | 2015-06-29 | 2018-12-11 | Amazon Technologies, Inc. | Confidence estimation based on frequency |
CN106935239A (zh) * | 2015-12-29 | 2017-07-07 | 阿里巴巴集团控股有限公司 | 一种发音词典的构建方法及装置 |
JP6495850B2 (ja) * | 2016-03-14 | 2019-04-03 | 株式会社東芝 | 情報処理装置、情報処理方法、プログラムおよび認識システム |
JP6545633B2 (ja) * | 2016-03-17 | 2019-07-17 | 株式会社東芝 | 単語スコア計算装置、単語スコア計算方法及びプログラム |
CN105845139B (zh) * | 2016-05-20 | 2020-06-16 | 北方民族大学 | 一种离线语音控制方法和装置 |
CN106297797B (zh) * | 2016-07-26 | 2019-05-31 | 百度在线网络技术(北京)有限公司 | 语音识别结果纠错方法和装置 |
CN106710587A (zh) * | 2016-12-20 | 2017-05-24 | 广东东田数码科技有限公司 | 一种语音识别数据预处理方法 |
CN107015969A (zh) * | 2017-05-19 | 2017-08-04 | 四川长虹电器股份有限公司 | 可自我更新的语义理解系统与方法 |
KR102353486B1 (ko) * | 2017-07-18 | 2022-01-20 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
JP6790003B2 (ja) * | 2018-02-05 | 2020-11-25 | 株式会社東芝 | 編集支援装置、編集支援方法及びプログラム |
US10846319B2 (en) * | 2018-03-19 | 2020-11-24 | Adobe Inc. | Online dictionary extension of word vectors |
CN108831473B (zh) * | 2018-03-30 | 2021-08-17 | 联想(北京)有限公司 | 一种音频处理方法及装置 |
JP6910987B2 (ja) * | 2018-06-07 | 2021-07-28 | 株式会社東芝 | 認識装置、認識システム、端末装置、サーバ装置、方法及びプログラム |
CN110781270B (zh) * | 2018-07-13 | 2024-10-29 | 北京搜狗科技发展有限公司 | 一种解码网络中非关键词模型的构建方法和装置 |
KR20210052564A (ko) * | 2018-11-05 | 2021-05-10 | 주식회사 엘솔루 | 빅 데이터를 이용한 최적의 언어 모델 생성 방법 및 이를 위한 장치 |
KR20200063521A (ko) * | 2018-11-28 | 2020-06-05 | 삼성전자주식회사 | 전자 장치 및 이의 제어 방법 |
CN110032626B (zh) * | 2019-04-19 | 2022-04-12 | 百度在线网络技术(北京)有限公司 | 语音播报方法和装置 |
WO2020241039A1 (ja) * | 2019-05-30 | 2020-12-03 | ソニー株式会社 | 情報処理装置、および情報処理方法、並びにプログラム |
CN110718226B (zh) * | 2019-09-19 | 2023-05-05 | 厦门快商通科技股份有限公司 | 语音识别结果处理方法、装置、电子设备及介质 |
CN111475611B (zh) * | 2020-03-02 | 2023-09-15 | 北京声智科技有限公司 | 词典管理方法、装置、计算机设备及存储介质 |
CN112037770B (zh) * | 2020-08-03 | 2023-12-29 | 北京捷通华声科技股份有限公司 | 发音词典的生成方法、单词语音识别的方法和装置 |
US11829720B2 (en) * | 2020-09-01 | 2023-11-28 | Apple Inc. | Analysis and validation of language models |
JP7479249B2 (ja) * | 2020-09-02 | 2024-05-08 | 株式会社日立ソリューションズ・テクノロジー | 未知語検出方法及び未知語検出装置 |
JP2022074509A (ja) | 2020-11-04 | 2022-05-18 | 株式会社東芝 | 差分抽出装置、方法及びプログラム |
JP7481999B2 (ja) * | 2020-11-05 | 2024-05-13 | 株式会社東芝 | 辞書編集装置、辞書編集方法及び辞書編集プログラム |
JP2023125311A (ja) * | 2022-02-28 | 2023-09-07 | 国立研究開発法人情報通信研究機構 | 言語モデル学習装置、対話装置及び学習済言語モデル |
Family Cites Families (28)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5855000A (en) * | 1995-09-08 | 1998-12-29 | Carnegie Mellon University | Method and apparatus for correcting and repairing machine-transcribed input using independent or cross-modal secondary input |
US5864805A (en) * | 1996-12-20 | 1999-01-26 | International Business Machines Corporation | Method and apparatus for error correction in a continuous dictation system |
US5933804A (en) * | 1997-04-10 | 1999-08-03 | Microsoft Corporation | Extensible speech recognition system that provides a user with audio feedback |
KR100277694B1 (ko) * | 1998-11-11 | 2001-01-15 | 정선종 | 음성인식시스템에서의 발음사전 자동생성 방법 |
US6434521B1 (en) * | 1999-06-24 | 2002-08-13 | Speechworks International, Inc. | Automatically determining words for updating in a pronunciation dictionary in a speech recognition system |
US6622121B1 (en) * | 1999-08-20 | 2003-09-16 | International Business Machines Corporation | Testing speech recognition systems using test data generated by text-to-speech conversion |
JP3976959B2 (ja) | 1999-09-24 | 2007-09-19 | 三菱電機株式会社 | 音声認識装置、音声認識方法および音声認識プログラム記録媒体 |
JP2002014693A (ja) | 2000-06-30 | 2002-01-18 | Mitsubishi Electric Corp | 音声認識システム用辞書提供方法、および音声認識インタフェース |
US6856956B2 (en) * | 2000-07-20 | 2005-02-15 | Microsoft Corporation | Method and apparatus for generating and displaying N-best alternatives in a speech recognition system |
JP2002091477A (ja) | 2000-09-14 | 2002-03-27 | Mitsubishi Electric Corp | 音声認識システム、音声認識装置、音響モデル管理サーバ、言語モデル管理サーバ、音声認識方法及び音声認識プログラムを記録したコンピュータ読み取り可能な記録媒体 |
US6975985B2 (en) * | 2000-11-29 | 2005-12-13 | International Business Machines Corporation | Method and system for the automatic amendment of speech recognition vocabularies |
JP4089861B2 (ja) | 2001-01-31 | 2008-05-28 | 三菱電機株式会社 | 音声認識文章入力装置 |
JP2003108180A (ja) | 2001-09-26 | 2003-04-11 | Seiko Epson Corp | 音声合成方法および音声合成装置 |
JP2003186494A (ja) * | 2001-12-17 | 2003-07-04 | Sony Corp | 音声認識装置および方法、記録媒体、並びにプログラム |
JP2003316376A (ja) | 2002-04-22 | 2003-11-07 | Toshiba Corp | 未知語登録装置および未知語登録方法 |
JP4217495B2 (ja) * | 2003-01-29 | 2009-02-04 | キヤノン株式会社 | 音声認識辞書作成方法、音声認識辞書作成装置及びプログラム、記録媒体 |
US7437296B2 (en) * | 2003-03-13 | 2008-10-14 | Matsushita Electric Industrial Co., Ltd. | Speech recognition dictionary creation apparatus and information search apparatus |
JP2004294542A (ja) | 2003-03-25 | 2004-10-21 | Mitsubishi Electric Corp | 音声認識装置及びそのプログラム |
US20040243412A1 (en) * | 2003-05-29 | 2004-12-02 | Gupta Sunil K. | Adaptation of speech models in speech recognition |
JP4515186B2 (ja) | 2003-09-02 | 2010-07-28 | 株式会社ジー・エフグループ | 音声辞書作成装置、音声辞書作成方法、及びプログラム |
US7266495B1 (en) * | 2003-09-12 | 2007-09-04 | Nuance Communications, Inc. | Method and system for learning linguistically valid word pronunciations from acoustic data |
US7783474B2 (en) * | 2004-02-27 | 2010-08-24 | Nuance Communications, Inc. | System and method for generating a phrase pronunciation |
US7392186B2 (en) * | 2004-03-30 | 2008-06-24 | Sony Corporation | System and method for effectively implementing an optimized language model for speech recognition |
JP2004265440A (ja) | 2004-04-28 | 2004-09-24 | A I Soft Inc | 未知語登録装置および方法並びに記録媒体 |
CN100524457C (zh) * | 2004-05-31 | 2009-08-05 | 国际商业机器公司 | 文本至语音转换以及调整语料库的装置和方法 |
US7684988B2 (en) * | 2004-10-15 | 2010-03-23 | Microsoft Corporation | Testing and tuning of automatic speech recognition systems using synthetic inputs generated from its acoustic models |
US7590536B2 (en) * | 2005-10-07 | 2009-09-15 | Nuance Communications, Inc. | Voice language model adjustment based on user affinity |
US7756708B2 (en) * | 2006-04-03 | 2010-07-13 | Google Inc. | Automatic language model update |
-
2007
- 2007-02-02 US US12/280,594 patent/US8719021B2/en active Active
- 2007-02-02 CN CN200780006299XA patent/CN101432801B/zh active Active
- 2007-02-02 JP JP2008501662A patent/JP5040909B2/ja active Active
- 2007-02-02 WO PCT/JP2007/051778 patent/WO2007097176A1/ja active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2007097176A1 (ja) | 2007-08-30 |
JP5040909B2 (ja) | 2012-10-03 |
CN101432801B (zh) | 2012-04-18 |
US8719021B2 (en) | 2014-05-06 |
CN101432801A (zh) | 2009-05-13 |
US20090024392A1 (en) | 2009-01-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5040909B2 (ja) | 音声認識辞書作成支援システム、音声認識辞書作成支援方法及び音声認識辞書作成支援用プログラム | |
US7299178B2 (en) | Continuous speech recognition method and system using inter-word phonetic information | |
US6934683B2 (en) | Disambiguation language model | |
US7937262B2 (en) | Method, apparatus, and computer program product for machine translation | |
US6910012B2 (en) | Method and system for speech recognition using phonetically similar word alternatives | |
Karpov et al. | Large vocabulary Russian speech recognition using syntactico-statistical language modeling | |
Wang et al. | Complete recognition of continuous Mandarin speech for Chinese language with very large vocabulary using limited training data | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
JP2008209717A (ja) | 入力された音声を処理する装置、方法およびプログラム | |
Menacer et al. | An enhanced automatic speech recognition system for Arabic | |
JP2008243080A (ja) | 音声を翻訳する装置、方法およびプログラム | |
Al-Anzi et al. | The impact of phonological rules on Arabic speech recognition | |
Illina et al. | Grapheme-to-phoneme conversion using conditional random fields | |
KR101747873B1 (ko) | 음성인식을 위한 언어모델 생성 장치 및 방법 | |
Lin et al. | Hierarchical prosody modeling for Mandarin spontaneous speech | |
Pellegrini et al. | Automatic word decompounding for asr in a morphologically rich language: Application to amharic | |
JP4595415B2 (ja) | 音声検索システムおよび方法ならびにプログラム | |
AbuZeina et al. | Cross-word modeling for Arabic speech recognition | |
JP2011007862A (ja) | 音声認識装置、音声認識プログラム、および音声認識方法 | |
Gauvain et al. | Speech-to-text conversion in French | |
JP2000259176A (ja) | 音声認識装置およびその記録媒体 | |
JP2012255867A (ja) | 音声認識装置 | |
KR100511247B1 (ko) | 음성 인식 시스템의 언어 모델링 방법 | |
JP4733436B2 (ja) | 単語・意味表現組データベースの作成方法、音声理解方法、単語・意味表現組データベース作成装置、音声理解装置、プログラムおよび記憶媒体 | |
WO2014035437A1 (en) | Using character describer to efficiently input ambiguous characters for smart chinese speech dictation correction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A524 | Written submission of copy of amendment under article 19 pct |
Free format text: JAPANESE INTERMEDIATE CODE: A527 Effective date: 20080731 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20100119 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120321 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120521 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120612 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120625 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5040909 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150720 Year of fee payment: 3 |