JP6804909B2 - 音声認識装置、音声認識方法及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法及び音声認識プログラム Download PDFInfo
- Publication number
- JP6804909B2 JP6804909B2 JP2016180447A JP2016180447A JP6804909B2 JP 6804909 B2 JP6804909 B2 JP 6804909B2 JP 2016180447 A JP2016180447 A JP 2016180447A JP 2016180447 A JP2016180447 A JP 2016180447A JP 6804909 B2 JP6804909 B2 JP 6804909B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- utterance
- probability
- time
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 31
- 230000006870 function Effects 0.000 claims description 21
- 238000012937 correction Methods 0.000 claims description 18
- 238000012545 processing Methods 0.000 description 16
- 238000001514 detection method Methods 0.000 description 12
- 230000005236 sound signal Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 101100000858 Caenorhabditis elegans act-3 gene Proteins 0.000 description 5
- HEFNNWSXXWATRW-UHFFFAOYSA-N Ibuprofen Chemical compound CC(C)CC1=CC=C(C(C)C(O)=O)C=C1 HEFNNWSXXWATRW-UHFFFAOYSA-N 0.000 description 5
- 235000013372 meat Nutrition 0.000 description 5
- 230000007704 transition Effects 0.000 description 5
- 244000236655 Diospyros kaki Species 0.000 description 4
- 102100031102 C-C motif chemokine 4 Human genes 0.000 description 3
- 101100054773 Caenorhabditis elegans act-2 gene Proteins 0.000 description 3
- 101100161935 Caenorhabditis elegans act-4 gene Proteins 0.000 description 3
- 206010011469 Crying Diseases 0.000 description 3
- 235000011511 Diospyros Nutrition 0.000 description 3
- 230000010365 information processing Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 101100217138 Mus musculus Actr10 gene Proteins 0.000 description 2
- 240000000220 Panda oleosa Species 0.000 description 2
- 235000016496 Panda oleosa Nutrition 0.000 description 2
- 230000003139 buffering effect Effects 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- OWNRRUFOJXFKCU-UHFFFAOYSA-N Bromadiolone Chemical compound C=1C=C(C=2C=CC(Br)=CC=2)C=CC=1C(O)CC(C=1C(OC2=CC=CC=C2C=1O)=O)C1=CC=CC=C1 OWNRRUFOJXFKCU-UHFFFAOYSA-N 0.000 description 1
- 235000008597 Diospyros kaki Nutrition 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/06—Decision making techniques; Pattern matching strategies
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/04—Segmentation; Word boundary detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
- G10L15/19—Grammatical context, e.g. disambiguation of the recognition hypotheses based on word sequence rules
- G10L15/197—Probabilistic grammars, e.g. word n-grams
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Probability & Statistics with Applications (AREA)
- Business, Economics & Management (AREA)
- Game Theory and Decision Science (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
- Electrically Operated Instructional Devices (AREA)
Description
プロセッサ11は、上記コンピュータの中枢部分に相当する。プロセッサ11は、オペレーティングシステムやアプリケーションプログラムに従って、音声認識装置10としての機能を実現するべく各部を制御する。
時計部14は、音声認識装置10の時刻情報源として機能する。プロセッサ11は、時計部14によって計時される時刻情報を基に、現在の日付及び時刻を計時する。なお、時計部14は、音声認識装置10が搭載された電子機器に備えられているものを兼用してもよい。
以上で、音声認識プログラムに基づくプロセッサ11の処理は終了する。
また音声認識装置10のプロセッサ11は、ユーザが発話ボタン30を押下してから発声を開始するまでの時間が所定の閾値時間Tよりも短いときに修正を行い、閾値時間T以上のときには修正を行わない。したがって、ユーザが発話ボタン30を押下してから直ぐに発声したときだけ修正処理を行えばよいので、この点からもプロセッサ11の処理負荷が大幅に増加するようなことはない。
前記実施形態では、プロセッサ11が、図4のAct2にて検知時刻Pを記憶し、Act4にて音声開始時刻Dを記憶した。他の実施形態では、Act1にて発話ボタン30が押下されたことを検知したならば、プロセッサ11がタイマをスタートさせ、Act3にて音データの入力を検知したならば、プロセッサ11がタイマをストップさせる。そしてAct9では、プロセッサ11がタイマの計時時間と閾値時間Tとを比較して、修正処理を行うか否かを判定する。このような構成であっても、前記実施形態と同様な作用効果を奏することができる。
以下、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[1]音声入力手段を介して入力された音声信号を記録する記録部と、音声入力の開始指示を受け付ける受付手段と、前記受付手段により前記開始指示を受け付けた後に前記記録部に記録された音声信号から音声発話を認識する認識手段と、前記受付手段により前記開始指示を受け付けてから前記音声入力手段を介して音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定する判定手段と、前記判定手段により修正すると判定された音声発話を修正する修正手段と、を具備する音声認識装置。
[2]前記判定手段は、前記時間が所定の閾値時間よりも短いとき修正すると判定する、付記[1]記載の音声認識装置。
[3]前記受付手段により前記開始指示を受け付けた第1時刻を取得する第1時刻取得手段と、前記音声入力手段を介して音声信号の入力が開始された第2時刻を取得する第2時刻取得手段と、をさらに具備し、前記判定手段は、前記第1時刻から前記第2時刻までの経過時間が前記閾値時間よりも短いとき修正すると判定する、付記[2]記載の音声認識装置。
[4]前記修正手段は、前記認識手段で認識した音声発話の先頭の単語を、前記音声発話の2番目以降の単語と繋がりのある他の単語に置き換えて修正する、付記[1]乃至[3]のうちいずれか1項記載の音声認識装置。
[5]音声入力の開始指示を受け付け、前記開始指示を受け付けた後に音声入力手段を介して入力された音声信号から音声発話を認識し、前記開始指示を受け付けてから前記音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定し、修正する場合、前記認識された音声発話を修正する音声認識方法。
[6]音声入力手段を接続するとともに、前記音声入力手段を介して入力された音声信号を記録する記録部を備えたコンピュータに、音声入力の開始指示を受け付ける機能と、前記開始指示を受け付けた後に前記記録部に記録された音声信号から音声発話を認識する機能と、前記開始指示を受け付けてから前記音声入力手段を介して音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定する機能と、前記修正すると判定された音声発話を修正する機能と、を実現させるための音声認識プログラム。
Claims (6)
- 音声入力手段を介して入力された音声信号を記録する記録部と、
音声入力の開始指示を受け付ける受付手段と、
前記受付手段により前記開始指示を受け付けた後に前記記録部に記録された音声信号から音声発話を認識する認識手段と、
前記受付手段により前記開始指示を受け付けてから前記音声入力手段を介して音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定する判定手段と、
前記判定手段により修正すると判定された音声発話について、種々の単語同士の繋がりパターンの確率を記憶する言語辞書ファイルを参照して前記音声発話に係る単語同士の繋がりパターンについて確率を計算し、最大確率の繋がりパターンの音声発話に修正する修正手段と、
を具備する音声認識装置。 - 前記受付手段により前記開始指示を受け付けた第1時刻を取得する第1時刻取得手段と、
前記音声入力手段を介して音声信号の入力が開始された第2時刻を取得する第2時刻取得手段と、
をさらに具備し、
前記判定手段は、前記第1時刻から前記第2時刻までの経過時間が所定の閾値時間よりも短いとき修正すると判定する、請求項1記載の音声認識装置。 - 前記修正手段は、前記認識手段で認識した音声発話の先頭の単語を、前記音声発話の2番目以降の単語と繋がりのある他の単語に置き換えて単語同士の繋がりパターンについて確率を計算し、最大確率の繋がりパターンの音声発話に修正する、請求項1又は2記載の音声認識装置。
- 前記修正手段は、前記認識手段で認識した音声発話の先頭の語が母音である場合、その母音に子音を順次付加した単語と前記音声発話の2番目以降の単語との単語同士の繋がりパターンについて確率を計算し、最大確率の繋がりパターンの音声発話に修正する、請求項1又は2記載の音声認識装置。
- 音声入力の開始指示を受け付け、
前記開始指示を受け付けた後に音声入力手段を介して入力された音声信号から音声発話を認識し、
前記開始指示を受け付けてから前記音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定し、
修正する場合、その修正すると判定された音声発話について、種々の単語同士の繋がりパターンの確率を記憶する言語辞書ファイルを参照して前記音声発話に係る単語同士の繋がりパターンについて確率を計算し、最大確率の繋がりパターンの音声発話に修正する音声認識方法。 - 音声入力手段を接続するとともに、前記音声入力手段を介して入力された音声信号を記録する記録部を備えたコンピュータに、
音声入力の開始指示を受け付ける機能と、
前記開始指示を受け付けた後に前記記録部に記録された音声信号から音声発話を認識する機能と、
前記開始指示を受け付けてから前記音声入力手段を介して音声信号が入力されるまでの時間により前記音声発話の認識結果を修正するか否かを判定する機能と、
前記修正すると判定された音声発話について、種々の単語同士の繋がりパターンの確率を記憶する言語辞書ファイルを参照して前記音声発話に係る単語同士の繋がりパターンについて確率を計算し、最大確率の繋がりパターンの音声発話に修正する機能と、
を実現させるための音声認識プログラム。
Priority Applications (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016180447A JP6804909B2 (ja) | 2016-09-15 | 2016-09-15 | 音声認識装置、音声認識方法及び音声認識プログラム |
US15/693,427 US10600422B2 (en) | 2016-09-15 | 2017-08-31 | Voice recognition device configured to start voice recognition in response to user instruction |
CN201710780531.0A CN107833578B (zh) | 2016-09-15 | 2017-09-01 | 声音识别装置、声音识别方法及计算机可读存储介质 |
EP17191196.9A EP3296990B1 (en) | 2016-09-15 | 2017-09-14 | Voice recognition device, voice recognition method, and voice recognition program |
US16/809,476 US11468902B2 (en) | 2016-09-15 | 2020-03-04 | Voice recognition device and voice recognition method |
JP2020200894A JP6972287B2 (ja) | 2016-09-15 | 2020-12-03 | 音声認識装置、音声認識方法及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2016180447A JP6804909B2 (ja) | 2016-09-15 | 2016-09-15 | 音声認識装置、音声認識方法及び音声認識プログラム |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020200894A Division JP6972287B2 (ja) | 2016-09-15 | 2020-12-03 | 音声認識装置、音声認識方法及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018045123A JP2018045123A (ja) | 2018-03-22 |
JP6804909B2 true JP6804909B2 (ja) | 2020-12-23 |
Family
ID=59887083
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2016180447A Active JP6804909B2 (ja) | 2016-09-15 | 2016-09-15 | 音声認識装置、音声認識方法及び音声認識プログラム |
Country Status (4)
Country | Link |
---|---|
US (2) | US10600422B2 (ja) |
EP (1) | EP3296990B1 (ja) |
JP (1) | JP6804909B2 (ja) |
CN (1) | CN107833578B (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6804909B2 (ja) * | 2016-09-15 | 2020-12-23 | 東芝テック株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
JP2020085953A (ja) * | 2018-11-16 | 2020-06-04 | トヨタ自動車株式会社 | 音声認識支援装置及び音声認識支援プログラム |
CN111326140B (zh) * | 2020-03-12 | 2023-05-30 | 科大讯飞股份有限公司 | 语音识别结果判别方法、纠正方法、装置、设备及存储介质 |
EP4170527A1 (en) * | 2021-10-19 | 2023-04-26 | ValidSoft Limited | An authentication method and system |
Family Cites Families (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7392185B2 (en) * | 1999-11-12 | 2008-06-24 | Phoenix Solutions, Inc. | Speech based learning/training system using semantic decoding |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
US7050977B1 (en) * | 1999-11-12 | 2006-05-23 | Phoenix Solutions, Inc. | Speech-enabled server for internet website and method |
JP3870775B2 (ja) | 2001-12-12 | 2007-01-24 | 松下電器産業株式会社 | 音声入力方法および音声入力装置 |
JP2004101963A (ja) * | 2002-09-10 | 2004-04-02 | Advanced Telecommunication Research Institute International | 音声認識結果の訂正方法および音声認識結果の訂正のためのコンピュータプログラム |
CN100495535C (zh) * | 2003-02-19 | 2009-06-03 | 松下电器产业株式会社 | 语音识别装置及语音识别方法 |
JP2005309065A (ja) | 2004-04-21 | 2005-11-04 | Toshiba Tec Corp | 音声認識結果出力装置 |
JP4544933B2 (ja) | 2004-07-29 | 2010-09-15 | 東芝テック株式会社 | 音声メモプリンタ |
JP4667082B2 (ja) * | 2005-03-09 | 2011-04-06 | キヤノン株式会社 | 音声認識方法 |
JP5127201B2 (ja) | 2006-11-08 | 2013-01-23 | キヤノン株式会社 | 情報処理装置及び方法並びにプログラム |
DE112007002665B4 (de) * | 2006-12-15 | 2017-12-28 | Mitsubishi Electric Corp. | Spracherkennungssystem |
US8886545B2 (en) | 2007-03-07 | 2014-11-11 | Vlingo Corporation | Dealing with switch latency in speech recognition |
WO2009004750A1 (ja) * | 2007-07-02 | 2009-01-08 | Mitsubishi Electric Corporation | 音声認識装置 |
JP2009031328A (ja) * | 2007-07-24 | 2009-02-12 | Panasonic Corp | 音声認識装置 |
WO2009040790A2 (en) * | 2007-09-24 | 2009-04-02 | Robert Iakobashvili | Method and system for spell checking |
JP2009122598A (ja) | 2007-11-19 | 2009-06-04 | Pioneer Electronic Corp | 電子機器、電子機器の制御方法、音声認識装置、音声認識方法及び音声認識プログラム |
KR101498622B1 (ko) * | 2008-06-25 | 2015-03-04 | 엘지전자 주식회사 | 촉각 효과를 제공하는 휴대 단말기 및 그 제어방법 |
KR101556522B1 (ko) * | 2008-06-27 | 2015-10-01 | 엘지전자 주식회사 | 촉각 효과를 제공하는 휴대 단말기 및 그 제어방법 |
US8306576B2 (en) * | 2008-06-27 | 2012-11-06 | Lg Electronics Inc. | Mobile terminal capable of providing haptic effect and method of controlling the mobile terminal |
US9460708B2 (en) * | 2008-09-19 | 2016-10-04 | Microsoft Technology Licensing, Llc | Automated data cleanup by substitution of words of the same pronunciation and different spelling in speech recognition |
WO2010086925A1 (ja) * | 2009-01-30 | 2010-08-05 | 三菱電機株式会社 | 音声認識装置 |
JP5160594B2 (ja) * | 2010-06-17 | 2013-03-13 | 株式会社エヌ・ティ・ティ・ドコモ | 音声認識装置および音声認識方法 |
US8290772B1 (en) * | 2011-10-03 | 2012-10-16 | Google Inc. | Interactive text editing |
JP6804909B2 (ja) * | 2016-09-15 | 2020-12-23 | 東芝テック株式会社 | 音声認識装置、音声認識方法及び音声認識プログラム |
-
2016
- 2016-09-15 JP JP2016180447A patent/JP6804909B2/ja active Active
-
2017
- 2017-08-31 US US15/693,427 patent/US10600422B2/en active Active
- 2017-09-01 CN CN201710780531.0A patent/CN107833578B/zh active Active
- 2017-09-14 EP EP17191196.9A patent/EP3296990B1/en active Active
-
2020
- 2020-03-04 US US16/809,476 patent/US11468902B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US10600422B2 (en) | 2020-03-24 |
JP2018045123A (ja) | 2018-03-22 |
US11468902B2 (en) | 2022-10-11 |
US20200202870A1 (en) | 2020-06-25 |
EP3296990A1 (en) | 2018-03-21 |
US20180075850A1 (en) | 2018-03-15 |
CN107833578A (zh) | 2018-03-23 |
EP3296990B1 (en) | 2019-04-17 |
CN107833578B (zh) | 2021-11-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6804909B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP6507316B2 (ja) | 外部データソースを用いた音声の再認識 | |
US9196247B2 (en) | Voice recognition method and voice recognition apparatus | |
JP4339931B2 (ja) | 発話を認識する方法及びシステム | |
EP1701338B1 (en) | Speech recognition method | |
KR20150127712A (ko) | 제스처들을 이용하여 프로세싱 모드들을 스위칭하기 위한 시스템들 및 방법들 | |
US20090138266A1 (en) | Apparatus, method, and computer program product for recognizing speech | |
EP1430474A1 (en) | Correcting a text recognized by speech recognition through comparison of phonetic sequences in the recognized text with a phonetic transcription of a manually input correction word | |
US9672820B2 (en) | Simultaneous speech processing apparatus and method | |
US8326597B2 (en) | Translation apparatus, method, and computer program product for detecting language discrepancy | |
JP2015014665A (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
JP6127422B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
CN112908308B (zh) | 一种音频处理方法、装置、设备及介质 | |
JP6972287B2 (ja) | 音声認識装置、音声認識方法及び音声認識プログラム | |
JP4296290B2 (ja) | 音声認識装置、音声認識方法及びプログラム | |
JP2008051883A (ja) | 音声合成制御方法および装置 | |
JP6527000B2 (ja) | 発音誤り検出装置、方法およびプログラム | |
JP3720595B2 (ja) | 音声認識装置及びその方法、コンピュータ可読メモリ | |
JP3992586B2 (ja) | 音声認識用辞書調整装置及び方法 | |
JP4347716B2 (ja) | 音声認識サーバ、音声入力システム、及び、音声入力方法 | |
JP2019095526A (ja) | 音声処理プログラム、音声処理装置、及び音声処理方法 | |
WO2016143420A1 (ja) | 提示装置、提示装置の制御方法、および制御プログラム | |
JPS6126678B2 (ja) | ||
JP6221267B2 (ja) | 音声認識装置及び方法、並びに、半導体集積回路装置 | |
EP3462446A1 (en) | Method, device and computer program for speech-to-text conversion |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20190823 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20200519 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20200602 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200722 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20201104 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20201203 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6804909 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |