JP6450139B2 - 音声認識装置、音声認識方法、及び音声認識プログラム - Google Patents
音声認識装置、音声認識方法、及び音声認識プログラム Download PDFInfo
- Publication number
- JP6450139B2 JP6450139B2 JP2014208834A JP2014208834A JP6450139B2 JP 6450139 B2 JP6450139 B2 JP 6450139B2 JP 2014208834 A JP2014208834 A JP 2014208834A JP 2014208834 A JP2014208834 A JP 2014208834A JP 6450139 B2 JP6450139 B2 JP 6450139B2
- Authority
- JP
- Japan
- Prior art keywords
- voice
- speech recognition
- sound source
- speech
- voice recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 36
- 230000008569 process Effects 0.000 claims description 11
- 238000001514 detection method Methods 0.000 claims description 8
- 230000006870 function Effects 0.000 description 6
- 230000004044 response Effects 0.000 description 6
- 238000004891 communication Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000010079 rubber tapping Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Landscapes
- Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
Claims (7)
- 複数の方向からの音声ストリームのそれぞれを取得する音声取得手段と、
前記音声取得手段により取得された複数の方向からの音声ストリームのそれぞれに対して音声認識を実行する音声認識処理手段と、
前記音声認識処理手段により、予め定められた信頼度の基準を満たす音声認識結果が得られた場合に、当該音声認識結果が得られた音声ストリームに対応する方向を音源方向として決定する音源方向決定手段と、
前記音声取得手段により取得された音声ストリームのうち前記音源方向決定手段により決定された音源方向からの音声ストリームに対して、前記音声認識処理手段による音声認識よりも精度の高い音声認識を実行する第2音声認識処理手段と、を備える音声認識装置。 - 前記音声取得手段は、予め定められた複数の方向に指向性ビームを設定することにより、各指向性ビームのビーム方向に対応する音声ストリームを取得する、請求項1記載の音声認識装置。
- 前記音声取得手段は、所定の方法により推定された音源方向の候補となる複数の方向に指向性ビームを設定することにより、各指向性ビームのビーム方向に対応する音声ストリームを取得する、請求項1記載の音声認識装置。
- 前記音声認識処理手段は、予め定められた単語が音声認識結果に含まれている場合に、当該音声認識結果は予め定められた信頼度の基準を満たすと判定する、請求項1〜3のいずれか一項記載の音声認識装置。
- 前記音声認識処理手段は、発話区間を検出するための発話区間検出処理を実行し、当該発話区間検出処理により検出された発話区間に対して音声認識を実行する、請求項1〜4のいずれか一項記載の音声認識装置。
- 音声認識装置により実行される音声認識方法であって、
複数の方向からの音声ストリームのそれぞれを取得する音声取得ステップと、
前記音声取得ステップにおいて取得された複数の方向からの音声ストリームのそれぞれに対して音声認識を実行する音声認識処理ステップと、
前記音声認識処理ステップにおいて、予め定められた信頼度の基準を満たす音声認識結果が得られた場合に、当該音声認識結果が得られた音声ストリームに対応する方向を音源方向として決定する音源方向決定ステップと、
前記音声取得ステップにおいて取得された音声ストリームのうち前記音源方向決定ステップにおいて決定された音源方向からの音声ストリームに対して、前記音声認識処理ステップにおける音声認識よりも精度の高い音声認識を実行する第2音声認識処理ステップと、を含む音声認識方法。 - コンピュータを、
複数の方向からの音声ストリームのそれぞれを取得する音声取得手段と、
前記音声取得手段により取得された複数の方向からの音声ストリームのそれぞれに対して音声認識を実行する音声認識処理手段と、
前記音声認識処理手段により、予め定められた信頼度の基準を満たす音声認識結果が得られた場合に、当該音声認識結果が得られた音声ストリームに対応する方向を音源方向として決定する音源方向決定手段と、
前記音声取得手段により取得された音声ストリームのうち前記音源方向決定手段により決定された音源方向からの音声ストリームに対して、前記音声認識処理手段による音声認識よりも精度の高い音声認識を実行する第2音声認識処理手段、として実行させる音声認識プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014208834A JP6450139B2 (ja) | 2014-10-10 | 2014-10-10 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014208834A JP6450139B2 (ja) | 2014-10-10 | 2014-10-10 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2016080750A JP2016080750A (ja) | 2016-05-16 |
JP6450139B2 true JP6450139B2 (ja) | 2019-01-09 |
Family
ID=55958464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014208834A Active JP6450139B2 (ja) | 2014-10-10 | 2014-10-10 | 音声認識装置、音声認識方法、及び音声認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6450139B2 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102562287B1 (ko) | 2016-10-14 | 2023-08-02 | 삼성전자주식회사 | 전자 장치 및 전자 장치의 오디오 신호 처리 방법 |
CN109859749A (zh) * | 2017-11-30 | 2019-06-07 | 阿里巴巴集团控股有限公司 | 一种语音信号识别方法和装置 |
US10679617B2 (en) * | 2017-12-06 | 2020-06-09 | Synaptics Incorporated | Voice enhancement in audio signals through modified generalized eigenvalue beamformer |
CN110364166B (zh) | 2018-06-28 | 2022-10-28 | 腾讯科技(深圳)有限公司 | 实现语音信号识别的电子设备 |
US20220036877A1 (en) * | 2018-10-15 | 2022-02-03 | Mitsubishi Electric Corporation | Speech recognition device, speech recognition system, and speech recognition method |
JP7407580B2 (ja) | 2018-12-06 | 2024-01-04 | シナプティクス インコーポレイテッド | システム、及び、方法 |
WO2020138943A1 (ko) * | 2018-12-27 | 2020-07-02 | 한화테크윈 주식회사 | 음성을 인식하는 장치 및 방법 |
KR20200081274A (ko) | 2018-12-27 | 2020-07-07 | 한화테크윈 주식회사 | 음성을 인식하는 장치 및 방법 |
CN110246501B (zh) * | 2019-07-02 | 2022-02-01 | 思必驰科技股份有限公司 | 用于会议记录的语音识别方法及系统 |
JP7010900B2 (ja) * | 2019-07-16 | 2022-01-26 | Kddi株式会社 | 音源定位装置及び音源定位方法 |
US11064294B1 (en) | 2020-01-10 | 2021-07-13 | Synaptics Incorporated | Multiple-source tracking and voice activity detections for planar microphone arrays |
JP7111206B2 (ja) * | 2021-02-17 | 2022-08-02 | 日本電信電話株式会社 | 話者方向強調装置、話者方向強調方法、およびプログラム |
JPWO2022239650A1 (ja) * | 2021-05-11 | 2022-11-17 | ||
US12057138B2 (en) | 2022-01-10 | 2024-08-06 | Synaptics Incorporated | Cascade audio spotting system |
US11823707B2 (en) | 2022-01-10 | 2023-11-21 | Synaptics Incorporated | Sensitivity mode for an audio spotting system |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS57205800A (en) * | 1981-06-15 | 1982-12-16 | Fujitsu Ltd | Voice recognition circuit |
JP2000101598A (ja) * | 1998-09-25 | 2000-04-07 | Matsushita Electric Works Ltd | 音声通信システム |
GB2412997A (en) * | 2004-04-07 | 2005-10-12 | Mitel Networks Corp | Method and apparatus for hands-free speech recognition using a microphone array |
JP2009020423A (ja) * | 2007-07-13 | 2009-01-29 | Fujitsu Ten Ltd | 音声認識装置および音声認識方法 |
JP2011107603A (ja) * | 2009-11-20 | 2011-06-02 | Sony Corp | 音声認識装置、および音声認識方法、並びにプログラム |
JP2011232619A (ja) * | 2010-04-28 | 2011-11-17 | Ntt Docomo Inc | 音声認識装置および音声認識方法 |
-
2014
- 2014-10-10 JP JP2014208834A patent/JP6450139B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2016080750A (ja) | 2016-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6450139B2 (ja) | 音声認識装置、音声認識方法、及び音声認識プログラム | |
US12125483B1 (en) | Determining device groups | |
JP7434137B2 (ja) | 音声認識方法、装置、機器及びコンピュータ読み取り可能な記憶媒体 | |
US11694710B2 (en) | Multi-stream target-speech detection and channel fusion | |
US11568867B2 (en) | Detecting self-generated wake expressions | |
CN110556103B (zh) | 音频信号处理方法、装置、系统、设备和存储介质 | |
CN110268470B (zh) | 音频设备滤波器修改 | |
EP3347894B1 (en) | Arbitration between voice-enabled devices | |
CN108351872B (zh) | 用于响应用户语音的方法和系统 | |
US10149049B2 (en) | Processing speech from distributed microphones | |
WO2020103703A1 (zh) | 一种音频数据处理方法、装置、设备及存储介质 | |
TWI711035B (zh) | 方位角估計的方法、設備、語音交互系統及儲存介質 | |
US9940949B1 (en) | Dynamic adjustment of expression detection criteria | |
US9076450B1 (en) | Directed audio for speech recognition | |
US8981994B2 (en) | Processing signals | |
JP6844608B2 (ja) | 音声処理装置および音声処理方法 | |
US11631411B2 (en) | System and method for multi-microphone automated clinical documentation | |
US10360922B2 (en) | Noise reduction device and method for reducing noise | |
JP2020024310A (ja) | 音声処理システム及び音声処理方法 | |
JP6361360B2 (ja) | 残響判定装置及びプログラム | |
JP2019537071A (ja) | 分散したマイクロホンからの音声の処理 | |
US20230298612A1 (en) | Microphone Array Configuration Invariant, Streaming, Multichannel Neural Enhancement Frontend for Automatic Speech Recognition | |
JP7279710B2 (ja) | 信号処理装置および方法、並びにプログラム | |
Kulhandjian et al. | AI-powered Emergency Keyword Detection for Autonomous Vehicles | |
CN117795597A (zh) | 用于自动语音辨识的联合声学回声消除、语音增强和话音分离 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20170818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20180613 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20180703 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20180831 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20181120 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20181207 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6450139 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |