JP6773074B2 - 応答生成方法、応答生成装置及び応答生成プログラム - Google Patents
応答生成方法、応答生成装置及び応答生成プログラム Download PDFInfo
- Publication number
- JP6773074B2 JP6773074B2 JP2018088229A JP2018088229A JP6773074B2 JP 6773074 B2 JP6773074 B2 JP 6773074B2 JP 2018088229 A JP2018088229 A JP 2018088229A JP 2018088229 A JP2018088229 A JP 2018088229A JP 6773074 B2 JP6773074 B2 JP 6773074B2
- Authority
- JP
- Japan
- Prior art keywords
- response
- voice
- generated
- user
- sentence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Machine Translation (AREA)
Description
この一態様において、前記ユーザの音声の音韻を分析するステップと、前記音韻の分析結果に基づいて、前記ユーザの音声に対する相槌の応答を生成するステップと、を更に含み、前記生成される繰返しの応答文を出力する前に、前記生成された相槌の応答を出力してもよい。
この一態様において、前記解析された音声の構造に基づいて、前記ユーザの音声に対する応答候補を複数生成し、該生成した複数の応答候補の中から、前記生成された繰返しの応答文及び前記生成された相槌の応答と重複する応答候補を除外し、該除外した応答候補の中から選択した応答候補を前記随意の応答文としてもよい。
この一態様において、前記認識されたユーザの音声からキーワード及び該キーワードの品詞を抽出し、複数のキーワードと、該各キーワードの品詞と、付加語尾と、を夫々対応付けた付加情報に基づいて前記抽出したキーワード及び品詞に対応した前記付加語尾を選択し、前記抽出したキーワードに対して前記選択した付加語尾を付加することで、繰返しの応答文を生成してもよい。
上記目的を達成するための本発明の一態様は、ユーザの音声を認識する音声認識手段と、前記音声認識手段により認識された音声の構造を解析する構造解析手段と、前記構造解析手段により解析された音声の構造に基づいて、前記ユーザの音声に対する応答文を生成し、該生成した随意の応答文を出力する応答出力手段と、を備える応答生成装置であって、前記音声認識手段により認識されたユーザの音声を、繰返しの応答文として生成する繰返生成手段を備え、前記応答出力手段は、前記音声の構造に基づいた随意の応答文を出力する前に、前記繰返生成手段により生成された繰返しの応答文を出力する、ことを特徴とする応答生成装置であってもよい。
上記目的を達成するための本発明の一態様は、ユーザの音声を認識する処理と、前記認識された音声の構造を解析する処理と、前記解析された音声の構造に基づいて、前記ユーザの音声に対する応答文を生成し、該生成した随意の応答文を出力する処理と、前記認識されたユーザの音声を、繰返しの応答文として生成する処理と、前記音声の構造に基づいた随意の応答文を出力する前に、前記生成された繰返しの応答文を出力する処理と、をコンピュータに実行させることを特徴とする応答生成プログラムであってもよい。
以下、図面を参照して本発明の実施の形態について説明する。図1は、本発明の実施形態1に係る応答生成装置の概略的なシステム構成を示すブロック図である。本実施形態1に係る応答生成装置1は、ユーザの音声を認識する音声認識部2と、音声の構造を解析する構造解析部と3、ユーザの音声に対する応答文を生成し、出力する応答出力部4と、繰返しの応答文を生成する繰返生成部5と、を備えている。
音声認識部2は、マイク6により取得されたユーザの音声情報の音声認識を行い(ステップS101)、認識したユーザの音声情報を構造解析部3及び繰返生成部5に出力する。
応答出力部4は、繰返生成部5から出力された繰返応答文をスピーカ7から出力する(ステップS103)。
図3は、本発明の実施形態2に係る応答生成装置の概略的なシステム構成を示すブロック図である。本実施形態2に係る応答生成装置20は、上記実施形態1に係る応答生成装置1の構成に加えて、ユーザの音声情報の音韻を分析する音韻分析部21と、ユーザの音声情報に対する相槌の応答を生成する相槌生成部22と、を更に備える点を特徴とする。
U:「今日は暑いね。」
M(相槌応答):「うん。」
M(繰返応答文):「暑いね。」
M(随意応答文):「いつまで暑いのかな?」
このように、対話の連続性をより滑らかに維持しつつ、重複する無駄な言葉を排除できより自然な対話を実現できる。
音韻分析部21は、マイク6により取得されたユーザの音声情報に基づいてユーザの音声情報の音韻を分析し(ステップS201)、その音韻の分析結果を相槌生成部22に出力する。
応答出力部4は、相槌生成部22から出力された相槌応答をスピーカ7から出力する(ステップS203)。
応答出力部4は、繰返生成部5から出力された繰返応答文をスピーカ7から出力する(ステップS206)。
M(話題提供):「お昼何を食べたの?」
U:「トンカツを食べたよ。」
M(相槌応答):「うん。うん。」
M(繰返応答文):「トンカツを食べた。」
M(随意応答文):「誰と食べたのかな?」
U:「友達と食べたよ。」
M(相槌応答):「そうなんだ。」
M(繰返応答文):「友達と食べた。」
M(随意応答文):「どこで食べたのかな?」
U:「矢場とんで食べたよ。」
M(相槌応答):「なるほど。」
M(繰返応答文):「矢場とんで食べた。」
M(随意応答文):「食べたね。」
U:「美味しかったよ。」
M(相槌応答):「ふーん。」
M(繰返応答文):「美味しかった。」
M(随意応答文):「それはいいね。○○さん。」
本実施形態3に係る繰返生成部5は、音声認識部2により認識されたユーザの音声情報からキーワードを抽出し、抽出したキーワードに対して特定の付加語尾を付加することで、繰返応答文を生成することを特徴とする。
Claims (6)
- ユーザの音声を認識するステップと、
前記認識された音声の構造を解析するステップと、
前記解析された音声の構造に基づいて、前記ユーザの音声に対する応答文を生成し、該生成した随意の応答文を出力するステップと、
を含む応答生成方法であって、
前記認識されたユーザの音声から、処理コストの異なる複数の繰返しの応答文を並列で生成するステップと、
前記音声の構造に基づいた随意の応答文を出力する前に、前記生成された複数の繰返しの応答文を前記生成された順で出力するステップと、を含む、ことを特徴とする応答生成方法。 - 請求項1記載の応答生成方法であって、
前記ユーザの音声の音韻を分析するステップと、
前記音韻の分析結果に基づいて、前記ユーザの音声に対する相槌の応答を生成するステップと、を更に含み、
前記生成される繰返しの応答文を出力する前に、前記生成された相槌の応答を出力する、ことを特徴とする応答生成方法。 - 請求項2記載の応答生成方法であって、
前記解析された音声の構造に基づいて、前記ユーザの音声に対する応答候補を複数生成し、該生成した複数の応答候補の中から、前記生成された繰返しの応答文及び前記生成された相槌の応答と重複する応答候補を除外し、該除外した応答候補の中から選択した応答候補を前記随意の応答文とする、ことを特徴とする応答生成方法。 - 請求項3記載の応答生成方法であって、
前記認識されたユーザの音声からキーワード及び該キーワードの品詞を抽出し、複数のキーワードと、該各キーワードの品詞と、付加語尾と、を夫々対応付けた付加情報に基づいて前記抽出したキーワード及び品詞に対応した前記付加語尾を選択し、前記抽出したキーワードに対して前記選択した付加語尾を付加することで、繰返しの応答文を生成する、ことを特徴とする応答生成方法。 - ユーザの音声を認識する音声認識手段と、
前記音声認識手段により認識された音声の構造を解析する構造解析手段と、
前記構造解析手段により解析された音声の構造に基づいて、前記ユーザの音声に対する応答文を生成し、該生成した随意の応答文を出力する応答出力手段と、を備える応答生成装置であって、
前記音声認識手段により認識されたユーザの音声から、処理コストの異なる複数の繰返しの応答文を並列で生成する繰返生成手段を備え、
前記応答出力手段は、前記音声の構造に基づいた随意の応答文を出力する前に、前記繰返生成手段により生成された複数の繰返しの応答文を前記生成された順で出力する、ことを特徴とする応答生成装置。 - ユーザの音声を認識する処理と、
前記認識された音声の構造を解析する処理と、
前記解析された音声の構造に基づいて、前記ユーザの音声に対する応答文を生成し、該生成した随意の応答文を出力する処理と、
前記認識されたユーザの音声から、処理コストの異なる複数の繰返しの応答文を並列で生成する処理と、
前記音声の構造に基づいた随意の応答文を出力する前に、前記生成された複数の繰返しの応答文を前記生成された順で出力する処理と、をコンピュータに実行させることを特徴とする応答生成プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018088229A JP6773074B2 (ja) | 2018-05-01 | 2018-05-01 | 応答生成方法、応答生成装置及び応答生成プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018088229A JP6773074B2 (ja) | 2018-05-01 | 2018-05-01 | 応答生成方法、応答生成装置及び応答生成プログラム |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014168762A Division JP6390264B2 (ja) | 2014-08-21 | 2014-08-21 | 応答生成方法、応答生成装置及び応答生成プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2018160248A JP2018160248A (ja) | 2018-10-11 |
JP6773074B2 true JP6773074B2 (ja) | 2020-10-21 |
Family
ID=63796781
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018088229A Active JP6773074B2 (ja) | 2018-05-01 | 2018-05-01 | 応答生成方法、応答生成装置及び応答生成プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6773074B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114694650A (zh) * | 2022-03-29 | 2022-07-01 | 青岛海尔科技有限公司 | 智能设备的控制方法和装置、存储介质及电子设备 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3199972B2 (ja) * | 1995-02-08 | 2001-08-20 | シャープ株式会社 | あいづち応答のある対話装置 |
JP2004191407A (ja) * | 2002-12-06 | 2004-07-08 | Casio Comput Co Ltd | 会話システム及び会話処理プログラム |
JP4755478B2 (ja) * | 2005-10-07 | 2011-08-24 | 日本電信電話株式会社 | 応答文生成装置、応答文生成方法、そのプログラムおよび記憶媒体 |
JP4849662B2 (ja) * | 2005-10-21 | 2012-01-11 | 株式会社ユニバーサルエンターテインメント | 会話制御装置 |
JP2009193448A (ja) * | 2008-02-15 | 2009-08-27 | Oki Electric Ind Co Ltd | 対話システム、方法及びプログラム |
JP5195414B2 (ja) * | 2008-12-26 | 2013-05-08 | トヨタ自動車株式会社 | 応答生成装置及びプログラム |
US9563265B2 (en) * | 2012-01-12 | 2017-02-07 | Qualcomm Incorporated | Augmented reality with sound and geometric analysis |
JP6295869B2 (ja) * | 2014-07-23 | 2018-03-20 | トヨタ自動車株式会社 | 応答生成装置、応答生成方法及びプログラム |
-
2018
- 2018-05-01 JP JP2018088229A patent/JP6773074B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2018160248A (ja) | 2018-10-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102161579B1 (ko) | 응답문 생성 장치, 방법 및 프로그램, 그리고 음성 대화 시스템 | |
JP6696923B2 (ja) | 音声対話装置、その処理方法及びプログラム | |
US20180137109A1 (en) | Methodology for automatic multilingual speech recognition | |
JP6390264B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
Chen et al. | Strategies for Vietnamese keyword search | |
JP7059813B2 (ja) | 音声対話システム、その処理方法及びプログラム | |
Black et al. | Automated evaluation of non-native English pronunciation quality: combining knowledge-and data-driven features at multiple time scales | |
Jain et al. | Speech Recognition Systems–A comprehensive study of concepts and mechanism | |
JP6828667B2 (ja) | 音声対話装置、音声対話方法及びプログラム | |
Savargiv et al. | Persian speech emotion recognition | |
JP6299563B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
JP6295869B2 (ja) | 応答生成装置、応答生成方法及びプログラム | |
JP6773074B2 (ja) | 応答生成方法、応答生成装置及び応答生成プログラム | |
JP2016080981A (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
Prombut et al. | Feature extraction technique based on Conv1D and Conv2D network for Thai speech emotion recognition | |
KR102090240B1 (ko) | 심층학습을 이용한 한국어 운율구 경계 예측 장치 및 방법 | |
Sarkar et al. | Modeling pauses for synthesis of storytelling style speech using unsupervised word features | |
JP6176137B2 (ja) | 音声対話装置、音声対話システム及びプログラム | |
JP6287754B2 (ja) | 応答生成装置、応答生成方法及び応答生成プログラム | |
CN113192483B (zh) | 一种文本转换为语音的方法、装置、存储介质和设备 | |
Tanaka et al. | Physically Constrained Statistical F0 Prediction for Electrolaryngeal Speech Enhancement. | |
JP2010191321A (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
Hozjan et al. | Improved Emotion Recognition with Large Set of Statistical | |
董良 | Study on Post-processing Method for HMM-based Phonetic Segmentation using Adaptive Neuro Fuzzy Inference system | |
Klatt | WORD VERIFICATION IN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180501 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190730 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20200310 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200605 |
|
C60 | Trial request (containing other claim documents, opposition documents) |
Free format text: JAPANESE INTERMEDIATE CODE: C60 Effective date: 20200605 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20200615 |
|
C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings |
Free format text: JAPANESE INTERMEDIATE CODE: C21 Effective date: 20200616 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200901 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200914 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6773074 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |