Nothing Special   »   [go: up one dir, main page]

JP2020170112A - 音声認識システム、近距離無線通信デバイス及び情報端末 - Google Patents

音声認識システム、近距離無線通信デバイス及び情報端末 Download PDF

Info

Publication number
JP2020170112A
JP2020170112A JP2019072125A JP2019072125A JP2020170112A JP 2020170112 A JP2020170112 A JP 2020170112A JP 2019072125 A JP2019072125 A JP 2019072125A JP 2019072125 A JP2019072125 A JP 2019072125A JP 2020170112 A JP2020170112 A JP 2020170112A
Authority
JP
Japan
Prior art keywords
voice recognition
short
unit
range wireless
wireless communication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2019072125A
Other languages
English (en)
Inventor
松岡 保静
Hosei Matsuoka
保静 松岡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Docomo Inc
Original Assignee
NTT Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NTT Docomo Inc filed Critical NTT Docomo Inc
Priority to JP2019072125A priority Critical patent/JP2020170112A/ja
Publication of JP2020170112A publication Critical patent/JP2020170112A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephone Function (AREA)

Abstract

【課題】 近距離無線通信デバイスから情報端末に送信される音声データに対して音声認識を行う場合に適切なタイミングで音声認識を行う。【解決手段】 近距離無線通信デバイスであるBluetoothデバイス10と情報端末20とを含む音声認識システム1であって、Bluetoothデバイス10は、ユーザからの操作に応じて、近距離無線通信の通信方式を第1の通信方式と第2の通信方式との間で切り替える切替部16を備え、情報端末20は、当該通信方式が第1の通信方式と第2の通信方式との間で切り替えられたことを検出する切替検出部27と、第1の通信方式に切り替えられたことが検出されると音声認識部25に、Bluetoothデバイス10からの音声データに対する音声認識を開始させ、第2の通信方式に切り替えられたことが検出されると当該音声認識を停止させる制御部28とを備える。【選択図】 図1

Description

本発明は、音声データに対する音声認識を行う音声認識システム、並びに当該音声認識システムに含まれる近距離無線通信デバイス及び情報端末に関する。
近年、音声認識技術及び機械翻訳技術の著しい進歩により、スマートフォン等の情報端末による音声翻訳サービスが普及しつつある。これはユーザが発話した内容を音声認識でテキストに変換し、そのテキストを目的の言語に機械翻訳して、翻訳結果を音声合成で再生するというシステムに基づいている。音声認識及び機械翻訳はネットワークを介したサーバで提供することが多いため、上記のようなサービスを利用するためには、通常、スマートフォン等のネットワーク接続できる情報端末が必要となる。
音声認識に係る技術として、マイクによって入力された音声データをBluetooth(登録商標)による通信で送信して音声認識装置に送信するというものがある(例えば、特許文献1参照)。
特開2005−217456号公報
上記の音声翻訳をスマートフォン等の情報端末で実現するにあたって、翻訳結果の音声は、コミュニケーションの相手に聞かせる必要がある。従って、単一の情報端末でこれを行おうとすると、情報端末にユーザが発話し、その結果の音声を相手に聞かせるために、相手に情報端末を差し出し、更には、相手に発話してもらう時も相手に情報端末を差し出して発話してもらって、その結果をユーザが聞くという動作が必要になる。2台の情報端末を使って通信で連携すれば、各自が1台ずつ情報端末を持つことで、情報端末を交換せずにコミュニケーションが可能ではある。
これを1つの情報端末と、ヘッドセットのような主に音声データの入出力の機能及びBluetooth通信機能しか持たないBluetoothマイクスピーカ(Bluetoothデバイス)とで実現することを考える。しかしながら、これらの装置の間でコミュニケーションのタイミングを制御する仕組みが無いため、1人が情報端末を、もう1人がBluetoothマイクスピーカをそれぞれ持って双方向コミュニケーションをすることが難しい。
本発明は、上記に鑑みてなされたものであり、近距離無線通信デバイスから情報端末に送信される音声データに対して音声認識を行う場合に適切なタイミングで音声認識を行うことができる音声認識システム、近距離無線通信デバイス及び情報端末を提供することを目的とする。
上記の目的を達成するために、本発明に係る音声認識システムは、マイクを備える近距離無線通信デバイスと、当該近距離無線通信デバイスとの間で近距離無線通信によって音声データを送受信する情報端末とを含む音声認識システムであって、近距離無線通信デバイスは、ユーザからの操作を受け付ける操作受付部と、操作受付部によって受け付けられたユーザからの操作に応じて、近距離無線通信の通信方式を第1の通信方式と、第1の通信方式とは異なる第2の通信方式との間で切り替える切替部と、マイクによって入力された音声データを第1の通信方式で情報端末に送信する送信部と、を備え、情報端末は、近距離無線通信デバイスから音声データを受信して、受信した音声データに対して音声認識を行う音声認識部と、近距離無線通信デバイスによって、近距離無線通信の通信方式が第1の通信方式と、第2の通信方式との間で切り替えられたことを検出する切替検出部と、第1の通信方式に切り替えられたことが切替検出部によって検出されると音声認識部に近距離無線通信デバイスからの音声データに対する音声認識を開始させ、第2の通信方式に切り替えられたことが切替検出部によって検出されると音声認識部に近距離無線通信デバイスからの音声データに対する音声認識を停止させる制御部と、を備える。
本発明に係る音声認識システムでは、近距離無線通信デバイスにおいて第1の通信方式に切り替えられている際に、情報端末において近距離無線通信デバイスからの音声データに対する音声認識が行われる。従って、本発明に係る音声認識システムによれば、適切なタイミングで音声認識を行うことができる。
また、本発明に係る音声認識システムに含まれる近距離無線通信デバイス及び情報端末は、それら自体が新規な構成を有しており発明である。
本発明では、近距離無線通信デバイスにおいて第1の通信方式に切り替えられている際に、情報端末において近距離無線通信デバイスからの音声データに対する音声認識が行われる。従って、本発明によれば、適切なタイミングで音声認識を行うことができる。
本発明の実施形態に係る音声認識システム、並びに当該音声認識システムに含まれる近距離無線通信デバイスであるBluetoothデバイス及び情報端末の構成を示す図である。 Bluetoothデバイスの外観を示す図である。 本発明の実施形態に係る近距離無線通信デバイスであるBluetoothデバイスで実行される処理を示すフローチャートである。 本発明の実施形態に係る情報端末で実行される処理を示すフローチャートである。 本発明の実施形態に係る音声認識システムに含まれる近距離無線通信デバイスであるBluetoothデバイス及び情報端末のハードウェア構成を示す図である。
以下、図面と共に本発明に係る音声認識システム、近距離無線通信デバイス及び情報端末の実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
図1に本実施形態に係る音声認識システム1を示す。音声認識システム1は、本実施形態に係る近距離無線通信デバイスであるBluetoothデバイス10と、本実施形態に係る情報端末20とを含む。図2にBluetoothデバイス10の外観の例を示す。本実施形態に係る音声認識システム1は、音声翻訳の機能をユーザに提供する。Bluetoothデバイス10と、情報端末20とは、互いに異なるユーザによって用いられる。それぞれのユーザは、例えば、使用言語が異なるユーザである。
Bluetoothデバイス10及び情報端末20は、それぞれマイク11,21とスピーカ12,22とを備えている。Bluetoothデバイス10のユーザが、Bluetoothデバイス10のマイク11に向かって発話すると、当該発話が翻訳された音声が情報端末20のスピーカから出力される。また、情報端末20のユーザが、情報端末20のマイク21に向かって発話すると、当該発話が翻訳された音声がBluetoothデバイス10のスピーカから出力される。このように本実施形態に係る音声認識システム1によれば、例えば、使用言語が異なるユーザ同士が音声でコミュニケーションを図ることができる。
Bluetoothデバイス10は、マイク11と、スピーカ12と、ボタン13とを備えるデバイスである。Bluetoothデバイス10を持ったユーザが発話する場合には、当該ユーザはボタン13を押しながら発話を行う。Bluetoothデバイス10の形状は、例えば、ユーザが片手で持てる程度の名刺サイズの形状である。図2に示すようにBluetoothデバイス10の所定の面にマイク11と、スピーカ12と、ボタン13とが設けられる。ボタン13は、例えば、ユーザが片手でBluetoothデバイス10を持ったときの当該ユーザの親指の位置に配置される。ユーザは、ボタン13を押しながらBluetoothデバイス10を口元に持っていき発話することでクリアな音声を認識することができる。また、ボタン13を押すことで、音声認識システム1では、後述するようにBluetoothデバイス10のユーザが発話する状態とすることができる。また、後述するようにBluetoothデバイス10は、Bluetoothによる近距離無線通信を行う機能、及び情報処理機能を有している。
情報端末20は、例えば、スマートフォン等の情報処理端末である。情報端末20は、従来のスマートフォン等と同様に、マイク21と、スピーカ22と、ボタン23とを備える。情報端末20としては、従来のスマートフォン等を利用することができる。なお、情報端末20は、従来のスマートフォン等にはない後述する本実施形態に係る新規な機能を有する。当該新規な機能は、ソフトウェアによって実現することができる。但し、当該新規な機能は、ソフトウェア以外によって実現されてもよい。
情報端末20を持ったユーザが発話する場合には、当該ユーザはボタン23を押しながら発話を行う。また、後述するように情報端末20は、Bluetoothによる近距離無線通信を行う機能、及び情報処理機能を有している。Bluetoothデバイス10と情報端末20とは互いに、Bluetoothによって音声データを送受信する。
Bluetoothデバイス10は、情報端末20に比べて安価に作成することができる。そのため、本実施形態のようにBluetoothデバイス10と情報端末20とを用いることで、2つの情報端末を使う場合と比べて、安価に音声翻訳の機能を実現することができる。
引き続いて、本実施形態に係る音声認識システム1に含まれるBluetoothデバイス10及び情報端末20の構成について説明する。図1に示すように本実施形態に係るBluetoothデバイス10は、マイク11と、スピーカ12と、ボタン13と、Bluetooth通信部14と、操作受付部15と、切替部16とを備えて構成される。Bluetoothデバイス10の説明におけるユーザは、特段の説明がなければBluetoothデバイス10のユーザである。
マイク11は、音声を入力し、音声データ(音声信号)を生成する装置である。マイク11としては、従来のマイクを用いることができる。スピーカ12は、音声データを入力して音声出力(再生)する装置である。スピーカ12としては、従来のスピーカを用いることができる。
ボタン13は、ユーザが押下することができるボタンである。上述したようにボタン13は、ユーザが発話する際に押下される。ボタン13は、例えば、物理的な押しボタンである。ボタン13は、それ以外の任意のもの、例えば、タッチパネルで実現されるもの等であってもよい。
Bluetooth通信部14、操作受付部15及び切替部16の機能は、Bluetoothデバイス10が備えるプロセッサ、メモリ及び通信モジュール等のハードウェアによって実現される。
Bluetooth通信部14は、近距離無線通信であるBluetoothによって他の装置との間で通信を行う機能部である。Bluetooth通信部14は、情報端末20との間で音声データの送受信を行う。Bluetoothデバイス10のマイク11を用いるため、Bluetoothデバイス10と情報端末20との間では、HFP(Hands-Free Profile)というプロファイルで通信を行う。HFPの通信では、通信モードが、本実施形態における第1の通信方式に相当するSCO(Synchronous Connection Oriented)と、本実施形態における第2の通信方式に相当するACL(Asynchronous Connection Less)との2種類ある。第1の通信方式に相当するSCOと、第2の通信方式に相当するACLとは互いに異なる方式である。HFPの通信では、SCOとACLとの何れか一方が設定されて、設定された通信モードによる通信が行われる。
SCO(SCOリンク)は、予約済み帯域・短レイテンシの音声転送に特化したパケットを送受信するためのものである。ACL(ACLリンク)は、一般のデータ転送に使われるパケットを送受信するためのものである。SCOは16kHzであり、ACLは44.1kHzであり、ACLは、SCOよりも通信品質が高い。ACLで音声データが送信される場合には、例えば、A2DP(Advanced Audio Distribution Profile)でメディア音声として送信される。Bluetoothデバイス10及び情報端末20の何れも、HFP及びA2DPの通信プロファイルを備えており、上述した何れの方式での通信も行うことができる。
ACL/A2DPで音声データが送信されれば、受信側において高音質で音声を再生することができる。但し、Bluetoothデバイス10のマイク11で音声を入力する場合には、SCOで通信する必要がある。そのため、本実施形態では、Bluetoothデバイス10から情報端末20への音声データ、即ち、上り方向の音声データはSCOで送信される。情報端末20からBluetoothデバイス10への音声データ、即ち、下り方向の音声データはACL/A2DPで送信される。通信モードの切り替えは、以下の機能部により行われる。なお、以降の説明において、ACLで音声データの送信が行われる際には、音声データはA2DPでメディア音声として送信される。
Bluetooth通信部14は、HFPの通信モード(HFPの状態)がSCOに設定されている際には、マイク11から音声データを入力して情報端末20に送信する。即ち、Bluetooth通信部14は、マイク11によって入力された音声データを、SCOで情報端末20に送信する送信部である。また、Bluetooth通信部14は、HFPの通信モード(HFPの状態)がACLに設定されている際には、情報端末20から送信される音声データを受信してスピーカ12に出力する。
操作受付部15は、ユーザからBluetoothデバイス10に対する操作を受け付ける機能部である。操作受付部15は、当該操作としてボタン13の押下を検出して受け付ける。操作受付部15は、ユーザのボタン13の押下を受け付けると、その旨を切替部16に通知する。あるいは、操作受付部15は、ボタン13の押下状態が、押下されている状態から押下されていない状態に変化したこと、及び押下されていない状態から押下されている状態に変化したことを検出してもよい。
切替部16は、操作受付部15によって受け付けられたユーザからの操作に応じて、BluetoothのHFPの通信モードをSCOと、ACLとの間で切り替える機能部である。例えば、切替部16は、操作受付部15からの通知によって示されるボタン13の押下状態に応じて切替を行う。切替部16は、ボタン13が押下されている際には通信モードをSCOに設定し、ボタン13が押下されていない際には通信モードをACLに設定する。即ち、ボタン13の押下が開始されると、切替部16は、通信モードをACLからSCOに切り替える。ボタン13の押下が終了すると、切替部16は、通信モードをSCOからACLに切り替える。切替部16は、Bluetooth通信部14に対して当該切替を指示する。Bluetooth通信部14は、当該指示を受け付けて、指示に係る通信モードで通信を行う。
なお、上述したように通信モードがSCOに設定されている際のみに上り方向の通信が行われるため、その際には下り方向の音声データの音声出力を行うスピーカ12の機能を停止させることとしてもよい。また、通信モードがACLに設定されている際のみに下り方向の通信が行われるため、その際には上り方向の音声データを入力するマイク11の機能を停止させることとしてもよい。以上が、本実施形態に係るBluetoothデバイス10の構成である。
続いて、情報端末20の構成について説明する。図1に示すように本実施形態に係る情報端末20は、マイク21と、スピーカ22と、ボタン23と、Bluetooth通信部24と、音声認識部25と、翻訳部26と、切替検出部27と、制御部28と、出力部29とを備えて構成される。情報端末20は、上記以外にも通常の情報端末が備える機能を備えていてもよい。情報端末20の説明におけるユーザは、特段の説明がなければ情報端末20のユーザである。
マイク21は、音声を入力し、音声データを生成する装置である。マイク21としては、従来のマイクを用いることができる。スピーカ22は、音声データを入力して音声出力する装置である。スピーカ22としては、従来のスピーカを用いることができる。
ボタン23は、ユーザが押下することができるボタンである。上述したようにボタン23は、ユーザが発話する際に押下される。ボタン23は、例えば、タッチパネルで実現されるもの、又は物理的な押しボタンである。ボタン13は、それ以外の任意のものであってもよい。
Bluetooth通信部24、音声認識部25、翻訳部26、切替検出部27、制御部28及び出力部29の機能は、情報端末20が備える、プロセッサ、メモリ及び通信モジュール等のハードウェアによって実現される。
Bluetooth通信部24は、近距離無線通信であるBluetoothによって他の装置との間で通信を行う機能部である。Bluetooth通信部14は、Bluetoothデバイス10との間で音声データの送受信を行う。Bluetooth通信部24は、Bluetoothデバイス10側で設定された通信モードで通信を行う。Bluetooth通信部24は、Bluetoothデバイス10との間のHFPの通信モード(状態)を監視し、通信モードの変化があった場合に、通信モードがSCOであるか、あるいはACLであるかを識別する。Bluetooth通信部24による通信モードの監視及び識別は、従来の方法によって瞬時に行うことができる。Bluetooth通信部24は、識別した通信モードでBluetoothデバイス10と通信を行う。また、Bluetooth通信部24は、識別した通信モードを切替検出部27に通知する。
Bluetooth通信部24は、HFPの通信モード(HFPの状態)がSCOに設定されている際には、Bluetoothデバイス10から送信される音声データを受信して音声認識部25に出力する。また、Bluetooth通信部24は、HFPの通信モードがACLに設定されている際には、出力部29から音声データを入力してBluetoothデバイス10に送信する。
音声認識部25は、音声データに対して音声認識を行う機能部である。音声認識部25は、Bluetooth通信部24を介してBluetoothデバイス10から音声データを受信して、受信した音声データに対して音声認識を行う。また、音声認識部25は、マイク21から音声データを入力して、入力した音声データに対して音声認識を行う。
音声認識部25による音声認識自体は、従来の方法等で行うことができる。なお、音声認識は、情報端末20内のみで行われる必要はなく、外部の装置が用いられて行われてもよい。例えば、音声認識部25は、情報端末20が備える移動体通信機能等のネットワーク接続機能によって、音声認識を行うサーバ(図示せず)に音声認識の対象の音声データを送信し、当該サーバから音声認識の結果であるテキストを受信してもよい。
音声認識部25による音声認識において、Bluetoothデバイス10からの音声データ及びマイク21からの音声データそれぞれに対して、音声認識を行う言語(例えば、日本語、英語)が予め設定されている。これらの言語は、互いに異なる言語であり、例えば、翻訳の前後の言語である。音声認識の結果のテキストは、設定された言語のテキストとなる。音声認識部25は、音声認識の結果であるテキストを翻訳部26に出力する。
後述するように、音声認識部25は、制御部28から音声認識のタイミングの制御を受ける。音声認識部25は、制御部28からの制御によって音声認識を行うとされたタイミングで音声認識を行う。
翻訳部26は、音声認識部25による音声認識の結果に対して翻訳を行う機能部である。翻訳部26は、音声認識の結果であるテキストを音声認識部25から入力して、当該テキストに対して翻訳を行う。翻訳部26による翻訳自体は、従来の機械翻訳の方法等で行うことができる。
翻訳部26による翻訳において、翻訳の前後の言語が予め設定されている。翻訳の前後の言語は、翻訳元のテキストがBluetoothデバイス10からの音声データに基づくもの、及びマイク21からの音声データに基づくものそれぞれに対して、設定されている。これらの言語の組は、互いに異なる組であり、例えば、組に含まれる2つの言語は同一であり、一方の翻訳前の言語ともう一方の翻訳後の言語とが同じとなる組である。なお、翻訳も、音声認識と同様に情報端末20内のみで行われる必要はなく、外部の装置が用いられて行われてもよい。翻訳部26は、翻訳の結果であるテキストを出力部29に出力する。
切替検出部27は、Bluetoothデバイス10によって、BluetoothのHFPの通信モードをSCOと、ACLとの間で切り替えられたことを検出する機能部である。切替検出部27は、Bluetooth通信部24によるHFPの通信モードの監視及び識別に基づく通知によって上記の検出を行う。切替検出部27は、通信モードの切り替えを検出したら制御部28にその旨及び切り替えの方向を通知する。
制御部28は、音声認識部25による音声認識の開始及び停止を制御する制御部である。制御部28は、切替検出部27から切り替えに係る通知を受け付ける。HFPの通信モードがACLからSCOに切り替えられたことが切替検出部27によって検出されると、制御部28は、音声認識部25にBluetoothデバイス10からの音声データに対する音声認識を開始(起動)させる。また、HFPの通信モードがSCOからACLに切り替えられたことが切替検出部27によって検出されると、制御部28は、音声認識部25にBluetoothデバイス10からの音声データに対する音声認識を停止させる。
音声認識部25は、上記の制御に応じたタイミングでBluetoothデバイス10からの音声データに対する音声認識を行う。音声認識部25は、Bluetoothデバイス10からの音声データに対する音声認識を停止している際にBluetoothデバイス10以外から音声データを入力して、入力した音声データに対して音声認識を行う。具体的には、音声認識部25は、上述したようにマイク21から音声データを入力して、入力した音声データに対して音声認識を行う。制御部28は、以下のようにマイク21からの音声データに対する音声認識の開始及び停止を制御する。
制御部28は、ユーザから情報端末20に対する操作を受け付ける。制御部28は、当該操作としてボタン23の押下を検出して受け付ける。あるいは、制御部28は、ボタン23の押下状態が、押下されている状態から押下されていない状態に変化したこと、及び押下されていない状態から押下されている状態に変化したことを検出してもよい。
制御部28は、受け付けられたユーザからの操作に応じて、マイク21からの音声データに対する音声認識の開始及び停止を制御する。例えば、制御部28は、ボタン23の押下状態に応じて音声認識の開始及び停止を制御する。切替部16は、ボタン23が押下されている際には、音声認識部25にマイク21からの音声データに対する音声認識を行わせる。切替部16は、ボタン23が押下されていない際には、音声認識部25にマイク21からの音声データに対する音声認識を行わせない。即ち、ボタン23の押下が開始されると、制御部28は、音声認識部25にマイク21からの音声データに対する音声認識を開始させる。ボタン23の押下が終了すると、制御部28は、音声認識部25にマイク21からの音声データに対する音声認識を終了させる。なお、マイク21からの音声データに対する音声認識が行われないタイミングでは、マイク21の機能を停止させることとしてもよい。
出力部29は、音声データを出力する機能部である。出力部29は、音声認識部25による音声認識の結果に応じた音声データとして、翻訳部26による翻訳の結果に応じた音声データを出力する。出力部29は、翻訳部26から翻訳の結果であるテキストを入力する。出力部29は、入力したテキストを音声に変換する音声合成を行って音声データを生成する。出力部29による音声合成自体は、従来の方法等で行うことができる。なお、音声合成も、音声認識及び翻訳と同様に情報端末20内のみで行われる必要はなく、外部の装置が用いられて行われてもよい。
出力部29は、Bluetoothデバイス10以外からの音声データに対する音声認識の結果に応じた音声データを、Bluetooth通信部24を介してACLでBluetoothデバイス10に送信する。具体的には、出力部29は、マイク21から入力された音声データに対応する翻訳の結果のテキストから音声合成して生成した音声データを、Bluetooth通信部24を介してACLでBluetoothデバイス10に送信する。
出力部29は、Bluetoothデバイス10からの音声データに対する音声認識の結果に応じた音声データを、Bluetoothデバイス10以外に出力する。具体的には、出力部29は、Bluetoothデバイス10から入力された音声データに対応する翻訳の結果のテキストから音声合成して生成した音声データを、スピーカ22に出力する。このように出力部29は、音声認識された音声データが、どこから入力されたかに応じて出力する音声データのルート制御を行う。
なお、上述したように通信モードがSCOに設定されている際のみに上り方向の通信が行われるため、その際には下り方向に係る音声データを入力するマイク21の機能を停止させることとしてもよい。また、通信モードがACLに設定されている際のみに下り方向の通信が行われるため、その際には上り方向に係る音声データの音声出力を行うスピーカ22の機能を停止させることとしてもよい。以上が、本実施形態に係る情報端末20の構成である。
引き続いて、図3及び図4のフローチャートを用いて、本実施形態に係る音声認識システム1で実行される処理(音声認識システム1が行う動作方法)を説明する。まず、図3のフローチャートを用いて、本実施形態に係るBluetoothデバイス10で実行される処理を説明する。本処理では、操作受付部15によって、ユーザよるボタン13の押下の検出が行われる(S01)。ボタン13が押下されていた場合(S01のYES)、その時点でBluetooth通信部14のHFPの状態がACLであれば、切替部16によってHFPの状態がSCOに切り替えられる(S02)。その時点でBluetooth通信部14のHFPの状態がSCOであれば、切り替えは行われずSCOが維持される。
続いて、マイク11によって、音声が入力される(S03)。マイク11によって入力された音声データは、Bluetooth通信部14によって、SCOで情報端末20に送信される(S04)。S03において、ユーザの音声である発話が入力されると、後述する情報端末20側の処理によって翻訳された音声となって情報端末20において音声出力される。続いて、S01以降の処理が繰り返される。
S01において、ボタン13が押下されていなかった場合(S01のNO)、その時点でBluetooth通信部14のHFPの状態がSCOであれば、切替部16によってHFPの状態がACLに切り替えられる(S05)。その時点でBluetooth通信部14のHFPの状態がACLであれば、切り替えは行われずACLが維持される。
続いて、Bluetooth通信部14によって、ACLで情報端末20から送信される音声データが受信される(S06)。受信された音声データは、スピーカ12によって音声出力される(S07)。ここで音声出力される音声は、後述する情報端末20側の処理で示されるように、情報端末20のユーザの発話が翻訳されたものである。なお、情報端末20のユーザの発話のタイミングによっては、情報端末20からBluetoothデバイス10への音声データの送信は行われず、音声出力も行われない。続いて、S01以降の処理が繰り返される。以上が、本実施形態に係るBluetoothデバイス10で実行される処理である。
続いて、図4のフローチャートを用いて、本実施形態に係る情報端末20で実行される処理を説明する。本処理では、切替検出部27によって、Bluetooth通信部24のBluetoothデバイス10との間のHFPの状態が監視される(S11)。監視されたHFPの状態がSCOであった場合(S12のYES)、その時点で音声認識部25によるBluetoothデバイス10からの音声データに対する音声認識が停止されていれば(即ち、その前の監視の時点でHFPの状態がACLであったら)、制御部28によって、音声認識部25によるBluetoothデバイス10からの音声データに対する音声認識を開始する制御が行われる(S13)。その時点で既に当該音声認識が開始されていたら、その状態が維持される。
続いて、Bluetooth通信部24によって、SCOでBluetoothデバイス10から送信される音声データが受信される(S14)。続いて、受信された音声データに対して、音声認識部25によって音声認識が行われる(S15)。続いて、翻訳部26によって、音声認識の結果であるテキストに対する翻訳が行われる(S16)。続いて、出力部29によって、翻訳の結果のテキストから音声合成が行われて、音声データが生成される(S17)。続いて、生成された音声データは、スピーカ22によって音声出力される(S18)。S14で入力される音声データは、上述したBluetoothデバイス10側の処理で示されるように、Bluetoothデバイス10のユーザの発話に係るものである。従って、ここで音声出力される音声は、Bluetoothデバイス10のユーザの発話が翻訳されたものである。なお、Bluetoothデバイス10のユーザの発話のタイミングによっては、音声データから音声認識がなされず(音声認識によるテキストが取得されず)、それ以降の処理も行われない。続いて、S11以降の処理が繰り返される。
S12において、監視されたHFPの状態がACLであった場合(S12のNO)、その時点で音声認識部25によるBluetoothデバイス10からの音声データに対する音声認識が開始されていれば(即ち、その前の監視の時点でHFPの状態がSCOであったら)、制御部28によって、音声認識部25によるBluetoothデバイス10からの音声データに対する音声認識を停止する制御が行われる(S19)。その時点で既に当該音声認識が停止されていたら、その状態が維持される。
続いて、制御部28によって、ユーザよるボタン23の押下の検出が行われる(S20)。ボタン23が押下されていなかった場合(S20のNO)、続いて、S11以降の処理が繰り返される。ボタン23が押下されていた場合(S20のYES)、マイク21によって、音声が入力される(S21)。続いて、マイク11によって入力された音声データに対して、音声認識部25によって音声認識が行われる(S22)。続いて、翻訳部26によって、音声認識の結果であるテキストに対する翻訳が行われる(S23)。続いて、出力部29によって、翻訳の結果のテキストから音声合成が行われて、音声データが生成される(S24)。続いて、生成された音声データは、Bluetooth通信部24によって、ACLでBluetoothデバイス10に送信される(S25)。なお、情報端末20のユーザの発話のタイミングによっては、音声データから音声認識がなされず(音声認識によるテキストが取得されず)、それ以降の処理も行われない。続いて、S11以降の処理が繰り返される。以上が、本実施形態に係る情報端末20で実行される処理である。
本実施形態では、Bluetoothデバイス10において通信モードがSCOに切り替えられている際に、情報端末20においてBluetoothデバイス10からの音声データに対する音声認識が行われる。即ち、情報端末20における音声認識を、Bluetoothデバイス10における通信モードの切り替えをトリガとして行うことができる。このように、本実施形態によれば、音声認識のタイミングをBluetoothデバイス10側で制御することができる。従って、本実施形態によれば、適切なタイミングで音声認識を行うことができる。また、本実施形態によれば、通信モードの切り替えによって音声認識の開始及び終了を制御するので、音声認識の開始及び終了を制御するためだけにBluetoothデバイス10と情報端末20との間で送受信される信号を用いる必要がない。
また、本実施形態のように情報端末20において、Bluetoothデバイス10以外(本実施形態では情報端末20のマイク21)から音声データを入力して音声認識を行って、当該音声認識の結果に応じた音声データをACLでBluetoothデバイス10に送信し、Bluetoothデバイス10からの音声データに対する音声認識の結果に応じた音声データをBluetoothデバイス10以外(本実施形態では情報端末20のスピーカ22)に出力することとしてもよい。この構成によれば、例えば、2人のユーザの音声がそれぞれ翻訳される翻訳システムを実現することができる。但し、上記の構成は、翻訳システム以外に用いられてもよい。
また、本発明の実施形態としては、Bluetoothデバイス10以外からの音声データの入力及び音声認識は行われなくてよく、Bluetoothデバイス10からの音声データに対する音声認識のみが行われるものであってもよい。この際、例えば、Bluetoothデバイス10からの音声データに係る翻訳の結果の音声データが、情報端末20からBluetoothデバイス10に送信されて、Bluetoothデバイス10のスピーカ12から音声出力されてもよい。この場合、Bluetoothデバイス10から情報端末20へのユーザの発話に係る音声データの送信は、SCOで行われる。また、情報端末20からBluetoothデバイス10への翻訳の結果に係る音声データの送信は、ユーザがBluetoothデバイス10のボタン13を話した後、ACLで行われる。
また、本実施形態のように音声認識の結果に対して翻訳を行う構成であってもよい。この構成によれば、適切なタイミングで音声認識されたものに対して翻訳を行う翻訳システムを実現することができる。
また、本実施形態のように第1の通信方式及び第2の通信方式として、それぞれSCO、及びSCOよりも通信品質が高いACLを用いることとしてもよい。この構成によれば、SCOによってBluetoothデバイス10から情報端末20に対して確実に音声データを送信することができると共に、Bluetoothデバイス10において音声出力される音声データを、通信品質が高いACLで送信することができる。従って、Bluetoothデバイス10からの音声データに対しては確実に音声認識が行われ、Bluetoothデバイス10では高品質な音声出力が行われる。
なお、上述した実施形態では、近距離無線通信の例をBluetoothとしたが、Bluetooth以外の近距離無線通信によって本発明の実施形態が実現されてもよい。また、第1の通信方式及び第2の通信方式をそれぞれ、SCO及びACLとしたが、第1の通信方式及び第2の通信方式はそれ以外であってもよい。
また、上述した実施形態では、ユーザの操作は、ボタン13,23の押下としたが、必ずしもボタン13,23の押下である必要はなく、通信モードの切り替えのトリガとなり得る操作であればどのようなものであってもよい。
なお、上記実施形態の説明に用いたブロック図の一部は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。たとえば、送信を機能させる機能ブロック(構成部)は、送信部(transmitting unit)や送信機(transmitter)と呼称される。いずれも、上述したとおり、実現方法は特に限定されない。
例えば、本開示の一実施の形態におけるBluetoothデバイス10及び情報端末20は、本開示の方法の処理を行うコンピュータとして機能してもよい。図5は、本開示の一実施の形態に係るBluetoothデバイス10及び情報端末20のハードウェア構成の一例を示す図である。上述のBluetoothデバイス10及び情報端末20は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。Bluetoothデバイス10及び情報端末20のハードウェア構成は、図に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
Bluetoothデバイス10及び情報端末20における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。例えば、上述のBluetoothデバイス10及び情報端末20における各機能は、プロセッサ1001によって実現されてもよい。
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、Bluetoothデバイス10及び情報端末20における各機能は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD−ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu−ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。通信装置1004は、例えば周波数分割複信(FDD:Frequency Division Duplex)及び時分割複信(TDD:Time Division Duplex)の少なくとも一方を実現するために、高周波スイッチ、デュプレクサ、フィルタ、周波数シンセサイザなどを含んで構成されてもよい。例えば、上述のBluetoothデバイス10及び情報端末20における各機能は、通信装置1004によって実現されてもよい。
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
また、Bluetoothデバイス10及び情報端末20は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
情報の通知は、本開示において説明した態様/実施形態に限られず、他の方法を用いて行われてもよい。例えば、情報の通知は、物理レイヤシグナリング(例えば、DCI(Downlink Control Information)、UCI(Uplink Control Information))、上位レイヤシグナリング(例えば、RRC(Radio Resource Control)シグナリング、MAC(Medium Access Control)シグナリング、報知情報(MIB(Master Information Block)、SIB(System Information Block)))、その他の信号又はこれらの組み合わせによって実施されてもよい。また、RRCシグナリングは、RRCメッセージと呼ばれてもよく、例えば、RRC接続セットアップ(RRC Connection Setup)メッセージ、RRC接続再構成(RRC Connection Reconfiguration)メッセージなどであってもよい。
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
以上、本開示について詳細に説明したが、当業者にとっては、本開示が本開示中に説明した実施形態に限定されるものではないということは明らかである。本開示は、請求の範囲の記載により定まる本開示の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本開示の記載は、例示説明を目的とするものであり、本開示に対して何ら制限的な意味を有するものではない。
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
なお、本開示において説明した用語及び本開示の理解に必要な用語については、同一の又は類似する意味を有する用語と置き換えてもよい。例えば、チャネル及びシンボルの少なくとも一方は信号(シグナリング)であってもよい。また、信号はメッセージであってもよい。
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。
本開示で使用する「判断(determining)」、「決定(determining)」という用語は、多種多様な動作を包含する場合がある。「判断」、「決定」は、例えば、判定(judging)、計算(calculating)、算出(computing)、処理(processing)、導出(deriving)、調査(investigating)、探索(looking up、search、inquiry)(例えば、テーブル、データベース又は別のデータ構造での探索)、確認(ascertaining)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、受信(receiving)(例えば、情報を受信すること)、送信(transmitting)(例えば、情報を送信すること)、入力(input)、出力(output)、アクセス(accessing)(例えば、メモリ中のデータにアクセスすること)した事を「判断」「決定」したとみなす事などを含み得る。また、「判断」、「決定」は、解決(resolving)、選択(selecting)、選定(choosing)、確立(establishing)、比較(comparing)などした事を「判断」「決定」したとみなす事を含み得る。つまり、「判断」「決定」は、何らかの動作を「判断」「決定」したとみなす事を含み得る。また、「判断(決定)」は、「想定する(assuming)」、「期待する(expecting)」、「みなす(considering)」などで読み替えられてもよい。
「接続された(connected)」、「結合された(coupled)」という用語、又はこれらのあらゆる変形は、2又はそれ以上の要素間の直接的又は間接的なあらゆる接続又は結合を意味し、互いに「接続」又は「結合」された2つの要素間に1又はそれ以上の中間要素が存在することを含むことができる。要素間の結合又は接続は、物理的なものであっても、論理的なものであっても、或いはこれらの組み合わせであってもよい。例えば、「接続」は「アクセス」で読み替えられてもよい。本開示で使用する場合、2つの要素は、1又はそれ以上の電線、ケーブル及びプリント電気接続の少なくとも一つを用いて、並びにいくつかの非限定的かつ非包括的な例として、無線周波数領域、マイクロ波領域及び光(可視及び不可視の両方)領域の波長を有する電磁エネルギーなどを用いて、互いに「接続」又は「結合」されると考えることができる。
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
1…音声認識システム、10…Bluetoothデバイス、11…マイク、12…スピーカ、13…ボタン、14…Bluetooth通信部、15…操作受付部、16…切替部、20…情報端末、21…マイク、22…スピーカ、23…ボタン、24…Bluetooth通信部、25…音声認識部、26…翻訳部、27…切替検出部、28…制御部、29…出力部、1001…プロセッサ、1002…メモリ、1003…ストレージ、1004…通信装置、1005…入力装置、1006…出力装置、1007…バス。

Claims (7)

  1. マイクを備える近距離無線通信デバイスと、当該近距離無線通信デバイスとの間で近距離無線通信によって音声データを送受信する情報端末とを含む音声認識システムであって、
    前記近距離無線通信デバイスは、
    ユーザからの操作を受け付ける操作受付部と、
    前記操作受付部によって受け付けられたユーザからの操作に応じて、近距離無線通信の通信方式を第1の通信方式と、第1の通信方式とは異なる第2の通信方式との間で切り替える切替部と、
    前記マイクによって入力された音声データを前記第1の通信方式で前記情報端末に送信する送信部と、を備え、
    前記情報端末は、
    前記近距離無線通信デバイスから音声データを受信して、受信した音声データに対して音声認識を行う音声認識部と、
    前記近距離無線通信デバイスによって、近距離無線通信の通信方式が前記第1の通信方式と、前記第2の通信方式との間で切り替えられたことを検出する切替検出部と、
    前記第1の通信方式に切り替えられたことが前記切替検出部によって検出されると前記音声認識部に前記近距離無線通信デバイスからの音声データに対する音声認識を開始させ、前記第2の通信方式に切り替えられたことが前記切替検出部によって検出されると前記音声認識部に前記近距離無線通信デバイスからの音声データに対する音声認識を停止させる制御部と、を備える音声認識システム。
  2. 前記情報端末は、
    音声データを出力する出力部を更に備え、
    前記音声認識部は、前記近距離無線通信デバイスからの音声データに対する音声認識を停止している際に前記近距離無線通信デバイス以外から音声データを入力して、入力した音声データに対して音声認識を行い、
    前記出力部は、前記近距離無線通信デバイス以外からの音声データに対する音声認識の結果に応じた音声データを前記第2の通信方式で前記近距離無線通信デバイスに送信し、前記近距離無線通信デバイスからの音声データに対する音声認識の結果に応じた音声データを前記近距離無線通信デバイス以外に出力する、請求項1に記載の音声認識システム。
  3. 前記情報端末は、
    前記音声認識部による音声認識の結果に対して翻訳を行う翻訳部を更に備え、
    前記出力部は、前記音声認識部による音声認識の結果に応じた音声データとして、前記翻訳部による翻訳の結果に応じた音声データを出力する、請求項2に記載の音声認識システム。
  4. 前記第2の通信方式は、前記第1の通信方式よりも通信品質が高い請求項1〜3の何れか一項に記載の音声認識システム。
  5. 前記近距離無線通信は、Bluetoothによる通信であり、第1の通信方式は、SCOであり、第2の通信方式は、ACLである請求項4に記載の音声認識システム。
  6. マイクを備える近距離無線通信デバイスと、当該近距離無線通信デバイスとの間で近距離無線通信によって音声データを送受信する情報端末とを含む音声認識システムに含まれる近距離無線通信デバイスであって、
    ユーザからの操作を受け付ける操作受付部と、
    前記操作受付部によって受け付けられたユーザからの操作に応じて、近距離無線通信の通信方式を第1の通信方式と、第1の通信方式とは異なる第2の通信方式との間で切り替える切替部と、
    前記マイクによって入力された音声データを前記第1の通信方式で前記情報端末に送信する送信部と、
    を備える近距離無線通信デバイス。
  7. マイクを備える近距離無線通信デバイスと、当該近距離無線通信デバイスとの間で近距離無線通信によって音声データを送受信する情報端末とを含む音声認識システムに含まれる情報端末であって、
    前記近距離無線通信デバイスから音声データを受信して、受信した音声データに対して音声認識を行う音声認識部と、
    前記近距離無線通信デバイスによって、近距離無線通信の通信方式が第1の通信方式と、第1の通信方式とは異なる第2の通信方式との間で切り替えられたことを検出する切替検出部と、
    前記第1の通信方式に切り替えられたことが前記切替検出部によって検出されると前記音声認識部に前記近距離無線通信デバイスからの音声データに対する音声認識を開始させ、前記第2の通信方式に切り替えられたことが前記切替検出部によって検出されると前記音声認識部に前記近距離無線通信デバイスからの音声データに対する音声認識を停止させる制御部と、
    を備える情報端末。
JP2019072125A 2019-04-04 2019-04-04 音声認識システム、近距離無線通信デバイス及び情報端末 Pending JP2020170112A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2019072125A JP2020170112A (ja) 2019-04-04 2019-04-04 音声認識システム、近距離無線通信デバイス及び情報端末

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2019072125A JP2020170112A (ja) 2019-04-04 2019-04-04 音声認識システム、近距離無線通信デバイス及び情報端末

Publications (1)

Publication Number Publication Date
JP2020170112A true JP2020170112A (ja) 2020-10-15

Family

ID=72745369

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2019072125A Pending JP2020170112A (ja) 2019-04-04 2019-04-04 音声認識システム、近距離無線通信デバイス及び情報端末

Country Status (1)

Country Link
JP (1) JP2020170112A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112492442A (zh) * 2020-11-24 2021-03-12 江苏紫米电子技术有限公司 一种蓝牙耳机的连接切换方法、装置、设备及存储介质

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112492442A (zh) * 2020-11-24 2021-03-12 江苏紫米电子技术有限公司 一种蓝牙耳机的连接切换方法、装置、设备及存储介质

Similar Documents

Publication Publication Date Title
US20210294565A1 (en) Changing companion communication device behavior based on status of wearable device
US11800002B2 (en) Audio data routing between multiple wirelessly connected devices
EP3920507B1 (en) Wireless audio output devices
CN103760969A (zh) 移动终端及语音控制应用程序的方法
CN110290441B (zh) 一种无线耳机控制方法、装置及无线耳机和存储介质
JP2020170112A (ja) 音声認識システム、近距離無線通信デバイス及び情報端末
US11303746B2 (en) Terminal apparatus that displays which communication system is available from multiple communication systems being used
WO2020054244A1 (ja) 対話情報生成装置
US10778674B2 (en) Voice authentication and setup for wireless media rendering system
JP2018056688A (ja) 携帯端末、電子機器、及びプログラム
JP7572890B2 (ja) 通信制御装置
CN116321084A (zh) 蓝牙通信方法、装置、电子设备及计算机可读介质
JP2019161260A (ja) 通信制御システム
JP2022090799A (ja) 通信装置
KR101945174B1 (ko) Ptt 통신 서비스를 실행하기 위한 기록매체에 저장된 프로그램
WO2024001134A1 (zh) 音频设备的连接方法、装置、存储介质及设备
CN211959480U (zh) 一种软硬件分离式声控蓝牙耳机
JP2024102368A (ja) 通信制御装置および通信制御方法
CN114786158A (zh) 双模蓝牙设备及蓝牙连接方法
KR101986197B1 (ko) 사용자 입력 패턴에 따른 스마트 단말기의 출력 설정 시스템
JP2020088818A (ja) 呼制御システム
CN104301512A (zh) 电子设备及信息处理方法