CN108538289A - 基于蓝牙实现语音遥控的方法、装置和终端设备 - Google Patents
基于蓝牙实现语音遥控的方法、装置和终端设备 Download PDFInfo
- Publication number
- CN108538289A CN108538289A CN201810183350.4A CN201810183350A CN108538289A CN 108538289 A CN108538289 A CN 108538289A CN 201810183350 A CN201810183350 A CN 201810183350A CN 108538289 A CN108538289 A CN 108538289A
- Authority
- CN
- China
- Prior art keywords
- telecommand
- character information
- character
- bluetooth
- remote control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000005540 biological transmission Effects 0.000 claims description 9
- 108010001267 Protein Subunits Proteins 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000004891 communication Methods 0.000 description 14
- 230000006854 communication Effects 0.000 description 14
- 230000006870 function Effects 0.000 description 14
- 238000010586 diagram Methods 0.000 description 8
- 241000207961 Sesamum Species 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000004064 recycling Methods 0.000 description 3
- 238000003384 imaging method Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 244000283207 Indigofera tinctoria Species 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000007175 bidirectional communication Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 238000009434 installation Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
- Telephone Function (AREA)
- Selective Calling Equipment (AREA)
Abstract
本发明揭示了一种基于蓝牙实现语音遥控的方法、装置和终端设备,所述方法包括以下步骤:接收蓝牙设备发送的语音信息;将语音信息发送给语音识别服务器,以使语音识别服务器将语音信息识别为字符信息;接收语音识别服务器返回的字符信息,并将字符信息与指令数据库中的遥控指令进行匹配;当字符信息与其中一个遥控指令匹配成功时,执行遥控指令。从而,通过利用现有的语音识别服务器在线上对语音信息进行识别,利用终端设备强大的运算能力在本地对识别结果进行遥控指令匹配,无需预置训练成本较高的特征数据库,大大降低了语音遥控的实现成本,同时用户可以自定义设置遥控指令,根据需要扩展新的遥控指令,提高了语音遥控的灵活性。
Description
技术领域
本发明涉及通信技术领域,特别是涉及到一种基于蓝牙实现语音遥控的方法、装置和终端设备。
背景技术
蓝牙耳机可以与移动终端建立蓝牙连接,并对移动终端进行控制。传统的控制方式是采用按键控制,用户通过按压蓝牙耳机的按键来向移动终端发送指令,移动终端则执行指令,从而实现蓝牙自拍等简单的功能。但这种控制方式功能单一,如果要扩展功能则需要增加蓝牙的按键数量,从而增加蓝牙耳机的成本体积。
现有技术中提出了一种通过蓝牙对移动终端进行语音遥控的方法,用户只需对蓝牙耳机发出语音,就能对移动终端进行控制,解放了用户的双手,且无需在蓝牙耳机上设置按键。其实现方式是由厂家预先进行遥控指令的识别训练,生成特征数据库,并将特征数据库存储在蓝牙耳机侧或移动终端侧,当用户发出语音指令时,则通过特征数据库对语音指令进行识别,识别出对应的遥控指令并予以执行。
然而,遥控指令识别训练的成本较高,故语音遥控的实现成本较高。而且遥控指令只能由厂家定制,用户无法自行修改或扩展,灵活性较差。
发明内容
本发明的主要目的为提供一种基于蓝牙实现语音遥控的方法、装置和终端设备,旨在降低语音遥控的实现成本,增强语音遥控的灵活性。
为达以上目的,本发明实施例提出一种基于蓝牙实现语音遥控的方法,所述方法包括以下步骤:
接收蓝牙设备发送的语音信息;
将所述语音信息发送给语音识别服务器,以使所述语音识别服务器将所述语音信息识别为字符信息;
接收所述语音识别服务器返回的所述字符信息,并将所述字符信息与指令数据库中的遥控指令进行匹配;
当所述字符信息与其中一个遥控指令匹配成功时,执行所述遥控指令。
可选地,所述遥控指令包括呼唤口令和控制命令。
可选地,所述将所述字符信息与指令数据库中的遥控指令进行匹配的步骤包括:
将所述字符信息与所述遥控指令的呼唤口令进行匹配;
当匹配成功时,将所述字符信息与所述遥控指令的控制命令进行匹配;
当匹配成功时,判定所述字符信息与所述遥控指令匹配成功。
可选地,所述将所述字符信息与所述遥控指令的呼唤口令进行匹配的步骤包括:
将所述字符信息与所述呼唤口令进行比对;
判断所述字符信息中是否包含与所述呼唤口令相同的字符;
若是,则判定所述字符信息与所述呼唤口令匹配成功。
可选地,所述将所述字符信息与所述遥控指令的控制命令进行匹配的步骤包括:
滤除所述字符信息中与所述呼唤口令相同的字符,将剩下的字符与所述控制命令进行比对;
判断所述剩下的字符与所述控制命令的匹配度是否超过第一阈值;
当匹配度超过第一阈值时,判定所述字符信息与所述控制命令匹配成功。
可选地,所述呼唤口令由至少两组重复的字符组成。
可选地,所述控制命令中不存在重复的字符。
可选地,所述控制命令的字符数量不超过第二阈值。
可选地,所述第二阈值的取值范围为4-6。
可选地,每个遥控指令的呼唤口令相同。
本发明实施例同时提出一种基于蓝牙实现语音遥控的装置,所述装置包括:
接收模块,用于接收蓝牙设备发送的语音信息;
发送模块,用于将所述语音信息发送给语音识别服务器,以使所述语音识别服务器将所述语音信息识别为字符信息;
匹配模块,用于接收所述语音识别服务器返回的所述字符信息,并将所述字符信息与指令数据库中的遥控指令进行匹配;
执行模块,用于当所述字符信息与其中一个遥控指令匹配成功时,执行所述遥控指令。
可选地,所述匹配模块包括:
第一匹配单元,用于将所述字符信息与所述遥控指令的呼唤口令进行匹配;
第二匹配单元,用于当所述字符信息与所述呼唤口令匹配成功时,将所述字符信息与所述遥控指令的控制命令进行匹配;
判决单元,用于当所述字符信息与所述控制命令匹配成功时,判定所述字符信息与所述遥控指令匹配成功。
可选地,所述第一匹配单元包括:
第一比对子单元,用于将所述字符信息与所述呼唤口令进行比对;
第一判断子单元,用于判断所述字符信息中是否包含与所述呼唤口令相同的字符;
第一判定子单元,用于当所述字符信息中包含与所述呼唤口令相同的字符时,则判定所述字符信息与所述呼唤口令匹配成功。
可选地,所述第二匹配单元包括:
第二比对子单元,用于滤除所述字符信息中与所述呼唤口令相同的字符,将剩下的字符与所述控制命令进行比对;
第二判断子单元,用于判断所述剩下的字符与所述控制命令的匹配度是否超过第一阈值;
第二判定子单元,用于当所述剩下的字符与所述控制命令的匹配度超过第一阈值时,判定所述字符信息与所述控制命令匹配成功。
本发明实施例同时提出一种终端设备,其包括存储器、处理器和至少一个被存储在存储器中并被配置为由处理器执行的应用程序,所述应用程序被配置为用于执行前述基于蓝牙实现语音遥控的方法。
本发明实施例所提供的一种基于蓝牙实现语音遥控的方法,通过利用现有的语音识别服务器在线上对语音信息进行识别,再利用终端设备强大的运算能力在本地对识别结果进行遥控指令匹配,当匹配成功时则执行匹配上的遥控指令。从而无需预置训练成本较高的特征数据库,大大降低了语音遥控的实现成本。同时,用户可以自定义设置遥控指令,根据需要扩展新的遥控指令,提高了语音遥控的灵活性,扩展了终端设备与蓝牙设备的交互功能,提升了用户体验。
附图说明
图1是本发明基于蓝牙实现语音遥控的方法第一实施例的流程图;
图2是本发明实施例中终端设备中预置的遥控指令的示意图;
图3是本发明基于蓝牙实现语音遥控的方法第二实施例的流程图;
图4是本发明基于蓝牙实现语音遥控的装置第一实施例的模块示意图;
图5是图4中匹配模块的模块示意图;
图6是图5中第一匹配单元的模块示意图;
图7是图5中第二匹配单元的模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,这里所使用的“终端”、“终端设备”既包括无线信号接收器的设备,其仅具备无发射能力的无线信号接收器的设备,又包括接收和发射硬件的设备,其具有能够在双向通信链路上,执行双向通信的接收和发射硬件的设备。这种设备可以包括:蜂窝或其他通信设备,其具有单线路显示器或多线路显示器或没有多线路显示器的蜂窝或其他通信设备;PCS(Personal Communications Service,个人通信系统),其可以组合语音、数据处理、传真和/或数据通信能力;PDA(Personal Digital Assistant,个人数字助理),其可以包括射频接收器、寻呼机、互联网/内联网访问、网络浏览器、记事本、日历和/或GPS(Global Positioning System,全球定位系统)接收器;常规膝上型和/或掌上型计算机或其他设备,其具有和/或包括射频接收器的常规膝上型和/或掌上型计算机或其他设备。这里所使用的“终端”、“终端设备”可以是便携式、可运输、安装在交通工具(航空、海运和/或陆地)中的,或者适合于和/或配置为在本地运行,和/或以分布形式,运行在地球和/或空间的任何其他位置运行。这里所使用的“终端”、“终端设备”还可以是通信终端、上网终端、音乐/视频播放终端,例如可以是PDA、MID(Mobile Internet Device,移动互联网设备)和/或具有音乐/视频播放功能的移动电话,也可以是智能电视、机顶盒等设备。
本技术领域技术人员可以理解,这里所使用的服务器,其包括但不限于计算机、网络主机、单个网络服务器、多个网络服务器集或多个服务器构成的云。在此,云由基于云计算(Cloud Computing)的大量计算机或网络服务器构成,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。本发明的实施例中,服务器、终端设备与WNS服务器之间可通过任何通信方式实现通信,包括但不限于,基于3GPP、LTE、WIMAX的移动通信、基于TCP/IP、UDP协议的计算机网络通信以及基于蓝牙、红外传输标准的近距无线传输方式。
本发明实施例基于蓝牙实现语音遥控的方法主要应用于终端设备,特别是手机、平板等移动终端,当然也可以应用于其它的电子设备,如电视、空调、冰箱等智能家居设备,本发明对此不作限定。以下以应用于终端设备为例进行详细说明。
参照图1,提出本发明基于蓝牙实现语音遥控的方法一实施例,所述方法包括以下步骤:
S11、接收蓝牙设备发送的语音信息。
本发明实施例中,蓝牙设备主要指蓝牙耳机,当然也可以是其它具有声音采集和蓝牙传输功能的电子设备,本发明对此不作限定。
本发明实施例中,蓝牙设备与终端设备建立蓝牙连接,包括ACL(AsynchronousConnectionless,异步无连接)和SCO(Synchronous Connection Oriented,同步定向连接)的两个连接链路。蓝牙设备采集用户的语音信息,并以PCM(Pulse Code Modulation,脉冲编码调制)码流的形式通过SCO链路将语音信息发送给终端设备,终端设备通过SCO链路接收语音信息。
S12、将语音信息发送给语音识别服务器,以使语音识别服务器将语音信息识别为字符信息。
本发明实施例中,终端设备基于移动通信网络(如4G网络)、WIFI网络等与语音识别服务器建立通信连接,通过HTTP向语音识别服务器发送语音信息,请求语音识别服务器对该语音信息进行语音识别,语音识别服务器则将语音信息识别为字符信息,并将字符信息返回给终端设备。
所述语音识别服务器可以是谷歌语音识别引擎、微软语音识别引擎、IBM语音识别引擎、Nuance语音识别引擎、讯飞语音识别引擎、百度语音识别引擎等,它们支持多种语言的识别,如英语、日语、德语、汉语等。
S13、接收语音识别服务器返回的字符信息,并将字符信息与指令数据库中的遥控指令进行匹配。
本发明实施例中,终端设备中预置了指令数据库,指令数据库中包括多个遥控指令,所述遥控指令可以是出厂预置的,也可以由用户自定义设置。
本发明实施例中的遥控指令,包括呼唤口令和控制命令,通常呼唤口令在前控制命令在后,当然也可以反过来。加入呼唤口令的目的,是为了避免将用户说话的语音当作语音指令,防止误操作。本发明实施例中,每个遥控指令的呼唤口令都是相同的,当然在其它实施例中,各个遥控指令的呼唤口令也可以不相同。在其它实施例中,遥控指令也可以只包括控制命令。
呼唤口令优选由至少两组重复的字符组成,既增加了与平常的语音的区分度,提高了识别度,又便于用户记忆和发声。例如,将呼唤口令设置为“芝麻芝麻”、“小沃小沃”、“小强小强”、“hello hello”等等。
控制命令中优选不存在重复的字符,以尽量简化,并增加与呼唤口令的区分度。控制命令尽量简短,字符数量优选不超过第二阈值,第二阈值的取值范围优选为4-6个,即字符数量不超过4-6个。
如图2所示,指令数据库中包括遥控指令1、遥控指令2、……、遥控指令N共N个遥控指令,每个遥控指令的呼唤口令都是“芝麻芝麻”,控制命令则各不相同,包括“拍照”、“录音”、“摄像”、“对讲”、“传图片”、“播放音乐”、“打电话”、“停止”、“关机”等。终端设备将指令数据库中的“拍照”、摄像”、“录音”、“播放音乐”、“对讲”、“打电话”、“停止”、“关机”等控制命令分别与摄像头、麦克风、音频设备、喇叭、送话器等的启动、关闭控制以及电源管理的关闭操作建立一一对应的地址索引关系。
如图3所示,本发明实施例中,终端设备将字符信息与指令数据库中的遥控指令进行匹配的具体流程如下:
S131、将字符信息与遥控指令的呼唤口令进行匹配。当匹配成功时,进入下一步骤S132;当匹配失败时,进入步骤S134。
本发明实施例中,终端设备将字符信息与呼唤口令进行逐个字符比对,判断字符信息中是否包含与呼唤口令相同的字符,若是,则判定字符信息与呼唤口令匹配成功,否则判定匹配失败。
例如,呼唤口令为“芝麻芝麻”,如果字符信息中包含“芝麻芝麻”四个字符,则判定字符信息与呼唤口令匹配成功。
S132、将字符信息与遥控指令的控制命令进行匹配。当匹配成功时,进入步骤S133;当匹配失败时,进入步骤S134。
本发明实施例中,终端设备滤除字符信息中与呼唤口令相同的字符,将剩下的字符与控制命令进行逐个字符比对,判断剩下的字符与控制命令的匹配度(相似度)是否超过第一阈值,当匹配度超过第一阈值时,判定字符信息与控制命令匹配成功,否则判定匹配失败。第一阈值可以根据实际需要设定,可以设定在50%-70%之间,如设定为50%。
S133、判定字符信息与遥控指令匹配成功。
当字符信息与遥控指令的呼唤口令和控制命令都匹配成功时,则判定字符信息与该遥控指令匹配成功。
S134、判定字符信息与遥控指令匹配失败。
当字符信息与遥控指令的呼唤口令或控制命令匹配失败时,则判定字符信息与该遥控指令匹配失败。
终端设备将字符信息分别与各个遥控指令进行匹配。当每个遥控指令的呼唤口令相同时,终端设备只需将字符信息与首个遥控指令的呼唤口令相匹配;当匹配成功时,后续则无需再匹配呼唤口令,直接与控制命令进行匹配,直到与某个遥控指令匹配成功或遍历完所有的遥控指令为止;当匹配失败时,则不再与其它遥控指令,直接判定没有与字符信息相匹配的遥控指令。当每个遥控指令的呼唤口令各不相同时,则需要分别与各个遥控指令的呼唤口令和控制命令相匹配,直到与某个遥控指令匹配成功或遍历完所有的遥控指令为止。
S14、当字符信息与其中一个遥控指令匹配成功时,执行该遥控指令。
本发明实施例中,当字符信息与其中一个遥控指令匹配成功时,终端设备则执行该遥控指令的控制命令,如拍照、录音、摄像、对讲、传图片、播放音乐、打电话等。
当遥控指令是对讲时,蓝牙设备与终端设备的语音上行链路通过SCO链路传输,蓝牙设备与终端设备的语音下行链路通过ACL链路传输,实现蓝牙设备与终端设备全双工语音对讲功能。
当遥控指令是与蓝牙设备交互通信等内容时,比如传输图片、音频、视频等流媒体,终端设备则将图片、音频、视频等流媒体通过ACL链路传输给蓝牙设备,比如拨打电话,终端设备则通过SCO链路实现通话。
当遥控指令是终端设备与蓝牙设备停止交互时,终端设备则关闭对应的功能,比如录音、摄像、传图片、对讲等连续时间功能的停止。
本发明实施例基于蓝牙实现语音遥控的方法,在具体实施时,可以在终端设备上安装一个特定的应用(APP),用户可以在应用上进行遥控指令的自定义设置,终端设备根据用户操作通过应用设置遥控指令并存储,并通过应用执行前述基于蓝牙实现语音遥控的方法。
本发明实施例基于蓝牙实现语音遥控的方法,通过利用现有的语音识别服务器在线上对语音信息进行识别,再利用终端设备强大的运算能力在本地对识别结果进行遥控指令匹配,当匹配成功时则执行匹配上的遥控指令。从而无需预置训练成本较高的特征数据库,大大降低了语音遥控的实现成本。同时,用户可以自定义设置遥控指令,根据需要扩展新的遥控指令,提高了语音遥控的灵活性。
参照图4,提出本发明基于蓝牙实现语音遥控的装置,所述装置包括接收模块10、发送模块20、匹配模块30和执行模块40,其中:接收模块10,用于接收蓝牙设备发送的语音信息;发送模块20,用于将语音信息发送给语音识别服务器,以使语音识别服务器将语音信息识别为字符信息;匹配模块30,用于接收语音识别服务器返回的字符信息,并将字符信息与指令数据库中的遥控指令进行匹配;执行模块40,用于当字符信息与其中一个遥控指令匹配成功时,执行遥控指令。
本发明实施例中,蓝牙设备采集用户的语音信息,并以PCM码流的形式通过SCO链路将语音信息发送给装置,装置的接收模块10通过SCO链路接收语音信息。
本发明实施例中,发送模块20通过HTTP向语音识别服务器发送语音信息,请求语音识别服务器对该语音信息进行语音识别,语音识别服务器则将语音信息识别为字符信息,并将字符信息返回给装置。
本发明实施例中,终端设备中预置了指令数据库,指令数据库中包括多个遥控指令,所述遥控指令可以是出厂预置的,也可以由用户自定义设置。
本发明实施例中的遥控指令,包括呼唤口令和控制命令,通常呼唤口令在前控制命令在后,当然也可以反过来。加入呼唤口令的目的,是为了避免将用户说话的语音当作语音指令,防止误操作。本发明实施例中,每个遥控指令的呼唤口令都是相同的,当然在其它实施例中,各个遥控指令的呼唤口令也可以不相同。在其它实施例中,遥控指令也可以只包括控制命令。
呼唤口令优选由至少两组重复的字符组成,既增加了与平常的语音的区分度,提高了识别度,又便于用户记忆和发声。例如,将呼唤口令设置为“芝麻芝麻”、“小沃小沃”、“小强小强”、“hello hello”等等。
控制命令中优选不存在重复的字符,以尽量简化,并增加与呼唤口令的区分度。控制命令尽量简短,字符数量优选不超过第二阈值,第二阈值的取值范围优选为4-6个,即字符数量不超过4-6个。
如图2所示,指令数据库中包括遥控指令1、遥控指令2、……、遥控指令N共N个遥控指令,每个遥控指令的呼唤口令都是“芝麻芝麻”,控制命令则各不相同,包括“拍照”、“录音”、“摄像”、“对讲”、“传图片”、“播放音乐”、“打电话”、“停止”、“关机”等。终端设备将指令数据库中的“拍照”、摄像”、“录音”、“播放音乐”、“对讲”、“打电话”、“停止”、“关机”等控制命令分别与摄像头、麦克风、音频设备、喇叭、送话器等的启动、关闭控制以及电源管理的关闭操作建立一一对应的地址索引关系。
本发明实施例中,匹配模块30如图5所示,包括第一匹配单元31、第二匹配单元32和判决单元33,其中:第一匹配单元31,用于将字符信息与遥控指令的呼唤口令进行匹配;第二匹配单元32,用于当字符信息与所述呼唤口令匹配成功时,将字符信息与遥控指令的控制命令进行匹配;判决单元33,用于当字符信息与控制命令匹配成功时,判定字符信息与遥控指令匹配成功。
如图6所示,第一匹配单元31包括第一比对单元、第一判断单元和第一判定单元,其中:第一比对子单元311,用于将字符信息与呼唤口令进行逐个字符比对;第一判断子单元312,用于判断字符信息中是否包含与呼唤口令相同的字符;第一判定子单元313,用于当字符信息中包含与呼唤口令相同的字符时,则判定字符信息与呼唤口令匹配成功,否则判定匹配失败。
如图7所示,第二匹配单元32包括第二比对子单元321、第二判断子单元322和第二判定子单元323,其中:第二比对子单元321,用于滤除字符信息中与呼唤口令相同的字符,将剩下的字符与控制命令进行逐个字符比对;第二判断子单元322,用于判断剩下的字符与控制命令的匹配度(相似度)是否超过第一阈值;第二判定子单元323,用于当剩下的字符与控制命令的匹配度超过第一阈值时,判定字符信息与控制命令匹配成功,否则判定匹配失败。第一阈值可以根据实际需要设定,可以设定在50%-70%之间,如设定为50%。
当字符信息与遥控指令的呼唤口令和控制命令都匹配成功时,判决单元33则判定字符信息与该遥控指令匹配成功。当字符信息与遥控指令的呼唤口令或控制命令匹配失败时,判决单元33则判定字符信息与该遥控指令匹配失败。
匹配模块30将字符信息分别与各个遥控指令进行匹配。当每个遥控指令的呼唤口令相同时,匹配模块30只需将字符信息与首个遥控指令的呼唤口令相匹配;当匹配成功时,后续则无需再匹配呼唤口令,直接与控制命令进行匹配,直到与某个遥控指令匹配成功或遍历完所有的遥控指令为止;当匹配失败时,则不再与其它遥控指令,直接判定没有与字符信息相匹配的遥控指令。当每个遥控指令的呼唤口令各不相同时,匹配模块30则需要分别与各个遥控指令的呼唤口令和控制命令相匹配,直到与某个遥控指令匹配成功或遍历完所有的遥控指令为止。
本发明实施例中,当字符信息与其中一个遥控指令匹配成功时,执行模块40则执行该遥控指令的控制命令,如拍照、录音、摄像、对讲、传图片、播放音乐、打电话等。
当遥控指令是对讲时,执行模块40与蓝牙设备的语音上行链路通过SCO链路传输,执行模块40与蓝牙设备的语音下行链路通过ACL链路传输,实现蓝牙设备与终端设备全双工语音对讲功能。
当遥控指令是与蓝牙设备交互通信等内容时,比如传输图片、音频、视频等流媒体,执行模块40则将图片、音频、视频等流媒体通过ACL链路传输给蓝牙设备,比如拨打电话,执行模块40则通过SCO链路实现通话。
当遥控指令是终端设备与蓝牙设备停止交互时,执行模块40则关闭对应的功能,比如录音、摄像、传图片、对讲等连续时间功能的停止。
本发明实施例基于蓝牙实现语音遥控的装置,通过利用现有的语音识别服务器在线上对语音信息进行识别,再利用终端设备强大的运算能力在本地对识别结果进行遥控指令匹配,当匹配成功时则执行匹配上的遥控指令。从而无需预置训练成本较高的特征数据库,大大降低了语音遥控的实现成本。同时,用户可以自定义设置遥控指令,根据需要扩展新的遥控指令,提高了语音遥控的灵活性。
本发明同时提出一种终端设备,其包括存储器、处理器和至少一个被存储在存储器中并被配置为由处理器执行的应用程序,所述应用程序被配置为用于执行前述基于蓝牙实现语音遥控的方法。所述方法包括以下步骤:接收蓝牙设备发送的语音信息;将语音信息发送给语音识别服务器,以使语音识别服务器将语音信息识别为字符信息;接收语音识别服务器返回的字符信息,并将字符信息与指令数据库中的遥控指令进行匹配;当字符信息与其中一个遥控指令匹配成功时,执行遥控指令。本实施例中所描述的基于蓝牙实现语音遥控的方法为本发明中上述实施例所涉及的基于蓝牙实现语音遥控的方法,在此不再赘述。
本领域技术人员可以理解,本发明包括涉及用于执行本申请中所述操作中的一项或多项的设备。这些设备可以为所需的目的而专门设计和制造,或者也可以包括通用计算机中的已知设备。这些设备具有存储在其内的计算机程序,这些计算机程序选择性地激活或重构。这样的计算机程序可以被存储在设备(例如,计算机)可读介质中或者存储在适于存储电子指令并分别耦联到总线的任何类型的介质中,所述计算机可读介质包括但不限于任何类型的盘(包括软盘、硬盘、光盘、CD-ROM、和磁光盘)、ROM(Read-Only Memory,只读存储器)、RAM(Random Access Memory,随机存储器)、EPROM(Erasable Programmable Read-Only Memory,可擦写可编程只读存储器)、EEPROM(Electrically Erasable ProgrammableRead-Only Memory,电可擦可编程只读存储器)、闪存、磁性卡片或光线卡片。也就是,可读介质包括由设备(例如,计算机)以能够读的形式存储或传输信息的任何介质。
本技术领域技术人员可以理解,可以用计算机程序指令来实现这些结构图和/或框图和/或流图中的每个框以及这些结构图和/或框图和/或流图中的框的组合。本技术领域技术人员可以理解,可以将这些计算机程序指令提供给通用计算机、专业计算机或其他可编程数据处理方法的处理器来实现,从而通过计算机或其他可编程数据处理方法的处理器来执行本发明公开的结构图和/或框图和/或流图的框或多个框中指定的方案。
本技术领域技术人员可以理解,本发明中已经讨论过的各种操作、方法、流程中的步骤、措施、方案可以被交替、更改、组合或删除。进一步地,具有本发明中已经讨论过的各种操作、方法、流程中的其他步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。进一步地,现有技术中的具有与本发明中公开的各种操作、方法、流程中的步骤、措施、方案也可以被交替、更改、重排、分解、组合或删除。
以上所述仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于蓝牙实现语音遥控的方法,其特征在于,包括以下步骤:
接收蓝牙设备发送的语音信息;
将所述语音信息发送给语音识别服务器,以使所述语音识别服务器将所述语音信息识别为字符信息;
接收所述语音识别服务器返回的所述字符信息,并将所述字符信息与指令数据库中的遥控指令进行匹配;
当所述字符信息与其中一个遥控指令匹配成功时,执行所述遥控指令。
2.根据权利要求1所述的基于蓝牙实现语音遥控的方法,其特征在于,所述遥控指令包括呼唤口令和控制命令。
3.根据权利要求2所述的基于蓝牙实现语音遥控的方法,其特征在于,所述将所述字符信息与指令数据库中的遥控指令进行匹配的步骤包括:
将所述字符信息与所述遥控指令的呼唤口令进行匹配;
当匹配成功时,将所述字符信息与所述遥控指令的控制命令进行匹配;
当匹配成功时,判定所述字符信息与所述遥控指令匹配成功。
4.根据权利要求3所述的基于蓝牙实现语音遥控的方法,其特征在于,所述将所述字符信息与所述遥控指令的呼唤口令进行匹配的步骤包括:
将所述字符信息与所述呼唤口令进行比对;
判断所述字符信息中是否包含与所述呼唤口令相同的字符;
若是,则判定所述字符信息与所述呼唤口令匹配成功。
5.根据权利要求4所述的基于蓝牙实现语音遥控的方法,其特征在于,所述将所述字符信息与所述遥控指令的控制命令进行匹配的步骤包括:
滤除所述字符信息中与所述呼唤口令相同的字符,将剩下的字符与所述控制命令进行比对;
判断所述剩下的字符与所述控制命令的匹配度是否超过第一阈值;
当匹配度超过第一阈值时,判定所述字符信息与所述控制命令匹配成功。
6.一种基于蓝牙实现语音遥控的装置,其特征在于,包括:
接收模块,用于接收蓝牙设备发送的语音信息;
发送模块,用于将所述语音信息发送给语音识别服务器,以使所述语音识别服务器将所述语音信息识别为字符信息;
匹配模块,用于接收所述语音识别服务器返回的所述字符信息,并将所述字符信息与指令数据库中的遥控指令进行匹配;
执行模块,用于当所述字符信息与其中一个遥控指令匹配成功时,执行所述遥控指令。
7.根据权利要求6所述的基于蓝牙实现语音遥控的装置,其特征在于,所述遥控指令包括呼唤口令和控制命令,所述匹配模块包括:
第一匹配单元,用于将所述字符信息与所述遥控指令的呼唤口令进行匹配;
第二匹配单元,用于当所述字符信息与所述呼唤口令匹配成功时,将所述字符信息与所述遥控指令的控制命令进行匹配;
判决单元,用于当所述字符信息与所述控制命令匹配成功时,判定所述字符信息与所述遥控指令匹配成功。
8.根据权利要求7所述的基于蓝牙实现语音遥控的装置,其特征在于,所述第一匹配单元包括:
第一比对子单元,用于将所述字符信息与所述呼唤口令进行比对;
第一判断子单元,用于判断所述字符信息中是否包含与所述呼唤口令相同的字符;
第一判定子单元,用于当所述字符信息中包含与所述呼唤口令相同的字符时,则判定所述字符信息与所述呼唤口令匹配成功。
9.根据权利要求8所述的基于蓝牙实现语音遥控的装置,其特征在于,所述第二匹配单元包括:
第二比对子单元,用于滤除所述字符信息中与所述呼唤口令相同的字符,将剩下的字符与所述控制命令进行比对;
第二判断子单元,用于判断所述剩下的字符与所述控制命令的匹配度是否超过第一阈值;
第二判定子单元,用于当所述剩下的字符与所述控制命令的匹配度超过第一阈值时,判定所述字符信息与所述控制命令匹配成功。
10.一种终端设备,包括存储器、处理器和至少一个被存储在所述存储器中并被配置为由所述处理器执行的应用程序,其特征在于,所述应用程序被配置为用于执行权利要求1至5任一项所述的基于蓝牙实现语音遥控的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810183350.4A CN108538289B (zh) | 2018-03-06 | 2018-03-06 | 基于蓝牙实现语音遥控的方法、装置和终端设备 |
PCT/CN2018/082033 WO2019169684A1 (zh) | 2018-03-06 | 2018-04-04 | 基于蓝牙实现语音遥控的方法、装置和终端设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810183350.4A CN108538289B (zh) | 2018-03-06 | 2018-03-06 | 基于蓝牙实现语音遥控的方法、装置和终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108538289A true CN108538289A (zh) | 2018-09-14 |
CN108538289B CN108538289B (zh) | 2020-12-22 |
Family
ID=63485623
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810183350.4A Active CN108538289B (zh) | 2018-03-06 | 2018-03-06 | 基于蓝牙实现语音遥控的方法、装置和终端设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN108538289B (zh) |
WO (1) | WO2019169684A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345817A (zh) * | 2018-10-09 | 2019-02-15 | 中天智领(北京)科技有限公司 | 大屏幕系统控制方法、装置及电子设备 |
CN111493868A (zh) * | 2019-01-30 | 2020-08-07 | 西门子医疗有限公司 | 执行磁共振断层扫描的系统和控制mr扫描仪的方法 |
CN112344619A (zh) * | 2020-11-04 | 2021-02-09 | 海信视像科技股份有限公司 | 冰箱及食材信息编辑方法 |
CN114322441A (zh) * | 2021-04-19 | 2022-04-12 | 海信视像科技股份有限公司 | 冰箱及语音控制方法 |
WO2022095553A1 (zh) * | 2020-11-04 | 2022-05-12 | 海信视像科技股份有限公司 | 显示设备及食材信息编辑方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113162961A (zh) * | 2020-12-15 | 2021-07-23 | 北京京航计算通讯研究所 | 基于语音控制的视频监控设备搜索系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070117549A1 (en) * | 2005-10-06 | 2007-05-24 | Arnos Reed W | Wireless handset and methods for use therewith |
CN104347072A (zh) * | 2013-08-02 | 2015-02-11 | 广东美的制冷设备有限公司 | 遥控器控制的方法、装置和遥控器 |
CN105792050A (zh) * | 2016-04-20 | 2016-07-20 | 青岛歌尔声学科技有限公司 | 一种蓝牙耳机及基于该蓝牙耳机的通信方法 |
CN106379262A (zh) * | 2016-08-31 | 2017-02-08 | 北京兴科迪科技有限公司 | 一种带语音识别控制的车载蓝牙麦克风 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101076050B1 (ko) * | 2010-09-29 | 2011-10-26 | 주식회사 세나테크놀로지 | 인터컴 기능을 갖는 헬멧용 블루투스 헤드셋 |
CN103209246A (zh) * | 2012-01-16 | 2013-07-17 | 三星电子(中国)研发中心 | 一种通过蓝牙耳机控制手持设备的方法及手持设备 |
CN103794215A (zh) * | 2012-10-30 | 2014-05-14 | 上海斐讯数据通信技术有限公司 | 基于语音控制的手持终端、系统及其基于语音的控制方法 |
CN105960794B (zh) * | 2014-02-03 | 2019-11-08 | 寇平公司 | 用于语音命令的智能蓝牙耳机 |
CN107528755A (zh) * | 2017-09-30 | 2017-12-29 | 百度在线网络技术(北京)有限公司 | 智能设备的控制方法、装置、设备和存储介质 |
-
2018
- 2018-03-06 CN CN201810183350.4A patent/CN108538289B/zh active Active
- 2018-04-04 WO PCT/CN2018/082033 patent/WO2019169684A1/zh active Application Filing
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070117549A1 (en) * | 2005-10-06 | 2007-05-24 | Arnos Reed W | Wireless handset and methods for use therewith |
CN104347072A (zh) * | 2013-08-02 | 2015-02-11 | 广东美的制冷设备有限公司 | 遥控器控制的方法、装置和遥控器 |
CN105792050A (zh) * | 2016-04-20 | 2016-07-20 | 青岛歌尔声学科技有限公司 | 一种蓝牙耳机及基于该蓝牙耳机的通信方法 |
CN106379262A (zh) * | 2016-08-31 | 2017-02-08 | 北京兴科迪科技有限公司 | 一种带语音识别控制的车载蓝牙麦克风 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109345817A (zh) * | 2018-10-09 | 2019-02-15 | 中天智领(北京)科技有限公司 | 大屏幕系统控制方法、装置及电子设备 |
CN111493868A (zh) * | 2019-01-30 | 2020-08-07 | 西门子医疗有限公司 | 执行磁共振断层扫描的系统和控制mr扫描仪的方法 |
CN112344619A (zh) * | 2020-11-04 | 2021-02-09 | 海信视像科技股份有限公司 | 冰箱及食材信息编辑方法 |
WO2022095553A1 (zh) * | 2020-11-04 | 2022-05-12 | 海信视像科技股份有限公司 | 显示设备及食材信息编辑方法 |
CN114322441A (zh) * | 2021-04-19 | 2022-04-12 | 海信视像科技股份有限公司 | 冰箱及语音控制方法 |
CN114322441B (zh) * | 2021-04-19 | 2022-08-26 | 海信视像科技股份有限公司 | 冰箱及语音控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN108538289B (zh) | 2020-12-22 |
WO2019169684A1 (zh) | 2019-09-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108538289A (zh) | 基于蓝牙实现语音遥控的方法、装置和终端设备 | |
CN1333385C (zh) | 用于通信系统的语音浏览器启用器 | |
CN107977562B (zh) | 身份识别方法、识别终端及存储介质 | |
CN104010267A (zh) | 支持基于翻译的通信服务方法和系统和支持该服务的终端 | |
CN104158945A (zh) | 通话信息获取方法、装置及系统 | |
CN107655154A (zh) | 终端控制方法、空调器及计算机可读存储介质 | |
CN107885731A (zh) | 语音翻译方法和装置 | |
CN110992955A (zh) | 一种智能设备的语音操作方法、装置、设备及存储介质 | |
CN104798031A (zh) | 具有连续关键词识别的免提设备 | |
CN107818787B (zh) | 一种语音信息的处理方法、终端及计算机可读存储介质 | |
CN109637534A (zh) | 语音遥控方法、系统、受控装置及计算机可读存储介质 | |
CN102209156A (zh) | 一种同步联系人信息的方法、装置和系统 | |
KR101170612B1 (ko) | 사용자 영상을 이용한 음성인식 시스템 및 방법 | |
KR102097777B1 (ko) | 사용자 필기 데이터 기반의 학습 성취도 판단 방법, 그리고 이를 위한 스마트 디바이스, 서버 및 시스템 | |
CN109302528B (zh) | 一种拍照方法、移动终端及计算机可读存储介质 | |
CN112148836B (zh) | 多模态信息处理方法、装置、设备及存储介质 | |
CN110971685B (zh) | 内容处理方法、装置、计算机设备及存储介质 | |
CN109065049A (zh) | 基于语音交互的智能终端的社交分享方法及系统、智能终端设备 | |
KR101351264B1 (ko) | 음성인식 기반의 메시징 통역서비스 제공 시스템 및 그 방법 | |
CN108712271A (zh) | 翻译方法和翻译装置 | |
CN108597511A (zh) | 基于物联网的信息展示方法、控制终端及可读存储介质 | |
CN113065879A (zh) | 一种数据流质检方法及系统 | |
CN110445934A (zh) | 通话信息处理方法、系统、终端及可读存储介质 | |
CN101237489A (zh) | 基于语音通信内容的处理方法和装置 | |
WO2016054885A1 (zh) | 操作对象的处理方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20210910 Address after: 518000 201, No.26, yifenghua Innovation Industrial Park, Xinshi community, Dalang street, Longhua District, Shenzhen City, Guangdong Province Patentee after: Shenzhen waterward Information Co.,Ltd. Address before: 518000, block B, huayuancheng digital building, 1079 Nanhai Avenue, Shekou, Nanshan District, Shenzhen City, Guangdong Province Patentee before: SHENZHEN WATER WORLD Co.,Ltd. |