Nothing Special   »   [go: up one dir, main page]

KR20130133629A - 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 - Google Patents

전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 Download PDF

Info

Publication number
KR20130133629A
KR20130133629A KR1020120057044A KR20120057044A KR20130133629A KR 20130133629 A KR20130133629 A KR 20130133629A KR 1020120057044 A KR1020120057044 A KR 1020120057044A KR 20120057044 A KR20120057044 A KR 20120057044A KR 20130133629 A KR20130133629 A KR 20130133629A
Authority
KR
South Korea
Prior art keywords
voice
command
signal corresponding
voice command
electronic device
Prior art date
Application number
KR1020120057044A
Other languages
English (en)
Inventor
서브호지트
이상훈
김희운
Original Assignee
삼성전자주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 삼성전자주식회사 filed Critical 삼성전자주식회사
Priority to KR1020120057044A priority Critical patent/KR20130133629A/ko
Priority to EP13169533.0A priority patent/EP2669889B1/en
Priority to US13/903,345 priority patent/US9619200B2/en
Priority to EP15194595.3A priority patent/EP3001414B1/en
Priority to CN201611043404.4A priority patent/CN106297802B/zh
Priority to CN201310205259.5A priority patent/CN103456306B/zh
Priority to CN201611027587.0A priority patent/CN106448678B/zh
Publication of KR20130133629A publication Critical patent/KR20130133629A/ko
Priority to US15/433,196 priority patent/US20170162198A1/en
Priority to US16/149,304 priority patent/US10657967B2/en
Priority to US16/876,225 priority patent/US11393472B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech

Landscapes

  • Engineering & Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)

Abstract

음성명령을 실행시키기 위한 방법은, 웨이크업 명령과 음성명령을 포함하는 음성신호를 입력받는 과정과, 제1 음성인식 알고리즘을 통해 웨이크업 명령에 해당하는 음성신호를 기반으로 화자검증을 수행하는 과정과, 화자검증 성공시, 상기 음성명령에 해당하는 음성신호를 서버로 제공하는 과정과, 상기 서버에서 제2 음성인식 알고리즘을 통해 음성인식된 음성명령에 해당하는 제어신호를 수신하는 과정과, 상기 음성명령에 해당하는 제어신호에 따라 상기 전자장치를 제어하는 과정을 포함하여, 음성명령을 실행하기 전에 화자 검증(speaker verification)을 수행함으로써, 보안/개인 정보 보호를 기반으로 음성명령을 수행할 수 있다.

Description

전자장치에서 음성명령을 실행시키기 위한 장치 및 방법{METHOD AND APPARATUS FOR EXECUTING VOICE COMMAND IN ELECTRONIC DEVICE}
본 발명은 일반적으로 전자장치에 관한 것으로, 특히 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법에 관한 것이다.
근래 들어 멀티미디어 기술이 발전하면서 다양한 기능을 갖는 전자 장치가 등장하고 있다. 이러한 기기들로는, 예를 들어 스마트폰으로 대별되는 휴대용 단말기가 있으며, 이러한 전자 장치들은 하나 또는 그 이상의 기능을 복합적으로 수행하는 컨버젼스 기능을 갖는 것이 일반적이다.
이러한 휴대용 단말기는 그 기능뿐만 아니라 상대적으로 동일한 또는 좀더 진보적인 성능을 발현하면서 장치의 전체 크기를 슬림화하고 미려한 디자인을 갖도록 하는 것이 중요한 요인으로 대두 되고 있으며, 단말기 제조자들은 동일한 기능 또는 좀더 진보된 성능을 구현하면서 종래의 단말기보다 좀더 소형 및 슬림화를 구현하기 위해 경주하고 있는 실정이다.
상술한 전자 장치의 다양한 기능들 중 최근 출시되는 전자 장치에는 비교적 정확도가 우수한 음성 인식 기능이 탑재되고 있다. 이러한 음성 인식 기능은 사용자의 음성을 정확히 인식하여 장치의 해당 기능을 별도의 버튼 조작 또는 터치 모듈의 접촉에 의하지 않고 손쉽게 실행시킬 수 있는 장점을 갖는다.
이러한 음성 인식 기능으로는, 예를 들어 스마트폰과 같은 휴대용 단말기에서는 별도의 조작 없이 통화 기능을 수행하거나 문자 메시지를 작성할 수 있으며, 작성된 메시지를 전송할 수 있고, 길찾기, 인터넷 검색, 알람 설정 등 다양한 기능을 손쉽게 설정할 수 있는 것이다.
종래에는 상술한 음성 인식 기능을 수행하기 위하여 해당 음성 인식 어플리케이션을 구동시키고 음성 인식 기능을 활성화시킨 후 해당 기능을 수행하여 왔다.
그러나, 이러한 음성 인식을 위한 초기 구동 단계는 별도의 키버튼 입력이나 터치 모듈에 의한 터치로 음성 인식 관련 애플리케이션을 수행하는 것으로 시작하는바, 손을 대지 않고 편리하게 데이터 입력을 수행하기 위한 음성 인식의 고유 기능에 역행하는 문제점이 있었다. 또한, 다양한 애플리케이션의 객체들을 혼재한 디스플레이 화면 중에 음성 인식용 개별 어플을 찾는 것 또한 쉽지 않은 것이 현실이다.
본 발명의 목적은 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법을 제공함에 있다.
본 발명의 다른 목적은 전자장치에서 서로 다른 종류의 음성인식 알고리즘을 사용하여, 시스템을 활성화한 다음 음성명령을 실행하는 장치 및 방법을 제공함에 있다.
본 발명의 또 다른 목적은 전자장치에서 음성명령 실행시 보안/개인 정보 보호를 수행하기 위한 장치 및 방법을 제공함에 있다.
상기한 목적들을 달성하기 위한 본 발명의 제 1 견지에 따르면, 음성명령을 실행시키기 위한 방법에 있어서, 웨이크업 명령과 음성명령을 포함하는 음성신호를 입력받는 과정과, 제1 음성인식 알고리즘을 통해 웨이크업 명령에 해당하는 음성신호를 기반으로 화자검증을 수행하는 과정과, 화자검증 성공시, 상기 음성명령에 해당하는 음성신호를 서버로 제공하는 과정과, 상기 서버에서 제2 음성인식 알고리즘을 통해 음성인식된 음성명령에 해당하는 제어신호를 수신하는 과정과, 상기 음성명령에 해당하는 제어신호에 따라 상기 전자장치를 제어하는 과정을 포함한다.
상기한 목적들을 달성하기 위한 본 발명의 제 2 견지에 따르면, 음성명령을 실행시키기 위한 방법에 있어서, 음성명령을 포함하는 음성신호를 수신하는 과정과, 제2 음성인식 알고리즘을 통해 음성인식된 음성명령에 해당하는 제어신호를 생성하는 과정과, 상기 음성명령에 해당하는 제어신호를 전자장치로 전송하는 과정을 포함한다.
상술한 바와 같이, 웨이크업 명령과 음성명령을 포함하는 연속적인 음성신호를 처리함으로써, 사용자가 쉽게 음성명령을 실행할 수 있다.
또한, 음성명령을 실행하기 전에 화자 검증(speaker verification)을 수행함으로써, 보안/개인 정보 보호를 기반으로 음성명령을 수행할 수 있다.
도 1은 본 발명의 실시 예에 따른 음성명령을 실행시키기 위한 전자장치를 도시하고 있다.
도 2는 본 발명의 제1 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
도 3은 본 발명의 제1 실시 예에 따른 서버의 동작 흐름도를 도시하고 있다.
도 4는 본 발명의 제2 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
도 5는 본 발명의 제2 실시 예에 따른 서버의 동작 흐름도를 도시하고 있다.
도 6은 본 발명의 제3 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
도 7은 본 발명의 실시 예에 따른 웨이크업 명령 및 음성명령을 포함하는 음성신호 예를 도시하고 있다.
도 8은 본 발명의 실시 예에 따른 웨이크업 명령 및 음성명령을 포함하는 음성신호를 이용하여 전화 걸기를 수행하는 예이다.
도 9는 본 발명의 실시 예에 따른 화자검증을 통해 잠금 화면을 해지하는 예를 도시하고 있다.
이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우 그 상세한 설명은 생략할 것이다. 그리고 후술되는 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례 등에 따라 달라질 수 있다. 그러므로 그 정의는 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
이하, 본 발명은 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법에 관해 설명하기로 한다.
도 1은 본 발명의 실시 예에 따른 음성명령을 실행시키기 위한 전자장치를 도시하고 있다.
상기 도 1을 참조하면, 전자장치는, 휴대용 전자장치(portable electronic device)일 수 있으며, 휴대용 단말기(portable terminal), 이동 전화(mobile phone), 이동 패드(mobile pad), 미디어 플레이어(media player), 태블릿 컴퓨터(tablet computer), 스마트폰, 노트북/데스트탑 컴퓨터 또는 PDA(Personal Digital Assistant)와 같은 장치일 수 있다. 또한, 이러한 장치들 중 두 가지 이상의 기능을 결합한 장치를 포함하는 임의의 휴대용 전자장치일 수도 있다.
전자장치는 제어기(100), 스피커/마이크로폰(110), 카메라(120), GPS 수신기(130), RF 처리기(140), 센서모듈(150), 터치스크린(160), 터치스크린 제어기(165), 외부 메모리(170)를 포함하여 구성된다.
제어기(100)는, 인터페이스(101), 하나 이상의 프로세서(102, 103) 그리고 내부 메모리(104)를 포함할 수 있다. 경우에 따라서는, 제어기(100) 전체를 프로세서로 칭하기도 한다. 인터페이스(101), 애플리케이션 프로세서(102), 통신 프로세서(103), 내부 메모리(104)는 별개의 구성요소일 수 있거나 하나 이상의 집적화된 회로에 집적화될 수 있다.
애플리케이션 프로세서(102)는 여러 가지의 소프트웨어 프로그램을 실행하여 전자장치를 위한 여러 기능을 수행하고 통신 프로세서(103)는 음성 통신 및 데이터 통신을 위한 처리 및 제어를 수행한다. 또한, 이러한 통상적인 기능에 더하여, 프로세서(102, 103)는 외부 메모리(170) 혹은 내부 메모리(104)에 저장되어 있는 특정한 소프트웨어 모듈(명령어 세트)을 실행하여 그 모듈에 대응하는 특정한 여러 가지의 기능을 수행하는 역할도 한다. 즉, 프로세서(102, 103)는 외부 메모리(170) 또는 내부 메모리(104)에 저장된 소프트웨어 모듈들과 연동하여 본 발명의 실시 예의 방법을 수행한다.
본 발명의 제1 실시 예는, 애플리케이션 프로세서(102)가 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받고, 웨이크업 명령에 해당하는 음성신호를 기반으로 화자 검증(speaker verification)을 수행한다. 또한, 화자검증이 성공할 시, 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지한다. 그리고, 음성명령에 해당하는 음성신호가 시작되는지를 확인하여, 음성명령에 해당하는 음성신호가 시작될 시, 음성명령에 해당하는 음성신호를 서버로 전송한다. 그리고, 서버로부터 음성명령에 해당하는 음성인식 결과를 통보받아 음성인식 결과를 기반으로 해당 동작을 수행한다.
본 발명의 제2 실시 예는, 애플리케이션 프로세서(102)가 웨이크업 명령과 음성명령을 포함한 연속적인 음성신호 전체를 서버로 전송하고, 서버로부터 웨이크업 명령에 해당하는 화자검증 결과를 통보받고, 화자검증 성공시, 시스템을 활성화한다. 그리고 음성명령에 해당하는 음성인식 결과를 통보받아, 음성인식 결과를 기반으로 동작을 수행한다.
본 발명의 제3 실시 예는, 애플리케이션 프로세서(102)가 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받고, 웨이크업 명령에 해당하는 음성신호를 기반으로 화자 검증(speaker verification)을 수행하고, 화자검증이 성공할 시, 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지하고, 음성명령에 해당하는 음성신호가 시작되는지를 확인하고, 음성명령에 해당하는 음성신호가 시작될 시, 음성인식 알고리즘을 통해 음성명령에 해당하는 음성신호 분석한다. 그리고 인식된 음성명령을 기반으로 해당 동작을 수행한다.
한편, 다른 프로세서(도시하지 않음)는 하나 이상의 음성인식 프로세서, 화자검증 프로세서를 더 포함할 수 있다. 음성인식 프로세서, 화자검증 프로세서는 하나로 구성할 수도 있고, 구현에 따라, 서로 다른 기능을 수행하는 여러 개의 프로세서로 구성될 수도 있다. 인터페이스(101)는 전자장치의 터치 스크린 제어기(165) 및 외부 혹은 내부 메모리에 연결시킨다.
센서모듈(150)은 인터페이스(101)에 결합되어 여러 가지 기능을 가능하게 할 수 있다. 예를 들어, 움직임 센서 및 광 센서가 인터페이스(101)에 결합되어 각각 전자 장치의 움직임 감지 및 외부로부터의 빛 감지를 가능하게 할 수 있다. 이외에도, 위치측정 시스템, 온도센서 또는 생체 센서 등과 같은 기타 센서들이 인터페이스(150)에 연결되어 관련 기능들을 수행할 수 있다.
카메라(120)는 인터페이스(101)를 통해 센서모듈(150)과 결합하여, 사진 및 비디오 클립 레코딩과 같은 카메라 기능을 수행할 수 있다.
RF 처리기(140)는 통신 기능이 수행된다. 예를 들어, 통신 프로세서(103)의 제어하에 RF 신호를 기저대역 신호로 변환하여 통신 프로세서(103)로 제공하거나 통신 프로세서(103)로부터의 기저대역 신호를 RF 신호로 변환하여 송신한다. 여기서, 통신 프로세서(103)는 다양한 통신방식에 기저대역신호를 처리한다. 예를 들어, 통신방식은, 이들에 한정하지는 않지만, GSM(Global System for Mobile Communication) 통신방식, EDGE(Enhanced Data GSM Environment) 통신방식, CDMA(Code Division Multiple Access) 통신방식, W-CDMA(W-Code Division Multiple Access) 통신방식, LTE(Long Term Evolution) 통신방식, OFDMA(Orthogonal Frequency Division Multiple Access) 통신방식, Wi-Fi(Wireless Fidelity) 통신방식, WiMax 통신방식 또는/및 Bluetooth 통신방식을 포함할 수 있다.
스피커/마이크로폰(110)은 음성 인식, 음성 복제, 디지털 레코딩(recording) 및 전화 기능과 같은 오디오 스트림의 입력과 출력을 담당할 수 있다. 즉, 스피커/마이크로폰(110)은 음성신호를 전기신호로 변환하거나 전기신호를 음성신호로 변환한다. 도시하지 않았지만, 탈부착 가능한(attachable and detachable) 이어폰(ear phone), 헤드폰(head phone) 또는 헤드셋(head set)이 외부포트를 통해 전자장치에 연결될 수 있다.
터치스크린 제어기(165)는 터치 스크린(160)에 결합될 수 있다. 터치 스크린(160) 및 터치 스크린 제어기(165)는, 이하에 한정되지는 않지만, 터치 스크린(160)과의 하나 이상의 접촉점을 결정하기 위한 용량성, 저항성, 적외선 및 표면 음향파 기술들뿐만 아니라 기타 근접 센서 배열 또는 기타 요소들을 포함하는 임의의 멀티 터치 감지 기술을 이용하여 접촉 및 움직임 또는 이들의 중단을 검출할 수 있다.
터치스크린(160)은 전자장치와 사용자 사이에 입력/출력 인터페이스를 제공한다. 즉, 터치스크린(160)은 사용자의 터치 입력을 전자장치에 전달한다. 또한 전자 장치로부터의 출력을 사용자에게 보여주는 매개체이다. 즉, 터치스크린은 사용자에게 시각적인 출력을 보여준다. 이러한 시각적 출력(visual output)은 텍스트(text), 그래픽(graphic), 비디오(video)와 이들의 조합의 형태로 나타난다.
터치스크린(160)은 여러 가지 디스플레이가 사용될 수 있다. 예를 들면, 이에 한정하지는 않지만, LCD(liquid crystal display), LED(Light Emitting Diode), LPD(light emitting polymer display), OLED(Organic Light Emitting Diode), AMOLED(Active Matrix Organic Light Emitting Diode) 또는 FLED(Flexible LED)를 사용할 수 있다.
GPS 수신기(130)는 인공위성으로부터 받은 신호를 위치, 속도, 시간 등의 정보로 변환한다. 예를 들어, 위성과 GPS 수신기간 거리는 빛의 속도와 신호도달 시간을 곱하면 계산되며, 3개 위성의 정확한 위치와 거리를 구하여 공지된 삼각측량의 원리로 전자장치의 위치를 측정한다.
외부 메모리(170) 혹은 내부 메모리(104)는 하나 이상의 자기 디스크 저장 장치와 같은 고속 랜덤 액세스 메모리 및/또는 비휘발성 메모리, 하나 이상의 광 저장 장치 및/또는 플래시 메모리(예컨대, NAND, NOR)를 포함할 수 있다.
외부 메모리(170) 혹은 내부 메모리(104)는 소프트웨어를 저장한다. 소프트웨어 구성요소는 운영 체제(operating system) 소프트웨어 모듈, 통신 소프트웨어 모듈, 그래픽 소프트웨어 모듈, 사용자 인터페이스 소프트웨어 모듈 및 MPEG 모듈, 카메라 소프트웨어 모듈, 하나 이상의 애플리케이션 소프트웨어 모듈 등을 포함한다. 또한, 소프트웨어 구성요소인 모듈은 명령어들의 집합으로 표현할 수 있으므로, 모듈을 명령어 세트(instruction set)라고 표현하기도 한다. 모듈은 또한 프로그램으로 표현하기도 한다.
운영 체제 소프트웨어는 일반적인 시스템 동작(system operation)을 제어하는 여러 가지의 소프트웨어 구성요소를 포함한다. 이러한 일반적인 시스템 작동의 제어는, 예를 들면, 메모리 관리 및 제어, 저장 하드웨어(장치) 제어 및 관리, 전력 제어 및 관리 등을 의미한다. 이러한 운영 체제 소프트웨어는 여러 가지의 하드웨어(장치)와 소프트웨어 구성요소(모듈) 사이의 통신을 원활하게 하는 기능도 수행한다.
통신 소프트웨어 모듈은, RF 처리기(140)를 통해 컴퓨터, 서버 및/또는 휴대용 단말기 등 다른 전자 장치와 통신을 가능하게 할 수 있다. 그리고, 통신 소프트웨어 모듈은, 해당 통신방식에 해당하는 프로토콜 구조로 구성된다.
그래픽 소프트웨어 모듈은 터치스크린(160) 상에 그래픽을 제공하고 표시하기 위한 여러 가지 소프트웨어 구성요소를 포함한다. 그래픽(graphics)이란 용어는 텍스트(text), 웹 페이지(web page), 아이콘(icon), 디지털 이미지(digital image), 비디오(video), 애니메이션(animation) 등을 포함하는 의미로 사용된다.
사용자 인터페이스 소프트웨어 모듈은 사용자 인터페이스에 관련한 여러 가지 소프트웨어 구성요소를 포함한다. 사용자 인터페이스의 상태가 어떻게 변경되는지 또는 사용자 인터페이스 상태의 변경이 어떤 조건에서 이루어지는지 등에 대한 내용을 포함한다.
카메라 소프트웨어 모듈은 카메라 관련 프로세스 및 기능들을 가능하게 하는 카메라 관련 소프트웨어 구성요소를 포함한다. 애플리케이션 모듈은 브라우저(browser), 이메일(email), 즉석 메시지(instant message), 워드 프로세싱(word processing), 키보드 에뮬레이션(keyboard emulation), 어드레스 북(address book), 접촉 리스트(touch list), 위짓(widget), 디지털 저작권 관리(DRM, Digital Right Management), 음성 인식(voice recognition), 음성 복제, 위치 결정 기능(position determining function), 위치기반 서비스(location based service) 등을 포함한다. 메모리(770, 704)는 위에서 기술한 모듈 이외에 추가적인 모듈(명령어들)을 포함할 수 있다. 또는, 필요에 따라, 일부의 모듈(명령어들)을 사용하지 않을 수 있다.
본 발명에 관련하여, 애플리케이션 모듈은 화자검증 기능 혹은 음성인식 기능 및 음성명령 실행 기능을 수행하는 명령어를 포함한다.
본 발명의 제1 실시 예에 따른 명령어는, 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받고, 웨이크업 명령에 해당하는 음성신호를 기반으로 화자 검증(speaker verification)을 수행하고, 또한, 화자검증이 성공할 시, 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지하고, 그리고, 음성명령에 해당하는 음성신호가 시작되는지를 확인하여, 음성명령에 해당하는 음성신호가 시작될 시, 음성명령에 해당하는 음성신호를 서버로 전송하고, 그리고, 서버로부터 음성명령에 해당하는 음성인식 결과를 통보받아 음성인식 결과를 기반으로 해당 동작을 수행한다.
본 발명의 제2 실시 예에 따른 명령어는, 웨이크업 명령과 음성명령을 포함한 연속적인 음성신호 전체를 서버로 전송하고, 서버로부터 웨이크업 명령에 해당하는 화자검증 결과를 통보받고, 화자검증 성공시, 시스템을 활성화한다. 그리고 음성명령에 해당하는 음성인식 결과를 통보받아, 음성인식 결과를 기반으로 동작을 수행한다.
본 발명의 제3 실시 예에 따른 명령어는, 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받고, 웨이크업 명령에 해당하는 음성신호를 기반으로 화자 검증(speaker verification)을 수행하고, 화자검증이 성공할 시, 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지하고, 음성명령에 해당하는 음성신호가 시작되는지를 확인하고, 음성명령에 해당하는 음성신호가 시작될 시, 음성인식 알고리즘을 통해 음성명령에 해당하는 음성신호 분석한다. 그리고 인식된 음성명령을 기반으로 해당 동작을 수행한다.
또한, 위에서 언급한, 그리고 이하에서 언급할, 본 발명에 따른 전자 장치의 다양한 기능들은 하나 이상의 프로세싱(processing) 및/또는 애플리케이션 특정 집적 회로(ASIC, Application Specific Integrated circuit)를 포함하는 하드웨어 및/또는 소프트웨어 및/또는 이들의 결합으로 실행될 수 있다.
도 2는 본 발명의 제1 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
상기 도 2를 참조하면, 전자장치(100)는 200단계에서 아이들 모드 혹은 잠금화면 상태에서 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받는다. 웨이크업 명령은 시스템을 활성화하기 위한 명령으로, 예를 들어, 음성명령을 입력받을 수 있는 모드로 천이시키는 명령이거나 잠금 화면을 해지시키기 위한 명령일 수 있다. 음성 명령은 전자장치가 제공하는 다양한 기능을 실행시키기 위한 명령으로써, 예를 들어, 전화 걸기, 사진 촬영, MP3 재생 기능 등등을 실행시키는 명령이다. 구현에 따라, 음성 명령은 지도검색 및 길찾기 같은 검색을 서버에 요청하기 위한 명령일 수 있다.
이후, 전자장치(100)는 202단계에서 웨이크업 명령에 해당하는 제1 음성신호를 기반으로 화자 검증(speaker verification)을 수행한다. 화자 검증은 인식 대상 화자를 검증하기 위한 것으로, 화자종속인식(speaker dependent recognition) 방식과 화자독립인식(speaker independent recognition) 방식이 있다. 화자종속인식 방식은 특정 화자 또는 사용자가 자신의 음성으로 미리 인식기를 훈련시키는 과정이 필요하며, 이 경우 인식기는 훈련된 음성만을 인식할 수 있다. 화자독립인식 방식은 임의의 화자의 발성을 인식할 수 있으며, 미리 수백 또는 수 천명의 음성에 관한 정보를 추출하여 데이터베이스화함으로써 별도의 훈련 과정 없이 어떤 사용자라도 사용가능하다.
만약, 화자종속인식 방식을 사용하는 경우, 음성명령에 대한 음성신호를 이용하여 화자검증을 수행할 수 있으므로, 별도의 웨이크업 명령을 입력할 필요가 없다. 예를 들어, 사용자의 고유한 음성 특성을 이용하여 화자검증을 수행할 경우 별도의 웨이크업 명령을 입력할 필요가 없다.
다른 구현에 따라, 다른 구현에 따라, 사용자가 음성 입력한 신호를 이용하는 화자종속인식 방식을 사용하는 경우, 기정의되었거나 사용자 설정 단어를 사용자가 여러 번 음성 입력하여 저장한 음성 신호를 이용해 화자 검증을 수행한다.
이후, 전자장치(100)는 204단계에서 화자검증이 성공할 시, 206단계로 진행하고, 화자검증이 실패할 시, 200단계로 진행한다.
도시하지 않았지만, 화자검증이 성공할 시, 잠금화면 상태에서 음성명령을 인식하기 위한 객체가 활성화되어 음성인식 관련한 GUI를 디스플레이된다(도 8 (a) 참고). 또는 구현에 따라, 화자검증이 성공할 시, 음성명령을 인식하기 위한 객체가 활성화되어, 잠금 해제 화면에 음성인식 관련한 GUI를 디스플레이될 수 있다.
또 다른 구현에 따라, 아이들 모드에서 화자 검증이 성공할 시, 잠금화면 설정되어 있다면 음성명령을 인식하기 위한 객체와 함께 음성인식 관련한 GUI가 디스플레이되고, 잠금화면 설정되어 있지 않다면 음성명령을 인식하기 위한 객체와 함께 음성인식 관련한 GUI가 디스플레이될 수 있다.
이후, 전자장치(100)는 206단계에서 웨이크업 명령에 해당하는 제1음성신호와 음성명령에 해당하는 제2 음성신호 사이에는 침묵구간(silence duration)을 감지한다. 예를 들어, 웨이크업 명령은 "하이 갤럭시"이고 음성명령이 "홍길동 전화 걸기"라고 할 때, 사용자는 "하이 갤럭시"와 "홍길동 전화 걸기"를 연속적으로 발음할 때, "하이 갤럭시"와 "홍길동 전화 걸기" 사이 침묵구간이 발생한다.
문장에서 2개 단어 사이에 휴지시간(pause)의 짧은 길이가 존재하기 때문에, 이것은 음성명령의 시작을 감지하는 데 사용할 수 있다. 웨이크업 명령의 일부 잔여 신호가 음성 명령과 함께 서버로 전송되지 않도록 하는 것이다. 이를 위해서 VAD(voice activity detection) 기술이 사용된다. 예를 들어, 음성신호는 일반적으로 침묵구간(silence)보다 더 많은 에너지를 갖는다. 하지만, 약간의 잡음이 존재하는 경우에, 사람의 음성의 특별한 특성을 식별하는 단계가 추가될 수 있다. 보통은 다양한 주파수에 걸쳐 에너지의 분포를 관찰을 통해 이루어진다. 사람의 음성은 특성 신호(characteristic signature)를 표시하지만, 잡음은 없다. 따라서 VAD 기술은 음성(speech) 과 침묵(silence)을 구별할 수 있다.
이후, 전자장치(100)는 208단계에서 음성명령에 해당하는 제2 음성신호가 시작되는지를 확인한다. 예를 들어, 208단계에서는 "홍길동 전화 걸기"라는 음성명령에 해당하는 음성신호의 시작시점을 확인한다.
이후, 전자장치(100)는 208단계에서 음성명령에 해당하는 음성신호가 시작될 시, 210단계로 진행하여 음성명령에 해당하는 음성신호(예: "홍길동 전화 걸기")를 서버로 전송한다.
반면 208단계에서 음성명령에 해당하는 음성신호가 시작되지 않을 시, 206단계로 진행한다.
이후, 전자장치(100)는 212단계에서 서버로부터 음성명령에 해당하는 음성인식 결과를 통보받는다. 예를 들어, 서버는 "홍길동 전화 걸기"라는 음성명령을 분석하여, 전자장치(100)에 홍길동 전화 걸기에 대응하는 제어신호를 전송하거나, 길찾기 혹은 지도검색 요청에 대한 검색결과를 전송한다.
이후, 전자장치(100)는 214단계에서 음성명령에 해당하는 음성인식 결과를 기반으로 해당 동작을 수행하거나 음성인식에 해당하는 결과를 디스플레이한다. 예를 들어, 홍길동 전화 걸기에 대응하는 제어신호를 서버로부터 수신할 시, 전자장치(100)는 폰북에 있는 홍길동 전화번호를 검색하여 검색된 전화번호로 호 연결을 시도한다. 또는 길찾기 혹은 지도검색 요청에 대한 검색결과를 디스플레이한다.
이후, 본 발명의 절차를 종료한다.
도 3은 본 발명의 제1 실시 예에 따른 서버의 동작 흐름도를 도시하고 있다.
상기 도 3을 참조하면, 서버는 300단계에서 전자장치로부터 음성명령에 해당하는 음성신호(예: "홍길동 전화 걸기")를 수신한다. 구현에 따라, 서버는 웨이크업 명령과 음성명령을 포함한 연속적인 음성신호 전체를 전자장치로부터 수신하여 처리할 수 있다.
이후, 서버는 302단계에서 음성인식 알고리즘을 통해 음성명령에 해당하는 음성신호 분석하고, 304단계에서 음성인식에 해당하는 결과가 제어신호인지를 판단한다.
음성인식에 해당하는 결과가 제어신호일 시 306단계로 진행하여 음성인식에 해당하는 제어신호를 전자장치로 제공한다. 예를 들어, "홍길동 전화 걸기" 인식한 후, 그에 대응하는 제어신호를 전자장치로 제공한다.
음성인식에 해당하는 결과가 제어신호가 아닐 시 308단계로 진행하여 음성인식에 해당하는 결과를 전자장치로 제공한다. 또는 길찾기 혹은 지도검색 요청에 대한 검색결과를 디스플레이한다.상술한 바와 같이, 제1 실시 예에서는 화자검증은 전자장치 내에서 수행되고 음성인식은 서버에서 수행되는 예이고, 하기 제2 실시 예는 화자검증 및 음성인식이 모두 서버에서 수행되는 예이다.
도 4는 본 발명의 제2 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
상기 도 4를 참조하면, 전자장치(100)는 400단계에서 아이들 모드 혹은 잠금화면 상태에서 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받는다. 웨이크업 명령은 시스템을 활성화하기 위한 명령으로, 예를 들어, 음성명령을 입력받을 수 있는 모드로 천이시키는 명령이거나 잠금 화면을 해지시키기 위한 명령일 수 있다. 음성 명령은 전자장치가 제공하는 다양한 기능을 실행시키기 위한 명령으로써, 예를 들어, 전화 걸기, 사진 촬영, MP3 재생 기능 등등을 실행시키는 명령이다.
이후, 전자장치(100)는 402단계에서 웨이크업 명령과 음성명령을 포함한 연속적인 음성신호 전체를 서버로 전송한다.
이후, 전자장치(100)는 404단계에서 서버로부터 웨이크업 명령에 해당하는 화자검증 결과를 통보받는다. 화자검증 성공시, 406단계로 진행하여 시스템을 활성화한다. 시스템 활성화 예는 잠금 화면을 해제하거나 아이들 모드(idle mode) 에서 액티브 모드(active mode)로 천이하는 것이다. 도시하지 않았지만, 400단계로 진행하여 다시 음성신호를 입력받는다.
이후, 전자장치(100)는 408단계에서 음성명령에 해당하는 음성인식 결과를 통보받고, 410단계에서 음성인식 결과를 기반으로 동작을 수행 하거나 음성인식에 해당하는 결과를 디스플레이한다. 예를 들어, 홍길동 전화 걸기에 대응하는 제어신호를 서버로부터 수신할 시, 전자장치(100)는 폰북에 있는 홍길동 전화번호를 검색하여 검색된 전화번호로 호 연결을 시도한다. 또는 길찾기 혹은 지도검색 요청에 대한 검색결과를 디스플레이한다.
이후, 본 발명의 실시 예를 종료한다.
도 5는 본 발명의 제2 실시 예에 따른 서버의 동작 흐름도를 도시하고 있다.
상기 도 5를 참조하면, 서버는 500단계에서 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 전자장치로부터 수신한다.
이후, 서버는 502단계에서 화자검증 알고리즘을 통해 웨이크업 명령에 해당하는 음성신호를 분석한다. 즉, 웨이크업 명령에 해당하는 음성신호를 분석하여 화자검증이 성공인지 실패인지를 판단한다.
이후, 서버는 504단계에서 화자검증에 대한 결과를 전자장치로 제공한다.
이후, 서버는 506단계에서, 화자 검증 성공 시, 508단계로 진행하여 음성인식 알고리즘을 통해 음성명령에 해당하는 음성신호를 분석한다. 즉, 음성명령에 해당하는 음성을 인식한다. 반면, 화자 검증 실패 시, 500단계로 진행하여 전자장치에 웨이크업 명령과 음성명령을 포함하는 음성신호를 요청하여 다시 수신한다. 구현에 따라, 이전 음성명령에 해당하는 음성신호가 정상이면 웨이크업 명령에 해당하는 제1 음성신호만을 요청하여 수신할 수 있다.
도시하지 않았지만, 서버는 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지하여, 웨이크업 명령과 음성명령을 구분한다.
이후, 서버는 510단계에서 화자검증 결과 및 음성인식 결과를 전자장치로 통보한다. 예를 들어, 서버는 "하이 갤럭시"라는 웨이크업 명령을 분석하여 화자검증 성공 여부와 "홍길동 전화 걸기"라는 음성명령을 분석하여, 전자장치(100)에 홍길동 전화 걸기에 대응하는 제어신호를 전송한다.
이후, 본 발명의 절차를 종료한다.
하기 도 6의 제3 실시 예에는 전자장치가 화자검증 및 음성인식을 수행하는 예이다.
도 6은 본 발명의 제3 실시 예에 따른 전자장치의 동작 흐름도를 도시하고 있다.
상기 도 6을 참조하면, 전자장치(100)는 600단계에서 아이들 모드 혹은 잠금화면 상태에서 웨이크업 명령(wakeup command)과 음성명령(voice command)을 포함한 연속적인 음성신호를 사용자로부터 마이크로폰(110)을 통해 입력받는다. 웨이크업 명령은 시스템을 활성화하기 위한 명령으로, 예를 들어, 음성명령을 입력받을 수 있는 모드로 천이시키는 명령이거나 잠금 화면을 해지시키기 위한 명령일 수 있다. 음성 명령은 전자장치가 제공하는 다양한 기능을 실행시키기 위한 명령으로써, 예를 들어, 전화 걸기, 사진 촬영, MP3 재생 기능 등등을 실행시키는 명령이다.
이후, 전자장치(100)는 602단계에서 웨이크업 명령에 해당하는 음성신호를 기반으로 화자 검증(speaker verification)을 수행한다. 화자 검증은 인식 대상 화자를 검증하기 위한 것으로, 화자종속인식(speaker dependent recognition) 방식과 화자독립인식(speaker independent recognition) 방식이 있다.
이후, 전자장치(100)는 604단계에서 화자검증이 성공할 시, 606단계로 진행하고, 화자검증이 실패할 시, 600단계로 진행한다.
이후, 전자장치(100)는 606단계에서 웨이크업 명령에 해당하는 음성신호와 음성명령에 해당하는 음성신호 사이에는 침묵구간(silence duration)을 감지한다. 예를 들어, 웨이크업 명령은 "하이 갤럭시"이고 음성명령이 "홍길동 전화 걸기"라고 할 때, 사용자는 "하이 갤럭시"와 "홍길동 전화 걸기"를 연속적으로 발음할 때, "하이 갤럭시"와 "홍길동 전화 걸기" 사이 침묵구간이 발생한다.
이후, 전자장치(100)는 608단계에서 음성명령에 해당하는 음성신호가 시작되는지를 확인한다. 예를 들어, 608단계에서는 "홍길동 전화 걸기"라는 음성명령에 해당하는 음성신호의 시작시점을 확인한다.
이후, 전자장치(100)는 608단계에서 음성명령에 해당하는 음성신호가 시작될 시, 610단계로 진행하여 음성인식 알고리즘을 통해 음성명령에 해당하는 음성신호 분석한다.
이후, 전자장치(100)는 612단계에서, 인식된 음성명령을 기반으로 해당 동작을 수행한다. 예를 들어, 인식된 음성명령이 "홍길동 전화 걸기"일 때, 전자장치(100)는 폰북에 있는 홍길동 전화번호를 검색하여 검색된 전화번호로 호 연결을 시도한다.
이후, 본 발명의 절차를 종료한다.
도 7은 본 발명의 실시 예에 따른 웨이크업 명령 및 음성명령을 포함하는 음성신호 예를 도시하고 있다.
상기 도 7을 참조하면, 웨이크업 명령에 해당하는 음성신호(700) 및 음성명령에 해당하는 음성신호(720)가 연속적으로 전자장치에 입력된다. 웨이크업 명령에 해당하는 음성신호(700)와 음성명령에 해당하는 음성신호(720) 사이에는 침묵구간(silence duration)이 존재한다.
도 8은 본 발명의 실시 예에 따른 웨이크업 명령 및 음성명령을 포함하는 음성신호를 이용하여 전화 걸기를 수행하는 예이다.
상기 도 8을 참조하면, 웨이크업 명령에 해당하는 음성신호(700)에 따라 음성명령을 인식하기 위한 아이콘 객체(800)가 활성화되고(a), 이후 웨이크업 명령에 해당하는 음성신호(700) 다음의 음성명령(예: 홍길동 전화 걸기)에 해당하는 음성신호(720)가 인식되고(b), 음성명령에 따라 동작이 수행된다. 예를 들어, 폰북 내의 홍길동 전화번호가 검색되어 검색된 전화번호로 호 연결이 자동으로 시작된다(c).
도 9는 본 발명의 실시 예에 따른 화자검증을 통해 잠금 화면을 해지하는 예를 도시하고 있다.
상기 도 9를 참조하면, 웨이크업 명령에 해당하는 음성신호(700)에 따라 잠금화면(a)이 잠금 해제 화면(b)으로 전환된다. 도시하지 않았지만, 잠금 해제 화면이후에 웨이크업 명령에 해당하는 음성신호(700) 다음의 음성명령(예: 홍길동 전화 걸기)에 해당하는 음성신호(720)가 인식되어 해당 동작이 수행될 수 있다.
한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.
제어기: 100
인터페이스: 101
애플리케이션 프로세서: 102
통신 프로세서: 103
RF 처리기: 140
센서모듈: 150
확장 메모리: 170

Claims (4)

  1. 웨이크업 명령과 음성명령을 포함하는 음성신호를 입력받는 과정과,
    제1 음성인식 알고리즘을 통해 웨이크업 명령에 해당하는 음성신호를 기반으로 화자검증을 수행하는 과정과,
    화자검증 성공시, 상기 음성명령에 해당하는 음성신호를 서버로 제공하는 과정과,
    상기 서버에서 제2 음성인식 알고리즘을 통해 음성인식된 음성명령에 해당하는 제어신호를 수신하는 과정과,
    상기 음성명령에 해당하는 제어신호에 따라 상기 전자장치를 제어하는 과정을 포함하는 음성명령을 실행시키기 위한 방법.
  2. 제1항에 있어서,
    화자검증 실패시, 웨이크업 명령과 음성명령을 포함하는 음성신호를 재입력받는 과정을 더 포함하는 음성명령을 실행시키기 위한 방법.
  3. 제1항에 있어서,
    VAD(voice activity detection) 기술을 이용하여, 상기 웨이크업 명령에 해당하는 음성신호와 상기 음성명령에 해당하는 음성신호 사이의 침묵구간을 결정하는 과정과,
    전체 음성신호로부터 상기 음성명령에 해당하는 음성신호를 추출하는 과정을 더 포함하는 음성명령을 실행시키기 위한 방법.
  4. 음성명령을 포함하는 음성신호를 수신하는 과정과,
    제2 음성인식 알고리즘을 통해 음성인식된 음성명령에 해당하는 제어신호를 생성하는 과정과,
    상기 음성명령에 해당하는 제어신호를 전자장치로 전송하는 과정을 포함하는 음성명령을 실행시키기 위한 방법.
KR1020120057044A 2012-05-29 2012-05-29 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법 KR20130133629A (ko)

Priority Applications (10)

Application Number Priority Date Filing Date Title
KR1020120057044A KR20130133629A (ko) 2012-05-29 2012-05-29 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
EP13169533.0A EP2669889B1 (en) 2012-05-29 2013-05-28 Method and apparatus for executing voice command in an electronic device
US13/903,345 US9619200B2 (en) 2012-05-29 2013-05-28 Method and apparatus for executing voice command in electronic device
EP15194595.3A EP3001414B1 (en) 2012-05-29 2013-05-28 Method for executing voice command and electronic device
CN201611043404.4A CN106297802B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备
CN201310205259.5A CN103456306B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备
CN201611027587.0A CN106448678B (zh) 2012-05-29 2013-05-29 用于在电子装置中执行语音命令的方法和设备
US15/433,196 US20170162198A1 (en) 2012-05-29 2017-02-15 Method and apparatus for executing voice command in electronic device
US16/149,304 US10657967B2 (en) 2012-05-29 2018-10-02 Method and apparatus for executing voice command in electronic device
US16/876,225 US11393472B2 (en) 2012-05-29 2020-05-18 Method and apparatus for executing voice command in electronic device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120057044A KR20130133629A (ko) 2012-05-29 2012-05-29 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20130133629A true KR20130133629A (ko) 2013-12-09

Family

ID=48625739

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120057044A KR20130133629A (ko) 2012-05-29 2012-05-29 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법

Country Status (4)

Country Link
US (4) US9619200B2 (ko)
EP (2) EP2669889B1 (ko)
KR (1) KR20130133629A (ko)
CN (3) CN106448678B (ko)

Cited By (133)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
CN106335436A (zh) * 2016-08-31 2017-01-18 北京兴科迪科技有限公司 一种集成麦克风的内后视镜
KR20170093629A (ko) * 2016-02-05 2017-08-16 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템
KR20170107058A (ko) * 2015-03-08 2017-09-22 애플 인크. 가상 어시스턴트 활성화
KR20180109580A (ko) * 2017-03-28 2018-10-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 동작 방법
CN109664847A (zh) * 2017-10-13 2019-04-23 现代自动车株式会社 基于语音识别的车辆控制方法
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
JP2019152867A (ja) * 2014-07-18 2019-09-12 グーグル エルエルシー コロケーション情報を使用した話者照合
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
WO2020045835A1 (ko) * 2018-08-29 2020-03-05 삼성전자주식회사 전자 장치 및 그 제어 방법
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US10636420B2 (en) 2017-01-09 2020-04-28 Samsung Electronics Co., Ltd. Method of responding to input voice of electronic device and electronic device therefor
KR20200047853A (ko) * 2018-10-25 2020-05-08 현대오토에버 주식회사 연속 음성 명령에 기반하여 서비스를 제공하는 인공지능 음성단말장치 및 음성서비스시스템
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
CN111199735A (zh) * 2018-11-16 2020-05-26 阿尔派株式会社 车载装置以及语音识别方法
US10679628B2 (en) 2015-02-16 2020-06-09 Samsung Electronics Co., Ltd Electronic device and method of operating voice recognition function
CN111261151A (zh) * 2018-12-03 2020-06-09 中移(杭州)信息技术有限公司 一种语音处理方法、装置、电子设备及存储介质
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10699718B2 (en) 2015-03-13 2020-06-30 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US10733978B2 (en) 2015-02-11 2020-08-04 Samsung Electronics Co., Ltd. Operating method for voice function and electronic device supporting the same
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10762899B2 (en) 2016-08-31 2020-09-01 Samsung Electronics Co., Ltd. Speech recognition method and apparatus based on speaker recognition
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
KR20210005253A (ko) * 2018-05-16 2021-01-13 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11314898B2 (en) 2017-02-28 2022-04-26 Samsung Electronics Co., Ltd. Operating method of electronic device for function execution based on voice command in locked state and electronic device supporting the same
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
KR20220112560A (ko) * 2021-02-04 2022-08-11 주식회사 퀀텀에이아이 실시간 End-to-End 방식의 음성 인식 및 음성DNA 생성 시스템
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11437030B2 (en) 2017-10-17 2022-09-06 Samsung Electronics Co., Ltd. Electronic apparatus and method for voice recognition
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11676608B2 (en) 2021-04-02 2023-06-13 Google Llc Speaker verification using co-location information
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
KR102581221B1 (ko) * 2023-05-10 2023-09-21 주식회사 솔트룩스 재생 중인 응답 발화를 제어 및 사용자 의도를 예측하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
KR102616598B1 (ko) * 2023-05-30 2023-12-22 주식회사 엘솔루 번역 자막을 이용한 원문 자막 병렬 데이터 생성 방법
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
KR102617914B1 (ko) * 2023-05-10 2023-12-27 주식회사 포지큐브 음성 인식 방법 및 그 시스템
KR102620070B1 (ko) * 2022-10-13 2024-01-02 주식회사 타이렐 상황 인지에 따른 자율발화 시스템
KR102626954B1 (ko) * 2023-04-20 2024-01-18 주식회사 덴컴 치과용 음성 인식 장치 및 이를 이용한 방법
KR102632872B1 (ko) * 2023-05-22 2024-02-05 주식회사 포지큐브 음성인식 오류 교정 방법 및 그 시스템
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
KR102648689B1 (ko) * 2023-05-26 2024-03-18 주식회사 액션파워 텍스트 오류를 검출하는 방법
US11942095B2 (en) 2014-07-18 2024-03-26 Google Llc Speaker verification using co-location information
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability
US12051413B2 (en) 2015-09-30 2024-07-30 Apple Inc. Intelligent device identification
US12112745B2 (en) 2018-11-08 2024-10-08 Samsung Electronics Co., Ltd. Electronic device and control method thereof
US12136419B2 (en) 2023-08-31 2024-11-05 Apple Inc. Multimodality in digital assistant systems

Families Citing this family (223)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10002189B2 (en) 2007-12-20 2018-06-19 Apple Inc. Method and apparatus for searching using an active ontology
US9330720B2 (en) 2008-01-03 2016-05-03 Apple Inc. Methods and apparatus for altering audio output signals
US8996376B2 (en) 2008-04-05 2015-03-31 Apple Inc. Intelligent text-to-speech conversion
US20100030549A1 (en) 2008-07-31 2010-02-04 Lee Michael M Mobile device having human language translation capability with positional feedback
US10241752B2 (en) 2011-09-30 2019-03-26 Apple Inc. Interface for a virtual digital assistant
US10241644B2 (en) 2011-06-03 2019-03-26 Apple Inc. Actionable reminder entries
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9721563B2 (en) 2012-06-08 2017-08-01 Apple Inc. Name recognition system
US9547647B2 (en) 2012-09-19 2017-01-17 Apple Inc. Voice-based media searching
US9805721B1 (en) * 2012-09-21 2017-10-31 Amazon Technologies, Inc. Signaling voice-controlled devices
US9584642B2 (en) * 2013-03-12 2017-02-28 Google Technology Holdings LLC Apparatus with adaptive acoustic echo control for speakerphone mode
US10304465B2 (en) * 2012-10-30 2019-05-28 Google Technology Holdings LLC Voice control user interface for low power mode
US10381001B2 (en) * 2012-10-30 2019-08-13 Google Technology Holdings LLC Voice control user interface during low-power mode
US10373615B2 (en) * 2012-10-30 2019-08-06 Google Technology Holdings LLC Voice control user interface during low power mode
TWI557722B (zh) * 2012-11-15 2016-11-11 緯創資通股份有限公司 語音干擾的濾除方法、系統,與電腦可讀記錄媒體
CN103871408B (zh) * 2012-12-14 2017-05-24 联想(北京)有限公司 一种语音识别方法及装置、电子设备
US10134392B2 (en) 2013-01-10 2018-11-20 Nec Corporation Terminal, unlocking method, and program
US9689960B1 (en) 2013-04-04 2017-06-27 Amazon Technologies, Inc. Beam rejection in multi-beam microphone systems
US9530410B1 (en) 2013-04-09 2016-12-27 Google Inc. Multi-mode guard for voice commands
JP6416752B2 (ja) * 2013-04-19 2018-10-31 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 家電機器の制御方法、家電機器制御システム、及びゲートウェイ
US20140358535A1 (en) * 2013-05-28 2014-12-04 Samsung Electronics Co., Ltd. Method of executing voice recognition of electronic device and electronic device using the same
US20140358552A1 (en) * 2013-05-31 2014-12-04 Cirrus Logic, Inc. Low-power voice gate for device wake-up
WO2014197334A2 (en) 2013-06-07 2014-12-11 Apple Inc. System and method for user-specified pronunciation of words for speech synthesis and recognition
WO2014197335A1 (en) 2013-06-08 2014-12-11 Apple Inc. Interpreting and acting upon commands that involve sharing information with remote devices
USD738889S1 (en) * 2013-06-09 2015-09-15 Apple Inc. Display screen or portion thereof with animated graphical user interface
JP2015011170A (ja) * 2013-06-28 2015-01-19 株式会社ATR−Trek ローカルな音声認識を行なう音声認識クライアント装置
US20150031416A1 (en) * 2013-07-23 2015-01-29 Motorola Mobility Llc Method and Device For Command Phrase Validation
US10192557B2 (en) * 2013-08-26 2019-01-29 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition engines
WO2015029296A1 (ja) * 2013-08-29 2015-03-05 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音声認識方法及び音声認識装置
US20150112690A1 (en) * 2013-10-22 2015-04-23 Nvidia Corporation Low power always-on voice trigger architecture
CN103595869A (zh) * 2013-11-15 2014-02-19 华为终端有限公司 一种终端语音控制方法、装置及终端
CN103714815A (zh) * 2013-12-09 2014-04-09 何永 语音控制方法及其设备
US20150221307A1 (en) * 2013-12-20 2015-08-06 Saurin Shah Transition from low power always listening mode to high power speech recognition mode
KR102210433B1 (ko) 2014-01-21 2021-02-01 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
US9589564B2 (en) * 2014-02-05 2017-03-07 Google Inc. Multiple speech locale-specific hotword classifiers for selection of a speech locale
US9646607B2 (en) * 2014-03-10 2017-05-09 Dell Products, L.P. Managing wake-on-voice buffer quality based on system boot profiling
US9552817B2 (en) * 2014-03-19 2017-01-24 Microsoft Technology Licensing, Llc Incremental utterance decoder combination for efficient and accurate decoding
US9547468B2 (en) * 2014-03-31 2017-01-17 Microsoft Technology Licensing, Llc Client-side personal voice web navigation
CN109949815B (zh) * 2014-04-07 2024-06-07 三星电子株式会社 电子装置
US10770075B2 (en) * 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input
TW201541328A (zh) * 2014-04-30 2015-11-01 Maetay Prec Co Ltd 可根據所接收的語音切換使用者介面之手持式電子裝置及其使用者介面切換方法
US9860076B2 (en) 2014-05-07 2018-01-02 Vivint, Inc. Home automation via voice control
CN105280180A (zh) * 2014-06-11 2016-01-27 中兴通讯股份有限公司 一种终端控制方法、装置、语音控制装置及终端
KR102261552B1 (ko) 2014-06-30 2021-06-07 삼성전자주식회사 음성 명령어 제공 방법 및 이를 지원하는 전자 장치
CN104134442A (zh) * 2014-08-15 2014-11-05 广东欧珀移动通信有限公司 一种启动语音服务的方法及装置
US20160055847A1 (en) * 2014-08-19 2016-02-25 Nuance Communications, Inc. System and method for speech validation
CN104282307A (zh) * 2014-09-05 2015-01-14 中兴通讯股份有限公司 唤醒语音控制系统的方法、装置及终端
US9818400B2 (en) 2014-09-11 2017-11-14 Apple Inc. Method and apparatus for discovering trending terms in speech requests
US20160076776A1 (en) * 2014-09-12 2016-03-17 General Electric Company Voice latching of appliance door
WO2016041190A1 (zh) * 2014-09-19 2016-03-24 华为技术有限公司 一种运行应用程序的方法及装置
US20160133255A1 (en) * 2014-11-12 2016-05-12 Dsp Group Ltd. Voice trigger sensor
US10147421B2 (en) 2014-12-16 2018-12-04 Microcoft Technology Licensing, Llc Digital assistant voice input integration
WO2016103415A1 (ja) * 2014-12-25 2016-06-30 日立マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
CN105845135A (zh) * 2015-01-12 2016-08-10 芋头科技(杭州)有限公司 一种机器人系统的声音识别系统及方法
US9653079B2 (en) * 2015-02-12 2017-05-16 Apple Inc. Clock switching in always-on component
US10567477B2 (en) 2015-03-08 2020-02-18 Apple Inc. Virtual assistant continuity
JP6556473B2 (ja) * 2015-03-12 2019-08-07 株式会社東芝 送信装置、音声認識システム、送信方法、およびプログラム
CN106033331B (zh) * 2015-03-16 2019-07-26 联想(北京)有限公司 信息处理方法及电子设备
JP6564058B2 (ja) * 2015-04-10 2019-08-21 華為技術有限公司Huawei Technologies Co.,Ltd. 音声認識方法、音声ウェイクアップ装置、音声認識装置、および端末
CN104902070A (zh) 2015-04-13 2015-09-09 青岛海信移动通信技术股份有限公司 一种移动终端语音控制的方法及移动终端
EP3091422B1 (en) * 2015-05-08 2020-06-24 Nokia Technologies Oy Method, apparatus and computer program product for entering operational states based on an input type
US11025565B2 (en) 2015-06-07 2021-06-01 Apple Inc. Personalized prediction of responses for instant messaging
CN106293034A (zh) * 2015-06-11 2017-01-04 中兴通讯股份有限公司 一种信息输出的方法及终端
CN105118505A (zh) * 2015-07-17 2015-12-02 北京乐动卓越科技有限公司 一种语音控制方法及系统
CN106469040B (zh) * 2015-08-19 2019-06-21 华为终端有限公司 通信方法、服务器及设备
US9519766B1 (en) 2015-09-07 2016-12-13 Voicebox Technologies Corporation System and method of providing and validating enhanced CAPTCHAs
US9734138B2 (en) 2015-09-07 2017-08-15 Voicebox Technologies Corporation System and method of annotating utterances based on tags assigned by unmanaged crowds
US9448993B1 (en) 2015-09-07 2016-09-20 Voicebox Technologies Corporation System and method of recording utterances using unmanaged crowds for natural language processing
US9786277B2 (en) * 2015-09-07 2017-10-10 Voicebox Technologies Corporation System and method for eliciting open-ended natural language responses to questions to train natural language processors
US9401142B1 (en) 2015-09-07 2016-07-26 Voicebox Technologies Corporation System and method for validating natural language content using crowdsourced validation jobs
US11010550B2 (en) 2015-09-29 2021-05-18 Apple Inc. Unified language modeling framework for word prediction, auto-completion and auto-correction
US10366158B2 (en) 2015-09-29 2019-07-30 Apple Inc. Efficient word encoding for recurrent neural network language models
JP6710037B2 (ja) * 2015-10-23 2020-06-17 シャープ株式会社 通信装置
WO2017069310A1 (ko) * 2015-10-23 2017-04-27 삼성전자 주식회사 전자 장치 및 이의 제어 방법
CN106814639A (zh) * 2015-11-27 2017-06-09 富泰华工业(深圳)有限公司 语音控制系统及方法
CN105632486B (zh) * 2015-12-23 2019-12-17 北京奇虎科技有限公司 一种智能硬件的语音唤醒方法和装置
CN105677152A (zh) * 2015-12-31 2016-06-15 宇龙计算机通信科技(深圳)有限公司 一种语音触屏操作处理的方法、装置以及终端
US9633659B1 (en) * 2016-01-20 2017-04-25 Motorola Mobility Llc Method and apparatus for voice enrolling an electronic computing device
US10264030B2 (en) 2016-02-22 2019-04-16 Sonos, Inc. Networked microphone device control
US10446143B2 (en) 2016-03-14 2019-10-15 Apple Inc. Identification of voice inputs providing credentials
KR102498364B1 (ko) * 2016-03-24 2023-02-10 삼성전자주식회사 전자 장치 및 전자 장치에서의 정보 제공 방법
US10854199B2 (en) * 2016-04-22 2020-12-01 Hewlett-Packard Development Company, L.P. Communications with trigger phrases
EP3455853A2 (en) * 2016-05-13 2019-03-20 Bose Corporation Processing speech from distributed microphones
US9934775B2 (en) 2016-05-26 2018-04-03 Apple Inc. Unit-selection text-to-speech synthesis based on predicted concatenation parameters
US9972304B2 (en) 2016-06-03 2018-05-15 Apple Inc. Privacy preserving distributed evaluation framework for embedded personalized systems
US10049670B2 (en) * 2016-06-06 2018-08-14 Google Llc Providing voice action discoverability example for trigger term
US10249300B2 (en) 2016-06-06 2019-04-02 Apple Inc. Intelligent list reading
DK179588B1 (en) 2016-06-09 2019-02-22 Apple Inc. INTELLIGENT AUTOMATED ASSISTANT IN A HOME ENVIRONMENT
US10509862B2 (en) 2016-06-10 2019-12-17 Apple Inc. Dynamic phrase expansion of language input
US10192552B2 (en) 2016-06-10 2019-01-29 Apple Inc. Digital assistant providing whispered speech
US10067938B2 (en) 2016-06-10 2018-09-04 Apple Inc. Multilingual word prediction
US10490187B2 (en) 2016-06-10 2019-11-26 Apple Inc. Digital assistant providing automated status report
DK179049B1 (en) 2016-06-11 2017-09-18 Apple Inc Data driven natural language event detection and classification
DK179343B1 (en) 2016-06-11 2018-05-14 Apple Inc Intelligent task discovery
KR102691889B1 (ko) * 2016-07-27 2024-08-06 삼성전자주식회사 전자 장치 및 그의 음성 인식 방법
CN106328132A (zh) * 2016-08-15 2017-01-11 歌尔股份有限公司 一种智能设备的语音交互控制方法和装置
US9972320B2 (en) 2016-08-24 2018-05-15 Google Llc Hotword detection on multiple devices
US10140987B2 (en) 2016-09-16 2018-11-27 International Business Machines Corporation Aerial drone companion device and a method of operating an aerial drone companion device
KR20180055661A (ko) * 2016-11-16 2018-05-25 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20180060328A (ko) 2016-11-28 2018-06-07 삼성전자주식회사 멀티 모달 입력을 처리하는 전자 장치, 멀티 모달 입력을 처리하는 방법 및 멀티 모달 입력을 처리하는 서버
US11281993B2 (en) 2016-12-05 2022-03-22 Apple Inc. Model and ensemble compression for metric learning
US10079015B1 (en) 2016-12-06 2018-09-18 Amazon Technologies, Inc. Multi-layer keyword detection
US10242673B2 (en) 2016-12-07 2019-03-26 Google Llc Preventing of audio attacks using an input and an output hotword detection model
US9940930B1 (en) 2016-12-07 2018-04-10 Google Llc Securing audio data
US10134396B2 (en) 2016-12-07 2018-11-20 Google Llc Preventing of audio attacks
KR101801182B1 (ko) * 2016-12-08 2017-12-20 장재윤 향초 제조 장치
DE102017219596A1 (de) * 2016-12-22 2018-06-28 Volkswagen Aktiengesellschaft Sprachausgabestimme eines Sprachbediensystems
US10593346B2 (en) 2016-12-22 2020-03-17 Apple Inc. Rank-reduced token representation for automatic speech recognition
US11176932B2 (en) * 2016-12-23 2021-11-16 Spectrum Brands, Inc. Electronic faucet with smart features
US10937421B2 (en) * 2016-12-23 2021-03-02 Spectrum Brands, Inc. Electronic faucet with smart features
KR20180082033A (ko) * 2017-01-09 2018-07-18 삼성전자주식회사 음성을 인식하는 전자 장치
US10102856B2 (en) * 2017-01-20 2018-10-16 Essential Products, Inc. Assistant device with active and passive experience modes
CN108304153A (zh) * 2017-03-02 2018-07-20 腾讯科技(深圳)有限公司 语音交互方法和装置
KR102304701B1 (ko) * 2017-03-28 2021-09-24 삼성전자주식회사 사용자의 음성 입력에 대한 답변을 제공하는 방법 및 장치
EP3382696B1 (en) * 2017-03-28 2022-09-14 Samsung Electronics Co., Ltd. Method for operating speech recognition service and electronic device supporting the same
CN107146608B (zh) * 2017-04-10 2020-09-25 北京猎户星空科技有限公司 一种播放控制方法、装置及智能设备
US11250844B2 (en) * 2017-04-12 2022-02-15 Soundhound, Inc. Managing agent engagement in a man-machine dialog
EP4293661A3 (en) 2017-04-20 2024-02-21 Google LLC Multi-user authentication on a device
DK201770439A1 (en) 2017-05-11 2018-12-13 Apple Inc. Offline personal assistant
DK201770431A1 (en) 2017-05-15 2018-12-20 Apple Inc. Optimizing dialogue policy decisions for digital assistants using implicit feedback
DK201770432A1 (en) 2017-05-15 2018-12-21 Apple Inc. Hierarchical belief states for digital assistants
KR102112565B1 (ko) * 2017-05-19 2020-05-19 엘지전자 주식회사 홈 어플라이언스 및 음성 인식 서버 시스템의 동작 방법
US10657328B2 (en) 2017-06-02 2020-05-19 Apple Inc. Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling
US10069976B1 (en) * 2017-06-13 2018-09-04 Harman International Industries, Incorporated Voice agent forwarding
US10283117B2 (en) * 2017-06-19 2019-05-07 Lenovo (Singapore) Pte. Ltd. Systems and methods for identification of response cue at peripheral device
CN109147776A (zh) * 2017-06-19 2019-01-04 丽宝大数据股份有限公司 具有声控功能的显示装置及声控时机指示方法
US10607606B2 (en) * 2017-06-19 2020-03-31 Lenovo (Singapore) Pte. Ltd. Systems and methods for execution of digital assistant
KR102060775B1 (ko) * 2017-06-27 2019-12-30 삼성전자주식회사 음성 입력에 대응하는 동작을 수행하는 전자 장치
GB2578386B (en) 2017-06-27 2021-12-01 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB2563953A (en) 2017-06-28 2019-01-02 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
GB201713697D0 (en) 2017-06-28 2017-10-11 Cirrus Logic Int Semiconductor Ltd Magnetic detection of replay attack
CN107564517A (zh) 2017-07-05 2018-01-09 百度在线网络技术(北京)有限公司 语音唤醒方法、设备及系统、云端服务器与可读介质
GB201801532D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Methods, apparatus and systems for audio playback
GB201801527D0 (en) 2017-07-07 2018-03-14 Cirrus Logic Int Semiconductor Ltd Method, apparatus and systems for biometric processes
US10504511B2 (en) 2017-07-24 2019-12-10 Midea Group Co., Ltd. Customizable wake-up voice commands
CN107508734B (zh) * 2017-08-17 2021-09-07 北京小米移动软件有限公司 多媒体留言播放方法及装置
KR102411766B1 (ko) * 2017-08-25 2022-06-22 삼성전자주식회사 음성 인식 서비스를 활성화하는 방법 및 이를 구현한 전자 장치
KR102335869B1 (ko) * 2017-08-31 2021-12-07 삼성전자주식회사 전자 장치, 입력 디바이스 및 그 제어 방법
US10445429B2 (en) 2017-09-21 2019-10-15 Apple Inc. Natural language understanding using vocabularies with compressed serialized tries
US10755051B2 (en) 2017-09-29 2020-08-25 Apple Inc. Rule-based natural language processing
GB2567503A (en) 2017-10-13 2019-04-17 Cirrus Logic Int Semiconductor Ltd Analysing speech signals
GB201801664D0 (en) 2017-10-13 2018-03-21 Cirrus Logic Int Semiconductor Ltd Detection of liveness
GB201804843D0 (en) 2017-11-14 2018-05-09 Cirrus Logic Int Semiconductor Ltd Detection of replay attack
US10665234B2 (en) * 2017-10-18 2020-05-26 Motorola Mobility Llc Detecting audio trigger phrases for a voice recognition session
WO2019079974A1 (en) * 2017-10-24 2019-05-02 Beijing Didi Infinity Technology And Development Co., Ltd. SYSTEM AND METHOD FOR UNINTERRUPTED APPLICATION REVIEW AND VOICE RECOGNITION
CN107808670B (zh) 2017-10-25 2021-05-14 百度在线网络技术(北京)有限公司 语音数据处理方法、装置、设备及存储介质
US10636424B2 (en) 2017-11-30 2020-04-28 Apple Inc. Multi-turn canned dialog
KR102492727B1 (ko) * 2017-12-04 2023-02-01 삼성전자주식회사 전자장치 및 그 제어방법
CN107911386B (zh) * 2017-12-06 2020-12-04 北京小米移动软件有限公司 获取服务授权信息的方法及装置
CN109901698B (zh) * 2017-12-08 2023-08-08 深圳市腾讯计算机系统有限公司 一种智能交互方法、可穿戴设备和终端以及系统
CN109994106B (zh) * 2017-12-29 2023-06-23 阿里巴巴集团控股有限公司 一种语音处理方法及设备
EP3692522A4 (en) * 2017-12-31 2020-11-11 Midea Group Co., Ltd. METHOD AND SYSTEM FOR THE CONTROL OF HOME ASSISTANT DEVICES
US10733982B2 (en) 2018-01-08 2020-08-04 Apple Inc. Multi-directional dialog
CN110021294A (zh) * 2018-01-09 2019-07-16 深圳市优必选科技有限公司 机器人的控制方法、装置以及存储装置
US11475899B2 (en) 2018-01-23 2022-10-18 Cirrus Logic, Inc. Speaker identification
US11264037B2 (en) * 2018-01-23 2022-03-01 Cirrus Logic, Inc. Speaker identification
US11735189B2 (en) 2018-01-23 2023-08-22 Cirrus Logic, Inc. Speaker identification
CN110097876A (zh) * 2018-01-30 2019-08-06 阿里巴巴集团控股有限公司 语音唤醒处理方法和被唤醒设备
US10789959B2 (en) 2018-03-02 2020-09-29 Apple Inc. Training speaker recognition models for digital assistants
KR102617265B1 (ko) * 2018-03-13 2023-12-26 삼성전자주식회사 사용자 음성 입력을 처리하는 장치
US11127405B1 (en) 2018-03-14 2021-09-21 Amazon Technologies, Inc. Selective requests for authentication for voice-based launching of applications
US10885910B1 (en) 2018-03-14 2021-01-05 Amazon Technologies, Inc. Voice-forward graphical user interface mode management
US10877637B1 (en) 2018-03-14 2020-12-29 Amazon Technologies, Inc. Voice-based device operation mode management
JP7186375B2 (ja) 2018-03-29 2022-12-09 パナソニックIpマネジメント株式会社 音声処理装置、音声処理方法および音声処理システム
CN108502656A (zh) * 2018-04-11 2018-09-07 苏州福特美福电梯有限公司 电梯语音控制方法和系统
CN108665900B (zh) 2018-04-23 2020-03-03 百度在线网络技术(北京)有限公司 云端唤醒方法及系统、终端以及计算机可读存储介质
CN108600219B (zh) * 2018-04-23 2020-09-11 海信(广东)空调有限公司 一种语音控制方法及设备
WO2019218370A1 (zh) 2018-05-18 2019-11-21 深圳傲智天下信息科技有限公司 一种ai语音交互方法、装置及系统
CN108766423B (zh) * 2018-05-25 2021-07-09 三星电子(中国)研发中心 一种基于场景的主动唤醒方法和装置
WO2019235863A1 (en) 2018-06-05 2019-12-12 Samsung Electronics Co., Ltd. Methods and systems for passive wakeup of a user interaction device
CN109036398A (zh) * 2018-07-04 2018-12-18 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备及存储介质
US10832673B2 (en) 2018-07-13 2020-11-10 International Business Machines Corporation Smart speaker device with cognitive sound analysis and response
US10832672B2 (en) 2018-07-13 2020-11-10 International Business Machines Corporation Smart speaker system with cognitive sound analysis and response
US10692490B2 (en) 2018-07-31 2020-06-23 Cirrus Logic, Inc. Detection of replay attack
CN108792856A (zh) * 2018-08-01 2018-11-13 迅达(中国)电梯有限公司 电梯呼叫系统
KR102574903B1 (ko) * 2018-08-08 2023-09-05 삼성전자주식회사 개인화된 장치 연결을 지원하는 전자 장치 및 그 방법
US10923128B2 (en) 2018-08-29 2021-02-16 Cirrus Logic, Inc. Speech recognition
US10915614B2 (en) 2018-08-31 2021-02-09 Cirrus Logic, Inc. Biometric authentication
KR102156054B1 (ko) * 2018-09-12 2020-09-15 김철회 인공지능스피커와 연동되는 전자펜 시스템
US11627012B2 (en) 2018-10-09 2023-04-11 NewTekSol, LLC Home automation management system
CN109286706B (zh) * 2018-10-12 2021-01-26 京东方科技集团股份有限公司 显示设备
KR20200043075A (ko) * 2018-10-17 2020-04-27 삼성전자주식회사 전자 장치 및 그 제어방법, 전자 장치의 음향 출력 제어 시스템
CN111063356B (zh) * 2018-10-17 2023-05-09 北京京东尚科信息技术有限公司 电子设备响应方法及系统、音箱和计算机可读存储介质
CN109119078A (zh) * 2018-10-26 2019-01-01 北京石头世纪科技有限公司 自动机器人控制方法、装置、自动机器人和介质
US10908883B2 (en) * 2018-11-13 2021-02-02 Adobe Inc. Voice interaction development tool
US10902851B2 (en) 2018-11-14 2021-01-26 International Business Machines Corporation Relaying voice commands between artificial intelligence (AI) voice response systems
US10657968B1 (en) * 2018-11-19 2020-05-19 Google Llc Controlling device output according to a determined condition of a user
US10847156B2 (en) 2018-11-28 2020-11-24 Adobe Inc. Assembled voice interaction
US10922044B2 (en) 2018-11-29 2021-02-16 Bose Corporation Wearable audio device capability demonstration
KR20200071841A (ko) * 2018-12-03 2020-06-22 현대자동차주식회사 차량용 음성명령어 처리 장치 및 그 방법
CN109725545A (zh) * 2018-12-27 2019-05-07 广东美的厨房电器制造有限公司 智能设备及其控制方法、计算机可读存储介质
CN109830232A (zh) * 2019-01-11 2019-05-31 北京猎户星空科技有限公司 人机交互方法、装置和存储介质
US11017771B2 (en) 2019-01-18 2021-05-25 Adobe Inc. Voice command matching during testing of voice-assisted application prototypes for languages with non-phonetic alphabets
US10964322B2 (en) 2019-01-23 2021-03-30 Adobe Inc. Voice interaction tool for voice-assisted application prototypes
US10923098B2 (en) 2019-02-13 2021-02-16 Bose Corporation Binaural recording-based demonstration of wearable audio device functions
US10813195B2 (en) * 2019-02-19 2020-10-20 Signify Holding B.V. Intelligent lighting device and system
WO2020196955A1 (ko) * 2019-03-27 2020-10-01 엘지전자 주식회사 인공 지능 기기 및 인공 지능 기기의 동작 방법
CN111754996A (zh) * 2019-03-29 2020-10-09 阿里巴巴集团控股有限公司 基于语音模拟遥控器的控制方法、装置及电子设备
US10855921B2 (en) 2019-04-29 2020-12-01 Sony Corporation Techniques for controlling camera interfaces using voice commands
CN110120222A (zh) * 2019-05-23 2019-08-13 九牧厨卫股份有限公司 一种带语音播报功能的智能镜柜的语音播报方法
CN110347862B (zh) * 2019-06-24 2022-09-06 歌尔股份有限公司 录音处理方法、装置、设备、系统及音频设备
CN110335597A (zh) * 2019-06-24 2019-10-15 深圳市小魔信息技术有限公司 一种手机锁屏状态下的唤醒系统和方法
KR20190092333A (ko) * 2019-07-19 2019-08-07 엘지전자 주식회사 음성 인식 디바이스와 통신하는 장치, 음성 인식 능력을 가진 장치 및 음성 인식 능력을 가진 장치를 제어하는 방법
CN110570840B (zh) * 2019-09-12 2022-07-05 腾讯科技(深圳)有限公司 一种基于人工智能的智能设备唤醒方法和装置
KR20210044985A (ko) * 2019-10-16 2021-04-26 엘지전자 주식회사 음성 처리 방법 및 음성 처리 장치
CA3059029A1 (en) 2019-10-17 2021-04-17 The Toronto-Dominion Bank Maintaining data confidentiality in communications involving voice-enabled devices in a distributed computing environment
KR102156055B1 (ko) * 2020-05-11 2020-09-15 김철회 인공지능스피커와 연동하여 인터랙티브 프로그램을 제어하는 전자펜 시스템
KR102164773B1 (ko) * 2020-05-11 2020-10-13 김철회 마이크로폰으로 인공지능스피커와 연동되는 전자펜 시스템
KR102164774B1 (ko) * 2020-05-11 2020-10-13 김철회 인공지능스피커의 기능을 조작하는 전자펜 시스템
WO2021237235A1 (en) * 2020-05-20 2021-11-25 Sonos, Inc. Input detection windowing
US11482224B2 (en) 2020-05-20 2022-10-25 Sonos, Inc. Command keywords with input detection windowing
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
CN111986682A (zh) * 2020-08-31 2020-11-24 百度在线网络技术(北京)有限公司 语音交互方法、装置、设备以及存储介质
CN112114887A (zh) * 2020-09-24 2020-12-22 北京小米移动软件有限公司 被控设备、唤醒被控设备的方法及存储介质
US11700139B2 (en) * 2020-11-13 2023-07-11 Haier Us Appliance Solutions, Inc. Virtual microphone input for multiple voice assistants
CN112698872A (zh) * 2020-12-21 2021-04-23 北京百度网讯科技有限公司 语音数据处理的方法、装置、设备及存储介质
KR102494051B1 (ko) * 2021-01-26 2023-01-31 삼성전자주식회사 전자 장치 및 이의 음성 인식 방법
CN112837694B (zh) * 2021-01-29 2022-12-06 青岛海尔科技有限公司 设备唤醒方法、装置、存储介质及电子装置
US20220358915A1 (en) * 2021-05-10 2022-11-10 Roku, Inc. Voice command recognition system
CN113409786B (zh) * 2021-07-07 2023-12-05 北京京东乾石科技有限公司 语音控制方法、装置、电子设备及计算机可读存储介质
US12118982B2 (en) 2022-04-11 2024-10-15 Honeywell International Inc. System and method for constraining air traffic communication (ATC) transcription in real-time
EP4270384A1 (en) * 2022-04-29 2023-11-01 Honeywell International Inc. System and method for handling unsplit segments in transcription of air traffic communication (atc)
CN117253488A (zh) * 2022-06-10 2023-12-19 Oppo广东移动通信有限公司 语音识别方法、装置、设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002540477A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント−サーバ音声認識
KR20100027865A (ko) * 2008-09-03 2010-03-11 엘지전자 주식회사 화자 및 음성 인식 장치 및 그 방법
KR20110061267A (ko) * 2009-12-01 2011-06-09 (주)에이치씨아이랩 다중인식 음성 인터페이스장치 및 그 방법

Family Cites Families (96)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5165095A (en) * 1990-09-28 1992-11-17 Texas Instruments Incorporated Voice telephone dialing
US5345538A (en) * 1992-01-27 1994-09-06 Krishna Narayannan Voice activated control apparatus
US5428707A (en) * 1992-11-13 1995-06-27 Dragon Systems, Inc. Apparatus and methods for training speech recognition systems and their users and otherwise improving speech recognition performance
US5668929A (en) * 1993-01-21 1997-09-16 Hirsch Electronics Corporation Speech activated security systems and methods
US6070140A (en) * 1995-06-05 2000-05-30 Tran; Bao Q. Speech recognizer
US5704009A (en) * 1995-06-30 1997-12-30 International Business Machines Corporation Method and apparatus for transmitting a voice sample to a voice activated data processing system
JP3674990B2 (ja) * 1995-08-21 2005-07-27 セイコーエプソン株式会社 音声認識対話装置および音声認識対話処理方法
EP0850673B1 (en) * 1996-07-11 2003-10-01 Sega Enterprises, Ltd. Game input device and game input method with voice recognition
US6092044A (en) * 1997-03-28 2000-07-18 Dragon Systems, Inc. Pronunciation generation in speech recognition
US6347299B1 (en) * 1997-07-31 2002-02-12 Ncr Corporation System for navigation and editing of electronic records through speech and audio
US6047255A (en) * 1997-12-04 2000-04-04 Nortel Networks Corporation Method and system for producing speech signals
US6145083A (en) * 1998-04-23 2000-11-07 Siemens Information And Communication Networks, Inc. Methods and system for providing data and telephony security
US6208971B1 (en) * 1998-10-30 2001-03-27 Apple Computer, Inc. Method and apparatus for command recognition using data-driven semantic inference
US6965863B1 (en) * 1998-11-12 2005-11-15 Microsoft Corporation Speech recognition user interface
US6606599B2 (en) * 1998-12-23 2003-08-12 Interactive Speech Technologies, Llc Method for integrating computing processes with an interface controlled by voice actuated grammars
US7082397B2 (en) * 1998-12-01 2006-07-25 Nuance Communications, Inc. System for and method of creating and browsing a voice web
US6411926B1 (en) * 1999-02-08 2002-06-25 Qualcomm Incorporated Distributed voice recognition system
ATE281689T1 (de) 1999-03-26 2004-11-15 Scansoft Inc Client-server spracherkennungssystem
US6266635B1 (en) * 1999-07-08 2001-07-24 Contec Medical Ltd. Multitasking interactive voice user interface
US6415257B1 (en) * 1999-08-26 2002-07-02 Matsushita Electric Industrial Co., Ltd. System for identifying and adapting a TV-user profile by means of speech technology
US6208917B1 (en) * 1999-12-23 2001-03-27 Daimlerchrysler Corporation Ambient temperature/inlet air temperature sensor dither
US6466654B1 (en) * 2000-03-06 2002-10-15 Avaya Technology Corp. Personal virtual assistant with semantic tagging
US7047192B2 (en) * 2000-06-28 2006-05-16 Poirier Darrell A Simultaneous multi-user real-time speech recognition system
US7171365B2 (en) * 2001-02-16 2007-01-30 International Business Machines Corporation Tracking time using portable recorders and speech recognition
US20020194003A1 (en) * 2001-06-05 2002-12-19 Mozer Todd F. Client-server security system and method
US20030055535A1 (en) * 2001-09-17 2003-03-20 Hunter Engineering Company Voice interface for vehicle wheel alignment system
US6985865B1 (en) * 2001-09-26 2006-01-10 Sprint Spectrum L.P. Method and system for enhanced response to voice commands in a voice command platform
US7313525B1 (en) * 2001-09-26 2007-12-25 Sprint Spectrum L.P. Method and system for bookmarking navigation points in a voice command title platform
US6941265B2 (en) * 2001-12-14 2005-09-06 Qualcomm Inc Voice recognition system method and apparatus
US7167831B2 (en) * 2002-02-04 2007-01-23 Microsoft Corporation Systems and methods for managing multiple grammars in a speech recognition system
US6959279B1 (en) * 2002-03-26 2005-10-25 Winbond Electronics Corporation Text-to-speech conversion system on an integrated circuit
US6965786B2 (en) * 2002-08-13 2005-11-15 Qualcomm Incorporated Annunciators for voice and data applications in wireless communication devices
FI20030660A0 (fi) * 2003-05-02 2003-05-02 Nokia Corp Menetelmä päätelaitteen tehonsäästöön langattomassa lähiverkossa ja päätelaite
US7660578B2 (en) * 2003-05-02 2010-02-09 Nokia Corporation Method for saving power in a wireless terminal and a terminal
US20050131677A1 (en) * 2003-12-12 2005-06-16 Assadollahi Ramin O. Dialog driven personal information manager
EP1562180B1 (en) * 2004-02-06 2015-04-01 Nuance Communications, Inc. Speech dialogue system and method for controlling an electronic device
US20060041926A1 (en) * 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
US8086425B2 (en) * 2004-06-14 2011-12-27 Papadimitriou Wanda G Autonomous fitness for service assessment
US7240010B2 (en) * 2004-06-14 2007-07-03 Papadimitriou Wanda G Voice interaction with and control of inspection equipment
KR100652645B1 (ko) * 2004-07-23 2006-12-06 엘지전자 주식회사 푸시 투 토크형 이동 통신 단말기의 음성 검출 및 인식을이용한 발언권 관리 장치와 방법
US7624016B2 (en) * 2004-07-23 2009-11-24 Microsoft Corporation Method and apparatus for robustly locating user barge-ins in voice-activated command systems
US20060074658A1 (en) * 2004-10-01 2006-04-06 Siemens Information And Communication Mobile, Llc Systems and methods for hands-free voice-activated devices
US20060164205A1 (en) * 2005-01-27 2006-07-27 Buckingham Duane W Proximity wake-up activation of electronic circuits
KR100679044B1 (ko) * 2005-03-07 2007-02-06 삼성전자주식회사 사용자 적응형 음성 인식 방법 및 장치
JP4667082B2 (ja) * 2005-03-09 2011-04-06 キヤノン株式会社 音声認識方法
KR100690800B1 (ko) 2005-06-10 2007-03-09 엘지전자 주식회사 음성인식을 이용한 음성 정보 저장 장치 및 방법
US20070073718A1 (en) 2005-09-14 2007-03-29 Jorey Ramer Mobile search service instant activation
US7620553B2 (en) * 2005-12-20 2009-11-17 Storz Endoskop Produktions Gmbh Simultaneous support of isolated and connected phrase command recognition in automatic speech recognition systems
US20070174388A1 (en) * 2006-01-20 2007-07-26 Williams Michael G Integrated voice mail and email system
KR100762636B1 (ko) * 2006-02-14 2007-10-01 삼성전자주식회사 네트워크 단말의 음성 검출 제어 시스템 및 방법
US20070281748A1 (en) * 2006-05-31 2007-12-06 Spectralink Corp. Method & apparatus for unlocking a mobile phone keypad
KR100744301B1 (ko) 2006-06-01 2007-07-30 삼성전자주식회사 음성 인식을 이용하여 동작 모드를 전환하는 휴대 단말기및 그 방법
US7881832B2 (en) * 2006-06-09 2011-02-01 Garmin International, Inc. Automatic speech recognition system and method for aircraft
US8234120B2 (en) * 2006-07-26 2012-07-31 Nuance Communications, Inc. Performing a safety analysis for user-defined voice commands to ensure that the voice commands do not cause speech recognition ambiguities
US8214219B2 (en) * 2006-09-15 2012-07-03 Volkswagen Of America, Inc. Speech communications system for a vehicle and method of operating a speech communications system for a vehicle
US20080082338A1 (en) * 2006-09-29 2008-04-03 O'neil Michael P Systems and methods for secure voice identification and medical device interface
US20080140413A1 (en) * 2006-12-07 2008-06-12 Jonathan Travis Millman Synchronization of audio to reading
US8056070B2 (en) * 2007-01-10 2011-11-08 Goller Michael D System and method for modifying and updating a speech recognition program
US8886545B2 (en) * 2007-03-07 2014-11-11 Vlingo Corporation Dealing with switch latency in speech recognition
US20110054900A1 (en) * 2007-03-07 2011-03-03 Phillips Michael S Hybrid command and control between resident and remote speech recognition facilities in a mobile voice-to-speech application
US8886521B2 (en) * 2007-05-17 2014-11-11 Redstart Systems, Inc. System and method of dictation for a speech recognition command system
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
US20090210233A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Cognitive offloading: interface for storing and composing searches on and navigating unconstrained input patterns
KR101056511B1 (ko) 2008-05-28 2011-08-11 (주)파워보이스 실시간 호출명령어 인식을 이용한 잡음환경에서의음성구간검출과 연속음성인식 시스템
KR101513615B1 (ko) * 2008-06-12 2015-04-20 엘지전자 주식회사 이동 단말기 및 그 음성 인식 방법
JP5053950B2 (ja) * 2008-07-29 2012-10-24 キヤノン株式会社 情報処理方法、情報処理装置、プログラムおよび記憶媒体
US8498425B2 (en) * 2008-08-13 2013-07-30 Onvocal Inc Wearable headset with self-contained vocal feedback and vocal command
KR101526998B1 (ko) * 2008-10-16 2015-06-08 엘지전자 주식회사 이동통신 단말기 및 그 절전 방법
CA2748695C (en) 2008-12-31 2017-11-07 Bce Inc. System and method for unlocking a device
US8340969B2 (en) * 2009-04-24 2012-12-25 Research In Motion Limited Method and mobile communication device for generating dual-tone multi-frequency (DTMF) commands on a mobile communication device having a touchscreen
US20120004910A1 (en) * 2009-05-07 2012-01-05 Romulo De Guzman Quidilig System and method for speech processing and speech to text
US8217251B2 (en) * 2009-09-28 2012-07-10 Lawrence E Anderson Interactive display
US8924893B2 (en) * 2009-10-14 2014-12-30 At&T Mobility Ii Llc Locking and unlocking of an electronic device using a sloped lock track
US8335689B2 (en) * 2009-10-14 2012-12-18 Cogi, Inc. Method and system for efficient management of speech transcribers
US8717285B1 (en) * 2009-10-28 2014-05-06 Amazon Technologies, Inc. Orientation lock
US8626498B2 (en) * 2010-02-24 2014-01-07 Qualcomm Incorporated Voice activity detection based on plural voice activity detectors
US20110264452A1 (en) * 2010-04-27 2011-10-27 Ramya Venkataramu Audio output of text data using speech control commands
US11471091B2 (en) * 2010-07-29 2022-10-18 Kulangara Sivadas Mind strength trainer
US8402533B2 (en) * 2010-08-06 2013-03-19 Google Inc. Input to locked computing device
US20120052907A1 (en) 2010-08-30 2012-03-01 Sensory, Incorporated Hands-Free, Eyes-Free Mobile Device for In-Car Use
US20120133484A1 (en) * 2010-11-29 2012-05-31 Research In Motion Limited Multiple-input device lock and unlock
KR101208166B1 (ko) * 2010-12-16 2012-12-04 엔에이치엔(주) 온라인 음성인식을 처리하는 음성인식 클라이언트 시스템, 음성인식 서버 시스템 및 음성인식 방법
JP5695447B2 (ja) * 2011-03-01 2015-04-08 株式会社東芝 テレビジョン装置及び遠隔操作装置
US10146415B2 (en) * 2011-03-02 2018-12-04 Lenovo (Beijing) Limited Method and terminal device for controlling a terminal device in a locked and unlocked state
US9262612B2 (en) * 2011-03-21 2016-02-16 Apple Inc. Device access using voice authentication
US8768707B2 (en) * 2011-09-27 2014-07-01 Sensory Incorporated Background speech recognition assistant using speaker verification
US9395800B2 (en) * 2011-09-30 2016-07-19 Qualcomm Incorporated Enabling instant handwritten input on mobile computing devices
US8954334B2 (en) * 2011-10-15 2015-02-10 Zanavox Voice-activated pulser
US9031847B2 (en) * 2011-11-15 2015-05-12 Microsoft Technology Licensing, Llc Voice-controlled camera operations
US20130176108A1 (en) * 2012-01-06 2013-07-11 Intuit Inc. Automated mechanism to switch user data sets in a touch-based device
US8863042B2 (en) * 2012-01-24 2014-10-14 Charles J. Kulas Handheld device with touch controls that reconfigure in response to the way a user operates the device
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
KR20130133629A (ko) * 2012-05-29 2013-12-09 삼성전자주식회사 전자장치에서 음성명령을 실행시키기 위한 장치 및 방법
US9536528B2 (en) * 2012-07-03 2017-01-03 Google Inc. Determining hotword suitability
US9158372B2 (en) * 2012-10-30 2015-10-13 Google Technology Holdings LLC Method and apparatus for user interaction data storage
US8973104B2 (en) * 2012-12-31 2015-03-03 Google Technology Holdings LLC Method and system for providing limited usage of an electronic device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002540477A (ja) * 1999-03-26 2002-11-26 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ クライアント−サーバ音声認識
KR20100027865A (ko) * 2008-09-03 2010-03-11 엘지전자 주식회사 화자 및 음성 인식 장치 및 그 방법
KR20110061267A (ko) * 2009-12-01 2011-06-09 (주)에이치씨아이랩 다중인식 음성 인터페이스장치 및 그 방법

Cited By (204)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11979836B2 (en) 2007-04-03 2024-05-07 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US12087308B2 (en) 2010-01-18 2024-09-10 Apple Inc. Intelligent automated assistant
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10692504B2 (en) 2010-02-25 2020-06-23 Apple Inc. User profiling for voice input processing
US10417405B2 (en) 2011-03-21 2019-09-17 Apple Inc. Device access using voice authentication
US11350253B2 (en) 2011-06-03 2022-05-31 Apple Inc. Active transport based notifications
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11069336B2 (en) 2012-03-02 2021-07-20 Apple Inc. Systems and methods for name pronunciation
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US12009007B2 (en) 2013-02-07 2024-06-11 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US10714117B2 (en) 2013-02-07 2020-07-14 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11048473B2 (en) 2013-06-09 2021-06-29 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US12073147B2 (en) 2013-06-09 2024-08-27 Apple Inc. Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10769385B2 (en) 2013-06-09 2020-09-08 Apple Inc. System and method for inferring user intent from speech inputs
US12010262B2 (en) 2013-08-06 2024-06-11 Apple Inc. Auto-activating smart responses based on activities from remote devices
US11314370B2 (en) 2013-12-06 2022-04-26 Apple Inc. Method for extracting salient dialog usage from live data
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10417344B2 (en) 2014-05-30 2019-09-17 Apple Inc. Exemplar-based natural language processing
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US12118999B2 (en) 2014-05-30 2024-10-15 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US12067990B2 (en) 2014-05-30 2024-08-20 Apple Inc. Intelligent assistant for home automation
US10657966B2 (en) 2014-05-30 2020-05-19 Apple Inc. Better resolution when referencing to concepts
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US10699717B2 (en) 2014-05-30 2020-06-30 Apple Inc. Intelligent assistant for home automation
US10714095B2 (en) 2014-05-30 2020-07-14 Apple Inc. Intelligent assistant for home automation
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
JP2019152867A (ja) * 2014-07-18 2019-09-12 グーグル エルエルシー コロケーション情報を使用した話者照合
US11942095B2 (en) 2014-07-18 2024-03-26 Google Llc Speaker verification using co-location information
US10390213B2 (en) 2014-09-30 2019-08-20 Apple Inc. Social reminders
US10438595B2 (en) 2014-09-30 2019-10-08 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US10453443B2 (en) 2014-09-30 2019-10-22 Apple Inc. Providing an indication of the suitability of speech recognition
US10733978B2 (en) 2015-02-11 2020-08-04 Samsung Electronics Co., Ltd. Operating method for voice function and electronic device supporting the same
US12027172B2 (en) 2015-02-16 2024-07-02 Samsung Electronics Co., Ltd Electronic device and method of operating voice recognition function
US10679628B2 (en) 2015-02-16 2020-06-09 Samsung Electronics Co., Ltd Electronic device and method of operating voice recognition function
US11231904B2 (en) 2015-03-06 2022-01-25 Apple Inc. Reducing response latency of intelligent automated assistants
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
KR20170107058A (ko) * 2015-03-08 2017-09-22 애플 인크. 가상 어시스턴트 활성화
US10699718B2 (en) 2015-03-13 2020-06-30 Samsung Electronics Co., Ltd. Speech recognition system and speech recognition method thereof
KR20160110085A (ko) * 2015-03-13 2016-09-21 삼성전자주식회사 음성 인식 시스템 및 방법
US12001933B2 (en) 2015-05-15 2024-06-04 Apple Inc. Virtual assistant in a communication session
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11127397B2 (en) 2015-05-27 2021-09-21 Apple Inc. Device voice control
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US10681212B2 (en) 2015-06-05 2020-06-09 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US12051413B2 (en) 2015-09-30 2024-07-30 Apple Inc. Intelligent device identification
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US10354652B2 (en) 2015-12-02 2019-07-16 Apple Inc. Applying neural network language models to weighted finite state transducers for automatic speech recognition
US10942703B2 (en) 2015-12-23 2021-03-09 Apple Inc. Proactive assistance based on dialog communication between devices
KR20170093629A (ko) * 2016-02-05 2017-08-16 삼성전자주식회사 음성인식 장치 및 방법, 음성인식시스템
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
US11069347B2 (en) 2016-06-08 2021-07-20 Apple Inc. Intelligent automated assistant for media exploration
US10733993B2 (en) 2016-06-10 2020-08-04 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US10580409B2 (en) 2016-06-11 2020-03-03 Apple Inc. Application integration with a digital assistant
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
US10942702B2 (en) 2016-06-11 2021-03-09 Apple Inc. Intelligent device arbitration and control
CN106335436A (zh) * 2016-08-31 2017-01-18 北京兴科迪科技有限公司 一种集成麦克风的内后视镜
US10762899B2 (en) 2016-08-31 2020-09-01 Samsung Electronics Co., Ltd. Speech recognition method and apparatus based on speaker recognition
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
US10553215B2 (en) 2016-09-23 2020-02-04 Apple Inc. Intelligent automated assistant
US10636420B2 (en) 2017-01-09 2020-04-28 Samsung Electronics Co., Ltd. Method of responding to input voice of electronic device and electronic device therefor
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11314898B2 (en) 2017-02-28 2022-04-26 Samsung Electronics Co., Ltd. Operating method of electronic device for function execution based on voice command in locked state and electronic device supporting the same
KR20180109580A (ko) * 2017-03-28 2018-10-08 삼성전자주식회사 사용자 발화를 처리하는 전자 장치 및 그 동작 방법
US11222635B2 (en) 2017-03-28 2022-01-11 Samsung Electronics Co., Ltd. Electronic device for processing user speech and operating method therefor
US11955124B2 (en) 2017-03-28 2024-04-09 Samsung Electronics Co., Ltd. Electronic device for processing user speech and operating method therefor
US10417266B2 (en) 2017-05-09 2019-09-17 Apple Inc. Context-aware ranking of intelligent response suggestions
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10847142B2 (en) 2017-05-11 2020-11-24 Apple Inc. Maintaining privacy of personal information
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US12014118B2 (en) 2017-05-15 2024-06-18 Apple Inc. Multi-modal interfaces having selection disambiguation and text modification capability
US10748546B2 (en) 2017-05-16 2020-08-18 Apple Inc. Digital assistant services based on device capabilities
US10403278B2 (en) 2017-05-16 2019-09-03 Apple Inc. Methods and systems for phonetic matching in digital assistant services
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US12026197B2 (en) 2017-05-16 2024-07-02 Apple Inc. Intelligent automated assistant for media exploration
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
CN109664847A (zh) * 2017-10-13 2019-04-23 现代自动车株式会社 基于语音识别的车辆控制方法
US11437030B2 (en) 2017-10-17 2022-09-06 Samsung Electronics Co., Ltd. Electronic apparatus and method for voice recognition
US10733375B2 (en) 2018-01-31 2020-08-04 Apple Inc. Knowledge-based framework for improving natural language understanding
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
US10909331B2 (en) 2018-03-30 2021-02-02 Apple Inc. Implicit identification of translation payload with neural machine translation
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
KR20230020019A (ko) * 2018-05-16 2023-02-09 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
KR20210005253A (ko) * 2018-05-16 2021-01-13 구글 엘엘씨 가상 어시스턴트를 위한 입력 모드 선택
US10984780B2 (en) 2018-05-21 2021-04-20 Apple Inc. Global semantic word embeddings using bi-directional recurrent neural networks
US10403283B1 (en) 2018-06-01 2019-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11495218B2 (en) 2018-06-01 2022-11-08 Apple Inc. Virtual assistant operation in multi-device environments
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US12061752B2 (en) 2018-06-01 2024-08-13 Apple Inc. Attention aware virtual assistant dismissal
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US12080287B2 (en) 2018-06-01 2024-09-03 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
US11386266B2 (en) 2018-06-01 2022-07-12 Apple Inc. Text correction
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US12067985B2 (en) 2018-06-01 2024-08-20 Apple Inc. Virtual assistant operations in multi-device environments
US10684703B2 (en) 2018-06-01 2020-06-16 Apple Inc. Attention aware virtual assistant dismissal
US10504518B1 (en) 2018-06-03 2019-12-10 Apple Inc. Accelerated task performance
US10944859B2 (en) 2018-06-03 2021-03-09 Apple Inc. Accelerated task performance
US10496705B1 (en) 2018-06-03 2019-12-03 Apple Inc. Accelerated task performance
WO2020045835A1 (ko) * 2018-08-29 2020-03-05 삼성전자주식회사 전자 장치 및 그 제어 방법
KR20200025226A (ko) * 2018-08-29 2020-03-10 삼성전자주식회사 전자 장치 및 그 제어 방법
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
KR20200047853A (ko) * 2018-10-25 2020-05-08 현대오토에버 주식회사 연속 음성 명령에 기반하여 서비스를 제공하는 인공지능 음성단말장치 및 음성서비스시스템
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US12112745B2 (en) 2018-11-08 2024-10-08 Samsung Electronics Co., Ltd. Electronic device and control method thereof
CN111199735A (zh) * 2018-11-16 2020-05-26 阿尔派株式会社 车载装置以及语音识别方法
CN111199735B (zh) * 2018-11-16 2024-05-28 阿尔派株式会社 车载装置以及语音识别方法
CN111261151A (zh) * 2018-12-03 2020-06-09 中移(杭州)信息技术有限公司 一种语音处理方法、装置、电子设备及存储介质
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
KR20220112560A (ko) * 2021-02-04 2022-08-11 주식회사 퀀텀에이아이 실시간 End-to-End 방식의 음성 인식 및 음성DNA 생성 시스템
US11676608B2 (en) 2021-04-02 2023-06-13 Google Llc Speaker verification using co-location information
KR102620070B1 (ko) * 2022-10-13 2024-01-02 주식회사 타이렐 상황 인지에 따른 자율발화 시스템
KR102626954B1 (ko) * 2023-04-20 2024-01-18 주식회사 덴컴 치과용 음성 인식 장치 및 이를 이용한 방법
KR102617914B1 (ko) * 2023-05-10 2023-12-27 주식회사 포지큐브 음성 인식 방법 및 그 시스템
KR102581221B1 (ko) * 2023-05-10 2023-09-21 주식회사 솔트룩스 재생 중인 응답 발화를 제어 및 사용자 의도를 예측하는 방법, 장치 및 컴퓨터-판독 가능 기록 매체
KR102632872B1 (ko) * 2023-05-22 2024-02-05 주식회사 포지큐브 음성인식 오류 교정 방법 및 그 시스템
KR102648689B1 (ko) * 2023-05-26 2024-03-18 주식회사 액션파워 텍스트 오류를 검출하는 방법
KR102616598B1 (ko) * 2023-05-30 2023-12-22 주식회사 엘솔루 번역 자막을 이용한 원문 자막 병렬 데이터 생성 방법
US12136419B2 (en) 2023-08-31 2024-11-05 Apple Inc. Multimodality in digital assistant systems

Also Published As

Publication number Publication date
CN103456306A (zh) 2013-12-18
US10657967B2 (en) 2020-05-19
US20190035399A1 (en) 2019-01-31
EP2669889A3 (en) 2014-01-01
EP2669889B1 (en) 2016-01-13
US20130325484A1 (en) 2013-12-05
EP2669889A2 (en) 2013-12-04
CN106448678A (zh) 2017-02-22
US11393472B2 (en) 2022-07-19
CN106297802B (zh) 2020-01-17
US20200279563A1 (en) 2020-09-03
US20170162198A1 (en) 2017-06-08
EP3001414B1 (en) 2017-09-20
CN106297802A (zh) 2017-01-04
EP3001414A1 (en) 2016-03-30
US9619200B2 (en) 2017-04-11
CN106448678B (zh) 2020-05-01
CN103456306B (zh) 2017-03-01

Similar Documents

Publication Publication Date Title
US11393472B2 (en) Method and apparatus for executing voice command in electronic device
US10866785B2 (en) Equal access to speech and touch input
KR101703911B1 (ko) 인식된 음성 개시 액션에 대한 시각적 확인
CN105378708B (zh) 环境感知对话策略和响应生成
US20190013025A1 (en) Providing an ambient assist mode for computing devices
TWI585744B (zh) 用於操作虛擬助理之方法、系統及電腦可讀取儲存媒體
US10353495B2 (en) Personalized operation of a mobile device using sensor signatures
KR102501083B1 (ko) 음성 인식 방법 및 이를 사용하는 전자 장치
US9565289B2 (en) Mobile terminal and method of controlling the same
WO2019179068A1 (zh) 风险检测方法、装置、移动终端和存储介质
US9772815B1 (en) Personalized operation of a mobile device using acoustic and non-acoustic information
CN111079438A (zh) 身份验证方法、装置、电子设备及存储介质
KR20140116642A (ko) 음성 인식 기반의 기능 제어 방법 및 장치
US10122854B2 (en) Interactive voice response (IVR) using voice input for tactile input based on context
JP2019020927A (ja) ユーザ認証システム、コンピューティング装置、端末装置、その方法、及びコンピュータが実行可能なプログラム

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E601 Decision to refuse application