KR102454761B1 - 영상표시장치의 동작 방법 - Google Patents
영상표시장치의 동작 방법 Download PDFInfo
- Publication number
- KR102454761B1 KR102454761B1 KR1020150084459A KR20150084459A KR102454761B1 KR 102454761 B1 KR102454761 B1 KR 102454761B1 KR 1020150084459 A KR1020150084459 A KR 1020150084459A KR 20150084459 A KR20150084459 A KR 20150084459A KR 102454761 B1 KR102454761 B1 KR 102454761B1
- Authority
- KR
- South Korea
- Prior art keywords
- signal
- sound
- audio
- audio signal
- speaker
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 80
- 230000005236 sound signal Effects 0.000 claims abstract description 130
- 230000005540 biological transmission Effects 0.000 claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 63
- 238000001914 filtration Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 21
- 230000008569 process Effects 0.000 description 21
- 238000004891 communication Methods 0.000 description 17
- 230000006870 function Effects 0.000 description 12
- 239000011521 glass Substances 0.000 description 8
- 238000012790 confirmation Methods 0.000 description 7
- 230000008859 change Effects 0.000 description 5
- 238000011017 operating method Methods 0.000 description 5
- 238000012937 correction Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000003111 delayed effect Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000001133 acceleration Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005669 field effect Effects 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000004091 panning Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000003825 pressing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42203—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/41—Structure of client; Structure of client peripherals
- H04N21/422—Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
- H04N21/42204—User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/40—Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
- H04N21/43—Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
- H04N21/439—Processing of audio elementary streams
- H04N21/4394—Processing of audio elementary streams involving operations for analysing the audio stream, e.g. detecting features or characteristics in audio streams
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R3/00—Circuits for transducers, loudspeakers or microphones
- H04R3/02—Circuits for transducers, loudspeakers or microphones for preventing acoustic reaction, i.e. acoustic oscillatory feedback
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Human Computer Interaction (AREA)
- General Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Controls And Circuits For Display Device (AREA)
Abstract
본 발명의 일실시예에 따른 영상표시장치의 동작 방법은 마이크(MIC)를 통하여 음성 신호 및 스피커의 음향 신호를 포함하는 오디오 신호를 수신하는 단계, 외부 스피커 연결 여부를 판단하는 단계, 외부 스피커가 연결된 경우에, 외부 스피커의 입력 신호를 분석하는 단계, 외부 스피커의 입력 신호와 오디오 신호를 비교하여, 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하는 단계와 보정된 오디오 신호에 기초하여, 스피커의 음향 신호를 제거하는 단계를 포함한다. 이에 따라, 사운드바에 대한 음향 제거를 수행할 수 있고, 음성 인식의 정확성을 높일 수 있어, 사용자의 이용 편의성을 향상시킬 수 있다.
Description
본 발명은 영상표시장치 및 그 동작 방법에 관한 것이며, 더욱 상세하게는 사운드바에 대한 음향 제거 방법 및 효율적인 음성 인식 방법을 제공할 수 있는 영상표시장치 및 그 동작 방법에 관한 것이다.
영상표시장치는 사용자가 시청할 수 있는 영상을 표시하는 기능을 갖춘 장치이다. 사용자는 영상표시장치를 통하여 방송을 시청할 수 있다. 영상표시장치는 방송국에서 송출되는 방송신호 중 사용자가 선택한 방송을 디스플레이에 표시한다. 현재 방송은 전 세계적으로 아날로그 방송에서 디지털 방송으로 전환하고 있는 추세이다.
디지털 방송은 디지털 영상 및 음성 신호를 송출하는 방송을 의미한다. 디지털 방송은 아날로그 방송에 비해, 외부 잡음에 강해 데이터 손실이 작으며, 에러 정정에 유리하며, 해상도가 높고, 선명한 화면을 제공한다. 또한, 디지털 방송은 아날로그 방송과 달리 양방향 서비스가 가능하다.
한편, 영상표시장치는 고품질의 오디오 출력을 위하여, 오디오 신호 처리부를 포함하거나 오디오 신호를 처리하여 출력하는 오디오 처리 장치와 연결되어 사용될 수 있다.
또한, 영상표시장치의 기능 및 서비스에 다양화에 따라, 메뉴 선택, 텍스트 입력, 명령 입력, 채널 전환 등을 사용자 음성을 인식하여 조작할 수 있는 음성 인식 기술에 대한 연구가 증가하고 있다.
본 발명의 목적은, 사운드바에 대한 음향 제거를 수행할 수 있는 영상표시장치 및 그 동작 방법을 제공함에 있다.
또한, 본 발명의 다른 목적은, 음성 인식의 정확성을 높일 수 있는 영상표시장치 및 그 동작 방법을 제공함에 있다.
또한, 본 발명의 다른 목적은, 음성 인식 기술을 통하여 정확하고 편리하게 조작 가능하고, 사용자의 이용 편의성을 향상시킬 수 있는 영상표시장치 및 그 동작 방법을 제공함에 있다.
본 발명의 일실시예에 따른 영상표시장치의 동작 방법은 마이크(MIC)를 통하여 음성 신호 및 스피커의 음향 신호를 포함하는 오디오 신호를 수신하는 단계, 외부 스피커 연결 여부를 판단하는 단계, 외부 스피커가 연결된 경우에, 외부 스피커의 입력 신호를 분석하는 단계, 외부 스피커의 입력 신호와 오디오 신호를 비교하여, 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하는 단계와 보정된 오디오 신호에 기초하여, 스피커의 음향 신호를 제거하는 단계를 포함한다.
본 발명에 따르면, 사운드바에 대한 음향 제거를 수행할 수 있고, 음성 인식의 정확성을 높일 수 있다.
본 발명에 따르면, 음성 인식 기술을 통하여 정확하고 편리하게 조작 가능하고, 사용자의 이용 편의성을 향상시킬 수 있다.
도 1은 본 발명의 실시예에 따른 영상표시 시스템을 보여주는 도면이다.
도 2는 본 발명의 일실시예에 따른 영상표시장치의 내부 블록도이다.
도 3은 도 2의 제어부의 내부 블록도의 일예이다.
도 4는 도 2의 원격제어장치의 제어 방법을 도시한 도면이다.
도 5는 본 발명의 일실시예에 의한 원격제어장치의 사시도이다.
도 6은 본 발명의 일실시예에 따른 원격제어장치의 내부 블록도이다.
도 7은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이다.
도 8a 내지 도 11은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 설명하기 위해 참조되는 도면이다.
도 12는 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이다.
도 13은 도 2의 제어부의 내부 블록도의 일예이다.
도 14는 본 발명의 일실시예에 따른 음성 인식 과정의 설명에 참조되는 도면이다.
도 2는 본 발명의 일실시예에 따른 영상표시장치의 내부 블록도이다.
도 3은 도 2의 제어부의 내부 블록도의 일예이다.
도 4는 도 2의 원격제어장치의 제어 방법을 도시한 도면이다.
도 5는 본 발명의 일실시예에 의한 원격제어장치의 사시도이다.
도 6은 본 발명의 일실시예에 따른 원격제어장치의 내부 블록도이다.
도 7은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이다.
도 8a 내지 도 11은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 설명하기 위해 참조되는 도면이다.
도 12는 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이다.
도 13은 도 2의 제어부의 내부 블록도의 일예이다.
도 14는 본 발명의 일실시예에 따른 음성 인식 과정의 설명에 참조되는 도면이다.
이하에서는 도면을 참조하여 본 발명을 더욱 상세하게 설명한다.
이하의 설명에서 사용되는 구성요소에 대한 접미사 "모듈", "엔진" 및 "부"는 단순히 본 명세서 작성의 용이함만이 고려되어 부여되는 것으로서, 그 자체로 특별히 중요한 의미 또는 역할을 부여하는 것은 아니다. 따라서, 상기 "모듈", "엔진" 및 "부"는 서로 혼용되어 사용될 수도 있다.
도 1은 본 발명의 일 실시예에 따른 영상표시 시스템을 보여주는 도면이다.
도 1을 참조하면, 본 발명의 일실시예에 의한 영상표시 시스템(10)은, 영상표시장치(100) 및 외부 스피커, 예를 들어 사운드 바(400)를 포함할 수 있고, 영상표시장치(100)와 사운드 바(400)는 유선 또는 무선으로 연결될 수 있다.
또한, 본 발명의 일실시예에 의한 영상표시 시스템(10)은, 영상표시장치(100) 및 외부 스피커, 예를 들어 사운드 바(400) 및/또는 복수개의 스피커를 포함하는 홈씨어터 시스템일 수 있다.
한편, 영상표시장치(100)는, 디스플레이 수단을 구비한 다양한 전자기기일 수 있다. 예를 들어, 방송 표시가 가능한 티브이(TV), 모니터, 컴퓨터, 태블릿 PC, 휴대 단말기 등을 포함할 수 있다.
본 발명의 일실시예에 따른 영상표시장치(100)는, 음성 신호를 수신할 수 있고, 내부에 구비된 임베디드(Embedded) 음성 인식 엔진(미도시)을 통하여 수신하는 음성 신호에 대한 음성 인식을 수행할 수 있다.
한편, 영상표시장치(100)는 음성 인식 엔진 내부에 또는 음성 인식 엔진 외부의 저장부에 음성 인식에 사용되는 데이터를 저장하는 음성 데이터베이스를 구비할 수 있다.
상기 음성 데이터베이스는 음향 모델(Acoustic Model)과 언어 모델(Language Model)을 저장할 수 있고, 음향 모델과 언어 모델을 각각 저장하는 음향 모델 데이터베이스와 언어 모델 데이터베이스를 포함할 수 있다.
또한, 음성 데이터베이스는 어휘 및 대응하는 발음기호를 저장하는 발음 사전 데이터베이스를 더 구비할 수 있다. 실시예에 따라서는, 음성 인식 엔진은 수신되는 텍스트(text) 데이터로부터 발음기호를 생성하는 발음기호 생성 모듈을 더 포함할 수 있다.
상기 음성 인식 엔진은, 수신되는 음성 신호를 처리하고, 상기 음성 데이터베이스에 저장되는 데이터와 비교하여 음성 인식 결과 데이터를 출력할 수 있다. 한편, 영상표시장치(100)는 출력되는 음성 인식 결과 데이터에 기초하여 메뉴 선택, 텍스트 입력, 명령 입력, 채널 전환 등 다양한 동작을 수행할 수 있다.
도 2는 본 발명의 일 실시예에 따른 영상표시장치의 내부 블록도이다.
도 2를 참조하면, 본 발명의 일실시예에 의한 영상표시장치(100)는, 방송 수신부(105), 외부장치 인터페이스부(130), 네트워크 인터페이스부(135), 저장부(140), 사용자입력 인터페이스부(150), 센서부(미도시), 제어부(170), 디스플레이(180), 및 오디오 출력부(185)를 포함할 수 있다.
또한, 본 발명의 일실시예에 따른 영상표시장치(100)는 내장 마이크(MIC, 미도시)를 더 포함할 수 있다.
방송 수신부(105)는, 튜너부(110), 복조부(120)를 포함할 수 있다. 한편, 필요에 따라, 방송 수신부(105)는 튜너부(110)와 복조부(120)를 구비하면서 네트워크 인터페이스부(135)는 포함하지 않도록 설계하는 것도 가능하며, 반대로 네트워크 인터페이스부(135)를 구비하면서 튜너부(110)와 복조부(120)는 포함하지 않도록 설계하는 것도 가능하다.
튜너부(110)는 안테나를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기저장된 모든 채널에 해당하는 RF 방송 신호를 선택한다. 또한, 선택된 RF 방송 신호를 중간 주파수 신호 혹은 베이스 밴드 영상 또는 음성신호로 변환한다.
예를 들어, 선택된 RF 방송 신호가 디지털 방송 신호이면 디지털 IF 신호(DIF)로 변환하고, 아날로그 방송 신호이면 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)로 변환한다. 즉, 튜너부(110)는 디지털 방송 신호 또는 아날로그 방송 신호를 처리할 수 있다. 튜너부(110)에서 출력되는 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)는 제어부(170)로 직접 입력될 수 있다.
또한, 튜너부(110)는 ATSC(Advanced Television System Committee) 방식에 따른 단일 캐리어의 RF 방송 신호 또는 DVB(Digital Video Broadcasting) 방식에 따른 복수 캐리어의 RF 방송 신호를 수신할 수 있다.
한편, 튜너부(110)는, 본 발명에서 안테나를 통해 수신되는 RF 방송 신호 중 채널 기억 기능을 통하여 저장된 모든 방송 채널의 RF 방송 신호를 순차적으로 선택하여 이를 중간 주파수 신호 혹은 베이스 밴드 영상 또는 음성 신호로 변환할 수 있다.
한편, 튜너부(110)는, 복수 채널의 방송 신호를 수신하기 위해, 복수의 튜너를 구비하는 것이 가능하다. 또는, 복수 채널의 방송 신호를 동시에 수신하는 단일 튜너도 가능하다.
복조부(120)는 튜너부(110)에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조 동작을 수행한다.
복조부(120)는 복조 및 채널 복호화를 수행한 후 스트림 신호(TS)를 출력할 수 있다. 이때 스트림 신호는 영상 신호, 음성 신호 또는 데이터 신호가 다중화된 신호일 수 있다.
복조부(120)에서 출력한 스트림 신호는 제어부(170)로 입력될 수 있다. 제어부(170)는 역다중화, 영상/음성 신호 처리 등을 수행한 후, 디스플레이(180)에 영상을 출력하고, 오디오 출력부(185)로 음성을 출력한다.
외부장치 인터페이스부(130)는, 접속된 외부 장치(190)와 데이터를 송신 또는 수신할 수 있다. 이를 위해, 외부장치 인터페이스부(130)는, A/V 입출력부(미도시) 또는 무선 통신부(미도시)를 포함할 수 있다.
외부장치 인터페이스부(130)는, DVD(Digital Versatile Disk), 블루레이(Blu ray), 게임기기, 카메라, 캠코더, 컴퓨터(노트북), 셋탑 박스 등과 같은 외부 장치와 유/무선으로 접속될 수 있으며, 외부 장치와 입력/출력 동작을 수행할 수도 있다.
A/V 입출력부는, 외부 장치의 영상 및 음성 신호를 입력받을 수 있다. 한편, 무선 통신부는, 다른 전자기기와 근거리 무선 통신을 수행할 수 있다.
네트워크 인터페이스부(135)는, 영상표시장치(100)를 인터넷망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공한다. 예를 들어, 네트워크 인터페이스부(135)는, 네트워크를 통해, 인터넷 또는 컨텐츠 제공자 또는 네트워크 운영자가 제공하는 서버로부터 컨텐츠 또는 기타 데이터들을 수신할 수 있다.
저장부(140)는, 제어부(170) 내의 각 신호 처리 및 제어를 위한 프로그램이 저장될 수도 있고, 신호 처리된 영상, 음성 또는 데이터 신호를 저장할 수도 있다.
또한, 저장부(140)는 외부장치 인터페이스부(130)로 입력되는 영상, 음성 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있다. 또한, 녹화된 소정프로그램을 TS 형태 또는 소정 포맷으로 트랜스코딩(transcoding)된 형태로 저장 보관할 수 있다.
한편, 저장부(140)는, 음성 인식에 이용하는 데이터들을 저장하고 관리할 수 있다.
도 2의 저장부(140)가 제어부(170)와 별도로 구비된 실시예를 도시하고 있으나, 본 발명의 범위는 이에 한정되지 않는다. 저장부(140)는 제어부(170) 내에 포함될 수 있다.
사용자입력 인터페이스부(150)는, 사용자가 입력한 신호를 제어부(170)로 전달하거나, 제어부(170)로부터의 신호를 사용자에게 전달한다.
예를 들어, 원격제어장치(200)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 사용자 입력 신호를 송신/수신하거나, 전원키, 채널키, 볼륨키, 설정치 등의 로컬키(미도시)에서 입력되는 사용자 입력 신호를 제어부(170)에 전달하거나, 사용자의 제스처를 센싱하는 센서부(미도시)로부터 입력되는 사용자 입력 신호를 제어부(170)에 전달하거나, 제어부(170)로부터의 신호를 센서부(미도시)로 송신할 수 있다.
제어부(170)는, 튜너부(110) 또는 복조부(120) 또는 외부장치 인터페이스부(130) 등을 통하여, 입력되는 스트림을 역다중화하거나, 역다중화된 신호들을 처리하여, 영상 또는 음성 출력을 위한 신호를 생성 및 출력할 수 있다.
제어부(170)에서 영상 처리된 영상 신호는 디스플레이(180)로 입력되어, 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 제어부(170)에서 영상 처리된 영상 신호는 외부장치 인터페이스부(130)를 통하여 외부 출력장치로 입력될 수 있다.
제어부(170)에서 처리된 음성 신호는 오디오 출력부(185)로 음향 출력될 수 있다. 또한, 제어부(170)에서 처리된 음성 신호는 외부장치 인터페이스부(130)를 통하여 외부 출력장치, 예를 들어, 사운드 바(400)로 입력될 수 있다.
도 2에는 도시되어 있지 않으나, 제어부(170)는 역다중화부, 영상처리부 등을 포함할 수 있다. 이에 대해서는 도 3을 참조하여 후술한다.
그 외, 제어부(170)는, 영상표시장치(100) 내의 전반적인 동작을 제어할 수 있다. 예를 들어, 제어부(170)는 튜너부(110)를 제어하여, 사용자가 선택한 채널 또는 기저장된 채널에 해당하는 RF 방송을 선택(Tuning)하도록 제어할 수 있다.
또한, 제어부(170)는 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 영상표시장치(100)를 제어할 수 있다.
한편, 제어부(170)는, 영상을 표시하도록 디스플레이(180)를 제어할 수 있다. 이때, 디스플레이(180)에 표시되는 영상은, 정지 영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.
한편, 제어부(170)는 디스플레이(180)에 표시되는 영상 중에, 소정 2D 오브젝트에 대해 3D 오브젝트로 생성하여 표시되도록 할 수 있다. 예를 들어, 오브젝트는, 접속된 웹 화면(신문, 잡지 등), EPG(Electronic Program Guide), 다양한 메뉴, 위젯, 아이콘, 정지 영상, 동영상, 텍스트 중 적어도 하나일 수 있다.
이러한 3D 오브젝트는, 디스플레이(180)에 표시되는 영상과 다른 깊이를 가지도록 처리될 수 있다. 바람직하게는 3D 오브젝트가 디스플레이(180)에 표시되는 영상에 비해 돌출되어 보이도록 처리될 수 있다.
한편, 제어부(170)는, 촬영부(미도시)로부터 촬영된 영상에 기초하여, 사용자의 위치를 인식할 수 있다. 예를 들어, 사용자와 영상표시장치(100)간의 거리(z축 좌표)를 파악할 수 있다. 그 외, 사용자 위치에 대응하는 디스플레이(180) 내의 x축 좌표, 및 y축 좌표를 파악할 수 있다.
한편, 도면에 도시하지 않았지만, 채널 신호 또는 외부 입력 신호에 대응하는 썸네일 영상을 생성하는 채널 브라우징 처리부가 더 구비되는 것도 가능하다. 채널 브라우징 처리부는, 복조부(120)에서 출력한 스트림 신호(TS) 또는 외부장치 인터페이스부(130)에서 출력한 스트림 신호 등을 입력받아, 입력되는 스트림 신호로부터 영상을 추출하여 썸네일 영상을 생성할 수 있다. 생성된 썸네일 영상은 복호화딘 영상 등과 함께 스트림 복호화되어 제어부(170)로 입력될 수 있다. 제어부(170)는 입력된 썸네일 영상을 이용하여 복수의 썸네일 영상을 구비하는 썸네일 리스트를 디스플레이(180)에 표시할 수 있다.
이때의 썸네일 리스트는, 디스플레이(180)에 소정 영상을 표시한 상태에서 일부 영역에 표시되는 간편 보기 방식으로 표시되거나, 디스플레이(180)의 대부분 영역에 표시되는 전체 보기 방식으로 표시될 수 있다. 이러한 썸네일 리스트 내의 썸네일 영상은 순차적으로 업데이트 될 수 있다.
디스플레이(180)는, 제어부(170)에서 처리된 영상 신호, 데이터 신호, OSD 신호, 제어 신호 또는 외부장치 인터페이스부(130)에서 수신되는 영상 신호, 데이터 신호, 제어 신호 등을 변환하여 구동 신호를 생성한다.
디스플레이(180)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display)등이 가능하며, 또한, 3차원 디스플레이(3D display)가 가능할 수도 있다.
이러한, 3차원 영상 시청을 위해, 디스플레이(180)는, 추가 디스플레이 방식과 단독 디스플레이 방식으로 나뉠 수 있다.
단독 디스플레이 방식은, 별도의 추가 디스플레이, 예를 들어 안경(glass) 등이 없이, 디스플레이(180) 단독으로 3D 영상을 구현할 수 있는 것으로서, 그 예로, 렌티큘라 방식, 파라랙스 베리어(parallax barrier) 등 다양한 방식이 적용될 수 있다.
한편, 추가 디스플레이 방식은, 디스플레이(180) 외에 시청장치로서 추가 디스플레이를 사용하여, 3D 영상을 구현할 수 있는 것으로서, 그 예로, 헤드 마운트 디스플레이(HMD) 타입, 안경 타입 등 다양한 방식이 적용될 수 있다.
한편, 안경 타입은, 편광 안경 타입 등의 패시브(passive) 방식과, 셔터 글래스(ShutterGlass) 타입 등의 액티브(active) 방식으로 다시 나뉠 수 있다. 그리고, 헤드 마운트 디스플레이 타입에서도 패시브 방식과 액티브 방식으로 나뉠 수 있다.
한편, 디스플레이(180)는, 터치 스크린으로 구성되어 출력 장치 이외에 입력 장치로 사용되는 것도 가능하다.
오디오 출력부(185)는, 제어부(170)에서 음성 처리된 신호를 입력 받아 음성으로 출력한다.
촬영부(미도시)는 사용자를 촬영한다. 촬영부(미도시)는 1 개의 카메라로 구현되는 것이 가능하나, 이에 한정되지 않으며, 복수 개의 카메라로 구현되는 것도 가능하다. 한편, 촬영부(미도시)는 디스플레이(180) 상부에 영상표시장치(100)에 매립되거나 또는 별도로 배치될 수 있다. 촬영부(미도시)에서 촬영된 영상 정보는 제어부(170)에 입력될 수 있다.
제어부(170)는, 촬영부(미도시)로부터 촬영된 영상, 또는 센서부(미도시)로부터의 감지된 신호 각각 또는 그 조합에 기초하여 사용자의 제스처를 감지할 수 있다.
원격제어장치(200)는, 사용자 입력을 사용자입력 인터페이스부(150)로 송신한다. 이를 위해, 원격제어장치(200)는, 블루투스(Bluetooth), RF(Radio Frequency) 통신, 적외선(IR) 통신, UWB(Ultra Wideband), 지그비(ZigBee) 방식 등을 사용할 수 있다. 또한, 원격제어장치(200)는, 사용자입력 인터페이스부(150)에서 출력한 영상, 음성 또는 데이터 신호 등을 수신하여, 이를 원격제어장치(200)에서 표시하거나 음성 출력할 수 있다.
원격제어장치(200)는, 도 4 내지 도 6을 참조하여 후술한다.
한편, 상술한 영상표시장치(100)는, 고정형 또는 이동형 디지털 방송 수신 가능한 디지털 방송 수신기일 수 있다.
한편, 도 2에 도시된 영상표시장치(100)의 블록도는 본 발명의 일실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 영상표시장치(100)의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나, 혹은 하나의 구성요소가 2 이상의 구성요소로 세분되어 구성될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시예를 설명하기 위한 것이며, 그 구체적인 동작이나 장치는 본 발명의 권리범위를 제한하지 아니한다.
한편, 영상표시장치(100)는 도 2에 도시된 바와 달리, 도 2의 도시된 튜너부(110)와 복조부(120)를 구비하지 않고, 네트워크 인터페이스부(135) 또는 외부장치 인터페이스부(130)를 통해서, 컨텐츠를 수신하고, 이를 재생할 수도 있다.
도 3은 도 2의 제어부의 내부 블록도의 일예이다.
도면을 참조하여 설명하면, 본 발명의 일실시예에 의한 제어부(170)는, 역다중화부(310), 오디오 처리부(315), 영상 처리부(320), 프로세서(330), OSD 생성부(340), 믹서(345), 프레임 레이트 변환부(350), 및 포맷터(360)를 포함할 수 있다. 그 외 데이터 처리부(미도시)를 더 포함할 수 있다.
역다중화부(310)는, 입력되는 스트림을 역다중화한다. 예를 들어, MPEG-2 TS가 입력되는 경우 이를 역다중화하여, 각각 영상, 음성 및 데이터 신호로 분리할 수 있다. 여기서, 역다중화부(310)에 입력되는 스트림 신호는, 튜너부(110) 또는 복조부(120) 또는 외부장치 인터페이스부(130)에서 출력되는 스트림 신호일 수 있다.
한편, 제어부(170) 내의 오디오 처리부(315)는, 역다중화부(310)에서 역다중화된 오디오 신호 또는 네트워크 인터페이스부(135)나 외부장치 인터페이스부(130)에서 바로 입력되는 오디오 신호 등에 대한, 오디오 신호 처리를 수행할 수 있다. 이를 위해 오디오 처리부(315)는, 다양한 디코더를 구비할 수 있다.
또한, 오디오 처리부(315)는, 다양한 디코더에서 디코딩된 오디오 신호, 특히 다양한 채널의 오디오 신호를 믹싱하는 믹서를 포함할 수 있다. 그리고, 믹서에서 믹싱된 오디오 신호는, 오디오 출력부(185)로 전달될 수 있다.
또한, 오디오 처리부(315)는, 베이스(Base), 트레블(Treble), 음량 조절 등을 처리하거나, 자동으로 음장 신호 처리를 수행할 수 있다.
또한, 오디오 처리부(315)는, 출력할 오디오 신호의 주파수 밴드 별 게인(gain) 또는 위상 중 적어도 하나를 조절할 수 있다.
한편, 처리된 오디오 신호는, 오디오 출력부(185)를 통해 사운드 출력될 수 있게 된다. 오디오 출력부(185)는 디지털-앰프(D-Amp) 및/또는 스피커로 구성될 수 있다.
또는, 처리된 오디오 신호는 외부장치 인터페이스부(130)를 통하여 외부 출력장치, 예를 들어, 사운드 바(400)로 입력될 수 있고, 사운드 바(400)에서 사운드 출력될 수 있다.
영상 처리부(320)는, 역다중화된 영상 신호의 영상 처리를 수행할 수 있다. 이를 위해, 영상 처리부(320)는, 영상 디코더(225), 및 스케일러(235)를 구비할 수 있다.
영상 디코더(225)는, 역다중화된 영상신호를 복호화하며, 스케일러(235)는, 복호화된 영상신호의 해상도를 디스플레이(180)에서 출력 가능하도록 스케일링(scaling)을 수행한다.
영상 디코더(225)는 다양한 규격의 디코더를 구비하는 것이 가능하다.
한편, 영상 처리부(320)에서 복호화된 영상 신호는, 2D 영상 신호만 있는 경우, 2D 영상 신호와 3D 영상 신호가 혼합된 경우, 및 3D 영상 신호만 있는 경우로 구분될 수 있다.
예를 들어, 외부 장치(190)로부터 입력되는 외부 영상 신호 또는 튜너부(110)에서 수신되는 방송 신호의 방송 영상 신호가, 2D 영상 신호만 있는 경우, 2D 영상 신호와 3D 영상 신호가 혼합된 경우, 및 3D 영상 신호만 있는 경우로 구분될 수 있으며, 이에 따라, 이후의 제어부(170), 특히 영상 처리부(320) 등에서 신호 처리되어, 각각 2D 영상 신호, 2D 영상 신호와 3D 영상 신호의 혼합 신호, 3D 영상 신호가 출력될 수 있다.
한편, 영상 처리부(320)에서 복호화된 영상 신호는, 다양한 포맷의 3D 영상 신호일 수 있다. 예를 들어, 색차 영상(color image) 및 깊이 영상(depth image)으로 이루어진 3D 영상 신호일 수 있으며, 또는 복수 시점 영상 신호로 이루어진 3D 영상 신호 등일 수 있다. 복수 시점 영상 신호는, 예를 들어, 좌안 영상 신호와 우안 영상 신호를 포함할 수 있다.
프로세서(330)는, 영상표시장치(100) 내 또는 제어부(170) 내의 전반적인 동작을 제어할 수 있다. 예를 들어, 프로세서(330)는 튜너(110)를 제어하여, 사용자가 선택한 채널 또는 기저장된 채널에 해당하는 RF 방송을 선택(Tuning)하도록 제어할 수 있다.
또한, 프로세서(330)는, 사용자입력 인터페이스부(150)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 영상표시장치(100)를 제어할 수 있다.
또한, 프로세서(330)는, 네트워크 인터페이스부(135) 또는 외부장치 인터페이스부(130)와의 데이터 전송 제어를 수행할 수 있다.
또한, 프로세서(330)는, 전반적인 음성 인식 기능을 제어하고, 음성 신호 입력에 기초하여 음성 인식을 수행하도록 제어하거나, 네트워크를 통하여 연결된 서버(400)를 이용하도록 제어할 수 있다.
또한, 프로세서(330)는, 제어부(170) 내의 역다중화부(310), 오디오 처리부(315), 영상 처리부(320), OSD 생성부(340) 등의 동작을 제어할 수 있다.
OSD 생성부(340)는, 사용자 입력에 따라 또는 자체적으로 OSD 신호를 생성한다. 예를 들어, 사용자 입력 신호에 기초하여, 디스플레이(180)의 화면에 각종 정보를 그래픽(Graphic)이나 텍스트(Text)로 표시하기 위한 신호를 생성할 수 있다. 생성되는 OSD 신호는, 영상표시장치(100)의 사용자 인터페이스 화면, 다양한 메뉴 화면, 위젯, 아이콘 등의 다양한 데이터를 포함할 수 있다. 또한, 생성되는 OSD 신호는, 2D 오브젝트 또는 3D 오브젝트를 포함할 수 있다.
또한, OSD 생성부(340)는, 원격제어장치(200)로부터 입력되는 포인팅 신호에 기초하여, 디스플레이에 표시 가능한, 포인터를 생성할 수 있다. 특히, 이러한 포인터는, 포인팅 신호 처리부에서 생성될 수 있으며, OSD 생성부(240)는, 이러한 포인팅 신호 처리부(미도시)를 포함할 수 있다. 물론, 포인팅 신호 처리부(미도시)가 OSD 생성부(240) 내에 구비되지 않고 별도로 마련되는 것도 가능하다.
믹서(345)는, OSD 생성부(340)에서 생성된 OSD 신호와 영상 처리부(320)에서 영상 처리된 복호화된 영상 신호를 믹싱할 수 있다. 이때, OSD 신호와 복호화된 영상 신호는 각각 2D 신호 및 3D 신호 중 적어도 하나를 포함할 수 있다. 믹싱된 영상 신호는 프레임 레이트 변환부(350)에 제공된다.
프레임 레이트 변환부(Frame Rate Conveter, FRC)(350)는, 입력되는 영상의 프레임 레이트를 변환할 수 있다. 한편, 프레임 레이트 변환부(350)는, 별도의 프레임 레이트 변환 없이, 그대로 출력하는 것도 가능하다.
포맷터(360)는, 프레임 레이트 변환된 3D 영상의 좌안 영상 프레임과 우안 영상 프레임을 배열할 수 있다. 그리고, 3D 시청 장치의 좌안 글래스와 우안 글래스의 개방을 위한 동기 신호(Vsync)를 출력할 수 있다.
한편, 포맷터(Formatter)(360)는, 믹서(345)에서 믹싱된 신호, 즉 OSD 신호와 복호화된 영상 신호를 입력받아, 2D 영상 신호와 3D 영상 신호를 분리할 수 있다.
한편, 본 명세서에서, 3D 영상 신호는 3D 오브젝트를 포함하는 것을 의미하며, 이러한 오브젝트의 예로는 PIP(picuture in picture) 영상(정지 영상 또는 동영상), 방송 프로그램 정보를 나타내는 EPG, 다양한 메뉴, 위젯, 아이콘, 텍스트, 영상 내의 사물, 인물, 배경, 웹 화면(신문, 잡지 등) 등이 있을 수 있다.
한편, 포맷터(360)는, 3D 영상 신호의 포맷을 변경할 수 있다.
한편, 포맷터(360)는, 2D 영상 신호를 3D 영상 신호로 전환할 수도 있다. 예를 들어, 3D 영상 생성 알고리즘에 따라, 2D 영상 신호 내에서 에지(edge) 또는 선택 가능한 오브젝트를 검출하고, 검출된 에지(edge)에 따른 오브젝트 또는 선택 가능한 오브젝트를 3D 영상 신호로 분리하여 생성할 수 있다. 이때, 생성된 3D 영상 신호는, 상술한 바와 같이, 좌안 영상 신호(L)와 우안 영상 신호(R)로 분리되어 정렬될 수 있다.
한편, 도면에서는 도시하지 않았지만, 포맷터(360) 이후에, 3D 효과(3-dimensional effect) 신호 처리를 위한 3D 프로세서(미도시)가 더 배치되는 것도 가능하다. 이러한 3D 프로세서(미도시)는, 3D 효과의 개선을 위해, 영상 신호의 밝기(brightness), 틴트(Tint) 및 색조(Color) 조절 등을 처리할 수 있다. 예를 들어, 근거리는 선명하게, 원거리는 흐리게 만드는 신호 처리 등을 수행할 수 있다. 한편, 이러한 3D 프로세서의 기능은, 포맷터(360)에 병합되거나 영상처리부(320) 내에 병합될 수 있다.
제어부(170) 내의 데이터 처리부(미도시)는, 역다중화된 데이터 신호의 데이터 처리를 수행할 수 있다. 예를 들어, 역다중화된 데이터 신호가 부호화된 데이터 신호인 경우, 이를 복호화할 수 있다. 부호화된 데이터 신호는, 각 채널에서 방영되는 방송프로그램의 시작시간, 종료시간 등의 방송정보를 포함하는 EPG(Electronic Progtam Guide) 정보일 수 있다.
한편, 도 3에서는 OSD 생성부(340)와 영상 처리부(320)로부터의 신호를 믹서(345)에서 믹싱한 후, 포맷터(360)에서 3D 처리 등을 하는 것으로 도시하나, 이에 한정되지 않으며, 믹서가 포맷터 뒤에 위치하는 것도 가능하다. 즉, 영상 처리부(320)의 출력을 포맷터(360)에서 3D 처리하고, OSD 생성부(340)는 OSD 생성과 함께 3D 처리를 수행한 후, 믹서(345)에서 각각의 처리된 3D 신호를 믹싱하는 것도 가능하다.
한편, 도 3에 도시된 제어부(170)의 블록도는 본 발명의 일실시예를 위한 블록도이다. 블록도의 각 구성요소는 실제 구현되는 제어부(170)의 사양에 따라 통합, 추가, 또는 생략될 수 있다.
특히, 프레임 레이트 변환부(350), 및 포맷터(360)는 제어부(170) 내에 마련되지 않고, 각각 별도로 구비될 수도 있다.
도 4는 도 2의 원격제어장치의 제어 방법을 도시한 도면이다.
도 4의 (a)에 도시된 바와 같이, 디스플레이(180)에 원격제어장치(200)에 대응하는 포인터(205)가 표시되는 것을 예시한다.
사용자는 원격제어장치(200)를 상하, 좌우(도 5의 (b)), 앞뒤(도 5의 (c))로 움직이거나 회전할 수 있다. 영상표시장치의 디스플레이(180)에 표시된 포인터(205)는 원격제어장치(200)의 움직임에 대응한다. 이러한 원격제어장치(200)는, 도면과 같이, 3D 공간 상의 움직임에 따라 해당 포인터(205)가 이동되어 표시되므로, 공간 리모콘이라 명명할 수 있다.
도 4의 (b)는 사용자가 원격제어장치(200)를 왼쪽으로 이동하면, 영상표시장치의 디스플레이(180)에 표시된 포인터(205)도 이에 대응하여 왼쪽으로 이동하는 것을 예시한다.
원격제어장치(200)의 센서를 통하여 감지된 원격제어장치(200)의 움직임에 관한 정보는 영상표시장치로 전송된다. 영상표시장치는 원격제어장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다. 영상표시장치는 산출한 좌표에 대응하도록 포인터(205)를 표시할 수 있다.
도 4의 (c)는, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서, 사용자가 원격제어장치(200)를 디스플레이(180)에서 멀어지도록 이동하는 경우를 예시한다. 이에 의해, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌인되어 확대 표시될 수 있다. 이와 반대로, 사용자가 원격제어장치(200)를 디스플레이(180)에 가까워지도록 이동하는 경우, 포인터(205)에 대응하는 디스플레이(180) 내의 선택 영역이 줌아웃되어 축소 표시될 수 있다. 한편, 원격제어장치(200)가 디스플레이(180)에서 멀어지는 경우, 선택 영역이 줌아웃되고, 원격제어장치(200)가 디스플레이(180)에 가까워지는 경우, 선택 영역이 줌인될 수도 있다.
한편, 원격제어장치(200) 내의 특정 버튼을 누른 상태에서는 상하, 좌우 이동의 인식이 배제될 수 있다. 즉, 원격제어장치(200)가 디스플레이(180)에서 멀어지거나 접근하도록 이동하는 경우, 상,하,좌,우 이동은 인식되지 않고, 앞뒤 이동만 인식되도록 할 수 있다. 원격제어장치(200) 내의 특정 버튼을 누르지 않은 상태에서는, 원격제어장치(200)의 상,하, 좌,우 이동에 따라 포인터(205)만 이동하게 된다.
한편, 포인터(205)의 이동속도나 이동방향은 원격제어장치(200)의 이동속도나 이동방향에 대응할 수 있다.
도 5는 본 발명의 일실시예에 의한 원격제어장치의 사시도이고, 도 6은 원격제어장치의 내부 블록도이다.
도 5를 참조하면, 본 발명의 일실시예에 의한 공간리모콘(201)은, 각종 입력키 또는 입력 버튼 등을 구비할 수 있다.
예를 들어, 공간리모콘(201)은, 확인키(Okay key)(291), 메뉴키(292), 사방향키(293), 채널 조정키(294), 볼륨 조정키(296)를 구비할 수 있다. 또한, 별도의 마이크(미도시)를 더 포함할 수 있다.
예를 들어, 확인키(Okay key)(291)는 메뉴 또는 항목 선택시 사용 가능하며, 메뉴키(292)는 소정 메뉴 표시를 위해 사용 가능하며, 사방향키(293)는 포인터 또는 인디케이터를 상,하,좌우 이동시 사용 가능하며, 채널 조정키(294)는 채널 상, 하 조정시 사용 가능하며, 볼륨 조정키(296)는, 볼륨 업, 다운 조정 시 사용 가능할 수 있다.
또한, 공간리모콘(201)은, 백 키(back key)(297), 홈 키(home key)(298)을 더 구비할 수 있다. 예를 들어, 백 키(back key)(297)는 이전 화면 이동시 사용 가능하며, 홈 키(298)는, 홈 화면으로의 이동시 사용될 수 있다.
한편, 도면과 같이, 확인키(291)는, 스크롤 기능이 추가된 것도 가능하다. 이를 위해 확인키(291)는 휠 키 형태로 구현이 가능하다. 즉, 확인키(291)가 눌려지는 경우, 해당 메뉴 또는 항목 선택으로 사용되고, 확인키(291)가 상,하로 스크롤되는 경우, 디스플레이 화면 스크롤링 또는 리스트 페이지 전환 등이 수행될 수 있다.
구체적으로, 디스플레이부(180)에 디스플레이의 사이즈 보다 더 큰 영상이 표시된 상태에서, 해당 영상 탐색을 위해 확인키(291)를 스크롤링하면, 현재 디스플레이에 표시되지 않던 영상 영역이 디스플레이에 표시되게 된다. 다른 예로, 디스플레이부(180)에 리스트 페이지가 표시되는 경우, 확인키(291)를 스크롤링하면, 현재 페이지의 이전 페이지 또는 다음 페이지가 표시될 수 있다.
이러한 스크롤 기능은, 확인키(291)가 아닌 별도의 키로 구비되는 것도 가능하다.
한편, 사방향키(293)는, 도면과 같이, 원형 타입에서, 상,하,좌,우키가 각각 사방향에 배치될 수 있다. 한편, 사방향키(293)에 대한 터치 입력도 가능할 수 있다. 예를 들어, 사방향키(293) 내의 상 키(up key)에서부터 하 키(down key)까지 터치 동작이 있는 경우, 해당 터치 입력에 따라, 설정된 기능이 입력되거나 수행될 수 있다.
도 6을 참조하여 설명하면, 원격제어장치(200)는 무선통신부(220), 사용자 입력부(230), 센서부(240), 출력부(250), 전원공급부(260), 저장부(270), 제어부(280), 오디오 입력부(290)를 포함할 수 있다.
무선통신부(220)는 영상표시장치(100)와, 예를 들어, 사용자입력 인터페이스부(150)의 무선통신부(211)와 신호를 송수신할 수 있다.
한편, 영상표시장치(100)의 좌표값 산출부(215)는 원격제어장치(200)의 움직임에 관한 정보로부터 포인터(205)의 좌표를 산출할 수 있다
본 실시예에서, 원격제어장치(200)는 RF 통신규격에 따라 영상표시장치(100)의 RF 모듈(212)과 신호를 송수신할 수 있는 RF 모듈(221)을 구비할 수 있다. 또한 원격제어장치(200)는 IR 통신규격에 따라 영상표시장치(100)의 IR 모듈(213)과 신호를 송수신할 수 있는 IR 모듈(223)을 구비할 수 있다.
또한, 원격제어장치(200)는, 전자기기와의 근거리 자기장 통신을 위한, NFC 모듈(미도시)을 더 구비할 수 있다.
원격제어장치(200)는 영상표시장치(100)로 원격제어장치(200)의 움직임 등에 관한 정보가 담긴 신호를 RF 모듈(221)을 통하여 전송할 수 있다.
또한, 원격제어장치(200)는 영상표시장치(100)가 전송한 신호를 RF 모듈(221)을 통하여 수신할 수 있다. 또한, 원격제어장치(200)는 필요에 따라 IR 모듈(223)을 통하여 영상표시장치(100)로 전원 온/오프, 채널 변경, 볼륨 변경 등에 관한 명령을 전송할 수 있다.
한편, 본 실시예에 따라, 원격제어장치(200)는, 소정 전자기기와 근거리 자기장 통신 등에 의해, 개인 정보를 수신할 수 있다.
한편, 원격제어장치(200)는, 수신되는 개인 정보를, 영상표시장치(100)로 전송할 수 있다. 이때의 통신 방식은, IR 방식 또는 RF 방식을 이용할 수 있다.
사용자 입력부(230)는 키패드, 키(버튼), 터치 패드, 또는 터치 스크린 등으로 구성될 수 있다. 사용자는 사용자 입력부(230)를 조작하여 원격제어장치(200)으로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(230)가 하드키 버튼을 구비할 경우 사용자는 하드키 버튼의 푸쉬 동작을 통하여 원격제어장치(200)로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 사용자 입력부(230)가 터치스크린을 구비할 경우 사용자는 터치스크린의 소프트키를 터치하여 원격제어장치(200)으로 영상표시장치(100)와 관련된 명령을 입력할 수 있다. 또한, 사용자 입력부(230)는 스크롤 키나, 조그 키 등 사용자가 조작할 수 있는 다양한 종류의 입력수단을 구비할 수 있으며 본 실시예는 본 발명의 권리범위를 제한하지 아니한다.
센서부(240)는 자이로 센서(241) 또는 가속도 센서(243)를 구비할 수 있다. 자이로 센서(241)는 원격제어장치(200)의 움직임에 관한 정보를 센싱할 수 있다.
일예로, 자이로 센서(241)는 원격제어장치(200)의 동작에 관한 정보를 x,y,z 축을 기준으로 센싱할 수 있다. 가속도 센서(243)는 원격제어장치(200)의 이동속도 등에 관한 정보를 센싱할 수 있다. 한편, 거리측정센서를 더 포함할 수 있으며, 이에 의해, 디스플레이(180)와의 거리를 센싱할 수 있다. 또는, 지구에서 발생하는 자기장의 흐름을 파악해 나침반처럼 방위를 탐지할 수 있는 지자기 센서를 포함하여 방위의 변화량을 감지할 수 있다.
출력부(250)는 사용자 입력부(230)의 조작에 대응하거나 영상표시장치(100)에서 전송한 신호에 대응하는 영상 또는 음성 신호를 출력할 수 있다. 출력부(250)를 통하여 사용자는 사용자 입력부(230)의 조작 여부 또는 영상표시장치(100)의 제어 여부를 인지할 수 있다.
일예로, 출력부(250)는 사용자 입력부(230)가 조작되거나 무선 통신부(225)을 통하여 영상표시장치(100)와 신호가 송수신되면 점등되는 LED 모듈(251), 진동을 발생하는 진동 모듈(253), 음향을 출력하는 음향 출력 모듈(255), 또는 영상을 출력하는 디스플레이 모듈(257)을 구비할 수 있다.
전원공급부(260)는 원격제어장치(200)으로 전원을 공급한다. 전원공급부(260)는 원격제어장치(200)가 소정 시간 동안 움직이지 않은 경우 전원 공급을 중단함으로서 전원 낭비를 줄일 수 있다. 전원공급부(260)는 원격제어장치(200)에 구비된 소정 키가 조작된 경우에 전원 공급을 재개할 수 있다.
저장부(270)는 원격제어장치(200)의 제어 또는 동작에 필요한 여러 종류의 프로그램, 애플리케이션 데이터 등이 저장될 수 있다. 만일 원격제어장치(200)가 영상표시장치(100)와 RF 모듈(221)을 통하여 무선으로 신호를 송수신할 경우 원격제어장치(200)와 영상표시장치(100)는 소정 주파수 대역을 통하여 신호를 송수신한다. 원격제어장치(200)의 제어부(280)는 원격제어장치(200)와 페어링된 영상표시장치(100)와 신호를 무선으로 송수신할 수 있는 주파수 대역 등에 관한 정보를 저장부(270)에 저장하고 참조할 수 있다.
또한, 저장부(270)는 IR 신호로써 다른 전자기기들을 제어하기 위한 IR 포맷 키(key) 코드들을 저장할 수 있고, 복수의 전자기기의 IR 포맷 키 데이터베이스를 저장할 수 있다.
제어부(280)는 원격제어장치(200)의 제어에 관련된 제반사항을 제어한다. 제어부(280)는 사용자 입력부(230)의 소정 키 조작에 대응하는 신호 또는 센서부(240)에서 센싱한 원격제어장치(200)의 움직임에 대응하는 신호를 무선 통신부(220)를 통하여 영상표시장치(100)로 전송할 수 있다.
오디오 입력부(290)는 오디오 신호을 위한 것으로, 마이크(MIC) 등이 포함될 수 있다. 마이크는 마이크로폰(Microphone)에 의해 외부의 음향 신호, 예를 들어, 사용자의 음성 신호를 입력받아 전기적인 음성 데이터로 처리할 수 있다.
한편, 이러한 음성 신호 및 데이터는 무선통신부(220)를 통하여 영상표시장치(100)로 전송될 수 있다.
도 7은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이고, 도 8a 내지 도 11은 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 설명하기 위해 참조되는 도면이다.
도 7을 참조하면, 본 발명의 실시예에 따른 영상표시장치의 동작 방법은, 마이크(MIC)를 통하여 음성 신호 및 스피커의 음향 신호를 포함하는 오디오 신호를 수신할 수 있다.(S710)
상기 마이크(Microphone: MIC)는, 사용자의 음성 신호, 내장 및/또는 외부 스피커를 통해 출력되는 TV의 음향 신호 등을 포함하는 오디오 신호를 수신하여 전기적인 음성 데이터로 처리할 수 있다.
여기서, 상기 마이크(MIC)는, 원격제어장치 또는 영상표시장치에 구비된 마이크이거나, 인터페이스부를 통해 연결된 외부 마이크일 수 있다.
본 발명의 일실시예에 따른 원격제어장치(200)는 오디오 입력부(290)를 구비할 수 있고, 상기 오디오 입력부(290)는 오디오 신호을 위한 것으로, 마이크(MIC) 등이 포함될 수 있다. 마이크는 마이크로폰(Microphone)에 의해 외부의 음향 신호, 예를 들어, 사용자의 음성 신호를 입력받아 전기적인 음성 데이터로 처리할 수 있다. 한편, 이러한 음성 신호 및 데이터는 무선통신부(220)를 통하여 영상표시장치(100)로 전송될 수 있다.
또는, 본 발명의 일실시예에 따른 영상표시장치(100)는 내장 마이크(MIC)를 구비하여 오디오 신호를 수신하고, 처리할 수 있다.
또는, 외부 마이크와 외부장치 인터페이스부(130) 또는 네트워크 인터페이스부(135)를 통하여 연결되어, 외부 마이크에서 처리된 오디오 신호를 수신할 수 있다.
한편, 마이크(MIC)는 아날로그 오디오 신호를 수신하고, 수신한 아날로그 오디오 신호를 디지털 오디오 신호로 변환할 수 있다. 또는, 마이크(MIC)가 수신한 아날로그 오디오 신호는 별도의 아날로그-디지털 컨버터(Analog-Digital Converter)를 거쳐 디지털 오디오 신호로 변환될 수 있다.
한편, 상기 디지털 오디오 신호는 SPDIF, HDMI, MADI, ADAT 등과 같은 멀티채널 오디오 신호일 수 있다.
한편, 마이크(MIC)에는 사용자의 음성뿐만 아니라 내장 스피커 또는 영상표시장치에 연결된 외부 스피커를 통해 출력된 오디오의 음향도 함께 수신되고, 이렇게 수신된 오디오 신호들은 모두 음성 인식의 입력이 될 수 있다.
따라서, 정확한 음성 인식을 하기위해서는 마이크에서 수신되는 오디오 신호로부터 스피커 등 음향 기기에서 발생하는 음향 신호를 제거해야 한다.
음향 신호의 제거시, 참조 신호로 이용되는 TV 오디오와 음성 인식을 위해 사용되는 마이크 입력단에서의 오디오 중 TV 오디오는 유사하지만 동일하지 않아 잡음에 해당하는 TV 소리를 정확하게 제거할 수 없게 될 수 있다.
예를 들어, 음향 및/또는 음성 신호도 일부 제거될 수 있다
또한, 마이크 입력단에서의 오디오는 오디오 출력이 내장 스피커 또는 영상표시장치에 연결된 외부 스피커를 통해 수행되는지에 따라 달리질 수 있다.
따라서, 오디오 출력이 내장 스피커 또는 영상표시장치에 연결된 외부 스피커를 통해 수행되는지 등 상황에 적합하도록 가장 정확하고 적절한 방식으로 음향 신호를 제거할 필요가 있다.
본 발명은 영상표시장치에 외부 스피커가 연결되었는 지 여부를 판단하여(S720), 외부 스피커 연결 여부에 따라 다르게 처리할 수 있다. 즉, 외부 스피커 연결 여부에 따라 적절한 음향 제거에 사용할 참조 신호를 선택하여 보다 효과적인 음향 제거 방법을 적용할 수 있다.
이에 따라, 음성인식에 따른 오동작을 방지 및 음성 인식율을 향상 할 수 있다. 또한, 스피커에서 출력되는 음향은 제거되어 사용자의 음성에 대해서만 음성인식을 하므로, 영상표시장치의 오동작을 방지할 수 있다.
한편, 상기 외부 스피커는 사운드 바(Sound Bar, 400)일 수 있다.
상기 사운드 바(400)는 영상표시장치에 분리된 오디오 장치로 영상표시장치의 오디오 신호 처리 및 오디오 출력의 기능하고, 단독으로 사용되거나, 다른 하나 이상의 스피커와 연결되어 스피커 시스템으로도 사용될 수 있다.
상기 사운드 바(400)는 라우드 스피커(Loud speaker) 구성으로, 복수의 라우드 스피커를 선형으로 연결한 라우드 스피커 어레이(Loud speaker Array)일 수 있다.
상기 사운드 바(400)는 복수의 스피커를 이용하여 오디오 신호를 출력함으로써, 음장을 재현할 수 있다. 상기 사운드 바(400)는 단독 또는 사운드 바(400)가 포함된 스피커 시스템의 배치 환경하에서, 패닝(Panning), 파면음장 합성(Wave Field Synthesis), 빔포밍(Beam Forming), 초점음원(Focused Source), 머리전달함수(Head Related Transfer Function) 등과 같은 3차원 음장처리 기술을 이용하여 멀티채널 오디오 신호를 가상적으로 재현할 수 있다.
도 7을 참조하면, 본 발명의 실시예에 따른 영상표시장치에 외부 스피커가 연결되었는 지 여부를 판단하여(S720), 상기 외부 스피커가 연결된 경우에, 외부 스피커의 입력 신호를 분석할 수 있다.(S730)
여기서, 상기 외부 스피커의 입력 신호는 영상표시장치가 상기 외부 스피커로 출력하는 디지털화된 오디오 신호일 수 있다. 또한, 디지털화된 오디오 신호는 SPDIF, HDMI, MADI, ADAT 등과 같은 오디오 신호일 수 있다.
본 발명은 영상표시장치의 내장 스피커 또는 연결된 외부 스피커의 출력 전의 디지털화된 신호를 캡쳐(capture)하고, 참조(reference) 신호로 이용하여, 마이크(MIC)에서 수신된 스피커 음향 신호의 제거에 사용할 수 있다.
도 8a와 도 8b는 각각 TV 스피커 사운드(-33dB)의 게인(gain)과 주파수 특성 일예를 도시한 것이다.
도 9a와 도 9b는 각각 사운드바 사운드(-29dB)의 게인(gain)과 주파수 특성 일예를 도시한 것이다.
도 8a, 도 8b, 도 9a와 도 9b는, 디지털 앰프(D-Amp) 출력전의 음향이므로 TV 스피커의 사운드와 게인(Gain) 및 주파수 특성이 다르다, 예를 들어, 도면들을 참조하면, 사운드 바 사운드의 경우 고주파의 변동폭이 상대적으로 크다는 것을 확인할 수 있다.
또한, 내장 스피커로 오디오 신호가 전송되는 경로는 디지털 앰프(D-Amp)를 통하므로 디지털 앰프(D-Amp) 출력전에 신호를 캡쳐(capture)할 수 있으나, 사운드 바(400)로 전송되는 경로는 디지털 앰프(D-Amp)를 통하지 않아 기존의 TV사운드 캡쳐하는 경로와 다르다.
또한, 오디오 신호의 전송 경로가 다르기 때문에 마이크(MIC)에서 캡쳐되는 신호와 사운드바의 캡쳐 신호가 TV 캡쳐 신호와 차이가 크게 발생할 수 있다.
또한, 마이크(MIC)로 입력되는 TV 사운드는 딜레이(delay)가 발생할 수 있으므로, 발생된 딜레이(delay)의 제거가 필요하다.
따라서, 본 발명은 외부 스피커 연결 여부에 따라서, 입력 신호 프로파일링을 구분하여 수행할 수 있다.
상기 외부 스피커의 입력 신호와 상기 오디오 신호를 비교하여, 상기 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하고,(S740) 상기 보정된 오디오 신호에 기초하여, 상기 스피커의 음향 신호를 제거할 수 있다.(S750)
도 10은 마이크 신호와 사운드바 캡쳐 신호의 딜레이(delay)를 간략히 나타낸 도면이다.
도 10의 (a)는 마이크 캡쳐 신호를 나타낸 것이고, 도 10의 (b)는 TV 캡쳐 신호를 나타낸 것이며, 도 10의 (c)는 전송 딜레이(delay)를 처리한 신호를 나타낸 것이다.
도 10의 (a)와 도 10의 (b)를 비교하면, 마이크 캡쳐 신호는 1 패킷(packet)과 시스템 타임(system time)을 합한 구간(a1)이, TV 캡쳐 신호의 1 패킷과 시스템 타임을 합한 구간(a2)보다 전송 딜레이(delay) 시간(d)만큼 지연될 수 있고, TV 캡쳐 신호와 마이크 신호의 샘플 오차가 발생할 수 있다.
따라서, 마이크 캡쳐 신호로부터 전송 딜레이(delay) 시간(d)을 제거하여 처리한 신호(a3)를 음성 인식의 입력으로 사용할 수 있다.
본 발명의 일실시예에 따르면, 외부 스피커로 사운드 전송시 TV 사운드 전송시의 시스템 시간 정보를 포함하여 패킷을 구성할 수 있다.
또한, 외부 스피커로 TV 사운드 전송시 시스템 시간 정보를 포함하여 패킷 구성할 수 있다.
이에 따라, 마이크로 입력되는 오디오 신호(사운드)와 캡쳐 사운드와 비교하여 실제 AEC(Acoustic Echo Cancellation)을 처리할 때는 음향 보정을 수행할 수 있다.
또한, 디지털 오디오 신호의 디지털 출력 게인(Gain)과 디코딩 정보를 포함한 헤더를 구성할 수 있다.
이에 따라, 외부 스피커(사운드) 장치를 사용할때 음성 인식 성능을 향상할 수 있다.
한편, 상기 보정 단계(S740)는, 마이크(MIC)를 통하여 음성 신호 및 스피커의 음향 신호를 포함하는 오디오 신호의 게인(gain) 및 주파수 특성을 보정할 수 있다. 사운드 바(400)가 영상표시장치(TV)에 연결된 경우에, 도 8a, 도 8b, 도 9a와 도 9b를 참조하여 설명한 것과 같이, 게인(Gain)은 커지고, 고주파의 변동폭이 상대적으로 크기 때문에, 제어부(170) 및/또는 오디오 처리부(315)는 상기 오디오 신호의 게인(gain)은 감소시키고, 주파수 특성은 평탄화 보정할 수 있다.
오디오 처리부(315)는, 입력되는 오디오 신호를 서브 밴드 분석 필터링할 수 있다. 즉, 서브 밴드(sub-band) 분석 필터 뱅크를 구비하여, 음상 정위 제어된 오디오 신호를 주파수 신호로 변환시킨다. 필터링된 오디오 신호의 서브 밴드는 32개의 서브 밴드 또는 64개의 서브 밴드 또는 FFT 서브 밴드일 수 있다.
이와 같이 주파수 대역 별로 구분된 오디오 신호는 주파수 대역 별로, 또는 주파수 대역 그룹별로 위상 조정 또는 게인 조정이 수행될 수 있다.
오디오 처리부(315)는, 오디오 신호를 주파수 밴드별로, 위상 조정 또는 게인 조정 중 적어도 하나를 수행할 수 있다.
이를 위해, 오디오 처리부(315)는, 대역별로 분리된 주파수 대역별로 게인(gain)을 조정할 수 있다.
게인 조정 방법은, 다양한 방법으로 수행될 수 있다. 예를 들어, 모든 주파수 대역에서 각각 독립적으로 게인을 조절하거나, 특정 주파수 범위에 대해서만 밴드 혹은 대역을 나누어 게인을 조절하거나, 특정 주파수 범위에 대해서 그룹으로 묶어서 그룹별로 게인을 조절할 수 있다.
도 11은 상기 외부 스피커의 입력 신호와 상기 오디오 신호를 비교하여, 상기 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하고(S740), 상기 보정된 오디오 신호에 기초하여, 상기 스피커의 음향 신호를 제거(S750)한 결과를 나타낸 것이다.
즉, 본 발명에 따른 음향 처리 결과 마이크 신호에서 사운드 바(400)를 통한 TV의 출력사운드와 음성이 분리되어, 도 11과 같이 처리된 사용자의 음성 신호로 음성 인식을 수행할 수 있고,(S760) 영상표시장치는 상기 판별된 음성 인식 결과 데이터에 기초하여 대응 동작을 수행할 수 있다.
한편, 음성 인식 단계(S760)는 상기 스피커의 음향 신호가 제거된 음성 신호에 기초하여, 특징 벡터를 추출하는 단계, 상기 특징 벡터를 상기 음성 데이터베이스와 비교하여, 상기 수신된 음성 신호에 대응하는 데이터를 판별하는 단계 등을 포함할 수 있다. 음성 인식 단계(S760)에 대해서는 도 14를 참조하여 후술한다.
한편, 도 7을 참조하면, 상기 외부 스피커가 연결되지 않은 경우에는(S720), 영상표시장치(100)의 내장 스피커, 예를 들어, 디지털 앰프(D-Amp)의 입력 신호를 분석하여(S770) 상기 내장 스피커의 입력 신호와 상기 오디오 신호를 비교하여, 상기 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하게 된다.(S780)
한편, 상기 보정된 오디오 신호에 기초하여, 상기 스피커의 음향 신호를 제거할 수 있고,(S750) 상기 스피커의 음향 신호가 제거된 신호에 기초하여 음성 인식을 수행할 수 있다.(S760)
즉, 본 발명은 TV 측 사운드를 출력할 스피커에 따라서, 음향 제거에 사용할 참조 신호를 다르게 구성하여, 오디오 신호의 보정-음향 제거를 수행할 수 있다.
본 발명에 따르면, 사운드 바(400) 등 외부 오디오 출력 장치 연결시에도 음성 인식 성능을 향상시킬 수 있다.
또한, 종래에는 TV 스피커가 아닌 사운드 바 사용시 반향 성능에 한계가 있었으나, 본 발명에 따르면, 외부 오디오 출력 장치의 음향 특성 및 연결 상태에 구애 받지 않고 음성 인식 사용이 가능하며, 복수의 스피커가 연결된 영상표시장치 시스템에 활용이 가능하는 장점이 있다.
또한, 내장 마이크(MIC) 및 USB 마이크 등 외장 마이크(MIC) 시스템으로 음성 인식 사용이 가능하다.
도 12는 본 발명의 실시예에 따른 영상표시장치의 동작 방법을 보여주는 흐름도이다.
도 12를 참조하면, 본 발명의 실시예에 따른 영상표시장치(100)는, 먼저, 마이크 신호를 캡쳐할 수 있다.(S1210) 이 경우에 캡쳐된 마이크 신호는 음성 신호 및 스피커의 음향 신호를 포함할 수 있다.
영상표시장치(100)는, 사운드 바(400) 등 외부 스피커의 연결 여부를 판단할 수 있다.(S1220)
만약, 외부 스피커가 연결되어 있지 않다면, TV 사운드를 캡쳐할 수 있다.(S1230) 이 때 캡쳐된 TV 사운드는 디지털 앰프(D-AMP)의 입력단에서 캡쳐된 디지털화된 오디오 신호일 수 있다.
영상표시장치(100)는, 캡쳐된 마이크 신호와 캡쳐된 TV 사운드를 비교하여 딜레이(delay) 여부를 판단할 수 있다.(S1240)
만약, 딜레이(delay)가 발생하지 않았다면, 캡쳐된 TV 사운드를 참조 신호로 사용하여 캡쳐된 마이크 신호로부터 스피커 측 음향을 제거할 수 있다.(S1250)
만약, 딜레이(delay)가 발생했다면, 딜레이(delay)된 시간을 분석하여(S1245), 분석된 시간 음성 샘플을 변환하여 전송 딜레이(delay)를 보정한 후(S1247), 보정된 TV 사운드를 참조 신호로 사용하여 캡쳐된 마이크 신호로부터 스피커 측 음향을 제거할 수 있다.(S1250)
만약, 외부 스피커가 연결되어 있다면, 사운드 바 등 외부 스피커의 사운드를 캡쳐하여 입력 신호에 대한 프로파일링 과정을 수행할 수 있다.(S1235) 이 때 캡쳐된 외부 스피커 사운드는 사운드 바 등 외부 스피커의 입력단에서 캡쳐된 디지털화된 오디오 입력 신호일 수 있다.
한편, 마이크(MIC)를 통하여 음성 신호 및 스피커의 음향 신호를 포함하는 오디오 신호의 게인(gain) 및 주파수 특성을 보정할 수 있다.
특히, 외부 스피커 사운드의 디지털 출력 게인(gain) 및 신호를 변환할 수 있다.(S1237)
사운드 바(400)가 영상표시장치(TV)에 연결된 경우에, 도 8a, 도 8b, 도 9a와 도 9b를 참조하여 설명한 것과 같이, 게인(Gain)은 커지고, 고주파의 변동폭이 상대적으로 크기 때문에, 제어부(170) 및/또는 오디오 처리부(315)는 상기 오디오 신호의 게인(gain)은 감소시키고, 주파수 특성은 평탄화 보정할 수 있다.
사운드 바(400) 등의 외부 스피커로 출력되는 경우에는 통상적으로 딜레이가 발생하므로, 이후에는 딜레이(delay)된 시간을 분석하여(S1245), 분석된 시간 음성 샘플을 변환하여 전송 딜레이(delay)를 보정한 후(S1247), 보정된 사운드 바 사운드를 참조 신호로 사용하여 캡쳐된 마이크 신호로부터 스피커 측 음향을 제거할 수 있다.(S1250)
도 13은 도 2의 제어부의 내부 블록도의 일예로, 특히 오디오 처리부(315)의 일실시예를 도시한 것이다.
도 13을 참조하면, 오디오 처리부(315)는, 오디오 입력 장치로부터 입력되는 오디오 신호를 처리할 수 있다.
오디오 처리부(315)는, 역다중화부(310)에서 역다중화된 오디오 신호 또는 네트워크 인터페이스부(135)나 외부장치 인터페이스부(130)에서 바로 입력되는 오디오 신호 등에 대한, 오디오 신호 처리를 수행할 수 있다. 이를 위해 오디오 처리부(315)는, 다양한 디코더를 구비할 수 있다.
또한, 오디오 처리부(315)는, 다양한 디코더에서 디코딩된 오디오 신호, 특히 다양한 채널의 오디오 신호를 믹싱하는 믹서를 포함할 수 있다.
한편, 오디오 처리부(315)는, 출력할 사운드를 위한 신호 처리를 수행하는 사운드 엔진(1310)을 포함할 수 있다. 실시예에 따라서는, 사운드 엔진(1310)은 상기 디코더, 믹서 등을 구비할 수도 있다.
또한, 오디오 처리부(315)는, 음향 제거부(1320)를 포함할 수 있다.
상기 음향 제거부(1320)는, 입력되는 오디오 신호로부터 소정 성분을 필터링(filtering)하거나, 소정 음향 신호를 제거하거나, 출력할 오디오 신호의 주파수 밴드 별 게인(gain) 또는 위상 중 적어도 하나를 조절할 수 있다.
한편, 오디오 처리부(315)는, 오디오 처리부(315) 내 전반적인 동작을 제어하는 오디오 DSP(Audio Digital Signal Prroessor, 1330)를 구비할 수 있다.
한편, 처리된 오디오 신호는, 디지털-앰프(D-Amp)(185)를 통해 내장 스피커로 사운드 출력되거나, 외부 사운드 출력장치, 예를 들어, 사운드 바(400)에서 사운드 출력될 수 있다.
한편, 영상표시장치(100)는 사운드 바(400) 등 사운드 출력장치와 외부장치 인터페이스부(130)를 통하여 유/무선으로 연결되어, SPDIF, HDMI 등 디지털 신호를 전송할 수 있다.
본 발명의 일실시예에 따르면, 사운드 바(400) 등 외부 스피커로 전송되는 오디오 신호는 영상표시장치 시스템 내의 음장 효과와 다르므로 사운드 엔진(1310) 전후에 대한 전송 경로를 구현할 수 있다.
즉, 사운드 바(400) 등 외부 스피커로 전송되는 오디오 신호는 기존 신호와의 음장 효과가 다르므로, 다채널 사운드 시스템 구성시 위치에 따른 방향성으로 인하여 캡쳐되는 신호의 위상 차이도 보정할 수 있다.
또한, 도 13과 같이, 사운드 바(400)로 신호를 전송하는 경로는 D-Amp(185)를 통하지 않으므로, D-Amp(185) 입력단에서 캡쳐하는 기존의 TV 사운드 캡쳐 경로와 달리 사운드 바(400)의 입력 신호를 캡쳐할 수 있다.
한편, 본 발명의 일실시예에 따른 영상표시장치의 동작 방법은, 상기 오디오 신호의 노이즈(Noise) 성분을 필터링(filtering)하는 단계를 더 포함할 수 있다.
도 14는 본 발명의 일실시예에 따른 음성 인식 과정의 설명에 참조되는 도면이다.
도 14를 참조하면, 먼저 수신되는 음성 신호(1410)에 대하여, 잡음 처리 등의 전처리를 수행한다.(1420) 전처리 과정은 끝점 검출(End-point detection)과 같이, 입력되는 신호로부터 음성 구간만을 검출하는 처리 방식, 입력 신호로부터 계산과정이 비교적 간단한 통계적 특징을 추출하여 음성구간과 묵음구간을 구분하는 방식을 사용할 수 있다.
일반적으로 사용되는 방법은 입력 신호의 매 구간에서 에너지 값(또는 로그 에너지 값)을 구하여 통계에 의해 미리 결정된 임계 값과의 비교를 통해서 음성구간과 묵음구간을 판별하는 방법이다.
또한, 전처리 과정은 잡음을 제거하는 잡음 처리 과정을 포함할 수 있다.
한편, 전처리 과정(1420)은 필요한 추가 잡음 처리 과정 및 신호 처리 과정을 더 포함할 수 있다.
이후, 입력된 음성 신호로부터 인식에 유효한 특징 벡터(파라미터)를 추출한다.(1430)
여기서, LPC(Linear Predictive Coefficients)에 기반한 방법과 MFCC(Mel Frequency Cepstral Coefficients) 추출법 등을 사용할 수 있다.
이후, 음성 신호, 상기 추출된 특징 파라미터의 패턴을 인식할 수 있고,(1440) 패턴 인식에는 음향 모델(Acoustic Model, 1441)이 이용될 수 있다.
이것은 음성의 신호적인 특성을 모델링하여 비교하는 방법으로써, 인식대상을 특징벡터 모델로 설정하고 이를 입력신호의 특징벡터와 비교하는 직접비교 방법이 이용될 수 있다. 직접비교 방법은 인식대상이 되는 단어, 음소 등의 단위를 특징벡터 모델로 설정하고 입력음성이 이와 얼마나 유사한가 비교할 수 있다.
또는, 인식대상의 특징벡터를 통계적으로 처리하여 이용하는 통계방법을 사용할 수 있다. 이러한 통계방법은 인식대상에 대한 단위를 상태 열(State Sequence)로 구성하고 상태 열 간의 관계를 이용할 수 있으며, 시간적 배열관계를 이용하는 DTW(Dynamic Time Warping) 방법, 확률값, 평균, 분산을 비교대상으로 하는 HMM(Hidden Markov Model) 방법 등이 있다.
더욱 상세히 살펴보면, DTW(Dynamic Time Warping)는 기준 음성신호와 입력된 음성신호간의 유사도(Distance)를 동적 프로그래밍을 이용하여 구하는 방법으로, 화자종속 고립어 인식시스템 구성에 주로 이용되며 인식률이 높다.
HMM(Hidden Markov Model)는 음의 상태가 한 상태에서 다음 상태로 바뀌는 것을 천이 확률로 표현하는 방식으로, 음성 신호의 시간적인 통계적 특성을 이용하여 훈련 데이터로부터 이들을 대표하는 모델을 구성한 후 실제 음성 신호와 유사도가 높은 확률 모델을 인식 결과로 채택하는 방법이다.
이후, 상기 수신된 음성 신호에 대응하는 데이터를 판별하고, 인식 결과(1960)를 출력할 수 있다.
한편, 데이터 판별 과정은 언어모델(1451)을 이용한 언어처리(1450) 동작을 포함할 수 있다.
언어 모델(language Model)은 일반적으로 가능한 모든 단어 열에 대한 확률 값을 찾는 것으로, 가능한 단어의 조합 중에 주어진 상황에 대해 문법적으로 맞는 단어 열 만을 고려하는 문법 기반 방식, 주어진 상황에서 발화된 음성의 데이터베이스로부터, 가능한 단어열의 확률 값을 통계적으로 추정하는 통계 기반 방식이 사용될 수 있다.
음성 인식은 입력된 음성과 저장된 음향 모델, 언어 모델 등의 데이터를 비교하여 가장 유사한 데이터를 인식 결과 데이터로 출력한다.
예를 들어, 영상표시장치(100) 내에 구비되는 임베디드 음성 엔진은 마이크 또는 원격제어장치 등을 통해 입력된 음성 신호의 특징을 벡터 형태로 추출하고, 추출된 특징 벡터와 음향 모델, 언어 모델, 발음 사전 등의 음성학적 정보를 포함하는 음성 데이터베이스를 이용하여 음성 인식 결과를 출력할 수 있다.
영상표시장치(100)는 음성 데이터베이스와 상기 특징 벡터와의 비교를 통해 인식 결과를 얻게 된다. 더욱 자세히는, 상기 특징 벡터를 음성의 신호적인 특성을 모델링하여 비교하는 음향 모델과 인식 어휘에 해당하는 단어나 음절 등의 언어적인 순서 관계를 모델링하는 언어 모델과 비교하여 음성 인식 결과를 획득할 수 있다.
본 발명의 실시예에 따른 영상표시장치의 동작 방법은 상기한 바와 같이 설명된 실시예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시예들은 다양한 변형이 이루어질 수 있도록 각 실시예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
한편, 본 발명의 영상표시장치의 동작 방법은 영상표시장치에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록장치를 포함한다. 프로세서가 읽을 수 있는 기록매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한, 인터넷을 통한 전송 등과 같은 캐리어 웨이브의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
방송 수신부 : 105
외부장치 인터페이스부 : 130
저장부 : 140
사용자입력 인터페이스부 : 150
제어부 : 170
디스플레이 : 180
오디오 출력부 : 185
외부장치 인터페이스부 : 130
저장부 : 140
사용자입력 인터페이스부 : 150
제어부 : 170
디스플레이 : 180
오디오 출력부 : 185
Claims (10)
- 오디오 신호를 신호 처리하는 오디오 처리부와, 상기 오디오 처리부에서 출력되는 신호를 증폭하는 디지털 앰프와, 상기 디지털 앰프로부터의 증폭된 신호에 기초하여 제1 사운드를 출력하는 스피커를 구비하는 영상표시장치의 동작 방법에 있어서,
마이크(MIC)를 통하여 음성 신호를 수신하고, 상기 디지털 앰프에서 스피커로 출력되는 음향 신호를 포함하는 오디오 신호를 수신하는 단계;
상기 오디오 처리부에서 출력되는 신호를 수신하여 제2 사운드를 출력하는 외부 스피커의 연결 여부를 판단하는 단계;
상기 외부 스피커가 연결된 경우에, 외부 스피커의 입력 신호를 분석하는 단계;
상기 외부 스피커의 입력 신호와 상기 오디오 신호를 비교하여, 상기 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하는 단계; 및,
상기 보정된 오디오 신호에 기초하여, 상기 스피커의 음향 신호를 제거하는 단계;를 포함하고,
상기 외부 스피커의 상기 입력 신호는, 시스템 시간 정보를 포함하며,
상기 시스템 시간 정보에 기초하여, 상기 외부 스피커의 입력 신호와 상기 오디오 신호를 비교하며,
상기 오디오 처리부에서 상기 외부 스피커로, 상기 디지털 앰프를 통하지 않고, 신호가 전송되며, 상기 오디오 신호의 상기 전송 딜레이는, 상기 디지털 앰프로 인하여 발생하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 외부 스피커는 사운드 바(Sound Bar)인 것을 특징으로 하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 스피커의 음향 신호가 제거된 음성 신호에 기초하여, 특징 벡터를 추출하는 단계; 및,
상기 특징 벡터를 음성 데이터베이스와 비교하여, 상기 수신된 음성 신호에 대응하는 데이터를 판별하는 단계;를 더 포함하는 영상표시장치의 동작 방법. - 제3항에 있어서,
상기 판별된 데이터에 기초하여 대응 동작을 수행하는 단계;를 더 포함하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 마이크(MIC)는, 원격제어장치 또는 영상표시장치에 구비된 마이크이거나, 인터페이스부를 통해 연결된 외부 마이크인 것을 특징으로 하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 외부 스피커가 연결되지 않은 경우에, 내장 스피커의 입력 신호를 분석하는 단계;와
상기 내장 스피커의 입력 신호와 상기 오디오 신호를 비교하여, 상기 오디오 신호의 음질 왜곡 및 전송 딜레이(delay)를 보정하는 단계;를 더 포함하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 오디오 신호의 노이즈(Noise) 성분을 필터링(filtering)하는 단계;를 더 포함하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 외부 스피커의 입력 신호는 영상표시장치가 상기 외부 스피커로 출력하는 디지털화된 오디오 신호인 것을 특징으로 하는 영상표시장치의 동작 방법. - 제1항에 있어서,
상기 보정 단계는, 게인(gain) 및 주파수 특성을 보정하는 것을 특징으로 하는 영상표시장치의 동작 방법. - 제9항에 있어서,
상기 보정 단계는, 상기 게인(gain)은 감소시키고, 상기 주파수 특성은 평탄화 보정하는 것을 특징으로 하는 영상표시장치의 동작 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150084459A KR102454761B1 (ko) | 2015-06-15 | 2015-06-15 | 영상표시장치의 동작 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020150084459A KR102454761B1 (ko) | 2015-06-15 | 2015-06-15 | 영상표시장치의 동작 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160147556A KR20160147556A (ko) | 2016-12-23 |
KR102454761B1 true KR102454761B1 (ko) | 2022-10-13 |
Family
ID=57736061
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150084459A KR102454761B1 (ko) | 2015-06-15 | 2015-06-15 | 영상표시장치의 동작 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102454761B1 (ko) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102356877B1 (ko) * | 2017-11-09 | 2022-01-28 | 엘지디스플레이 주식회사 | 표시장치 및 그 구동 방법 |
KR20190056060A (ko) * | 2017-11-16 | 2019-05-24 | 삼성전자주식회사 | 전자 장치 및 제어 방법 |
KR102626924B1 (ko) | 2019-06-20 | 2024-01-19 | 삼성전자주식회사 | 지향성 음향 센서와, 이를 이용한 지향 특성의 조절 방법 및 특정 방향의 음향 신호 감쇄 방법 |
US11887588B2 (en) | 2019-06-20 | 2024-01-30 | Lg Electronics Inc. | Display device |
KR20210068953A (ko) | 2019-12-02 | 2021-06-10 | 삼성전자주식회사 | 전자 장치 및 그 제어 방법 |
TWM612163U (zh) * | 2020-12-21 | 2021-05-21 | 技嘉科技股份有限公司 | 具有自動降噪功能之顯示裝置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001094370A (ja) * | 1999-09-27 | 2001-04-06 | Alpine Electronics Inc | 音声入出力方式 |
JP2006217117A (ja) * | 2005-02-02 | 2006-08-17 | Funai Electric Co Ltd | テレビジョン受像機 |
JP2008263562A (ja) * | 2007-04-16 | 2008-10-30 | Yamaha Corp | 音響特性補正システム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100630061B1 (ko) * | 1999-12-06 | 2006-09-28 | 삼성전자주식회사 | 복수의 서비스 데이터를 구별하기 위한 데이터 타입식별정보등록 및 재생방법 |
KR20150004051A (ko) * | 2013-07-02 | 2015-01-12 | 엘지전자 주식회사 | 리모트 컨트롤러 및 멀티미디어 디바이스의 제어 방법 |
-
2015
- 2015-06-15 KR KR1020150084459A patent/KR102454761B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001094370A (ja) * | 1999-09-27 | 2001-04-06 | Alpine Electronics Inc | 音声入出力方式 |
JP2006217117A (ja) * | 2005-02-02 | 2006-08-17 | Funai Electric Co Ltd | テレビジョン受像機 |
JP2008263562A (ja) * | 2007-04-16 | 2008-10-30 | Yamaha Corp | 音響特性補正システム |
Also Published As
Publication number | Publication date |
---|---|
KR20160147556A (ko) | 2016-12-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102454761B1 (ko) | 영상표시장치의 동작 방법 | |
KR102147346B1 (ko) | 디스플레이 장치 및 그의 동작 방법 | |
EP2626771B1 (en) | Display apparatus and method for controlling a camera mounted on a display apparatus | |
US8223269B2 (en) | Closed caption production device, method and program for synthesizing video, sound and text | |
US9552057B2 (en) | Electronic apparatus and method for controlling the same | |
EP2595031A2 (en) | Display apparatus and control method thereof | |
TW201344597A (zh) | 顯示裝置控制方法、控制器及多媒體系統 | |
US20130300934A1 (en) | Display apparatus, server, and controlling method thereof | |
US20120301030A1 (en) | Image processing apparatus, image processing method and recording medium | |
KR20160049347A (ko) | 영상표시기기 및 그의 원거리 음성 인식율 향상 방법 | |
KR20190056119A (ko) | 디스플레이장치 및 그 제어방법 | |
CN109792576B (zh) | 图像显示设备 | |
KR20190100630A (ko) | 디스플레이 장치 및 그의 동작 방법 | |
KR20190017507A (ko) | 영상표시장치 | |
US20140108934A1 (en) | Image display apparatus and method for operating the same | |
US20240121501A1 (en) | Electronic apparatus and method of controlling the same | |
CN116097655A (zh) | 显示装置及其操作方法 | |
US10992273B2 (en) | Electronic device and operation method thereof | |
US11887588B2 (en) | Display device | |
CN113689810B (zh) | 图像显示设备及其方法 | |
KR20150022476A (ko) | 디스플레이장치 및 그 제어방법 | |
KR20210071664A (ko) | 전자장치 및 그 제어방법 | |
JP7216621B2 (ja) | 電子機器、プログラムおよび音声認識方法 | |
EP4456060A1 (en) | Display device | |
EP4216214A1 (en) | Controller and system comprising same |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |