WO2016027933A1 - 디지털 디바이스 및 그 제어 방법 - Google Patents
디지털 디바이스 및 그 제어 방법 Download PDFInfo
- Publication number
- WO2016027933A1 WO2016027933A1 PCT/KR2014/010746 KR2014010746W WO2016027933A1 WO 2016027933 A1 WO2016027933 A1 WO 2016027933A1 KR 2014010746 W KR2014010746 W KR 2014010746W WO 2016027933 A1 WO2016027933 A1 WO 2016027933A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- audio
- digital
- data
- digital device
- external device
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 94
- 230000005540 biological transmission Effects 0.000 claims abstract description 17
- 238000004891 communication Methods 0.000 claims description 55
- 230000005236 sound signal Effects 0.000 claims description 22
- 238000005406 washing Methods 0.000 claims description 3
- 230000006870 function Effects 0.000 description 47
- 230000008569 process Effects 0.000 description 44
- 238000012545 processing Methods 0.000 description 41
- 238000010586 diagram Methods 0.000 description 33
- 238000007726 management method Methods 0.000 description 18
- 230000000694 effects Effects 0.000 description 14
- 238000011161 development Methods 0.000 description 10
- 238000012384 transportation and delivery Methods 0.000 description 9
- 238000010295 mobile communication Methods 0.000 description 7
- 238000013468 resource allocation Methods 0.000 description 7
- 241001677731 Enyo Species 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 230000033001 locomotion Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 239000013256 coordination polymer Substances 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000000007 visual effect Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 239000002131 composite material Substances 0.000 description 3
- 239000004973 liquid crystal related substance Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 230000004044 response Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000003058 natural language processing Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000003672 processing method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- 101000591286 Homo sapiens Myocardin-related transcription factor A Proteins 0.000 description 1
- 102100034099 Myocardin-related transcription factor A Human genes 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 108010038083 amyloid fibril protein AS-SAM Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000002592 echocardiography Methods 0.000 description 1
- 230000005684 electric field Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000010408 film Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000006386 memory function Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 238000011017 operating method Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000001151 other effect Effects 0.000 description 1
- 238000009304 pastoral farming Methods 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000035807 sensation Effects 0.000 description 1
- 230000015541 sensory perception of touch Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/20—Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2807—Exchanging configuration information on appliance services in a home automation network
- H04L12/2809—Exchanging configuration information on appliance services in a home automation network indicating that an appliance service is present in a home automation network
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/02—Details
- H04L12/12—Arrangements for remote connection or disconnection of substations or of equipment thereof
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L12/2816—Controlling appliance services of a home automation network by calling their functionalities
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L61/00—Network arrangements, protocols or services for addressing or naming
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/51—Discovery or management thereof, e.g. service location protocol [SLP] or web services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/52—Network services specially adapted for the location of the user terminal
-
- G—PHYSICS
- G08—SIGNALLING
- G08C—TRANSMISSION SYSTEMS FOR MEASURED VALUES, CONTROL OR SIMILAR SIGNALS
- G08C2201/00—Transmission systems of control signals via wireless link
- G08C2201/90—Additional features
- G08C2201/91—Remote control based on location and proximity
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02082—Noise filtering the noise being echo, reverberation of the speech
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/284—Home automation networks characterised by the type of medium used
- H04L2012/2841—Wireless
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/2847—Home automation networks characterised by the type of home appliance used
- H04L2012/2849—Audio/video appliances
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L12/00—Data switching networks
- H04L12/28—Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
- H04L12/2803—Home automation networks
- H04L2012/2847—Home automation networks characterised by the type of home appliance used
- H04L2012/285—Generic home appliances, e.g. refrigerators
Definitions
- the present invention relates to a digital device, and more particularly, to a digital device for outputting an audio signal through a speaker.
- the present invention relates to a repeater including a Wi-Fi (Wireless-fidelity) router and to the repeater.
- Wi-Fi Wireless-fidelity
- the other external device performs the voice recognition function
- audio data output through the speaker of the digital device is transmitted to the external device, and the external device uses the audio data to provide an acoustic echo canceler (AEC) function.
- AEC acoustic echo canceler
- the present invention has been made to solve the above situation or problem, and an object of the present invention is to increase the speech recognition rate of a digital device using the AEC function.
- Another object of the present invention is to achieve more accurate AEC results by using audio data output from a speaker located within a predetermined distance when the digital device performs an AEC function.
- Another object of the present invention when there are a plurality of digital devices including a speaker, to perform the AEC function by using all the audio data output through the speaker of each of the plurality of digital devices, thereby increasing the speech recognition rate will be.
- This disclosure discloses various embodiment (s) of a digital device and a processing method in the digital device.
- a method of controlling a digital device may include: connecting to a repeater, detecting an external device located within a predetermined distance and connected to the repeater, an audio reference from the sensed external device And receiving a data transmission request and transmitting the requested audio reference data to the external device.
- a digital device may include a communication module for performing data communication with a repeater and an external device, a storage module for storing at least one audio reference data, and operation of the digital device. And a controller for controlling the controller, wherein the controller is connected to the repeater, detects an external device connected to the repeater located within a predetermined distance, and receives an audio reference data transmission request from the sensed external device.
- a digital device may be designed to control the external device to transmit the requested audio reference data.
- FIG. 1 is a diagram schematically illustrating a service system including a digital device according to an embodiment of the present invention.
- FIG. 2 is a block diagram illustrating a digital device according to an embodiment of the present invention.
- FIG. 3 is a block diagram illustrating a digital device according to another embodiment of the present invention.
- FIG. 4 is a block diagram illustrating a digital device according to another embodiment of the present invention.
- FIG. 5 is a block diagram illustrating a detailed configuration of the controller of FIGS. 2 to 4 according to an embodiment of the present invention.
- FIG. 6 is a diagram illustrating input means connected to the digital device of FIGS. 2 to 4 according to one embodiment of the present invention.
- FIG. 7 is a diagram illustrating a Web OS architecture according to an embodiment of the present invention.
- FIG. 8 is a diagram illustrating the architecture of a Web OS device according to one embodiment of the present invention.
- FIG. 9 is a diagram illustrating a graphic composition flow in a Web OS device according to one embodiment of the present invention.
- FIG. 10 is a diagram illustrating a media server according to one embodiment of the present invention.
- FIG. 11 is a block diagram illustrating a configuration of a media server according to an embodiment of the present invention.
- FIG. 12 is a diagram illustrating a relationship between a media server and a TV service, according to an exemplary embodiment.
- FIG. 13 and 14 illustrate an AEC function performed in a digital device before the present invention.
- 15 is a block diagram illustrating in detail a configuration module of a digital device according to another embodiment of the present invention.
- FIG. 16 illustrates an example in which a digital device and an external device connect to the same repeater to transmit / receive data according to an embodiment of the present invention.
- 17 and 18 are diagrams for describing an example of increasing a voice recognition rate using audio reference data of a digital device according to one embodiment of the present invention.
- FIG. 19 is a diagram for explaining an example in which a digital device performs data communication by connecting an external device with Bluetooth according to an embodiment of the present invention.
- 20 and 21 are diagrams for describing an example of transmitting all audio reference data to an external device when there are a plurality of digital devices according to an embodiment of the present invention.
- 22 is a flowchart illustrating a control method of a digital device according to an embodiment of the present invention.
- the term "digital device” refers to, for example, transmitting, receiving, processing, and outputting data, content, service, application, and the like. It includes all devices that perform at least one or more.
- the digital device may be paired or connected (hereinafter referred to as 'pairing') with another digital device, an external server, or the like through a wired / wireless network, and transmits predetermined data therethrough. Can send / receive At this time, if necessary, the data may be appropriately converted (converted) before the transmission / reception.
- the digital device includes, for example, a standing device such as a network television (TV), a hybrid broadcast broadband TV (HBBTV), a smart television (TV), an internet protocol television (IPTV), a personal computer (PC), or the like.
- a mobile device such as a PDA (Personal Digital Assistant), smart phone (Smart Phone), tablet PC (Tablet PC), notebook (notebook) and the like can all include.
- a digital TV is illustrated in FIG. 2 and a mobile device is illustrated in FIG. 3, which will be described later to help the understanding of the present invention and for convenience of the applicant.
- the digital device described herein may be a configuration having only a panel, or may be a set configuration such as a set-top box (STB), a device, a system, and the like. .
- wired / wireless network refers to a communication network supporting various communication standards or protocols for pairing and / or transmitting and receiving data between digital devices or digital devices and external servers.
- wired / wireless networks include all communication networks that are currently or will be supported by the specification and are capable of supporting one or more communication protocols for them.
- Such wired and wireless networks include, for example, Universal Serial Bus (USB), Composite Video Banking Sync (CVBS), Component, S-Video (Analog), Digital Visual Interface (DVI), High Definition Multimedia Interface (HDMI), Network for wired connection such as RGB, D-SUB and communication standard or protocol therefor, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), Zigbee (ZigBee), Digital Living Network Alliance (DLNA), Wireless LAN (WLAN) (Wi-Fi), Wireless broadband (Wibro), World Interoperability for Microwave Access (Wimax), High Speed Downlink Packet Access (HSDPA), LTE / LTE It may be formed by a network for a wireless connection such as Long Term Evolution / LTE-Advanced (A), Wi-Fi Direct, and a communication standard or protocol therefor.
- RFID Radio Frequency Identification
- IrDA Infrared Data Association
- UWB Ultra Wideband
- the meaning when referred to herein only as a digital device, the meaning may mean a fixed device or a mobile device depending on the context, and may be used to include both unless specifically mentioned.
- the digital device is, for example, an intelligent device that supports a broadcast receiving function, a computer function or support, at least one external input, and the like, and includes e-mail and web browsing through the above-described wired / wireless network. , Banking, games, applications, and the like.
- the digital device may include an interface for supporting at least one input or control means (hereinafter, “input means”) such as a handwritten input device, a touch-screen, and a spatial remote controller. Can be.
- the digital device may use a standardized general operating system (OS), but in particular, the digital device described in the present specification uses a web OS. Accordingly, digital devices can add, delete, modify, and update various services or applications on a general-purpose OS kernel or Linux kernel. It is possible, through which a more user-friendly environment can be constructed and provided.
- OS general operating system
- the digital device described in the present specification uses a web OS. Accordingly, digital devices can add, delete, modify, and update various services or applications on a general-purpose OS kernel or Linux kernel. It is possible, through which a more user-friendly environment can be constructed and provided.
- the above-described digital device may receive and process an external input.
- the external input may be connected to an external input device, that is, the digital device through a wired / wireless network, to transmit / receive data, and to process the external input.
- An input means to a digital device.
- a game device such as a high-definition multimedia interface (HDMI), a playstation or an X-box, a smartphone, a tablet PC, a pocket photo, etc. may be used as the external input.
- digital devices such as printing devices, smart TVs, Blu-ray device devices, and the like.
- server refers to a digital device or system for supplying data to or receiving data from the above-mentioned digital device, that is, a client, and also referred to as a processor. do.
- a portal server for providing a web page, a web content or a web service
- an advertising server for providing advertising data
- Providing a content server providing content an SNS server providing a social network service (SNS), a service server provided by a manufacturer, and providing a video on demand (VOD) or streaming service
- SNS social network service
- VOD video on demand
- It may include a multi-channel video programming distributor (MVDP), a service server for providing a pay service, and the like.
- MVDP multi-channel video programming distributor
- the meaning may be a meaning including not only an application but also a service based on the context.
- FIG. 1 is a diagram schematically illustrating a service system including a digital device according to an embodiment of the present invention.
- the service system includes a content provider 10, a service provider 20, a network provider 30, and a home network end user (HNED). And 40.
- the HNED 40 comprises, for example, a client 100, ie a digital device according to the invention.
- the content provider 10 produces and provides various contents. As shown in FIG. 1, such a content provider 10 may include a terrestrial broadcast sender, a cable SO (System Operator) or MSO (Multiple SO), a satellite broadcast sender, various Internet broadcast senders, and an individual. Content providers and the like. The content provider 10 may produce and provide various services or applications in addition to broadcast content.
- a content provider 10 may include a terrestrial broadcast sender, a cable SO (System Operator) or MSO (Multiple SO), a satellite broadcast sender, various Internet broadcast senders, and an individual. Content providers and the like.
- the content provider 10 may produce and provide various services or applications in addition to broadcast content.
- the service provider 20 service packetizes the content produced by the content provider 10 and provides it to the HNED 40.
- the service provider 20 may package at least one or more of contents produced by the first terrestrial broadcast, the second terrestrial broadcast, the cable MSO, the satellite broadcast, the various Internet broadcasts, the application, and the like for the service, and the HNED ( 40).
- the service provider 20 provides a service to the client 100 in a uni-cast or multi-cast manner.
- the service provider 20 may transmit data to a plurality of clients 100 registered in advance, for this purpose may use the Internet Group Management Protocol (IGMP) protocol.
- IGMP Internet Group Management Protocol
- the content provider 10 and the service provider 20 described above may be the same entity.
- the content produced by the content provider 10 may be packaged as a service and provided to the HNED 40 to perform the functions of the service provider 20 together or vice versa.
- the network provider 30 provides a network for data exchange between the content provider 10 or / and the service provider 20 and the client 100.
- the client 100 receives a data through a network provider 30, for example, by establishing a home network, and receives data about various services or applications such as VoD and streaming. You can also send / receive.
- the content provider 10 and / or the service provider 20 in the service system may use conditional access or content protection means to protect the transmitted content.
- the client 100 may use a processing means such as a cable card (or point of deployment) or a downloadable casing (DCAS) in response to the limited reception or content protection.
- a processing means such as a cable card (or point of deployment) or a downloadable casing (DCAS) in response to the limited reception or content protection.
- the client 100 may also use a bidirectional service through a network. Accordingly, the client 100 may perform a role or function of a content provider, and the service provider 20 may receive it and transmit it to another client.
- the content provider 10 and / or the service provider 20 may be a server that provides a service described later herein.
- the server may mean owning or including the network provider 30 as necessary.
- the service or service data includes not only services or applications received from the outside described above, but also internal services or applications, and the services or applications include service or application data for the Web OS-based client 100. Can mean.
- FIG. 2 is a block diagram illustrating a digital device according to an embodiment of the present invention.
- the digital device described herein corresponds to the client 100 of FIG. 1.
- the digital device 200 includes a network interface 201, a TCP / IP manager 202, a service delivery manager 203, an SI decoder 204, A demux or demultiplexer 205, an audio decoder 206, a video decoder 207, a display A / V and OSD module 208, a service control manager (service control manager) 209, service discovery manager 210, SI & metadata DB 211, metadata manager 212, service manager 213, And a UI manager 214.
- a network interface 201 includes a network interface 201, a TCP / IP manager 202, a service delivery manager 203, an SI decoder 204, A demux or demultiplexer 205, an audio decoder 206, a video decoder 207, a display A / V and OSD module 208, a service control manager (service control manager) 209, service discovery manager 210, SI & metadata DB 211, metadata manager 212, service manager 213, And a UI
- the network interface unit 201 may be configured to perform IP packet (s) (Internet Protocol (IP) packet (s)) or IP datagram (s) (hereinafter referred to as IP packet (s) through an accessing network. Send / receive)
- IP packet Internet Protocol
- IP datagram IP datagram
- Send / receive For example, the network interface unit 201 may receive a service, an application, content, and the like from the service provider 20 of FIG. 1 through a network.
- the TCP / IP manager 202 may be configured to transfer packets between the source and the destination for IP packets received by the digital device 200 and IP packets transmitted by the digital device 200. involved in packet delivery).
- the TCP / IP manager 202 classifies the received packet (s) to correspond to an appropriate protocol, and includes a service delivery manager 205, a service discovery manager 210, a service control manager 209, and a metadata manager 212. Output the classified packet (s).
- the service delivery manager 203 is in charge of controlling the received service data.
- the service delivery manager 203 may use RTP / RTCP when controlling real-time streaming data.
- the service delivery manager 203 parses the received data packet according to the RTP and transmits it to the demultiplexer 205 or the control of the service manager 213.
- the service delivery manager 203 feeds back the network reception information to a server that provides a service using RTCP.
- the demultiplexer 205 demultiplexes the received packet into audio, video, SI (System Information) data, and the like, and transmits the demultiplexed unit to the audio / video decoders 206/207 and the SI decoder 204, respectively.
- SI System Information
- the SI decoder 204 includes demultiplexed SI data, that is, Program Specific Information (PSI), Program and System Information Protocol (PSIP), Digital Video Broadcasting-Service Information (DVB-SI), and Digital Television Terrestrial Multimedia (DTMB / CMMB). Decode service information such as Broadcasting / Coding Mobile Multimedia Broadcasting).
- the SI decoder 204 may store the decoded service information in the SI & metadata database 211. The stored service information may be read and used by the corresponding configuration, for example, at the request of a user.
- the audio / video decoder 206/207 decodes each demultiplexed audio data and video data.
- the decoded audio data and video data are provided to the user through the display unit 208.
- the application manager may include, for example, the UI manager 214 and the service manager 213 and perform a control function of the digital device 200.
- the application manager may manage the overall state of the digital device 200, provide a user interface (UI), and manage other managers.
- UI user interface
- the UI manager 214 provides a Graphic User Interface (UI) / UI for a user by using an OSD (On Screen Display) and the like, and receives a key input from the user to perform a device operation according to the input. For example, the UI manager 214 transmits the key input signal to the service manager 213 when receiving a key input related to channel selection from the user.
- UI Graphic User Interface
- OSD On Screen Display
- the service manager 213 controls a manager associated with a service such as a service delivery manager 203, a service discovery manager 210, a service control manager 209, and a metadata manager 212.
- the service manager 213 generates a channel map and controls the channel selection using the generated channel map according to the key input received from the UI manager 214.
- the service manager 213 receives service information from the SI decoder 204 and sets the audio / video packet identifier (PID) of the selected channel to the demultiplexer 205.
- PID audio / video packet identifier
- the PID set as described above may be used in the above demultiplexing process. Accordingly, the demultiplexer 205 filters (PID or section filtering) audio data, video data, and SI data by using the PID.
- the service discovery manager 210 provides information necessary to select a service provider that provides a service. Upon receiving a signal regarding channel selection from the service manager 213, the service discovery manager 210 searches for a service using the information.
- the service control manager 209 is responsible for selecting and controlling services. For example, the service control manager 209 uses IGMP or RTSP when the user selects a live broadcasting service such as a conventional broadcasting method, and uses RTSP when selecting a service such as VOD. Select and control services.
- the RTSP protocol may provide a trick mode for real time streaming.
- the service control manager 209 may initialize and manage a session through the IMS gateway 250 using an IP Multimedia Subsystem (IMS) or a Session Initiation Protocol (SIP).
- IMS IP Multimedia Subsystem
- SIP Session Initiation Protocol
- the protocols are one embodiment, and other protocols may be used depending on implementation.
- the metadata manager 212 manages metadata associated with the service and stores the metadata in the SI & metadata database 211.
- the SI & metadata database 211 stores service information decoded by the SI decoder 204, metadata managed by the metadata manager 212, and information necessary to select a service provider provided by the service discovery manager 210. do.
- the SI & metadata database 211 can store set-up data and the like for the system.
- the SI & metadata database 211 may be implemented using non-volatile memory (NVRAM), flash memory, or the like.
- NVRAM non-volatile memory
- the IMS gateway 250 is a gateway that collects functions necessary for accessing an IMS-based IPTV service.
- FIG. 3 is a block diagram illustrating a digital device according to another embodiment of the present invention.
- Figure 3 is a mobile device to another embodiment of the digital device.
- the mobile device 300 may include a wireless communication unit 310, an A / V input unit 320, a user input unit 330, a sensing unit 340, an output unit 350,
- the memory 360 may include an interface unit 370, a controller 380, a power supply unit 390, and the like.
- the wireless communication unit 310 may include one or more modules that enable wireless communication between the mobile device 300 and the wireless communication system or between the mobile device and the network in which the mobile device is located.
- the wireless communication unit 310 may include a broadcast receiving module 311, a mobile communication module 312, a wireless internet module 313, a short range communication module 314, a location information module 315, and the like. .
- the broadcast receiving module 311 receives a broadcast signal and / or broadcast related information from an external broadcast management server through a broadcast channel.
- the broadcast channel may include a satellite channel and a terrestrial channel.
- the broadcast management server may mean a server that generates and transmits a broadcast signal and / or broadcast related information or a server that receives a previously generated broadcast signal and / or broadcast related information and transmits the same to a terminal.
- the broadcast signal may include not only a TV broadcast signal, a radio broadcast signal, and a data broadcast signal, but also a broadcast signal having a data broadcast signal combined with a TV broadcast signal or a radio broadcast signal.
- the broadcast related information may mean information related to a broadcast channel, a broadcast program, or a broadcast service provider.
- the broadcast related information may also be provided through a mobile communication network. In this case, it may be received by the mobile communication module 312.
- the broadcast related information may exist in various forms, for example, in the form of an electronic program guide (EPG) or an electronic service guide (ESG).
- EPG electronic program guide
- ESG electronic service guide
- the broadcast receiving module 311 may be, for example, ATSC, DVB-T (Digital Video Broadcasting-Terrestrial), DVB-S (Satellite), MediaFLO (Media Forward Link Only), DVB-H (Handheld), ISDB-T ( Digital broadcasting signals may be received using a digital broadcasting system such as Integrated Services Digital Broadcast-Terrestrial.
- the broadcast receiving module 311 may be configured to be suitable for not only the above-described digital broadcasting system but also other broadcasting systems.
- the broadcast signal and / or broadcast related information received through the broadcast receiving module 311 may be stored in the memory 360.
- the mobile communication module 312 transmits and receives a radio signal with at least one of a base station, an external terminal, and a server on a mobile communication network.
- the wireless signal may include various types of data according to transmission and reception of a voice signal, a video call signal, or a text / multimedia message.
- the wireless internet module 313 may include a module for wireless internet access and may be embedded or external to the mobile device 300.
- Wireless Internet technologies may include Wireless LAN (Wi-Fi), Wireless Broadband (Wibro), World Interoperability for Microwave Access (Wimax), High Speed Downlink Packet Access (HSDPA), and the like.
- the short range communication module 314 refers to a module for short range communication.
- Short range communication technologies include Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, RS-232, and RS-485. Can be.
- the location information module 315 may be a module for acquiring location information of the mobile device 300, and may use a Global Position System (GPS) module as an example.
- GPS Global Position System
- the A / V input unit 320 is for inputting an audio or / video signal, and may include a camera 321 and a microphone 322.
- the camera 321 processes image frames such as still images or moving images obtained by the image sensor in the video call mode or the imaging mode.
- the processed image frame may be displayed on the display unit 351.
- the image frame processed by the camera 321 may be stored in the memory 360 or transmitted to the outside through the wireless communication unit 310. Two or more cameras 321 may be provided depending on the use environment.
- the microphone 322 receives an external sound signal by a microphone in a call mode, a recording mode, a voice recognition mode, etc., and processes the external sound signal into electrical voice data.
- the processed voice data may be converted into a form transmittable to the mobile communication base station through the mobile communication module 312 and output in the call mode.
- the microphone 322 may be implemented with various noise removing algorithms for removing noise generated in the process of receiving an external sound signal.
- the user input unit 330 generates input data for the user to control the operation of the terminal.
- the user input unit 330 may include a key pad, a dome switch, a touch pad (constant voltage / capacitance), a jog wheel, a jog switch, and the like.
- the sensing unit 340 may determine the current state of the mobile device 300 such as an open / closed state of the mobile device 300, a location of the mobile device 300, presence or absence of user contact, orientation of the mobile device, acceleration / deceleration of the mobile device, and the like.
- the sensing unit generates a sensing signal for controlling the operation of the mobile device 300. For example, when the mobile device 300 is moved or tilted, the position or tilt of the mobile device may be sensed. Also, whether the power supply unit 390 is supplied with power or whether the interface unit 370 is coupled to an external device may be sensed.
- the sensing unit 240 may include a proximity sensor 341 including near field communication (NFC).
- the output unit 350 is to generate an output related to visual, auditory or tactile senses, and may include a display unit 351, a sound output module 352, an alarm unit 353, a haptic module 354, and the like. have.
- the display unit 351 displays (outputs) information processed by the mobile device 300. For example, when the mobile device is in the call mode, the UI or GUI related to the call is displayed. When the mobile device 300 is in a video call mode or a shooting mode, the mobile device 300 displays a captured image and / or a received image, UI, or GUI.
- the display unit 351 may include a liquid crystal display (LCD), a thin film transistor-liquid crystal display (TFT LCD), an organic light-emitting diode (OLED), a flexible display ( flexible display) and three-dimensional display.
- LCD liquid crystal display
- TFT LCD thin film transistor-liquid crystal display
- OLED organic light-emitting diode
- flexible display flexible display
- three-dimensional display three-dimensional display.
- Some of these displays can be configured to be transparent or light transmissive so that they can be seen from the outside. This may be referred to as a transparent display.
- a representative example of the transparent display is TOLED (Transparant OLED).
- the rear structure of the display unit 351 may also be configured as a light transmissive structure. With this structure, the user can see the object located behind the terminal body through the area occupied by the display unit 351 of the terminal body.
- two or more display units 351 may exist.
- a plurality of display units may be spaced apart or integrally disposed on one surface of the mobile device 300, or may be disposed on different surfaces.
- the display unit 351 and a sensor for detecting a touch motion form a mutual layer structure (hereinafter referred to as a touch screen)
- the display unit 351 may be input in addition to the output device. It can also be used as a device.
- the touch sensor may have, for example, a form of a touch film, a touch sheet, a touch pad, or the like.
- the touch sensor may be configured to convert a change in pressure applied to a specific portion of the display unit 351 or capacitance generated at a specific portion of the display unit 351 into an electrical input signal.
- the touch sensor may be configured to detect not only the position and area of the touch but also the pressure at the touch.
- the corresponding signal (s) is sent to the touch controller.
- the touch controller processes the signal (s) and then transmits the corresponding data to the controller 380.
- the controller 380 may determine which area of the display unit 351 is touched.
- the proximity sensor 341 may be disposed in an inner region of the mobile device surrounded by the touch screen or near the touch screen.
- the proximity sensor refers to a sensor that detects the presence or absence of an object approaching a predetermined detection surface or an object present in the vicinity without using a mechanical contact by using an electromagnetic force or infrared rays.
- Proximity sensors have a longer life and higher utilization than touch sensors.
- the proximity sensor examples include a transmission photoelectric sensor, a direct reflection photoelectric sensor, a mirror reflection photoelectric sensor, a high frequency oscillation proximity sensor, a capacitive proximity sensor, a magnetic proximity sensor, and an infrared proximity sensor.
- the touch screen is capacitive, the touch screen is configured to detect the proximity of the pointer by the change of the electric field according to the proximity of the pointer.
- the touch screen may be classified as a proximity sensor.
- the act of allowing the pointer to be recognized without being in contact with the touch screen so that the pointer is located on the touch screen is referred to as a "proximity touch", and the touch
- the act of actually touching the pointer on the screen is called “contact touch.”
- the position where the proximity touch is performed by the pointer on the touch screen refers to a position where the pointer is perpendicular to the touch screen when the pointer is in proximity proximity.
- the proximity sensor detects a proximity touch and a proximity touch pattern (for example, a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, and a proximity touch movement state).
- a proximity touch and a proximity touch pattern for example, a proximity touch distance, a proximity touch direction, a proximity touch speed, a proximity touch time, a proximity touch position, and a proximity touch movement state.
- Information corresponding to the sensed proximity touch operation and proximity touch pattern may be output on the touch screen.
- the sound output module 352 may output audio data received from the wireless communication unit 310 or stored in the memory 360 in a call signal reception, a call mode or a recording mode, a voice recognition mode, a broadcast reception mode, and the like.
- the sound output module 352 may output a sound signal related to a function (eg, a call signal reception sound, a message reception sound, etc.) performed by the mobile device 300.
- the sound output module 352 may include a receiver, a speaker, a buzzer, and the like.
- the alarm unit 353 outputs a signal for notifying occurrence of an event of the mobile device 300. Examples of events occurring in the mobile device include call signal reception, message reception, key signal input, and touch input.
- the alarm unit 353 may output a signal for notifying the occurrence of an event by vibration, in addition to a video signal or an audio signal.
- the video signal or the audio signal may also be output through the display unit 351 or the audio output module 352, so that they 351 and 352 may be classified as part of the alarm unit 353.
- the haptic module 354 generates various tactile effects that a user can feel. Vibration is a representative example of the haptic effect generated by the haptic module 354.
- the intensity and pattern of vibration generated by the haptic module 354 can be controlled. For example, different vibrations may be synthesized and output or may be sequentially output.
- the haptic module 354 may be configured to provide a pin array that vertically moves with respect to the contact skin surface, a jetting force or suction force of air through the jetting or suction port, grazing to the skin surface, contact of the electrode, electrostatic force, and the like.
- Various tactile effects can be generated, such as effects due to the effects of cold / warm reproduction using an element that can absorb heat or generate heat.
- the haptic module 354 may not only deliver the haptic effect through direct contact, but also may implement the user to feel the haptic effect through muscle sensation such as a finger or an arm.
- the haptic module 354 may be provided with two or more according to the configuration aspect of the mobile device 300.
- the memory 360 may store a program for the operation of the controller 380 and may temporarily store input / output data (for example, a phone book, a message, a still image, a video, etc.).
- the memory 360 may store data regarding vibration and sound of various patterns output when a touch input on the touch screen is performed.
- the memory 360 may include a flash memory type, a hard disk type, a multimedia card micro type, a card type memory (for example, SD or XD memory), Random Access Memory (RAM), Static Random Access Memory (SRAM), Read-Only Memory (ROM), Electrically Erasable Programmable Read-Only Memory (EEPROM), Programmable Read-Only Memory (PROM), Magnetic Memory, It may include a storage medium of at least one type of magnetic disk, optical disk.
- the mobile device 300 may operate in association with web storage that performs a storage function of the memory 360 on the Internet.
- the interface unit 370 serves as a path to all external devices connected to the mobile device 300.
- the interface unit 370 receives data from an external device, receives power, transfers the power to each component inside the mobile device 300, or transmits data within the mobile device 300 to the external device.
- wired / wireless headset port, external charger port, wired / wireless data port, memory card port, port for connecting a device with an identification module, audio input / output (I / O) port, The video I / O port, the earphone port, and the like may be included in the interface unit 370.
- the identification module is a chip that stores various types of information for authenticating the usage rights of the mobile device 300, and includes a user identification module (UIM), a subscriber identification module (SIM), and a universal user authentication module (UI). Universal Subscriber Identity Module (USIM), and the like.
- a device equipped with an identification module (hereinafter referred to as an “identification device”) may be manufactured in the form of a smart card. Therefore, the identification device may be connected to the terminal 200 through a port.
- the interface unit 370 may be a path through which power from the cradle is supplied to the mobile device 300 or may be input by the user from the cradle. It may be a passage through which a command signal is transmitted to the mobile device. Various command signals or power input from the cradle may be operated as signals for recognizing that the mobile device is correctly mounted in the cradle.
- the controller 380 typically controls the overall operation of the mobile device 300.
- the controller 380 performs, for example, related control and processing for voice call, data communication, video call, and the like.
- the controller 380 may include a multimedia module 381 for multimedia playback.
- the multimedia module 381 may be implemented in the controller 380 or may be implemented separately from the controller 380.
- the controller 380 may perform a pattern recognition process for recognizing a writing input or a drawing input performed on a touch-screen as a character and an image, respectively.
- the power supply unit 390 receives an external power source and an internal power source under the control of the controller 380 to supply power for operation of each component.
- Various embodiments described herein may be implemented in a recording medium readable by a computer or similar device using, for example, software, hardware or a combination thereof.
- the embodiments described herein include application specific integrated circuits (ASICs), digital signal processors (DSPs), digital signal processing devices (DSPDs), programmable logic devices (PLDs), field programmable gate arrays (FPGAs), and the like. It may be implemented using at least one of a processor, a controller, micro-controllers, microprocessors, and other electrical units for performing other functions. Examples may be implemented by the controller 380 itself.
- ASICs application specific integrated circuits
- DSPs digital signal processors
- DSPDs digital signal processing devices
- PLDs programmable logic devices
- FPGAs field programmable gate arrays
- embodiments such as the procedures and functions described herein may be implemented as separate software modules.
- Each of the software modules may perform one or more functions and operations described herein.
- Software code may be implemented in software applications written in a suitable programming language.
- the software code may be stored in the memory 360 and executed by the controller 380.
- FIG. 4 is a block diagram illustrating a digital device according to another embodiment of the present invention.
- the digital device 400 include a broadcast receiver 405, an external device interface 435, a storage 440, a user input interface 450, a controller 470, a display 480, and audio. It may include an output unit 485, a power supply unit 490 and a photographing unit (not shown).
- the broadcast receiver 405 may include at least one tuner 410, a demodulator 420, and a network interface unit 430. However, in some cases, the broadcast receiver 405 may include a tuner 410 and a demodulator 420, but may not include the network interface 430, or vice versa.
- the broadcast receiver 405 includes a multiplexer and a signal demodulated by the demodulator 420 via the tuner 410 and a signal received through the network interface 430. You can also multiplex.
- the broadcast receiving unit 425 may include a demultiplexer to demultiplex the multiplexed signal or to demultiplex the demodulated signal or the signal passed through the network interface unit 430. Can be.
- the tuner 410 receives an RF broadcast signal by tuning a channel selected by a user or all previously stored channels among radio frequency (RF) broadcast signals received through an antenna.
- the tuner 410 also converts the received RF broadcast signal into an intermediate frequency (IF) signal or a baseband signal.
- IF intermediate frequency
- the received RF broadcast signal is a digital broadcast signal
- it is converted into a digital IF signal (DIF).
- the analog broadcast signal is converted into an analog baseband video or audio signal (CVBS / SIF). That is, the tuner 410 may process both a digital broadcast signal or an analog broadcast signal.
- the analog baseband video or audio signal CVBS / SIF output from the tuner 410 may be directly input to the controller 470.
- the tuner 410 may receive an RF broadcast signal of a single carrier or multiple carriers. Meanwhile, the tuner 410 sequentially tunes and receives RF broadcast signals of all broadcast channels stored through a channel memory function among RF broadcast signals received through an antenna, and then converts them to intermediate frequency signals or baseband signals (DIFs). Frequency or baseband signal).
- DIFs baseband signals
- the demodulator 420 may receive and demodulate the digital IF signal DIF converted by the tuner 410 and perform channel decoding.
- the demodulator 420 includes a trellis decoder, a de-interleaver, a reed-solomon decoder, or a convolutional decoder, deinterleaver, and lead. A solo decoder or the like.
- the demodulator 420 may output a stream signal TS after performing demodulation and channel decoding.
- the stream signal may be a signal multiplexed with a video signal, an audio signal, or a data signal.
- the stream signal may be an MPEG-2 Transport Stream (TS) multiplexed with an MPEG-2 standard video signal, a Dolby AC-3 standard audio signal, and the like.
- TS MPEG-2 Transport Stream
- the stream signal output from the demodulator 420 may be input to the controller 470.
- the controller 470 may control demultiplexing, image / audio signal processing, and the like, control the output of the image through the display 480, and the audio output through the audio output unit 485.
- the external device interface unit 435 provides an interfacing environment between the digital device 300 and various external devices.
- the external device interface unit 335 may include an A / V input / output unit (not shown) or a wireless communication unit (not shown).
- the external device interface unit 435 may include a digital versatile disk (DVD), a Blu-ray, a game device, a camera, a camcorder, a computer (laptop), a tablet PC, a smartphone, a Bluetooth device (Bluetooth). device), an external device such as a cloud, etc. may be connected via wired / wireless.
- the external device interface unit 435 transmits a signal including data such as an image, video, and audio input through the connected external device to the controller 470 of the digital device.
- the controller 470 may control the processed image, video, audio, and the like to output the data signal to the connected external device.
- the external device interface unit 435 may further include an A / V input / output unit (not shown) or a wireless communication unit (not shown).
- the A / V input / output unit may include a USB terminal, a CVBS (Composite Video Banking Sync) terminal, a component terminal, an S-video terminal (analog), so that video and audio signals of an external device can be input to the digital device 400. It may include a DVI (Digital Visual Interface) terminal, an HDMI (High Definition Multimedia Interface) terminal, an RGB terminal, a D-SUB terminal, and the like.
- the wireless communication unit may perform short range wireless communication with another digital device.
- the digital device 400 may include, for example, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, and Digital Living Network Alliance (DLNA). It may be networked with other digital devices according to a communication protocol.
- RFID Radio Frequency Identification
- IrDA Infrared Data Association
- UWB Ultra Wideband
- ZigBee ZigBee
- DLNA Digital Living Network Alliance
- the external device interface unit 435 may be connected to the set top box STB through at least one of the various terminals described above to perform an input / output operation with the set top box STB.
- the external device interface unit 435 may receive an application or an application list in an adjacent external device and transmit the received application or application list to the controller 470 or the storage unit 440.
- the network interface unit 430 provides an interface for connecting the digital device 400 to a wired / wireless network including an internet network.
- the network interface unit 430 may include, for example, an Ethernet terminal for connection with a wired network, and for example, a wireless LAN (WLAN) for connection with a wireless network.
- WLAN wireless LAN
- Fi Wibro (Wireless broadband), Wimax (World Interoperability for Microwave Access), and High Speed Downlink Packet Access (HSDPA) communication standards.
- the network interface unit 430 may transmit or receive data with another user or another digital device through the connected network or another network linked to the connected network.
- some content data stored in the digital device 400 may be transmitted to another user who is registered in advance in the digital device 400 or a selected user among the other digital devices or the selected digital device.
- the network interface unit 430 may access a predetermined web page through a connected network or another network linked to the connected network. That is, by accessing a predetermined web page through the network, it is possible to send or receive data with the server.
- content or data provided by a content provider or a network operator may be received. That is, content such as a movie, an advertisement, a game, a VOD, a broadcast signal, and related information provided from a content provider or a network provider may be received through a network.
- the network interface unit 430 may select and receive a desired application from among applications that are open through the network.
- the storage unit 440 may store a program for processing and controlling each signal in the controller 470, or may store a signal-processed video, audio, or data signal.
- the storage unit 440 may perform a function for temporarily storing an image, audio, or data signal input from the external device interface unit 435 or the network interface unit 430.
- the storage unit 440 may store information about a predetermined broadcast channel through a channel storage function.
- the storage unit 440 may store an application or an application list input from the external device interface unit 435 or the network interface unit 330.
- the storage unit 440 may store various platforms described below.
- the storage unit 440 may include, for example, a flash memory type, a hard disk type, a multimedia card micro type, and a card type memory (for example, SD or XD). Memory, etc.), RAM (RAM), or ROM (EEPROM, etc.) may include at least one type of storage medium.
- the digital device 400 may reproduce and provide a content file (video file, still image file, music file, document file, application file, etc.) stored in the storage unit 440 to the user.
- FIG. 4 illustrates an embodiment in which the storage unit 440 is provided separately from the control unit 470, but the present invention is not limited thereto. In other words, the storage unit 440 may be included in the control unit 470.
- the user input interface unit 450 transmits a signal input by the user to the controller 470 or transmits a signal of the controller 470 to the user.
- the user input interface unit 450 controls power on / off, channel selection, screen setting, etc. from the remote control device 500 according to various communication methods such as an RF communication method and an infrared (IR) communication method.
- the signal may be received and processed, or the control signal of the controller 470 may be transmitted to the remote control device 500.
- the user input interface unit 450 may transmit a control signal input from a local key (not shown), such as a power key, a channel key, a volume key, and a set value, to the controller 470.
- a local key such as a power key, a channel key, a volume key, and a set value
- the user input interface unit 450 may transmit a control signal input from a sensing unit (not shown) that senses a user's gesture to the controller 470, or may sense a signal of the controller 470.
- the sensing unit may include a touch sensor, a voice sensor, a position sensor, an operation sensor, and the like.
- the controller 470 demultiplexes the stream input through the tuner 410, the demodulator 420, or the external device interface unit 435, or processes the demultiplexed signals to generate a signal for video or audio output. And output.
- the image signal processed by the controller 470 may be input to the display unit 480 and displayed as an image corresponding to the image signal.
- the image signal processed by the controller 470 may be input to the external output device through the external device interface 435.
- the audio signal processed by the controller 470 may be audio output to the audio output unit 485.
- the voice signal processed by the controller 470 may be input to the external output device through the external device interface 435.
- controller 470 may include a demultiplexer, an image processor, and the like.
- the controller 470 may control overall operations of the digital device 400.
- the controller 470 may control the tuner 410 to control tuning of an RF broadcast corresponding to a channel selected by a user or a pre-stored channel.
- the controller 470 may control the digital device 400 by a user command or an internal program input through the user input interface 450. In particular, it is possible to connect to the network so that the user can download the desired application or application list into the digital device 400.
- the controller 470 controls the tuner 410 to input a signal of a channel selected according to a predetermined channel selection command received through the user input interface 450. It processes the video, audio or data signal of the selected channel.
- the controller 470 allows the channel information selected by the user to be output through the display unit 480 or the audio output unit 485 together with the processed video or audio signal.
- the controller 470 may be provided from an external device, for example, a camera or a camcorder, input through the external device interface unit 435 according to an external device image playback command received through the user input interface unit 450.
- the video signal or the audio signal may be output through the display unit 480 or the audio output unit 485.
- the controller 470 may control the display 480 to display an image.
- an image For example, a broadcast image input through the tuner 410, an external input image input through the external device interface unit 435, an image input through a network interface unit, or an image stored in the storage unit 440.
- the display unit 480 may control the display.
- the image displayed on the display unit 480 may be a still image or a video, and may be a 2D image or a 3D image.
- the controller 470 may control to reproduce the content.
- the content may be content stored in the digital device 400, received broadcast content, or external input content input from the outside.
- the content may be at least one of a broadcast image, an external input image, an audio file, a still image, a connected web screen, and a document file.
- the controller 470 may control to display an application or a list of applications downloadable from the digital device 300 or from an external network.
- the controller 470 may control to install and run an application downloaded from an external network, along with various user interfaces. In addition, by selecting a user, an image related to an application to be executed may be controlled to be displayed on the display unit 480.
- a channel browsing processor may be further provided to generate a thumbnail image corresponding to the channel signal or the external input signal.
- the channel browsing processor receives a stream signal TS output from the demodulator 320 or a stream signal output from the external device interface 335, extracts an image from the input stream signal, and generates a thumbnail image.
- the generated thumbnail image may be input as it is or encoded to the controller 470.
- the generated thumbnail image may be encoded in a stream form and input to the controller 470.
- the controller 470 may display a thumbnail list including a plurality of thumbnail images on the display unit 480 using the input thumbnail image. Meanwhile, the thumbnail images in the thumbnail list may be updated sequentially or simultaneously. Accordingly, the user can easily grasp the contents of the plurality of broadcast channels.
- the display unit 480 converts an image signal, a data signal, an OSD signal processed by the controller 470 or an image signal, data signal, etc. received from the external device interface unit 435 into R, G, and B signals, respectively. Generate a drive signal.
- the display unit 480 may be a PDP, an LCD, an OLED, a flexible display, a 3D display, or the like.
- the display unit 480 may be configured as a touch screen and used as an input device in addition to the output device.
- the audio output unit 485 receives a signal processed by the controller 470, for example, a stereo signal, a 3.1 channel signal, or a 5.1 channel signal, and outputs a voice signal.
- the voice output unit 485 may be implemented as various types of speakers.
- a sensing unit including at least one of a touch sensor, a voice sensor, a position sensor, and a motion sensor may be further provided in the digital device 400. .
- the signal detected by the sensing unit may be transmitted to the control unit 3470 through the user input interface unit 450.
- a photographing unit (not shown) for photographing the user may be further provided. Image information photographed by a photographing unit (not shown) may be input to the controller 470.
- the controller 470 may detect a user's gesture by combining or respectively combining an image photographed by a photographing unit or a sensed signal from a sensing unit (not shown).
- the power supply unit 490 supplies the power throughout the digital device 400.
- controller 470 may be implemented in the form of a System on Chip (SoC), a display unit 480 for displaying an image, and an audio output unit 485 for audio output. Can be.
- SoC System on Chip
- display unit 480 for displaying an image
- audio output unit 485 for audio output. Can be.
- the power supply unit 490 may include a converter (not shown) for converting AC power into DC power.
- a converter for example, when the display unit 480 is implemented as a liquid crystal panel including a plurality of backlight lamps, an inverter capable of operating a pulse width modulation (PWM) for driving of variable brightness or dimming It may further comprise an inverter (not shown).
- PWM pulse width modulation
- the remote control device 500 transmits the user input to the user input interface unit 450.
- the remote control device 500 may use Bluetooth, Radio Frequency (RF) communication, Infrared (IR) communication, Ultra Wideband (UWB), ZigBee (ZigBee), or the like.
- RF Radio Frequency
- IR Infrared
- UWB Ultra Wideband
- ZigBee ZigBee
- the remote control device 500 may receive an image, an audio or a data signal output from the user input interface unit 450, display it on the remote control device 500, or output a voice or vibration.
- the digital device 400 described above may be a digital broadcast receiver capable of processing a fixed or mobile ATSC or DVB digital broadcast signal.
- the digital device according to the present invention may omit some of the configurations of the illustrated configurations, or may further include components not shown on the contrary.
- the digital device does not include a tuner and a demodulator, and may receive and play content through a network interface unit or an external device interface unit.
- FIG. 5 is a block diagram illustrating a detailed configuration of the controller of FIGS. 2 to 4 according to an embodiment of the present invention.
- control unit may include a demultiplexer 510, an image processor 520, an OSD generator 540, a mixer 550, a frame rate converter (FRC) 555, and It may include a formatter 560.
- controller may further include a voice processor and a data processor.
- the demultiplexer 510 demultiplexes an input stream.
- the demultiplexer 510 may demultiplex the input MPEG-2 TS video, audio, and data signals.
- the stream signal input to the demultiplexer 510 may be a stream signal output from a tuner, a demodulator, or an external device interface unit.
- the image processor 420 performs image processing of the demultiplexed image signal.
- the image processor 420 may include an image decoder 425 and a scaler 435.
- the video decoder 425 decodes the demultiplexed video signal, and the scaler 435 scales the resolution of the decoded video signal so that the display unit can output the resolution.
- the image decoder 525 may support various standards.
- the video decoder 525 performs the function of the MPEG-2 decoder when the video signal is encoded in the MPEG-2 standard, and the video signal is encoded in the Digital Multimedia Broadcasting (DMB) method or the H.264 standard.
- DMB Digital Multimedia Broadcasting
- H.264 the function of the H.264 decoder can be performed.
- the video signal decoded by the image processor 520 is input to the mixer 450.
- the OSD generator 540 generates the OSD data according to a user input or itself. For example, the OSD generator 440 generates data for displaying various data in the form of a graphic or text on the screen of the display 380 based on a control signal of the user input interface.
- the generated OSD data includes various data such as a user interface screen of the digital device, various menu screens, widgets, icons, viewing rate information, and the like.
- the OSD generator 540 may generate data for displaying broadcast information based on subtitles or EPGs of a broadcast image.
- the mixer 550 mixes the OSD data generated by the OSD generator 540 and the image signal processed by the image processor to provide the formatter 560. Since the decoded video signal and the OSD data are mixed, the OSD is overlaid and displayed on the broadcast video or the external input video.
- the frame rate converter (FRC) 555 converts a frame rate of an input video.
- the frame rate converter 555 may convert the frame rate of the input 60Hz image to have a frame rate of, for example, 120Hz or 240Hz according to the output frequency of the display unit.
- various methods may exist in the method of converting the frame rate. For example, when the frame rate converter 555 converts the frame rate from 60 Hz to 120 Hz, the frame rate converter 555 inserts the same first frame between the first frame and the second frame or predicts the first frame from the first frame and the second frame. It can be converted by inserting three frames.
- the frame rate converter 555 may insert and convert three more identical or predicted frames between existing frames. On the other hand, when no separate frame conversion is performed, the frame rate converter 555 may be bypassed.
- the formatter 560 changes the output of the input frame rate converter 555 to match the output format of the display unit.
- the formatter 560 may output R, G, B data signals, and the R, G, B data signals may be output as low voltage differential signals (LVDSs) or mini-LVDSs. Can be.
- the formatter 560 may support a 3D service through the display by configuring the output in a 3D form according to the output format of the display.
- the voice processing unit (not shown) in the controller may perform voice processing of the demultiplexed voice signal.
- the voice processor (not shown) may support processing of various audio formats. For example, even when a voice signal is encoded in a format such as MPEG-2, MPEG-4, AAC, HE-AAC, AC-3, BSAC, etc., a decoder corresponding thereto may be provided.
- the voice processing unit (not shown) in the controller may process base, treble, volume control, and the like.
- the data processor in the control unit may perform data processing of the demultiplexed data signal.
- the data processor may decode the demultiplexed data signal even when it is encoded.
- the encoded data signal may be EPG information including broadcast information such as a start time and an end time of a broadcast program broadcasted in each channel.
- each component may be integrated, added, or omitted according to the specifications of the digital device actually implemented. That is, as needed, two or more components may be combined into one component or one component may be subdivided into two or more components.
- the function performed in each block is for explaining an embodiment of the present invention, the specific operation or device does not limit the scope of the present invention.
- the digital device may be an image signal processing device that performs signal processing of an image stored in the device or an input image.
- a set top box (STB) excluding the display unit 480 and the audio output unit 485 shown in FIG. 4, the above-described DVD player, Blu-ray player, game device, computer And the like can be further illustrated.
- FIG. 6 is a diagram illustrating input means connected to the digital device of FIGS. 2 to 4 according to one embodiment of the present invention.
- a front panel (not shown) or control means (input means) provided on the digital device 600 is used.
- control means is a user interface device (UID) capable of wired and wireless communication, the remote control 610, keyboard 630, pointing device 620, mainly implemented for the purpose of controlling the digital device 600, A touch pad may be included, but a control means dedicated to an external input connected to the digital device 600 may also be included.
- control means also includes a mobile device such as a smart phone, a tablet PC, etc. that control the digital device 600 through mode switching and the like, although the purpose is not the digital device 600 control.
- a pointing device is described as an embodiment, but is not limited thereto.
- the input means is a communication protocol such as Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), ZigBee, Digital Living Network Alliance (DLNA), RS, or the like. At least one may be employed as necessary to communicate with the digital device.
- RFID Radio Frequency Identification
- IrDA Infrared Data Association
- UWB Ultra Wideband
- DLNA Digital Living Network Alliance
- RS Digital Living Network Alliance
- the remote controller 610 refers to conventional input means equipped with various key buttons necessary for controlling the digital device 600.
- the pointing device 620 is equipped with a gyro sensor to implement a pointer corresponding to a screen of the digital device 600 based on a user's movement, pressure, rotation, etc., so that the digital device 600 Transmits a predetermined control command.
- the pointing device 620 may be named by various names such as a magic remote controller and a magic controller.
- the keyboard 630 is an intelligent integrated digital device that provides a variety of services such as a web browser, an application, a social network service (SNS), and the like, as the digital device 600 provides only a conventional broadcast. It is not easy to implement, and it is implemented to facilitate input of texts by implementing it similar to the keyboard of a PC.
- SNS social network service
- control means such as the remote control 610, the pointing device 620, the keyboard 630 is provided with a touch pad, if necessary, for more convenient and various control purposes such as text input, pointer movement, enlargement / reduction of pictures or videos Can be used for
- the digital device described in the present specification uses a Web OS as an OS and / or a platform.
- a process such as a configuration or an algorithm based on Web OS may be performed by the controller of the above-described digital device.
- the control unit includes the control unit in FIGS. 2 to 5 and uses the concept broadly. Therefore, hereinafter, the configuration for the processing of Web OS-based or related services, applications, content, etc. in the digital device, the hardware or components including the related software (software), firmware (firmware), etc. to the controller (controller) Explain by naming.
- Such a Web OS based platform is intended to enhance development independence and functionality scalability by integrating services and applications based on, for example, a luna-service bus, and to develop applications based on a web application framework. Productivity can also be increased. In addition, multi-tasking can be supported by efficiently utilizing system resources through Web OS processes and resource management.
- the Web OS platform described in the present specification may be used not only for fixed devices such as PCs, TVs, and STBs, but also for mobile devices such as mobile phones, smart phones, tablet pcs, notebooks, and wearable devices. .
- the architecture of software for digital devices is a monolithic structure that is based on conventional problem solving and market-dependent monolithic structures, and is a single process and closed product based on multi-threading technology. Afterwards, there was a difficulty in external application, and after that, we aimed for new platform-based development, and then layered and componentized by pursuing cost innovation and efficient UI and external application development through chip-set replacement. ), Which had a three-layered structure, add-on, single source product, and add-on structure for open applications.
- the software architecture has been further developed to provide a modular architecture of functional units, to provide a Web Open API (Application Programming Interface) for the eco-system, and to provide a game engine. Modular design for the native open API (Native Open API), etc. is being made, and accordingly, it is generated as a multi-process structure based on the service structure.
- FIG. 7 is a diagram illustrating a Web OS architecture according to an embodiment of the present invention.
- the platform can be largely classified into a kernel, a system library-based Web OS core platform, an application, a service, and the like.
- the architecture of the Web OS platform is a layered structure, with the OS at the bottom layer, system library (s) at the next layer, and applications at the top.
- the lowest layer may include a Linux kernel as an OS layer and include Linux as an OS of the digital device.
- BSP Board Support Package
- HAL Hardware Abstraction Layer
- Web OS core modules layer Web OS core modules layer
- service layer Luna-Service bus layer
- the Enyo framework / NDK / QT layer and the top layer, the application layer is sequentially present.
- some layers in the above-described Web OS layer structure may be omitted, and a plurality of layers may be one layer or conversely, one layer may have a plurality of layer structures.
- the Web OS core module layer is based on a Luna Surface Manager (LSM) that manages surface windows, etc., a System & Application Manage (SAM) and a WebKit (WebKit) that manages the execution and execution states of applications. It may include a WAM (Web Application Manager) for managing a web application.
- LSM Luna Surface Manager
- SAM System & Application Manage
- WebKit WebKit
- WAM Web Application Manager
- the LSM manages an application window displayed on the screen.
- the LSM manages display hardware, provides a buffer that renders the contents required by the applications, and combines the results of the rendering of the plurality of applications on the screen. You can print
- the SAM manages performance policies for various conditions of systems and applications.
- WAM is based on the Enyo Framework, which allows Web OS to be viewed as a web application.
- the service use of the application is made through the Luna-service bus, and the service can be newly registered on the bus, and the application can find and use the service that it needs.
- the service layer may include services of various service levels, such as a TV service and a Web OS service.
- the Web OS service may include a media server, Node.JS, and the like.
- the Node.JS service supports, for example, JavaScript.
- Web OS services can communicate over the bus to Linux processes that implement function logic. It can be divided into four parts, which are migrated from the TV process and the existing TV to the Web OS or services that are differentiated from the makers, the Web OS common service, and the JavaScript developed and used through Node.js. It consists of a Node.js service.
- the application layer may include all applications that can be supported by a digital device, such as a TV application, a showcase application, a native application, and a web application.
- Applications on the Web OS may be classified into a web application, a Palm Development Kit (PDK) application, a Qt Meta Language or Qt Modeling Language (QML) application, and the like according to an implementation method.
- PDK Palm Development Kit
- QML Qt Modeling Language
- the web application is based on the WebKit engine and runs on the WAM Runtime. Such web applications may be based on the Enyo framework, or may be developed and executed based on general HTML5, Cascading Style Sheets (CSS), or JavaScript.
- CCS Cascading Style Sheets
- the PDK application includes a third-party or native application developed in C / C ++ based on a PDK provided for an external developer.
- the PDK refers to a development library and a set of tools provided to enable a third party such as a game to develop a native application (C / C ++).
- a PDK application can be used for the development of applications whose performance is important.
- the QML application is a Qt-based native application, and includes a basic application provided with the Web OS platform such as a card view, a home dashboard, a virtual keyboard, and the like.
- QML is a mark-up language in script form instead of C ++.
- the native application refers to an application that is developed in C / C ++, compiled, and executed in a binary form.
- Such a native application has an advantage in that its execution speed is fast.
- FIG. 8 is a diagram illustrating the architecture of a Web OS device according to one embodiment of the present invention.
- FIG. 8 is a block diagram based on runtime of a Web OS device, which can be understood with reference to the layered structure of FIG. 7.
- services and applications and Web OS core modules are included on a system OS (Linux) and system libraries, and communication therebetween may be via a luna-service bus.
- Node.js services based on HTML5, CSS, JavaScript, e-mail, contacts, calendar, logging, backup, file notifier Web OS services such as notify, database (DB), activity manager, system policy, audio daemon (AudioD), update, media server, etc.
- TV services such as Electronic Program Guide (PVR), Personal Video Recorder (PVR), data broadcasting, etc., voice recognition, Now on, Notification, search CP services such as ACR (Auto Content Recognition), CBOX (Contents List Broswer), wfdd, DMR, Remote Application, Download, SDPIF (Sony Philips Digital Interface Format), PDK applications, browser , Native applications such as QML applications
- Enyo framework-based UI-related TV applications and Web applications are processed through Web OS core modules such as SAM, WAM, and LSM described above through the Luna-Service Bus.
- TV applications and Web applications may not necessarily be Enyo framework based or UI related.
- CBOX can manage the list and metadata of the content of external devices such as USB, DLNA, cloud, etc. connected to the TV. Meanwhile, the CBOX may output content listings of various content containers such as USB, DMS, DVR, cloud, etc. in an integrated view. In addition, the CBOX can display various types of content listings such as pictures, music, and videos, and manage its metadata. In addition, the CBOX may output the contents of the attached storage in real-time. For example, the CBOX should be able to immediately output a content list of the storage device when the storage device such as USB is plugged in. In this case, a standardized method for processing the content listing may be defined. In addition, CBOX can accommodate a variety of connection protocols.
- SAM is intended to improve module complexity and enhance scalability.
- the existing System Manager processes multiple functions such as system UI, window management, web application runtime, and handling constraints on UX in one process, so that the complexity of implementation is large. Clear implementation interfaces reduce implementation complexity.
- LSM supports the development and integration of system UX implementations, such as card views and launcher, independently, and makes it easy to respond to changes in product requirements.
- LSM when synthesizing a plurality of application screens, such as App-on-App, to make the most of the hardware resources (HW resource) to enable multi-tasking, multi-window (multi-window) and 21: 9, etc. It can provide a window management mechanism (window management mechanism) for.
- LSM supports the implementation of system UI based on QML and improves its development productivity.
- QML UX is based on MVC, which makes it easy to compose views of layouts and UI components, and to easily develop code to handle user input.
- the interface between QML and Web OS components is made through QML extension plug-in, and the graphic operation of the application may be based on the wayland protocol, luna-service call, etc. have.
- LSM stands for Luna Surface Manager and functions as an application window compositor.
- the LSM allows you to synthesize independently developed applications, UI components, etc. on the screen.
- the LSM defines a output area, an interworking method, and the like as a compositor.
- the compositor LSM handles graphics compositing, focus management, input events, and the like.
- the LSM receives an event, focus, and the like from an input manager.
- the input manager may include a HID such as a remote controller, a mouse & a keyboard, a joystick, a game pad, an application remote, a pen touch, and the like.
- LSM supports multiple window models, which can be executed simultaneously in all applications due to the system UI.
- NLP Natural Language Processing
- MRCU Mobile Radio Control Unit
- Live menu ACR (Auto Content Recognition), etc. .
- FIG. 9 is a diagram illustrating a graphic composition flow in a Web OS device according to one embodiment of the present invention.
- the graphic composition processing includes a web application manager 910 in charge of a UI process, a webkit 920 in charge of a web process, a LSM 930, and a graphic manager (GM). Through 940.
- the generated graphic data is transferred to the LSM 930 when the graphic data is not a full-screen application.
- the web application manager 910 receives an application generated by the web kit 920 for sharing a GPU (Graphic Processing Unit) memory for graphic management between the UI process and the web process, and then displays the full-screen as described above. If it is not the application passes to the LSM (930). In the case of the full-screen application, the LSM 930 may be bypassed, and in this case, the LSM 930 may be directly transferred to the graphic manager 940.
- the LSM 930 may be bypassed, and in this case, the LSM 930 may be directly transferred to the graphic manager 940.
- the LSM 930 transmits the received UI application to the Wayland Compositor via the Wayland surface, and processes the received UI application to the graphic manager.
- the graphic data delivered from the LSM 930 is delivered to the graphic manager compositor via, for example, the LSM GM surface of the graphic manager 940.
- the full-screen application is delivered directly to the graphic manager 940 without passing through the LSM 930, which is processed by the graphic manager compositor via the WAM GM surface.
- the graphics manager handles all graphic data in the Web OS device, including GM surfaces such as data broadcasting applications, caption applications, etc., as well as data via LSM GM surfaces and WAM GM surfaces. Receives all the graphic data that has passed through and processes it to be properly displayed on the screen.
- GM surfaces such as data broadcasting applications, caption applications, etc.
- WAM GM surfaces Receives all the graphic data that has passed through and processes it to be properly displayed on the screen.
- the function of the GM compositor is the same as or similar to that of the compositor described above.
- FIG. 10 is a diagram illustrating a media server according to an embodiment of the present invention.
- FIG. 11 is a block diagram illustrating a configuration of a media server according to an embodiment of the present invention. Is a diagram illustrating a relationship between a media server and a TV service according to an embodiment of the present invention.
- the media server supports the execution of various multimedia in the digital device and manages necessary resources.
- the media server can efficiently use hardware resources required for media play.
- the media server requires audio / video hardware resources in order to execute multimedia, and can efficiently utilize the resource usage status.
- fixed devices with larger screens than mobile devices require more hardware resources to run multimedia and require faster encoding / decoding and graphics data delivery due to the large amount of data.
- the media server may perform broadcasting, recording, and tuning tasks, record simultaneously with viewing, or simultaneously display the sender and receiver screens during a video call. It should be able to handle
- the media server has limited hardware resources such as encoders, decoders, tuners, and display engines on a chip-set basis, making it difficult to execute multiple tasks at the same time. Input is processed.
- the media server can enhance the system stability, for example, by removing and restarting a playback pipeline in which an error occurred during media playback by pipeline and restarting the error. Even if it does not affect other media play.
- a pipeline is a chain connecting the respective unit functions such as decoding, analysis, and output when a media play request is requested, and required unit functions may vary according to a media type.
- Media servers can have extensibility, for example, adding new types of pipelines without affecting existing implementations.
- the media server may accommodate a camera pipeline, a video conference pipeline, a third-party pipeline, and the like.
- the media server can handle normal media playback and TV task execution as separate services because the interface of the TV service is different from the media playback case.
- the media server supports operations such as' setchannel ',' channelup ',' channeldown ',' channeltuning 'and' recordstart 'in relation to TV service, and' play 'and' pause in relation to general media playback.
- operations such as' and 'stop', different operations can be supported for both, and they can be treated as separate services.
- the media server may control or integrate management of resource management functions.
- the allocation and retrieval of hardware resources in the device are integrated in the media server.
- the TV service process transmits the running task and resource allocation status to the media server.
- the media server frees resources and executes pipelines as each media runs, allowing execution by priority (e.g., policy) upon request for media execution based on the resource status occupied by each pipeline. Recall resources of other pipelines.
- priority e.g., policy
- predefined execution priority and required resource information for a specific request are managed by a policy manager, and the resource manager may communicate with the policy manager to process resource allocation and retrieval.
- the media server may hold an identifier (ID) for all operations related to playback. For example, the media server may direct and direct a particular pipeline based on the identifier. The media server may issue separate commands to the pipelines for more than one media playback.
- ID identifier
- the media server may be responsible for playback of HTML 5 standard media.
- the media server may follow the TV restructuring scope of the separate service processing of the TV pipeline.
- the media server may be designed and implemented regardless of the TV restructuring scope. If the TV is not serviced separately, the media server may need to be re-executed when there is a problem with a specific task.
- the media server is also referred to as uMS, or micro media server.
- the media player is a media client, which is, for example, a web for HTML5 video tag, camera, TV, Skype, 2nd Screen, etc. It may mean a kit.
- management of micro resources such as a resource manager, a policy manager, and the like is a core function.
- the media server also controls the playback control role for the web standard media content.
- the media server may also manage pipeline controller resources.
- Such media servers support, for example, extensibility, reliability, efficient resource usage, and the like.
- the uMS that is, the media server
- the uMS is a Web OS device such as a cloud game, a MVPD (pay service, etc.), a camera preview, a second screen, a skype, and the like. It manages and controls the overall use and control of resource for proper processing within the system. Meanwhile, each resource uses, for example, a pipeline when the resource is used, and the media server can manage and control the creation, deletion, and use of the pipeline for resource management.
- a pipeline is created when a media associated with a task starts a continuation of tasks such as parsing a request, a decoding stream, a video output, and the like.
- tasks such as parsing a request, a decoding stream, a video output, and the like.
- watching, recording, channel tuning, and the like are each processed under control of resource usage through a pipeline generated according to the request. .
- an application or service is connected to a media server 1020 via a luna-service bus 1010, and the media server 1020 is connected to pipelines regenerated through the luna-service bus 1010.
- the application or service may have various clients according to its characteristics and may exchange data with the media server 1020 or pipeline through the client or the client.
- the client includes, for example, a uMedia client (web kit) and a resource manager (RM) client (C / C ++) for connecting to the media server 1020.
- a uMedia client web kit
- RM resource manager
- the application including the uMedia client is connected to the media server 1020 as described above. More specifically, the uMedia client corresponds to, for example, a video object to be described later, and the client uses the media server 1020 for operation of the video by request.
- the video operation relates to a video state
- loading, unloading, play, playback, or reproduce, pause, stop, and the like are all states related to the video operation. May contain data.
- Each operation or state of such video can be handled through the creation of a separate pipeline.
- the uMedia client sends state data related to the video operation to the pipeline manager 1022 in the media server.
- the pipeline manager 1022 obtains information on a resource of the current device through data communication with the resource manager 1024 and requests allocation of a resource corresponding to the state data of the uMedia client.
- the pipeline manager 1022 or the resource manager 1024 controls resource allocation through data communication with the policy manager 1026 when necessary in relation to the resource allocation. For example, when the resource manager 1024 has no or insufficient resources to allocate according to the request of the pipeline manager 1022, appropriate resource allocation may be performed according to the request according to the priority comparison of the policy manager 1026. Can be.
- the pipeline manager 1022 requests the media pipeline controller 1028 to generate a pipeline for an operation according to the request of the uMedia client for the allocated resource according to the resource allocation of the resource manager 1024.
- the media pipeline controller 1028 generates the required pipeline under the control of the pipeline manager 1022.
- This generated pipeline as shown, not only a media pipeline, a camera pipeline, but also a pipeline related to play, pause, and pause may be generated.
- the pipeline may include a pipeline for HTML5, Web CP, smartshare playback, thumbnail extraction, NDK, cinema, Multimedia and Hypermedia Information coding Experts Group (MHEG), and the like.
- the pipeline may include, for example, a service-based pipeline (own pipeline) and a URI-based pipeline (media pipeline).
- an application or service including an RM client may not be directly connected to the media server 1020. This is because an application or service may handle media directly. In other words, when an application or service directly processes media, it may not go through a media server. However, at this time, resource management is required for pipeline creation and its use, and for this purpose, the uMS connector functions. Meanwhile, when the uMS connector receives a resource management request for direct media processing of the application or service, the uMS connector communicates with the media server 1020 including the resource manager 1024. To this end, the media server 1020 should also be equipped with a uMS connector.
- the application or service may respond to the request of the RM client by receiving resource management of the resource manager 1024 through the uMS connector.
- RM clients can handle services such as native CP, TV services, second screens, Flash players, YouTube Source Source Extensions (MSE), cloud games, and Skype.
- the resource manager 1024 may manage the resource through the data communication with the policy manager 1026 as necessary for resource management.
- the URI-based pipeline is made through the media server 1020, rather than directly processing the media as described above.
- a URI-based pipeline may include a player factory, a Gstreamer, a streaming plug-in, a digital rights management plug-in pipeline, and the like.
- an interface method between an application and media services may be as follows.
- the PDK interface using a service.
- a method of using a service in the existing CP can be used to extend existing platform plug-ins based on Luna for backward compatibility.
- Seamless change is handled by a separate module (e.g. TVWIN), which is the process of first displaying and seamlessly displaying the TV on the screen without the Web OS before or during the Web OS boot. . It is used for the purpose of providing basic functions of TV service for fast response to the user's power on request because Web OS boot time is slow.
- the module also supports seamless change, factory mode, and the like, which provide fast boot and basic TV functions as part of the TV service process.
- the module may be responsible for switching from the non-Web OS mode to the Web OS mode.
- a processing structure of the media server is shown.
- the solid line box may indicate a process processing configuration
- the dotted line box may indicate an internal processing module during the process.
- the solid arrow may indicate an inter-process call, that is, a Luna service call
- the dashed arrow may indicate a notification or data flow such as register / notify.
- a service or web application or PDK application (hereinafter referred to as an "application") is connected to various service processing configurations via a luna-service bus, through which the application operates or is controlled.
- the data processing path depends on the type of application. For example, when the application is image data related to a camera sensor, the application is transmitted to the camera processor 1130 and processed. In this case, the camera processor 1130 processes image data of the received application, including a gesture, a face detection module, and the like. For example, when the data is required to be selected by the user or to automatically use the pipeline, the camera processor 1130 may generate a pipeline through the media server processor 1110 and process the corresponding data.
- the audio may be processed through the audio processor 1140 and the audio module 1150.
- the audio processor 1140 processes the audio data received from the application and transmits the audio data to the audio module 1150.
- the audio processor 1140 may include an audio policy manager to determine the processing of the audio data.
- the audio data thus processed is processed by the audio module 1160.
- the application may notify data related to audio data processing to the audio module 1160, which may also notify the audio module 1160 in a related pipeline.
- the audio module 1150 includes an advanced Linux sound architecture (ALSA).
- the corresponding content data is transmitted to the DRM service processor 1160, and the DRM service processor 1170 generates a DRM instance.
- the DRM service processor 1160 may be connected to and process the DRM pipeline in the media pipeline through the Luna-service bus to process the content data on which the DRM is applied.
- the following describes processing when the application is media data or TV service data (e.g., broadcast data).
- TV service data e.g., broadcast data
- FIG. 12 illustrates only the media server processing unit and the TV service processing unit in FIG. 11 described above in more detail.
- the TV service processor 1120 may include, for example, at least one or more of a DVR / channel manager, a broadcasting module, a TV pipeline manager, a TV resource manager, a data broadcasting module, an audio setting module, a path manager, and the like.
- the TV service processor 1220 may include a TV broadcast handler, a TV broadcast interface, a service processor, a TV middleware, a path manager, and a BSP. NetCast).
- the service processor may mean, for example, a module including a TV pipeline manager, a TV resource manager, a TV policy manager, a USM connector, and the like.
- the TV service processor may have a configuration as shown in FIG. 11 or 12 or a combination thereof, and some components may be omitted or some components not shown may be added.
- the TV service processor 1120/1220 transmits the DVR or channel related data to the DVR / channel manager based on the property or type of the TV service data received from the application, and then to the TV pipeline manager to transmit the TV pipe. Create and process a line. Meanwhile, when the attribute or type of the TV service data is broadcast content data, the TV service processor 1120 generates and processes a TV pipeline through a TV pipeline manager for processing the corresponding data through a broadcast module.
- a json (Javascript standard object notation) file or a file written in c is processed by the TV broadcast handler and transmitted to the TV pipeline manager through the TV broadcast interface to generate and process a TV pipeline.
- the TV broadcast interface unit may transmit data or files that have passed through the TV broadcast handler to the TV pipeline manager based on the TV service policy and refer to them when generating the pipeline.
- the TV pipeline manager may be controlled by the TV resource manager in generating one or more pipelines in response to a TV pipeline generation request from a processing module or manager in a TV service.
- the TV resource manager may be controlled by the TV policy manager to request the state and allocation of resources allocated for the TV service according to the TV pipeline creation request of the TV pipeline manager, and the media server processor 1110. / 1210) and uMS connector to communicate data.
- the resource manager in the media server processor 1110/1210 transmits a status and resource allocation of a resource for a current TV service at the request of the TV resource manager. For example, as a result of checking the resource manager in the media server processor 1110/1210, if all resources for the TV service are already allocated, the TV resource manager may notify that all resources are currently allocated.
- the resource manager in the media server processing unit removes a predetermined TV pipeline according to the priority or a predetermined criterion among the TV pipelines previously allocated for the TV service together with the notification, and the TV pipeline for the requested TV service. You can also request or assign generation. Alternatively, the TV resource manager may appropriately remove, add, or establish a TV pipeline in accordance with the status report of the resource manager in the media server processor 1110/1210.
- the BSP supports backward compatibility with existing digital devices, for example.
- the TV pipelines thus generated may be properly operated under the control of the path manager during the processing.
- the path manager may determine or control the processing path or process of the pipelines in consideration of not only the TV pipeline but also the operation of the pipeline generated by the media server processor 1110/1210.
- the media server processor 1110/1210 includes a resource manager, a policy manager, a media pipeline manager, a media pipeline controller, and the like.
- a pipeline generated under the control of the media pipeline manager and the media pipeline controller can be variously created such as a camera preview pipeline, a cloud game pipeline, and a media pipeline.
- the media pipeline may include a streaming protocol, an auto / static gstreamer, a DRM, and the like, which may be determined according to a path manager's control.
- the detailed processing procedure in the media server processor 1110/1210 uses the above-described description of FIG. 10 and will not be repeated herein.
- the resource manager in the media server processor 1110/1210 may manage resources on a counter base, for example.
- FIG. 13 and 14 illustrate an AEC function performed in a digital device before the present invention.
- AEC Acoustic Echo Canceler
- FET Far-End Talker
- the reference signal is used to remove the ADF (Adaptive Filter).
- ADF Adaptive Filter
- LMS Least Mean Square
- NLMS Normalized Least Mean Square
- APA Affine Projection Algorithm
- AEC is composed of ADF, Decision Block (DDT), Dual Talk Detector (DTD), Control Block (Step Size Control, Filter Update Control), and Residual Suppressor.
- the conventional AEC can buffer the reference signal in one system to remove echoes of the transmitter using the ADF in the same system.
- a method such as noise reduction using a microphone signal should be used, which is difficult to operate better than the AEC method using a reference signal.
- the digital device 1500 is a block diagram illustrating in detail a configuration module of a digital device according to another embodiment of the present invention. 1 to 14, some of the modules of the digital device of FIG. 15 may be added or changed, and the scope of the present invention is not determined by the elements described in FIGS. It should be interpreted according to the description in the scope.
- the digital device 1500 according to an embodiment of the present invention includes a communication module 1510, a storage module 1520, a controller 1530, and the like.
- the communication module 1510 may perform data communication with a repeater and an external device.
- the communication module 1510 collectively refers to a communication network supporting various communication standards or protocols including wired / wireless networks.
- wired / wireless networks include all communication networks that are currently or will be supported by the specification and are capable of supporting one or more communication protocols for them.
- Such wired and wireless networks include, for example, Universal Serial Bus (USB), Composite Video Banking Sync (CVBS), Component, S-Video (Analog), Digital Visual Interface (DVI), High Definition Multimedia Interface (HDMI), Network for wired connection such as RGB, D-SUB and communication standard or protocol therefor, Bluetooth, Radio Frequency Identification (RFID), Infrared Data Association (IrDA), Ultra Wideband (UWB), Zigbee (ZigBee), Digital Living Network Alliance (DLNA), Wireless LAN (WLAN) (Wi-Fi), Wireless broadband (Wibro), World Interoperability for Microwave Access (Wimax), High Speed Downlink Packet Access (HSDPA), LTE / LTE It may be formed by a network for a wireless connection such as Long Term Evolution / LTE-Advanced (A), Wi-Fi Direct, and a communication standard or protocol therefor.
- RFID Radio Frequency Identification
- IrDA Infrared Data Association
- UWB Ultra Wideband
- the storage module 1520 may store at least one audio reference data.
- the storage module 1520 may correspond to the storage unit 440 described with reference to FIG. 4.
- the controller 1530 performs a function of managing overall functions of at least one module illustrated in FIG. 15, such as the communication module 1510 and the storage module 1520. In this regard, the following will be described in more detail with reference to FIGS. 16 to 22.
- FIG. 16 illustrates an example in which a digital device and an external device connect to the same repeater to transmit / receive data according to an embodiment of the present invention.
- the controller of the digital device 1610 connects to the repeater 1650, detects external devices 1620, 1630, and 1640 located within a predetermined distance and connected to the repeater, and detects the detected An audio reference data transmission request may be received from an external device 1620, 1630, 1640, and the external device 1620, 1630, 1640 may be controlled to transmit the requested audio reference data.
- the repeater may be a wireless-fidelity (Wi-Fi) router.
- Wi-Fi wireless-fidelity
- the preset distance may be a case where the magnitude (or strength) of the Wi-Fi signal is greater than or equal to a preset degree.
- the preset distance may mean a distance from the digital device 1610 or a distance from the repeater 1650.
- the external device may include a home appliance, and the home appliance may be at least one of a robot cleaner, a refrigerator, and a washing machine.
- the external device may support a voice recognition function.
- the external device may transmit an audio reference data transmission request to the digital device.
- the audio reference data includes audio data included in a broadcast signal and audio data included in music content, and the audio reference data includes audio from a current to a predetermined section of an audio signal currently output through a speaker of the digital device. Data.
- the repeater may simultaneously transmit audio reference data output through the speakers of each of the plurality of digital devices to the external device.
- the external device may perform an acoustic echo canceler (AEC) function.
- AEC acoustic echo canceler
- the controller of the digital device 1610 is connected to the repeater 1650 and the external devices 1620, 1630, and 1640 connected to the repeater 1650. Detects an audio reference data transmission request from the external devices 1620, 1630 and 1640, and transmits the requested audio reference data to the external devices 1620, 1630 and 1640.
- the external devices 1620, 1630, and 1640 may be connected to the same repeater as the digital device 1610 and may have a data communication signal having a predetermined signal size or more.
- the external devices 1620, 1630, and 1640 may perform an AEC function by using audio reference data received from the digital device 1610.
- the AEC function may be performed using audio reference data of another device in a system such as a home network system, thereby realizing a technical effect of increasing the speech recognition rate in the near / far distance.
- 17 and 18 are diagrams for describing an example of increasing a voice recognition rate using audio reference data of a digital device according to one embodiment of the present invention.
- the digital device 1700 As shown in FIG. 17, it is assumed that the digital device 1700 according to an embodiment of the present invention outputs a real-time broadcast program and is connected to the same repeater 1720 as the external device 1710.
- the external device 1710 when a user utters a preset voice recognition trigger command to control the external device 1710 by voice, the external device 1710 outputs the real-time broadcast program. Send an audio reference data transmission request.
- the controller of the digital device 1700 that receives the audio reference data transmission request may control audio data included in the broadcast signal of the real-time broadcast program to be transmitted to the external device 1710.
- the external device 1710 receiving the audio reference data from the digital device 1700 may perform an AEC function while synchronizing with an audio signal output from a speaker of the digital device 1700. Therefore, the user has an advantage that the voice recognition rate of the voice command for controlling the external device 1710 can be increased as compared with before the present invention.
- FIG. 19 is a diagram for explaining an example in which a digital device performs data communication by connecting an external device with Bluetooth according to an embodiment of the present invention.
- the digital device 1900 performs data pairing by directly pairing with an external device 1910 using Bluetooth instead of a repeater. Can be performed.
- the external device 1910 sends a request for transmitting audio reference data to the digital device 1900 outputting the real-time broadcast program. I can send it.
- the controller of the digital device 1900 having received the audio reference data transmission request may control audio data included in the broadcast signal of the real-time broadcast program to be directly transmitted to the external device 1910 by Bluetooth.
- the external device 1910 that receives the audio reference data from the digital device 1900 may perform an AEC function while synchronizing with an audio signal output from a speaker of the digital device 1900. Therefore, although the data communication method is different, the user has an advantage that the voice recognition rate of the voice command for controlling the external device 1910 can be increased, as in FIG. 17.
- 20 and 21 are diagrams for describing an example of transmitting all audio reference data to an external device when there are a plurality of digital devices according to an embodiment of the present invention.
- the first digital device, the second digital device, and the third digital device are all digital devices including a speaker for outputting an audio signal, and the first digital device, the second digital device, and the third digital device. Assume that the digital devices are all connected to the same repeater 2070.
- the repeater 2070 may include the plurality of digital devices 2010, 2020, 2030) Audio reference data output through each speaker may be simultaneously transmitted to the external devices 2040, 2050, and 2060. Therefore, even when the digital device including the speaker uses the voice recognition function of the external devices 2040, 2050, and 2060 in a plurality of environments, the user may increase the voice recognition rate by reflecting all audio reference data output from each speaker. There is an advantage in using the techniques of the present invention.
- 22 is a flowchart illustrating a control method of a digital device according to an embodiment of the present invention.
- the digital device disclosed herein is not limited to the configuration and method of the above-described embodiments, but the embodiments may be configured by selectively combining all or some of the embodiments so that various modifications may be made. It may be.
- the operating method of the digital device disclosed herein may be implemented as processor readable codes on a processor readable recording medium included in the digital device.
- the processor-readable recording medium includes all kinds of recording devices for storing data that can be read by the processor. Examples of processor-readable recording media include read only memory (ROM), random access memory (RAM), CD-ROM, magnetic tape, floppy disks, optical data storage devices, and the like. It also includes the implementation in the form of a wave (carrier-wave).
- the processor-readable recording medium can also be distributed over network coupled computer systems so that the processor-readable code is stored and executed in a distributed fashion.
- the present invention relates to digital devices and control methods thereof, and has industrial applicability.
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Automation & Control Theory (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
본 명세서에서는 디지털 디바이스 및 그 제어방법에 대한 다양한 실시예(들)이 개시된다. 여기서, 본 발명의 일 실시 예에 따른 디지털 디바이스의 제어 방법은, 중계기에 접속하는 단계, 기 설정된 거리 이내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하는 단계, 상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하는 단계 및 상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하는 단계를 포함할 수 있다.
Description
본 발명은 디지털 디바이스에 관한 것으로, 더욱 상세하게는 스피커를 통해 오디오 신호를 출력하는 디지털 디바이스에 적용되는 발명으로서, Wi-Fi(Wireless-fidelity) 공유기를 포함하는 중계기에 접속하고, 상기 중계기에 접속한 다른 외부 디바이스에서 음성 인식 기능을 수행하는 경우, 상기 디지털 디바이스의 스피커를 통해 출력되는 오디오 데이터를 상기 외부 디바이스에 전송하고, 상기 외부 디바이스는 상기 오디오 데이터를 이용하여 AEC(Acoustic Echo Canceler) 기능을 수행하도록 설계함으로써, 외부 디바이스의 음성 인식률을 향상시키도록 하는 디지털 디바이스에 관한 것이다.
PC(Personal Computer), TV(Television)와 같은 고정 디바이스(standing device)에 이어 스마트 폰(smart phone), 태블릿 PC(Tablet PC) 등과 같은 모바일 디바이스(mobile device)의 발전이 눈부시다. 고정 디바이스와 모바일 디바이스는 원래 각자의 영역에서 서로 구분되어 발전해 왔으나, 최근 디지털 컨버전스(digital convergence)의 붐에 따라 그 영역이 모호해지고 있다.
또한, 이러한 디지털 디바이스의 발전 내지 환경 변화에 따라 사용자의 눈높이도 높아져 점차 다양하고 고사양의 서비스(services)나 애플리케이션(application) 지원에 대한 요청이 많다.
본 발명은 상기와 같은 상황 내지 문제점을 해소하고자 안출된 것으로, 본 발명의 일 과제는, AEC 기능을 이용하여 디지털 디바이스의 음성 인식률을 높이도록 하는 것이다.
본 발명의 다른 과제는, 디지털 디바이스가 AEC 기능을 수행할 때, 기 설정된 거리 이내에 위치한 스피커에서 출력되는 오디오 데이터를 이용하여, 보다 정확한 AEC 결과가 도출되도록 하는 것이다.
본 발명의 또 다른 과제는, 스피커를 포함하는 디지털 디바이스가 복수 개인 경우, 상기 복수 개의 디지털 디바이스 각각의 스피커를 통해 출력되는 오디오 데이터를 모두 이용하여 AEC 기능을 수행하도록 함으로써, 음성 인식률을 높이도록 하는 것이다.
본 발명에서 이루고자 하는 기술적 과제는 상기 언급한 기술적 과제로 제한되지 않으며, 언급하지 않은 다른 기술적 과제들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 명세서에서는 디지털 디바이스 및 상기 디지털 디바이스에서 처리 방법에 대한 다양한 실시예(들)을 개시한다.
본 발명의 일 실시 예에 따른 디지털 디바이스의 제어 방법은, 중계기에 접속하는 단계, 기 설정된 거리 이내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하는 단계, 상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하는 단계 및 상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하는 단계를 포함하여 설계할 수 있다.
본 발명의 일 실시 예에 따른 디지털 디바이스는, 중계기 및 외부 디바이스와 데이터 통신을 수행하는 커뮤니케이션 모듈(Communication module), 적어도 하나 이상의 오디오 레퍼런스 데이터를 저장하는 스토리지 모듈(Storage module) 및 상기 디지털 디바이스의 작동을 제어하는 컨트롤러를 포함하고, 상기 컨트롤러는, 중계기에 접속하고, 기 설정된 거리 이내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하고, 상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하고, 상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하도록 제어하는 디지털 디바이스를 설계할 수 있다.
본 발명에서 얻을 수 있는 기술적 해결 수단은 이상에서 언급한 해결 수단들로 제한되지 않으며, 언급하지 않은 또 다른 해결 수단들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
본 발명의 효과는 다음과 같다.
본 발명의 다양한 실시 예들 중 일 실시 예에 따르면, AEC 기능을 이용하여 디지털 디바이스의 음성 인식률을 높이도록 하는 장점이 있다.
본 발명의 다양한 실시 예들 중 다른 실시 예에 따르면, 디지털 디바이스가 AEC 기능을 수행할 때, 기 설정된 거리 이내에 위치한 스피커에서 출력되는 오디오 데이터를 이용하여, 더욱 정확한 AEC 결과가 도출되도록 하는 기술적 효과가 있다.
본 발명의 다양한 실시 예들 중 또 다른 실시 예에 따르면, 스피커를 포함하는 디지털 디바이스가 복수 개인 경우, 상기 복수 개의 디지털 디바이스 각각의 스피커를 통해 출력되는 오디오 데이터를 모두 이용하여 AEC 기능을 수행하도록 함으로써, 음성 인식률을 높이도록 하는 기술적 효과가 있다.
본 발명에서 얻을 수 있는 효과는 이상에서 언급한 효과들로 제한되지 않으며, 언급하지 않은 또 다른 효과들은 아래의 기재로부터 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
도 1은 본 발명의 일 실시 예에 따른 디지털 디바이스를 포함한 서비스 시스템을 개략적으로 설명하기 위해 도시한 도면이다.
도 2는 본 발명의 일 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 3은 본 발명의 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 4는 본 발명의 또 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
도 5는 본 발명의 일 실시 예에 따라 도 2 내지 4의 제어부의 상세 구성을 설명하기 위해 도시한 구성 블록도이다.
도 6은 본 발명의 일 실시 예에 따른 도 2 내지 4의 디지털 디바이스와 연결된 입력 수단을 도시한 도면이다.
도 7은 본 발명의 일 실시 예에 따른 Web OS 아키텍처를 설명하기 위해 도시한 도면이다.
도 8은 본 발명의 일 실시 예에 따른 Web OS 디바이스의 아키텍처를 설명하기 위해 도시한 도면이다.
도 9는 본 발명의 일 실시 예에 따른 Web OS 디바이스에서 그래픽 컴포지션 플로우를 설명하기 위해 도시한 도면이다.
도 10은 본 발명의 일 실시 예에 따른 미디어 서버를 설명하기 위해 도시한 도면이다.
도 11은 본 발명의 일 실시 예에 따른 미디어 서버의 구성 블록도를 설명하기 위해 도시한 도면이다.
도 12는 본 발명의 일 실시 예에 따른 미디어 서버와 TV 서비스의 관계를 설명하기 위해 도시한 도면이다.
도 13 및 도 14는 본 발명 이전에 디지털 디바이스에서 수행하는 AEC 기능에 대해 설명하기 위한 도면이다.
도 15는 본 발명의 다른 일 실시 예에 의한 디지털 디바이스의 구성 모듈을 상세히 도시한 블록도이다.
도 16은 본 발명의 일 실시 예에 의한 디지털 디바이스 및 외부 디바이스가 동일한 중계기에 접속하여 데이터를 송/수신하는 일 예를 설명하기 위한 도면이다.
도 17 및 도 18은 본 발명의 일 실시 예에 의한 디지털 디바이스의 오디오 레퍼런스 데이터를 이용하여 음성 인식률을 높이는 일 예를 설명하기 위한 도면이다.
도 19는 본 발명의 일 실시 예에 의한 디지털 디바이스가 외부 디바이스와 블루투스로 연결되어 데이터 통신을 수행하는 일 예를 설명하기 위한 도면이다.
도 20 및 도 21은 본 발명의 일 실시 예에 의한 디지털 디바이스가 복수 개인 경우 전체 오디오 레퍼런스 데이터를 외부 디바이스에 전송하는 일 예를 설명하기 위한 도면이다.
도 22는 본 발명의 일 실시 예에 의한 디지털 디바이스의 제어 방법을 도시한 플로우 차트이다.
이하에서는 도면을 참조하여 본 발명에 따른 디지털 디바이스 및 상기 디지털 디바이스에서 스크린 세이버 처리 방법의 다양한 실시 예(들)을 상세하게 설명한다.
본 명세서에서 사용되는 구성요소에 대한 접미사 "모듈", "부" 등은 단지 명세서 작성의 용이함을 고려하여 부여되는 것으로서, 필요에 따라 양자는 혼용될 수도 있다. 또한, "제1-", "제2-" 등과 같이 서수로 기술한 경우에도 그것이 순서를 의미하기보다는 해당 용어의 설명 편의를 위한 것일 뿐, 그러한 용어나 서수에 한정되는 것은 아니다.
또한, 본 명세서에서 사용되는 용어도, 본 발명의 기술 사상에 따른 기능을 고려하여 가능한 현재 널리 사용되는 일반적인 용어를 선택하였으나, 이는 당 분야에 종사하는 기술자의 의도 또는 관례 또는 새로운 기술의 출현 등에 따라 달라질 수 있다. 다만, 특정한 경우는 출원인이 임의로 선정한 용어도 있으나, 이에 대해서는 관련 설명 부분에서 그 의미를 기술할 것이다. 따라서, 해당 용어를 단지 그 명칭이 아니라 그가 가진 실질적인 의미와 본 명세서 전반에 걸쳐 기술된 내용을 토대로 해석되어야 함을 밝혀 둔다.
한편, 본 명세서 또는/및 도면에 기술된 내용은, 본 발명에 따른 바람직한 일 실시 예로서 그에 한정되지 않으며, 그 권리범위는 특허청구범위를 통해 결정되어야 한다.
이하 본 명세서에서 기술되는 “디지털 디바이스(digital device)”라 함은 예를 들어, 데이터(data), 컨텐트(content), 서비스(service), 애플리케이션(application) 등을 송신, 수신, 처리 및 출력 중 적어도 하나 이상을 수행하는 모든 디바이스를 포함한다. 상기 디지털 디바이스는, 유/무선 네트워크(wire/wireless network)를 통하여 다른 디지털 디바이스, 외부 서버(external server) 등과 페어링 또는 연결(pairing or connecting)(이하 '페어링') 가능하며, 그를 통해 소정 데이터를 송/수신할 수 있다. 이때, 필요에 따라, 상기 데이터는 그 송/수신 전에 적절히 변환(converting)될 수 있다. 상기 디지털 디바이스에는 예를 들어, 네트워크 TV(Network TV), HBBTV(Hybrid Broadcast Broadband TV), 스마트 TV(Smart TV), IPTV(Internet Protocol TV), PC(Personal Computer) 등과 같은 고정형 디바이스(standing device)와, PDA(Personal Digital Assistant), 스마트 폰(Smart Phone), 태블릿 PC(Tablet PC), 노트북(Notebook) 등과 같은 모바일 디바이스(mobile device or handheld device)가 모두 포함될 수 있다. 본 명세서에서는 본 발명의 이해를 돕고 출원인의 설명의 편의상 후술하는 도 2에서는 디지털 TV(Digital TV)를 그리고, 도 3에서는 모바일 디바이스를 디지털 디바이스의 일 실시 예로 도시하고 설명한다. 또한, 본 명세서에서 기술되는 디지털 디바이스는, 패널(panel)만을 가진 구성일 수도 있고, 셋톱박스(STB: Set-Top Box) 등과 같은 구성, 디바이스, 시스템 등과 하나의 세트(SET) 구성일 수도 있다.
한편, 본 명세서에서 기술되는 “유/무선 네트워크”라 함은, 디지털 디바이스들 또는 디지털 디바이스와 외부 서버 사이에서 페어링 또는/및 데이터 송수신을 위해 다양한 통신 규격 내지 프로토콜을 지원하는 통신 네트워크를 통칭한다. 이러한 유/무선 네트워크는, 규격에 의해 현재 또는 향후 지원될 통신 네트워크를 모두 포함하며, 그를 위한 하나 또는 그 이상의 통신 프로토콜들을 모두 지원 가능하다. 이러한 유/무선 네트워크에는 예컨대, USB(Universal Serial Bus), CVBS(Composite Video Banking Sync), 컴포넌트(Component), S-비디오(아날로그), DVI(Digital Visual Interface), HDMI(High Definition Multimedia Interface), RGB, D-SUB와 같은 유선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜과, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA: infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance), WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), LTE/LTE-A(Long Term Evolution/LTE-Advanced), Wi-Fi 다이렉트(direct)와 같은 무선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜에 의하여 형성될 수 있다.
그 밖에, 본 명세서에서 단지 디지털 디바이스로 명명하는 경우, 그 의미는 문맥에 따라 고정형 디바이스 또는 모바일 디바이스를 의미할 수도 있고 특별히 언급하지 않는다면 양자를 모두 포함하는 의미로 사용될 수 있다.
한편, 디지털 디바이스는 예컨대, 방송 수신 기능, 컴퓨터 기능 내지 지원, 적어도 하나의 외부 입력 등을 지원하는 지능형 디바이스로서, 상술한 유/무선 네트워크를 통해 이메일(e-mail), 웹 브라우징(web browsing), 뱅킹(banking), 게임(game), 애플리케이션(application) 등을 지원할 수 있다. 더불어, 상기 디지털 디바이스는, 수기 방식의 입력 디바이스, 터치-스크린(touch-screen), 공간 리모콘 등 적어도 하나의 입력 또는 제어 수단(이하 ‘입력 수단’)을 지원하기 위한 인터페이스(interface)를 구비할 수 있다.
그 밖에, 디지털 디바이스는, 표준화된 범용 OS(Operating System)를 이용할 수 있으나 특히, 본 명세에서 기술되는 디지털 디바이스는, Web OS를 이용하는 것을 일 실시 예로 한다. 따라서, 디지털 디바이스는 범용의 OS 커널(OS kernel) 또는 리눅스 커널(Linux kernel) 상에 다양한 서비스나 애플리케이션을 추가(adding), 삭제(deleting), 수정(amending), 업데이트(updating) 등을 처리가 가능하며, 그를 통해 더욱 사용자 친화적인(user-friendly) 환경을 구성하여 제공할 수 있다.
한편, 상술한 디지털 디바이스는 외부 입력을 수신하여 처리할 수 있는데 이때, 상기 외부 입력은, 외부 입력 디바이스 즉, 상술한 디지털 디바이스와 유/무선 네트워크를 통해 연결되어 데이터를 송/수신하여 처리 가능한 모든 입력 수단 내지 디지털 디바이스를 포함한다. 예를 들어, 상기 외부 입력으로 HDMI(High-Definition Multimedia Interface), 플레이스테이션(playstation)이나 엑스-박스(X-Box) 등과 같은 게임 디바이스(game device), 스마트 폰, 태블릿 PC, 포켓 포토(pocket photo) 등과 같은 프린터기(printing device), 스마트 TV, 블루-레이(Blu-ray device) 디바이스 등과 같은 디지털 디바이스들을 모두 포함한다.
그 밖에, 본 명세서에서 기술되는 “서버”라 함은, 상술한 디지털 디바이스 즉, 클라이언트(client)로 데이터를 공급 또는 그로부터 데이터를 수신하는 디지털 디바이스 혹은 시스템을 의미하며, 프로세서(processor)로 불리기도 한다. 상기 서버로 예컨대, 웹 페이지(web page), 웹 컨텐트 또는 웹 서비스(web content or web service)를 제공하는 포털 서버(portal server), 광고 데이터(advertising data)를 제공하는 광고 서버(advertising server), 컨텐트를 제공하는 컨텐트 서버(content server), SNS(Social Network Service)를 제공하는 SNS 서버, 제조업체(manufacturer)에서 제공하는 서비스 서버(service server), VoD(Video on Demand)나 스트리밍(streaminng) 서비스 제공을 위한 MVPD(Multichannel Video Programming Distributor), 유료 서비스(pay service) 등을 제공하는 서비스 서버 등이 포함될 수 있다.
또한, 이하 본 명세서에서 설명의 편의를 위하여 애플리케이션으로만 기술한 경우에도 그 문맥 등을 기초하여 그 의미는 애플리케이션뿐만 아니라 서비스까지 포함하는 의미일 수 있다.
이하 첨부된 도면을 참조하면 본 발명을 더욱 상세하게 설명하면, 다음과 같다.
도 1은 본 발명의 일 실시 예에 따른 디지털 디바이스를 포함한 서비스 시스템을 개략적으로 설명하기 위해 도시한 도면이다.
도 1을 참조하면, 서비스 시스템은, 컨텐트 제공자(content provider)(10), 서비스 제공자(service provider)(20), 네트워크 제공자(network provider)(30) 및 HNED(Home Network End User)(Customer)(40)를 포함한다. 여기서, HNED(40)는 예를 들어, 클라이언트(100) 즉, 본 발명에 따른 디지털 디바이스를 포함한다.
컨텐트 제공자(10)는, 각종 컨텐트를 제작하여 제공한다. 도 1에 도시된 바와 같이, 이러한 컨텐트 제공자(10)로 지상파 방송 송출자, 케이블 방송 사업자(cable SO (System Operator)) 또는 MSO(Multiple SO), 위성 방송 송출자, 다양한 인터넷 방송 송출자, 개인 컨텐트 제공자들 등을 예시할 수 있다. 한편, 컨텐트 제공자(10)는, 방송 컨텐트 외에도 다양한 서비스나 애플리케이션 등을 제작하여 제공할 수 있다.
서비스 제공자(20)는, 컨텐트 제공자(10)에 의해 제작된 컨텐트를 서비스 패키지화(service packetizing)하여 HNED(40)로 제공한다. 예컨대, 서비스 제공자(20)는, 제1 지상파 방송, 제2 지상파 방송, 케이블 MSO, 위성 방송, 다양한 인터넷 방송, 애플리케이션 등에 의해 제작된 컨텐트들 중 적어도 하나 이상을 서비스를 위해 패키지화하고, 이를 HNED(40)에게 제공한다.
서비스 제공자(20)는, 유니-캐스트(uni-cast) 또는 멀티-캐스트(multi-cast) 방식으로 클라이언트(100)에 서비스를 제공한다. 한편, 서비스 제공자(20)는 데이터를 미리 등록된 다수의 클라이언트(100)로 한꺼번에 전송할 수 있는데, 이를 위해 IGMP(Internet Group Management Protocol) 프로토콜 등을 이용할 수 있다.
상술한 컨텐트 제공자(10)와 서비스 제공자(20)는, 동일한 개체(entity)일 수 있다. 예를 들어, 컨텐트 제공자(10)가 제작한 컨텐트를 서비스 패키지화하여 HNED(40)로 제공함으로써 서비스 제공자(20)의 기능도 함께 수행하거나 그 반대일 수도 있다.
네트워크 제공자(30)는, 컨텐트 제공자(10) 또는/및 서비스 제공자(20)와 클라이언트(100) 사이의 데이터 교환을 위한 네트워크 망을 제공한다.
클라이언트(100)는, HNED(40)에 속한 소비자로서, 네트워크 제공자(30)를 통해 예컨대, 홈 네트워크(home network)를 구축하여 데이터를 수신하며, VoD, 스트리밍 등 다양한 서비스나 애플리케이션 등에 관한 데이터를 송/수신할 수도 있다.
한편, 서비스 시스템 내 컨텐트 제공자(10) 또는/및 서비스 제공자(20)는 전송되는 컨텐트의 보호를 위해 제한 수신(conditional access) 또는 컨텐트 보호(content protection) 수단을 이용할 수 있다. 따라서, 클라이언트(100)는 상기 제한 수신이나 컨텐트 보호에 대응하여 케이블카드(CableCARD)(또는 POD: Point of Deployment), DCAS(Downloadable CAS) 등과 같은 처리 수단을 이용할 수 있다.
그 밖에, 클라이언트(100)도 네트워크를 통해, 양방향 서비스를 이용할 수 있다. 따라서, 클라이언트(100)가 오히려 컨텐트 제공자의 역할 내지 기능을 수행할 수도 있으며, 서비스 제공자(20)는 이를 수신하여 다시 다른 클라이언트 등으로 전송할 수도 있다.
도 1에서 컨텐트 제공자(10) 또는/및 서비스 제공자(20)는 본 명세서에서 후술하는 서비스를 제공하는 서버일 수 있다. 이 경우, 상기 서버는 필요에 따라 네트워크 제공자(30)도 소유 내지 포함하는 의미일 수 있다. 이하 특별히 언급하지 않더라도 서비스 또는 서비스 데이터는, 전술한 외부로부터 수신되는 서비스 내지 애플리케이션뿐만 아니라 내부 서비스 내지 애플리케이션을 포함하며, 이러한 서비스 내지 애플리케이션은 Web OS 기반의 클라이언트(100)를 위한 서비스 내지 애플리케이션 데이터를 의미할 수 있다.
도 2는 본 발명의 일 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
이하 본 명세서에서 기술되는 디지털 디바이스는 전술한 도 1의 클라이언트(100)에 해당한다.
디지털 디바이스(200)는, 네트워크 인터페이스부(network interface)(201), TCP/IP 매니저(TCP/IP manager)(202), 서비스 전달 매니저(service delivery manager)(203), SI 디코더(204), 역다중화부(demux or demultiplexer)(205), 오디오 디코더(audio decoder)(206), 비디오 디코더(video decoder)(207), 디스플레이부(display A/V and OSD module)(208), 서비스 제어 매니저(service control manager)(209), 서비스 디스커버리 매니저(service discovery manager)(210), SI&메타데이터 데이터베이스(SI&metadata DB)(211), 메타데이터 매니저(metadata manager)(212), 서비스 매니저(213), UI 매니저(214) 등을 포함하여 구성된다.
네트워크 인터페이스부(201)는, 액세스하는 네트워크 망을 통하여 IP 패킷(들)(Internet Protocol (IP) packet(s)) 또는 IP 데이터그램(들)(IP datagram(s))(이하 IP 패킷(들)이라 한다)을 송/수신한다. 일 예로, 네트워크 인터페이스부(201)는 네트워크 망을 통해 도 1의 서비스 제공자(20)로부터 서비스, 애플리케이션, 컨텐트 등을 수신할 수 있다.
TCP/IP 매니저(202)는, 디지털 디바이스(200)로 수신되는 IP 패킷들과 디지털 디바이스(200)가 전송하는 IP 패킷들에 대하여 즉, 소스(source)와 목적지(destination) 사이의 패킷 전달(packet delivery)에 관여한다. 상기 TCP/IP 매니저(202)는 수신된 패킷(들)을 적절한 프로토콜에 대응하도록 분류하고, 서비스 전달 매니저(205), 서비스 디스커버리 매니저(210), 서비스 제어 매니저(209), 메타데이터 매니저(212) 등으로 상기 분류된 패킷(들)을 출력한다.
서비스 전달 매니저(203)는, 수신되는 서비스 데이터의 제어를 담당한다. 예를 들어, 서비스 전달 매니저(203)는 실시간 스트리밍(real-time streaming) 데이터를 제어하는 경우에는 RTP/RTCP를 사용할 수 있다. 상기 실시간 스트리밍 데이터를 RTP를 사용하여 전송하는 경우, 서비스 전달 매니저(203)는 상기 수신된 데이터 패킷을 RTP에 따라 파싱(parsing)하여 역다중화부(205)로 전송하거나 서비스 매니저(213)의 제어에 따라 SI&메타데이터 데이터베이스(211)에 저장한다. 그리고, 서비스 전달 매니저(203)는 RTCP를 이용하여 상기 네트워크 수신 정보를 서비스를 제공하는 서버 측에 피드백(feedback)한다.
역다중화부(205)는, 수신된 패킷을 오디오, 비디오, SI(System Information) 데이터 등으로 역다중화하여 각각 오디오/비디오 디코더(206/207), SI 디코더(204)에 전송한다.
SI 디코더(204)는, 역다중화된 SI 데이터 즉, PSI(Program Specific Information), PSIP(Program and System Information Protocol), DVB-SI(Digital Video Broadcasting-Service Information), DTMB/CMMB(Digital Television Terrestrial Multimedia Broadcasting/Coding Mobile Multimedia Broadcasting) 등의 서비스 정보를 디코딩한다. 또한, SI 디코더(204)는, 디코딩된 서비스 정보들을 SI&메타데이터 데이터베이스(211)에 저장할 수 있다. 저장된 서비스 정보는 예를 들어, 사용자의 요청 등에 의해 해당 구성에 의해 독출되어 이용될 수 있다.
오디오/비디오 디코더(206/207)는, 역다중화된 각 오디오 데이터와 비디오 데이터를 디코딩한다. 이렇게 디코딩된 오디오 데이터 및 비디오 데이터는 디스플레이부(208)를 통하여 사용자에게 제공된다.
애플리케이션 매니저는 예를 들어, UI 매니저(214)와 서비스 매니저(213)를 포함하며 디지털 디바이스(200)의 제어부 기능을 수행할 수 있다. 다시 말해, 애플리케이션 매니저는, 디지털 디바이스(200)의 전반적인 상태를 관리하고 사용자 인터페이스(UI: user interface)를 제공하며, 다른 매니저를 관리할 수 있다.
UI 매니저(214)는, 사용자를 위한 GUI(Graphic User Interface)/UI를 OSD(On Screen Display) 등을 이용하여 제공하며, 사용자로부터 키 입력을 받아 상기 입력에 따른 디바이스 동작을 수행한다. 예를 들어, UI 매니저(214)는 사용자로부터 채널 선택에 관한 키 입력을 받으면 상기 키 입력 신호를 서비스 매니저(213)에 전송한다.
서비스 매니저(213)는, 서비스 전달 매니저(203), 서비스 디스커버리 매니저(210), 서비스 제어 매니저(209), 메타데이터 매니저(212) 등 서비스와 연관된 매니저를 제어한다.
또한, 서비스 매니저(213)는, 채널 맵(channel map)을 생성하고 UI 매니저(214)로부터 수신한 키 입력에 따라 상기 생성된 채널 맵을 이용하여 채널을 선택 등을 제어한다. 상기 서비스 매니저(213)는 SI 디코더(204)로부터 서비스 정보를 전송받아 선택된 채널의 오디오/비디오 PID(Packet Identifier)를 역다중화부(205)에 설정한다. 이렇게 설정되는 PID는 상술한 역다중화 과정에 이용될 수 있다. 따라서, 역다중화부(205)는 상기 PID를 이용하여 오디오 데이터, 비디오 데이터 및 SI 데이터를 필터링(PID or section filtering) 한다.
서비스 디스커버리 매니저(210)는, 서비스를 제공하는 서비스 제공자를 선택하는데 필요한 정보를 제공한다. 상기 서비스 매니저(213)로부터 채널 선택에 관한 신호를 수신하면, 서비스 디스커버리 매니저(210)는 상기 정보를 이용하여 서비스를 찾는다.
서비스 제어 매니저(209)는, 서비스의 선택과 제어를 담당한다. 예를 들어, 서비스 제어 매니저(209)는 사용자가 기존의 방송 방식과 같은 생방송(live broadcasting) 서비스를 선택하는 경우 IGMP 또는 RTSP 등을 사용하고, VOD와 같은 서비스를 선택하는 경우에는 RTSP를 사용하여 서비스의 선택, 제어를 수행한다. 상기 RTSP 프로토콜은 실시간 스트리밍에 대해 트릭 모드(trick mode)를 제공할 수 있다. 또한, 서비스 제어 매니저(209)는 IMS(IP Multimedia Subsystem), SIP(Session Initiation Protocol)를 이용하여 IMS 게이트웨이(250)를 통하는 세션을 초기화하고 관리할 수 있다. 상기 프로토콜들은 일 실시 예이며, 구현 예에 따라 다른 프로토콜을 사용할 수도 있다.
메타데이터 매니저(212)는, 서비스와 연관된 메타데이터를 관리하고 상기 메타데이터를 SI&메타데이터 데이터베이스(211)에 저장한다.
SI&메타데이터 데이터베이스(211)는, SI 디코더(204)가 디코딩한 서비스 정보, 메타데이터 매니저(212)가 관리하는 메타데이터 및 서비스 디스커버리 매니저(210)가 제공하는 서비스 제공자를 선택하는데 필요한 정보를 저장한다. 또한, SI&메타데이터 데이터베이스(211)는 시스템에 대한 세트-업 데이터 등을 저장할 수 있다.
SI&메타데이터 데이터베이스(211)는, 비휘발성 메모리(Non-Volatile RAM: NVRAM) 또는 플래시 메모리(flash memory) 등을 사용하여 구현될 수도 있다.
한편, IMS 게이트웨이(250)는, IMS 기반의 IPTV 서비스에 접근하기 위해 필요한 기능들을 모아 놓은 게이트웨이이다.
도 3은 본 발명의 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
전술한 도 2가 고정 디바이스를 디지털 디바이스의 일 실시 예로 하여 설명하였다면, 도 3은 모바일 디바이스를 디지털 디바이스의 다른 실시 예로 한다.
도 3을 참조하면, 모바일 디바이스(300)는, 무선 통신부(310), A/V(Audio/Video) 입력부(320), 사용자 입력부(330), 센싱부(340), 출력부(350), 메모리(360), 인터페이스부(370), 제어부(380) 및 전원 공급부(390) 등을 포함할 수 있다.
이하 각 구성요소에 대해 상세히 설명하면, 다음과 같다.
무선 통신부(310)는, 모바일 디바이스(300)와 무선 통신 시스템 사이 또는 모바일 디바이스와, 모바일 디바이스가 위치한 네트워크 사이의 무선 통신을 가능하게 하는 하나 또는 그 이상의 모듈을 포함할 수 있다. 예를 들어, 무선 통신부(310)는 방송 수신 모듈(311), 이동통신 모듈(312), 무선 인터넷 모듈(313), 근거리 통신 모듈(314) 및 위치정보 모듈(315) 등을 포함할 수 있다.
방송 수신 모듈(311)은, 방송 채널을 통하여 외부의 방송 관리 서버로부터 방송 신호 및/또는 방송 관련된 정보를 수신한다. 여기서, 방송 채널은 위성 채널, 지상파 채널을 포함할 수 있다. 상기 방송 관리 서버는, 방송 신호 및/또는 방송 관련 정보를 생성하여 송신하는 서버 또는 기 생성된 방송 신호 및/또는 방송 관련 정보를 제공받아 단말기에 송신하는 서버를 의미할 수 있다. 상기 방송 신호는, TV 방송 신호, 라디오 방송 신호, 데이터 방송 신호를 포함할 뿐만 아니라, TV 방송 신호 또는 라디오 방송 신호에 데이터 방송 신호가 결합한 형태의 방송 신호도 포함할 수 있다.
방송 관련 정보는, 방송 채널, 방송 프로그램 또는 방송 서비스 제공자에 관련한 정보를 의미할 수 있다. 상기 방송 관련 정보는, 이동통신망을 통하여도 제공될 수 있다. 이러한 경우에는 상기 이동통신 모듈(312)에 의해 수신될 수 있다.
방송 관련 정보는 다양한 형태 예를 들어, EPG(Electronic Program Guide) 또는 ESG(Electronic Service Guide) 등의 형태로 존재할 수 있다.
방송수신 모듈(311)은 예를 들어, ATSC, DVB-T(Digital Video Broadcasting-Terrestrial), DVB-S(Satellite), MediaFLO(Media Forward Link Only), DVB-H(Handheld), ISDB-T(Integrated Services Digital Broadcast-Terrestrial) 등 디지털 방송 시스템을 이용하여 디지털 방송 신호를 수신할 수 있다. 물론, 방송수신 모듈(311)은, 상술한 디지털 방송 시스템뿐만 아니라 다른 방송 시스템에 적합하도록 구성될 수도 있다.
방송수신 모듈(311)을 통해 수신된 방송 신호 및/또는 방송 관련 정보는, 메모리(360)에 저장될 수 있다.
이동통신 모듈(312)은, 이동 통신망 상에서 기지국, 외부 단말, 서버 중 적어도 하나와 무선 신호를 송수신한다. 무선 신호는, 음성 신호, 화상 통화 신호 또는 문자/멀티미디어 메시지 송수신에 따른 다양한 형태의 데이터를 포함할 수 있다.
무선인터넷 모듈(313)은, 무선 인터넷 접속을 위한 모듈을 포함하여, 모바일 디바이스(300)에 내장되거나 외장될 수 있다. 무선 인터넷 기술로는 WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 등이 이용될 수 있다.
근거리통신 모듈(314)은, 근거리 통신을 위한 모듈을 말한다. 근거리 통신(short range communication) 기술로 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), ZigBee, RS-232, RS-485 등이 이용될 수 있다.
위치정보 모듈(315)은, 모바일 디바이스(300)의 위치 정보 획득을 위한 모듈로서, GPS(Global Position System) 모듈을 예로 할 수 있다.
A/V 입력부(320)는, 오디오 또는/및 비디오 신호 입력을 위한 것으로, 이에는 카메라(321)와 마이크(322) 등이 포함될 수 있다. 카메라(321)는, 화상통화 모드 또는 촬영 모드에서 이미지 센서에 의해 얻어지는 정지영상 또는 동영상 등의 화상 프레임을 처리한다. 처리된 화상 프레임은 디스플레이부(351)에 표시될 수 있다.
카메라(321)에서 처리된 화상 프레임은, 메모리(360)에 저장되거나 무선 통신부(310)를 통하여 외부로 전송될 수 있다. 카메라(321)는, 사용 환경에 따라 2개 이상이 구비될 수도 있다.
마이크(322)는, 통화 모드 또는 녹음 모드, 음성인식 모드 등에서 마이크로폰(Microphone)에 의해 외부의 음향 신호를 입력받아 전기적인 음성 데이터로 처리한다. 처리된 음성 데이터는, 통화 모드인 경우 이동통신 모듈(312)을 통하여 이동통신 기지국으로 송신 가능한 형태로 변환되어 출력될 수 있다. 마이크(322)에는 외부의 음향 신호를 입력받는 과정에서 발생하는 잡음(noise)을 제거하기 위한 다양한 잡음 제거 알고리즘이 구현될 수 있다.
사용자 입력부(330)는, 사용자가 단말기의 동작 제어를 위한 입력 데이터를 발생시킨다. 사용자 입력부(330)는, 키 패드(key pad), 돔 스위치 (dome switch), 터치 패드(정압/정전), 조그 휠(jog wheel), 조그 스위치(jog switch) 등으로 구성될 수 있다.
센싱부(340)는, 모바일 디바이스(300)의 개폐 상태, 모바일 디바이스(300)의 위치, 사용자 접촉 유무, 모바일 디바이스의 방위, 모바일 디바이스의 가속/감속 등과 같이 모바일 디바이스(300)의 현재 상태를 감지하여 모바일 디바이스(300)의 동작 제어를 위한 센싱 신호를 발생시킨다. 예를 들어, 모바일 디바이스(300)가 이동되거나 기울어진 경우 모바일 디바이스의 위치 내지 기울기 등을 센싱할 수 있다. 또한, 전원 공급부(390)의 전원 공급 여부, 인터페이스부(370)의 외부 디바이스 결합 여부 등도 센싱할 수도 있다. 한편, 센싱부(240)는, NFC(Near Field Communication) 등을 포함한 근접 센서(341)를 포함할 수 있다.
출력부(350)는, 시각, 청각 또는 촉각 등과 관련된 출력을 발생시키기 위한 것으로, 디스플레이부(351), 음향 출력 모듈(352), 알람부(353), 및 햅틱 모듈(354) 등이 포함될 수 있다.
디스플레이부(351)는, 모바일 디바이스(300)에서 처리되는 정보를 표시(출력)한다. 예를 들어, 모바일 디바이스가 통화 모드인 경우 통화와 관련된 UI 또는 GUI를 표시한다. 모바일 디바이스(300)가 화상 통화 모드 또는 촬영 모드인 경우에는, 촬영 또는/및 수신된 영상 또는 UI, GUI를 표시한다.
디스플레이부(351)는, 액정 디스플레이(liquid crystal display, LCD), 박막 트랜지스터 액정 디스플레이(thin film transistor-liquid crystal display, TFT LCD), 유기 발광 다이오드(organic light-emitting diode, OLED), 플렉시블 디스플레이(flexible display), 3차원 디스플레이 중에서 적어도 하나를 포함할 수 있다.
이들 중 일부 디스플레이는 그를 통해 외부를 볼 수 있도록 투명형 또는 광투과형으로 구성될 수 있다. 이는 투명 디스플레이라 호칭될 수 있는데, 상기 투명 디스플레이의 대표적인 예로는 TOLED(Transparant OLED) 등이 있다. 디스플레이부(351)의 후방 구조 또한 광 투과형 구조로 구성될 수 있다. 이러한 구조에 의하여, 사용자는 단말기 바디의 디스플레이부(351)가 차지하는 영역을 통해 단말기 바디(body)의 후방에 위치한 사물을 볼 수 있다.
모바일 디바이스(300)의 구현 형태에 따라 디스플레이부(351)가 2개 이상 존재할 수 있다. 예를 들어, 모바일 디바이스(300)에는 복수의 디스플레이부들이 하나의 면에 이격되거나 일체로 배치될 수 있고, 또한 서로 다른 면에 각각 배치될 수도 있다.
디스플레이부(351)와 터치 동작을 감지하는 센서(이하 '터치 센서'라 함)가 상호 레이어 구조를 이루는 경우(이하, '터치 스크린'이라 함)에, 디스플레이부(351)는 출력 디바이스 이외에 입력 디바이스로도 사용될 수 있다. 터치 센서는, 예를 들어, 터치 필름, 터치 시트, 터치 패드 등의 형태를 가질 수 있다.
터치 센서는 디스플레이부(351)의 특정 부위에 가해진 압력 또는 디스플레이부(351)의 특정 부위에 발생하는 정전 용량 등의 변화를 전기적인 입력신호로 변환하도록 구성될 수 있다. 터치 센서는 터치 되는 위치 및 면적뿐만 아니라, 터치 시의 압력까지도 검출할 수 있도록 구성될 수 있다.
터치 센서에 대한 터치 입력이 있는 경우, 그에 대응하는 신호(들)는 터치 제어기로 보내진다. 터치 제어기는 그 신호(들)를 처리한 다음 대응하는 데이터를 제어부(380)로 전송한다. 이로써, 제어부(380)는 디스플레이부(351)의 어느 영역이 터치 되었는지 여부 등을 알 수 있게 된다.
터치스크린에 의해 감싸지는 모바일 디바이스의 내부 영역 또는 상기 터치 스크린의 근처에 근접 센서(341)가 배치될 수 있다. 상기 근접 센서는 소정의 검출면에 접근하는 물체, 혹은 근방에 존재하는 물체의 유무를 전자계의 힘 또는 적외선을 이용하여 기계적 접촉이 없이 검출하는 센서를 말한다. 근접 센서는 접촉식 센서보다는 그 수명이 길며 그 활용도 또한 높다.
상기 근접 센서의 예로는 투과형 광전 센서, 직접 반사형 광전 센서, 미러 반사형 광전 센서, 고주파 발진형 근접 센서, 정전용량형 근접 센서, 자기형 근접 센서, 적외선 근접 센서 등이 있다. 상기 터치스크린이 정전식인 경우에는 상기 포인터의 근접에 따른 전계의 변화로 상기 포인터의 근접을 검출하도록 구성된다. 이 경우 상기 터치 스크린(터치 센서)은 근접 센서로 분류될 수도 있다.
이하에서는 설명의 편의를 위해, 상기 터치스크린 상에 포인터가 접촉되지 않으면서 근접되어 상기 포인터가 상기 터치스크린 상에 위치함이 인식되도록 하는 행위를 "근접 터치(proximity touch)"라고 칭하고, 상기 터치스크린 상에 포인터가 실제로 접촉되는 행위를 "접촉 터치(contact touch)"라고 칭한다. 상기 터치스크린 상에서 포인터로 근접 터치가 되는 위치라 함은, 상기 포인터가 근접 터치될 때 상기 포인터가 상기 터치스크린에 대해 수직으로 대응되는 위치를 의미한다.
상기 근접 센서는, 근접 터치와, 근접 터치 패턴(예를 들어, 근접 터치 거리, 근접 터치 방향, 근접 터치 속도, 근접 터치 시간, 근접 터치 위치, 근접 터치 이동 상태 등)을 감지한다. 상기 감지된 근접 터치 동작 및 근접 터치 패턴에 상응하는 정보는 터치 스크린상에 출력될 수 있다.
음향출력모듈(352)은, 호신호 수신, 통화 모드 또는 녹음 모드, 음성인식 모드, 방송수신 모드 등에서 무선 통신부(310)로부터 수신되거나 메모리(360)에 저장된 오디오 데이터를 출력할 수 있다. 음향 출력 모듈(352)은 모바일 디바이스(300)에서 수행되는 기능(예를 들어, 호신호 수신음, 메시지 수신음 등)과 관련된 음향 신호를 출력하기도 한다. 이러한 음향 출력 모듈(352)에는 리시버(receiver), 스피커(speaker), 버저(buzzer) 등이 포함될 수 있다.
알람부(353)는, 모바일 디바이스(300)의 이벤트 발생을 알리기 위한 신호를 출력한다. 모바일 디바이스에서 발생 되는 이벤트의 예로는 호 신호 수신, 메시지 수신, 키 신호 입력, 터치 입력 등이 있다. 알람부(353)는, 비디오 신호나 오디오 신호 이외에 다른 형태, 예를 들어 진동으로 이벤트 발생을 알리기 위한 신호를 출력할 수도 있다. 상기 비디오 신호나 오디오 신호는 디스플레이부(351)나 음성 출력 모듈(352)을 통해서도 출력될 수 있어서, 그들(351,352)은 알람부(353)의 일부로 분류될 수도 있다.
햅틱 모듈(haptic module)(354)은, 사용자가 느낄 수 있는 다양한 촉각 효과를 발생시킨다. 햅틱 모듈(354)이 발생시키는 촉각 효과의 대표적인 예로는 진동이 있다. 햅택 모듈(354)이 발생하는 진동의 세기와 패턴 등은 제어 가능하다. 예를 들어, 서로 다른 진동을 합성하여 출력하거나 순차적으로 출력할 수도 있다. 햅틱 모듈(354)은, 진동 외에도, 접촉 피부면에 대해 수직 운동하는 핀 배열, 분사구나 흡입구를 통한 공기의 분사력이나 흡입력, 피부 표면에 대한 스침, 전극(eletrode)의 접촉, 정전기력 등의 자극에 의한 효과와, 흡열이나 발열 가능한 소자를 이용한 냉/온감 재현에 의한 효과 등 다양한 촉각 효과를 발생시킬 수 있다. 햅틱 모듈(354)은, 직접적인 접촉을 통해 촉각 효과의 전달할 수 있을 뿐만 아니라, 사용자가 손가락이나 팔 등의 근 감각을 통해 촉각 효과를 느낄 수 있도록 구현할 수도 있다. 햅틱 모듈(354)은, 모바일 디바이스(300)의 구성 태양에 따라 2개 이상이 구비될 수 있다.
메모리(360)는, 제어부(380)의 동작을 위한 프로그램을 저장할 수 있고, 입/출력되는 데이터들(예를 들어, 폰 북, 메시지, 정지영상, 동영상 등)을 임시 저장할 수도 있다. 상기 메모리(360)는 상기 터치스크린 상의 터치 입력 시 출력되는 다양한 패턴의 진동 및 음향에 관한 데이터를 저장할 수 있다.
메모리(360)는, 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(Random Access Memory, RAM), SRAM(Static Random Access Memory), 롬(Read-Only Memory, ROM), EEPROM(Electrically Erasable Programmable Read-Only Memory), PROM(Programmable Read-Only Memory), 자기 메모리, 자기 디스크, 광디스크 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 모바일 디바이스(300)는 인터넷(internet) 상에서 상기 메모리(360)의 저장 기능을 수행하는 웹 스토리지(web storage)와 관련되어 동작할 수도 있다.
인터페이스부(370)는, 모바일 디바이스(300)에 연결되는 모든 외부 디바이스와의 통로 역할을 한다. 인터페이스부(370)는 외부 디바이스로부터 데이터를 전송받거나, 전원을 공급받아 모바일 디바이스(300) 내부의 각 구성 요소에 전달하거나, 모바일 디바이스(300) 내부의 데이터가 외부 디바이스로 전송되도록 한다. 예를 들어, 유/무선 헤드셋 포트, 외부 충전기 포트, 유/무선 데이터 포트, 메모리 카드(memory card) 포트, 식별 모듈이 구비된 디바이스를 연결하는 포트, 오디오 I/O(Input/Output) 포트, 비디오 I/O 포트, 이어폰 포트 등이 인터페이스부(370)에 포함될 수 있다.
식별 모듈은 모바일 디바이스(300)의 사용 권한을 인증하기 위한 각종 정보를 저장한 칩으로서, 사용자 인증 모듈(User Identify Module, UIM), 가입자 인증 모듈(Subscriber Identify Module, SIM), 범용 사용자 인증 모듈(Universal Subscriber Identity Module, USIM) 등을 포함할 수 있다. 식별 모듈이 구비된 디바이스(이하 '식별 디바이스')는, 스마트 카드(smart card) 형식으로 제작될 수 있다. 따라서 식별 디바이스는 포트를 통하여 단말기(200)와 연결될 수 있다.
인터페이스부(370)는, 모바일 디바이스(300)가 외부 크래들(cradle)과 연결될 때, 상기 크래들로부터의 전원이 상기 모바일 디바이스(300)에 공급되는 통로가 되거나, 사용자에 의해 상기 크래들에서 입력되는 각종 명령 신호가 상기 모바일 디바이스로 전달되는 통로가 될 수 있다. 크래들로부터 입력되는 각종 명령 신호 또는 상기 전원은, 모바일 디바이스가 상기 크래들에 정확히 장착되었음을 인지하기 위한 신호로 동작될 수도 있다.
제어부(380)는, 통상적으로 모바일 디바이스(300)의 전반적인 동작을 제어한다. 제어부(380)는 예를 들어, 음성 통화, 데이터 통신, 화상 통화 등을 위한 관련된 제어 및 처리를 수행한다. 제어부(380)는, 멀티미디어 재생을 위한 멀티미디어 모듈(381)을 구비할 수도 있다. 멀티미디어 모듈(381)은, 제어부(380) 내에 구현될 수도 있고, 제어부(380)와 별도로 구현될 수도 있다. 제어부(380)는, 터치-스크린상에서 행해지는 필기 입력 또는 그림 그리기 입력을 각각 문자 및 이미지로 인식할 수 있는 패턴 인식(pattern recognition) 처리를 행할 수 있다.
전원 공급부(390)는, 제어부(380)의 제어에 의해 외부의 전원, 내부의 전원을 인가받아 각 구성요소들의 동작에 필요한 전원을 공급한다.
여기에 설명되는 다양한 실시 예는 예를 들어, 소프트웨어, 하드웨어 또는 이들의 조합된 것을 이용하여 컴퓨터 또는 이와 유사한 디바이스로 읽을 수 있는 기록매체 내에서 구현될 수 있다.
하드웨어적인 구현에 의하면, 여기에 설명되는 실시 예는 ASICs(application specific integrated circuits), DSPs(digital signal processors), DSPDs(digital signal processing devices), PLDs(programmable logic devices), FPGAs(field programmable gate arrays, 프로세서, 제어기, 마이크로 컨트롤러(micro-controllers), 마이크로 프로세서(microprocessors), 기타 기능 수행을 위한 전기적인 유닛(unit) 중 적어도 하나를 이용하여 구현될 수 있다. 일부의 경우에 본 명세서에서 설명되는 실시 예들이 제어부(380) 자체로 구현될 수 있다.
소프트웨어적인 구현에 의하면, 본 명세서에서 설명되는 절차 및 기능과 같은 실시 예들은 별도의 소프트웨어 모듈들로 구현될 수 있다. 소프트웨어 모듈들 각각은 본 명세서에서 설명되는 하나 이상의 기능 및 작동을 수행할 수 있다. 적절한 프로그램 언어로 쓰여진 소프트웨어 애플리케이션으로 소프트웨어 코드(software code)가 구현될 수 있다. 여기서, 소프트웨어 코드는, 메모리(360)에 저장되고, 제어부(380)에 의해 실행될 수 있다.
도 4는 본 발명의 또 다른 실시 예에 따른 디지털 디바이스를 설명하기 위해 도시한 구성 블록도이다.
디지털 디바이스(400)의 다른 예는, 방송 수신부(405), 외부 디바이스 인터페이스부(435), 저장부(440), 사용자입력 인터페이스부(450), 제어부(470), 디스플레이부(480), 오디오 출력부(485), 전원 공급부(490) 및 촬영부(미도시)를 포함할 수 있다. 여기서, 상기 방송 수신부(405)는, 적어도 하나의 튜너(410), 복조부(420) 및 네트워크 인터페이스부(430)를 포함할 수 있다. 다만, 경우에 따라, 상기 방송 수신부(405)는 튜너(410)와 복조부(420)는 구비하나 네트워크 인터페이스부(430)는 포함하지 않을 수 있으며 그 반대의 경우일 수도 있다. 또한, 상기 방송 수신부(405)는 도시되진 않았으나, 다중화부(multiplexer)를 구비하여 상기 튜너(410)를 거쳐 복조부(420)에서 복조된 신호와 상기 네트워크 인터페이스부(430)를 거쳐 수신된 신호를 다중화할 수도 있다. 그 밖에 상기 방송 수신부(425)는 역시 도시되진 않았으나, 역다중화부(demultiplexer)를 구비하여 상기 다중화된 신호를 역다중화하거나 상기 복조된 신호 또는 상기 네트워크 인터페이스부(430)를 거친 신호를 역다중화할 수 있다.
튜너(410)는, 안테나를 통해 수신되는 RF(Radio Frequency) 방송 신호 중 사용자에 의해 선택된 채널 또는 기 저장된 모든 채널을 튜닝하여 RF 방송 신호를 수신한다. 또한, 튜너(410)는, 수신된 RF 방송 신호를 중간 주파수(Intermediate Frequency; IF) 신호 혹은 베이스밴드(baseband) 신호로 변환한다.
예를 들어, 수신된 RF 방송 신호가 디지털 방송 신호이면 디지털 IF 신호(DIF)로 변환하고, 아날로그 방송 신호이면 아날로그 베이스밴드 영상 또는 음성 신호(CVBS/SIF)로 변환한다. 즉, 튜너(410)는 디지털 방송 신호 또는 아날로그 방송 신호를 모두 처리할 수 있다. 튜너(410)에서 출력되는 아날로그 베이스 밴드 영상 또는 음성 신호(CVBS/SIF)는 제어부(470)로 직접 입력될 수 있다.
또한, 튜너(410)는, 싱글 캐리어(single carrier) 또는 멀티플 캐리어(multiple carrier)의 RF 방송 신호를 수신할 수 있다. 한편, 튜너(410)는, 안테나를 통해 수신되는 RF 방송 신호 중 채널 기억 기능을 통하여 저장된 모든 방송 채널의 RF 방송 신호를 순차로 튜닝 및 수신하여 이를 중간 주파수 신호 혹은 베이스 밴드 신호(DIF: Digital Intermediate Frequency or baseband signal)로 변환할 수 있다.
복조부(420)는, 튜너(410)에서 변환된 디지털 IF 신호(DIF)를 수신하여 복조하고, 채널 복호화 등을 수행할 수도 있다. 이를 위해 복조부(420)는 트렐리스 디코더(Trellis Decoder), 디인터리버(De-interleaver), 리드 솔로먼 디코더(Reed-Solomon Decoder) 등을 구비하거나 컨벌루션 디코더(convolution decoder), 디인터리버 및 리드-솔로먼 디코더 등을 구비할 수 있다.
복조부(420)는, 복조 및 채널 복호화를 수행한 후 스트림 신호(TS)를 출력할 수 있다. 이때, 스트림 신호는 영상 신호, 음성 신호 또는 데이터 신호가 다중화된 신호일 수 있다. 일 예로, 스트림 신호는 MPEG-2 규격의 영상 신호, 돌비(Dolby) AC-3 규격의 음성 신호 등이 다중화된 MPEG-2 TS(Transport Stream)일 수 있다.
복조부(420)에서 출력한 스트림 신호는 제어부(470)로 입력될 수 있다. 제어부(470)는 역다중화, 영상/음성 신호 처리 등을 제어하고, 디스플레이부(480)를 통해 영상을, 오디오 출력부(485)를 통해 음성의 출력을 제어할 수 있다.
외부 디바이스 인터페이스부(435)는 디지털 디바이스(300)와 다양한 외부 디바이스 사이의 인터페이싱 환경을 제공한다. 이를 위해, 외부 디바이스 인터페이스부(335)는, A/V 입/출력부(미도시) 또는 무선 통신부(미도시)를 포함할 수 있다.
외부 디바이스 인터페이스부(435)는, DVD(Digital Versatile Disk), 블루-레이(Blu-ray), 게임 디바이스, 카메라, 캠코더(Camcorder), 컴퓨터(노트북), 태블릿 PC, 스마트 폰, 블루투스 디바이스(Bluetooth device), 클라우드(Cloud) 등과 같은 외부 디바이스 등과 유/무선으로 접속될 수 있다. 외부 디바이스 인터페이스부(435)는 연결된 외부 디바이스를 통하여 입력되는 이미지, 영상, 음성 등 데이터를 포함한 신호를 디지털 디바이스의 제어부(470)로 전달한다. 제어부(470)는 처리된 이미지, 영상, 음성 등을 데이터 신호를 연결된 외부 디바이스로 출력되도록 제어할 수 있다. 이를 위해, 외부 디바이스 인터페이스부(435)는, A/V 입/출력부(미도시) 또는 무선 통신부(미도시)를 더 포함할 수 있다.
A/V 입/출력부는, 외부 디바이스의 영상 및 음성 신호를 디지털 디바이스(400)로 입력할 수 있도록, USB 단자, CVBS(Composite Video Banking Sync) 단자, 컴포넌트 단자, S-비디오 단자(아날로그), DVI(Digital Visual Interface) 단자, HDMI(High Definition Multimedia Interface) 단자, RGB 단자, D-SUB 단자 등을 포함할 수 있다.
무선 통신부는, 다른 디지털 디바이스와 근거리 무선 통신을 수행할 수 있다. 디지털 디바이스(400)는 예를 들어, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance) 등의 통신 프로토콜에 따라 다른 디지털 디바이스와 네트워크 연결될 수 있다.
또한, 외부 디바이스 인터페이스부(435)는, 셋톱-박스(STB)와 상술한 각종 단자 중 적어도 하나를 통해 접속되어, 셋톱-박스(STB)와 입력/출력 동작을 수행할 수도 있다.
한편, 외부 디바이스 인터페이스부(435)는, 인접하는 외부 디바이스 내의 애플리케이션 또는 애플리케이션 목록(application list)을 수신하여, 제어부(470) 또는 저장부(440)로 전달할 수 있다.
네트워크 인터페이스부(430)는, 디지털 디바이스(400)를 인터넷 망을 포함하는 유/무선 네트워크와 연결하기 위한 인터페이스를 제공한다. 네트워크 인터페이스부(430)는, 유선 네트워크와의 접속을 위해 예를 들어, 이더넷(Ethernet) 단자 등을 구비할 수 있으며, 무선 네트워크와의 접속을 위해 예를 들어, WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access) 통신 규격 등을 이용할 수 있다.
네트워크 인터페이스부(430)는, 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 다른 사용자 또는 다른 디지털 디바이스와 데이터를 송신 또는 수신할 수 있다. 특히, 디지털 디바이스(400)에 미리 등록된 다른 사용자 또는 다른 디지털 디바이스 중 선택된 사용자 또는 선택된 디지털 디바이스에, 상기 디지털 디바이스(400)에 저장된 일부의 컨텐트 데이터를 송신할 수 있다.
한편, 네트워크 인터페이스부(430)는, 접속된 네트워크 또는 접속된 네트워크에 링크된 다른 네트워크를 통해, 소정 웹 페이지에 접속할 수 있다. 즉, 네트워크를 통해 소정 웹 페이지에 접속하여, 해당 서버와 데이터를 송신 또는 수신할 수 있다. 그 외, 컨텐트 제공자 또는 네트워크 운영자가 제공하는 컨텐트 또는 데이터들을 수신할 수 있다. 즉, 네트워크를 통하여 컨텐트 제공자 또는 네트워크 제공자로부터 제공되는 영화, 광고, 게임, VOD, 방송 신호 등의 컨텐트 및 그와 관련된 정보를 수신할 수 있다. 또한, 네트워크 운영자가 제공하는 펌웨어(firmware)의 업데이트 정보 및 업데이트 파일을 수신할 수 있다. 또한, 인터넷 또는 컨텐트 제공자 또는 네트워크 운영자에게 데이터들을 송신할 수 있다.
또한, 네트워크 인터페이스부(430)는, 네트워크를 통해 공개(open)된 애플리케이션들 중 원하는 애플리케이션을 선택하여 수신할 수 있다.
저장부(440)는, 제어부(470) 내의 각 신호 처리 및 제어를 위한 프로그램을 저장할 수도 있고, 신호 처리된 영상, 음성 또는 데이터 신호를 저장할 수도 있다.
또한, 저장부(440)는 외부 디바이스 인터페이스부(435) 또는 네트워크 인터페이스부(430)로부터 입력되는 영상, 음성, 또는 데이터 신호의 임시 저장을 위한 기능을 수행할 수도 있다. 저장부(440)는, 채널 기억 기능을 통하여 소정 방송 채널에 관한 정보를 저장할 수 있다.
저장부(440)는, 외부 디바이스 인터페이스부(435) 또는 네트워크 인터페이스부(330)로부터 입력되는 애플리케이션 또는 애플리케이션 목록을 저장할 수 있다.
또한, 저장부(440)는, 후술하여 설명하는 다양한 플랫폼(platform)을 저장할 수도 있다.
저장부(440)는, 예를 들어 플래시 메모리 타입(flash memory type), 하드디스크 타입(hard disk type), 멀티미디어 카드 마이크로 타입(multimedia card micro type), 카드 타입의 메모리(예를 들어 SD 또는 XD 메모리 등), 램(RAM), 롬(EEPROM 등) 중 적어도 하나의 타입의 저장매체를 포함할 수 있다. 디지털 디바이스(400)는, 저장부(440) 내에 저장되어 있는 컨텐트 파일(동영상 파일, 정지영상 파일, 음악 파일, 문서 파일, 애플리케이션 파일 등)을 재생하여 사용자에게 제공할 수 있다.
도 4는 저장부(440)가 제어부(470)와 별도로 구비된 실시 예를 도시하고 있으나, 본 발명은 이에 한정되지 않는다. 다시 말해, 저장부(440)는 제어부(470) 내에 포함될 수도 있다.
사용자 입력 인터페이스부(450)는, 사용자가 입력한 신호를 제어부(470)로 전달하거나 제어부(470)의 신호를 사용자에게 전달한다.
예를 들어, 사용자 입력 인터페이스부(450)는, RF 통신 방식, 적외선(IR) 통신 방식 등 다양한 통신 방식에 따라, 원격제어 디바이스(500)로부터 전원 온/오프, 채널 선택, 화면 설정 등의 제어 신호를 수신하여 처리하거나, 제어부(470)의 제어 신호를 원격제어 디바이스(500)로 송신하도록 처리할 수 있다.
또한, 사용자 입력 인터페이스부(450)는, 전원 키, 채널 키, 볼륨 키, 설정치 등의 로컬 키(미도시)에서 입력되는 제어 신호를 제어부(470)에 전달할 수 있다.
사용자 입력 인터페이스부(450)는, 사용자의 제스처(gesture)를 센싱(sensing)하는 센싱부(미도시)로부터 입력되는 제어 신호를 제어부(470)에 전달하거나, 제어부(470)의 신호를 센싱부(미도시)로 송신할 수 있다. 여기서, 센싱부(미도시)는, 터치 센서, 음성 센서, 위치 센서, 동작 센서 등을 포함할 수 있다.
제어부(470)는, 튜너(410), 복조부(420) 또는 외부 디바이스 인터페이스부(435)를 통하여 입력되는 스트림을 역다중화하거나 역다중화된 신호들을 처리하여, 영상 또는 음성 출력을 위한 신호를 생성 및 출력할 수 있다.
제어부(470)에서 처리된 영상 신호는, 디스플레이부(480)로 입력되어 해당 영상 신호에 대응하는 영상으로 표시될 수 있다. 또한, 제어부(470)에서 영상 처리된 영상 신호는 외부 디바이스 인터페이스부(435)를 통하여 외부 출력 디바이스로 입력될 수 있다.
제어부(470)에서 처리된 음성 신호는 오디오 출력부(485)로 오디오 출력될 수 있다. 또한, 제어부(470)에서 처리된 음성 신호는 외부 디바이스 인터페이스부(435)를 통하여 외부 출력 디바이스로 입력될 수 있다.
도 4에서는 도시되어 있지 않으나, 제어부(470)는 역다중화부, 영상 처리부 등을 포함할 수 있다.
제어부(470)는, 디지털 디바이스(400)의 전반적인 동작을 제어할 수 있다. 예를 들어, 제어부(470)는, 튜너(410)를 제어하여, 사용자가 선택한 채널 또는 기 저장된 채널에 해당하는 RF 방송을 튜닝(tuning)하도록 제어할 수 있다.
제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 입력된 사용자 명령 또는 내부 프로그램에 의하여 디지털 디바이스(400)를 제어할 수 있다. 특히, 네트워크에 접속하여 사용자가 원하는 애플리케이션 또는 애플리케이션 목록을 디지털 디바이스(400) 내로 다운로드 받을 수 있도록 할 수 있다.
예를 들어, 제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 수신한 소정 채널 선택 명령에 따라 선택한 채널의 신호가 입력되도록 튜너(410)를 제어한다. 그리고 선택한 채널의 영상, 음성 또는 데이터 신호를 처리한다. 제어부(470)는, 사용자가 선택한 채널 정보 등이 처리한 영상 또는 음성신호와 함께 디스플레이부(480) 또는 오디오 출력부(485)를 통하여 출력될 수 있도록 한다.
다른 예로, 제어부(470)는, 사용자 입력 인터페이스부(450)를 통하여 수신한 외부 디바이스 영상 재생 명령에 따라, 외부 디바이스 인터페이스부(435)를 통하여 입력되는 외부 디바이스, 예를 들어, 카메라 또는 캠코더로부터의, 영상 신호 또는 음성 신호가 디스플레이부(480) 또는 오디오 출력부(485)를 통해 출력될 수 있도록 한다.
한편, 제어부(470)는, 영상을 표시하도록 디스플레이부(480)를 제어할 수 있다. 예를 들어, 튜너(410)를 통해 입력되는 방송 영상, 또는 외부 디바이스 인터페이스부(435)를 통해 입력되는 외부 입력 영상, 또는 네트워크 인터페이스부를 통해 입력되는 영상, 또는 저장부(440)에 저장된 영상을, 디스플레이부(480)에 표시하도록 제어할 수 있다. 이때, 디스플레이부(480)에 표시되는 영상은, 정지영상 또는 동영상일 수 있으며, 2D 영상 또는 3D 영상일 수 있다.
또한, 제어부(470)는, 컨텐트를 재생하도록 제어할 수 있다. 이때의 컨텐트는, 디지털 디바이스(400) 내에 저장된 컨텐트, 또는 수신된 방송 컨텐트, 외부로부터 입력되는 외부 입력 컨텐트일 수 있다. 컨텐트는, 방송 영상, 외부 입력 영상, 오디오 파일, 정지 영상, 접속된 웹 화면, 및 문서 파일 중 적어도 하나일 수 있다.
한편, 제어부(470)는, 애플리케이션 보기 항목에 진입하는 경우, 디지털 디바이스(300) 내 또는 외부 네트워크로부터 다운로드 가능한 애플리케이션 또는 애플리케이션 목록을 표시하도록 제어할 수 있다.
제어부(470)는, 다양한 사용자 인터페이스와 더불어, 외부 네트워크로부터 다운로드 되는 애플리케이션을 설치 및 구동하도록 제어할 수 있다. 또한, 사용자의 선택에 의해, 실행되는 애플리케이션에 관련된 영상이 디스플레이부(480)에 표시 되도록 제어할 수 있다.
한편, 도면에 도시하지 않았지만, 채널 신호 또는 외부 입력 신호에 대응하는 썸네일 이미지를 생성하는 채널 브라우징 처리부가 더 구비되는 것도 가능하다.
채널 브라우징 처리부는, 복조부(320)에서 출력한 스트림 신호(TS) 또는 외부 디바이스 인터페이스부(335)에서 출력한 스트림 신호 등을 입력받아, 입력되는 스트림 신호로부터 영상을 추출하여 썸네일 영상을 생성할 수 있다. 생성된 썸네일 영상은 그대로 또는 부호화되어 제어부(470)로 입력될 수 있다. 또한, 생성된 썸네일 영상은 스트림 형태로 부호화되어 제어부(470)로 입력되는 것도 가능하다. 제어부(470)는 입력된 썸네일 영상을 이용하여 복수의 썸네일 영상을 구비하는 썸네일 리스트를 디스플레이부(480)에 표시할 수 있다. 한편, 이러한 썸네일 리스트 내의 썸네일 영상들은 차례로 또는 동시에 업데이트 될 수 있다. 이에 따라 사용자는 복수의 방송 채널의 내용을 간편하게 파악할 수 있게 된다.
디스플레이부(480)는, 제어부(470)에서 처리된 영상 신호, 데이터 신호, OSD 신호 또는 외부 디바이스 인터페이스부(435)에서 수신되는 영상 신호, 데이터 신호 등을 각각 R, G, B 신호로 변환하여 구동 신호를 생성한다.
디스플레이부(480)는 PDP, LCD, OLED, 플렉시블 디스플레이(flexible display), 3차원 디스플레이(3D display) 등이 가능할 수 있다.
한편, 디스플레이부(480)는, 터치 스크린으로 구성되어 출력 디바이스 이외에 입력 디바이스로 사용되는 것도 가능하다.
오디오 출력부(485)는, 제어부(470)에서 음성 처리된 신호, 예를 들어, 스테레오 신호, 3.1 채널 신호 또는 5.1 채널 신호를 입력받아 음성으로 출력한다. 음성 출력부(485)는 다양한 형태의 스피커로 구현될 수 있다.
한편, 사용자의 제스처를 감지하기 위해, 상술한 바와 같이, 터치 센서, 음성 센서, 위치 센서, 동작 센서 중 적어도 하나를 구비하는 센싱부(미도시)가 디지털 디바이스(400)에 더 구비될 수 있다. 센싱부(미도시)에서 감지된 신호는 사용자입력 인터페이스부(450)를 통해 제어부(3470)로 전달될 수 있다.
한편, 사용자를 촬영하는 촬영부(미도시)가 더 구비될 수 있다. 촬영부(미도시)에서 촬영된 영상 정보는 제어부(470)에 입력될 수 있다.
제어부(470)는, 촬영부(미도시)로부터 촬영된 영상, 또는 센싱부(미도시)로부터의 감지된 신호를 각각 또는 조합하여 사용자의 제스처를 감지할 수도 있다.
전원 공급부(490)는, 디지털 디바이스(400) 전반에 걸쳐 해당 전원을 공급한다.
특히, 시스템 온 칩(System on Chip; SoC)의 형태로 구현될 수 있는 제어부(470)와, 영상 표시를 위한 디스플레이부(480), 및 오디오 출력을 위한 오디오 출력부(485)에 전원을 공급할 수 있다.
이를 위해, 전원 공급부(490)는, 교류 전원을 직류 전원으로 변환하는 컨버터(미도시)를 구비할 수 있다. 한편, 예를 들어, 디스플레이부(480)가 다수의 백라이트 램프(backlight lamp)를 구비하는 액정 패널로서 구현되는 경우, 휘도 가변 또는 디밍(dimming) 구동을 위해, PWM(Pulse Width Modulation) 동작 가능한 인버터(inverter)(미도시)를 더 구비할 수도 있다.
원격제어 디바이스(500)는, 사용자 입력을 사용자입력 인터페이스부(450)로 송신한다. 이를 위해, 원격제어 디바이스(500)는, 블루투스(Bluetooth), RF(Radio Frequency) 통신, 적외선(IR) 통신, UWB(Ultra Wideband), 지그비(ZigBee) 방식 등을 사용할 수 있다.
또한, 원격제어 디바이스(500)는, 사용자입력 인터페이스부(450)에서 출력한 영상, 음성 또는 데이터 신호 등을 수신하여, 이를 원격제어 디바이스(500)에서 표시하거나 음성 또는 진동을 출력할 수 있다.
상술한 디지털 디바이스(400)는, 고정형 또는 이동형의 ATSC 방식 또는 DVB 방식의 디지털 방송 신호의 처리가 가능한 디지털 방송 수신기일 수 있다.
그 밖에 본 발명에 따른 디지털 디바이스는 도시된 구성 중 필요에 따라 일부 구성을 생략하거나 반대로 도시되진 않은 구성을 더 포함할 수도 있다. 한편, 디지털 디바이스는 상술한 바와 달리, 튜너와 복조부를 구비하지 않고, 네트워크 인터페이스부 또는 외부 디바이스 인터페이스부를 통해서 컨텐트를 수신하여 재생할 수도 있다.
도 5는 본 발명의 일 실시 예에 따라 도 2 내지 4의 제어부의 상세 구성을 설명하기 위해 도시한 구성 블록도이다.
제어부의 일 예는, 역다중화부(510), 영상 처리부(520), OSD 생성부(540), 믹서(mixer)(550), 프레임 레이트 변환부(FRC: Frame Rate Converter)(555), 및 포맷터(formatter)(560)를 포함할 수 있다. 그 외 상기 제어부는 도시되진 않았으나 음성 처리부와 데이터 처리부를 더 포함할 수 있다.
역다중화부(510)는, 입력되는 스트림을 역다중화한다. 예를 들어, 역다중화부(510)는 입력되는 MPEG-2 TS 영상, 음성 및 데이터 신호로 역다중화할 수 있다. 여기서, 역다중화부(510)에 입력되는 스트림 신호는, 튜너 또는 복조부 또는 외부디바이스 인터페이스부에서 출력되는 스트림 신호일 수 있다.
영상 처리부(420)는, 역다중화된 영상 신호의 영상 처리를 수행한다. 이를 위해, 영상 처리부(420)는, 영상 디코더(425) 및 스케일러(435)를 구비할 수 있다.
영상 디코더(425)는 역다중화된 영상 신호를 복호하며, 스케일러(435)는 복호된 영상 신호의 해상도를 디스플레이부에서 출력 가능하도록 스케일링(scaling)한다.
영상 디코더(525)는 다양한 규격을 지원할 수 있다. 예를 들어, 영상 디코더(525)는 영상 신호가 MPEG-2 규격으로 부호화된 경우에는 MPEG-2 디코더의 기능을 수행하고, 영상 신호가 DMB(Digital Multimedia Broadcasting) 방식 또는 H.264 규격으로 부호화된 경우에는 H.264 디코더의 기능을 수행할 수 있다.
한편, 영상 처리부(520)에서 복호된 영상 신호는, 믹서(450)로 입력된다.
OSD 생성부(540)는, 사용자 입력에 따라 또는 자체적으로 OSD 데이터를 생성한다. 예를 들어, OSD 생성부(440)는 사용자입력 인터페이스부의 제어 신호에 기초하여 디스플레이부(380)의 화면에 각종 데이터를 그래픽(Graphic)이나 텍스트(Text) 형태로 표시하기 위한 데이터를 생성한다. 생성되는 OSD 데이터는, 디지털 디바이스의 사용자 인터페이스 화면, 다양한 메뉴 화면, 위젯(widget), 아이콘(icon), 시청률 정보(viewing rate information) 등의 다양한 데이터를 포함한다. OSD 생성부(540)는, 방송 영상의 자막 또는 EPG에 기반한 방송 정보를 표시하기 위한 데이터를 생성할 수도 있다.
믹서(550)는, OSD 생성부(540)에서 생성된 OSD 데이터와 영상 처리부에서 영상 처리된 영상 신호를 믹싱(mixing)하여 포맷터(560)로 제공한다. 복호된 영상 신호와 OSD 데이터가 믹싱됨으로 인하여, 방송 영상 또는 외부 입력 영상 상에 OSD가 오버레이(overlay) 되어 표시된다.
프레임 레이트 변환부(FRC)(555)는, 입력되는 영상의 프레임 레이트(frame rate)를 변환한다. 예를 들어, 프레임 레이트 변환부(555)는 입력되는 60Hz 영상의 프레임 레이트를 디스플레이부의 출력 주파수에 따라 예를 들어, 120Hz 또는 240Hz의 프레임 레이트를 가지도록 변환할 수 있다. 상기와 같이, 프레임 레이트를 변환하는 방법에는 다양한 방법이 존재할 수 있다. 일 예로, 프레임 레이트 변환부(555)는 프레임 레이트를 60Hz에서 120Hz로 변환하는 경우, 제1 프레임과 제2 프레임 사이에 동일한 제1 프레임을 삽입하거나, 제1 프레임과 제2 프레임으로부터 예측된 제3 프레임을 삽입함으로써 변환할 수 있다. 다른 예로, 프레임 레이트 변환부(555)는 프레임 레이트를 60Hz에서 240Hz로 변환하는 경우, 기존 프레임 사이에 동일한 프레임 또는 예측된 프레임을 3개 더 삽입하여 변환할 수 있다. 한편, 별도의 프레임 변환을 수행하지 않는 경우에는 프레임 레이트 변환부(555)를 바이패스(bypass) 할 수도 있다.
포맷터(560)는, 입력되는 프레임 레이트 변환부(555)의 출력을 디스플레이부의 출력 포맷에 맞게 변경한다. 예를 들어, 포맷터(560)는 R, G, B 데이터 신호를 출력할 수 있으며, 이러한 R, G, B 데이터 신호는, 낮은 전압 차분 신호(LVDS: Low voltage differential signal) 또는 mini-LVDS로 출력될 수 있다. 또한, 포맷터(560)는 입력되는 프레임 레이트 변환부(555)의 출력이 3D 영상 신호인 경우에는 디스플레이부의 출력 포맷에 맞게 3D 형태로 구성하여 출력함으로써, 상기 디스플레이부를 통해 3D 서비스를 지원할 수도 있다.
한편, 제어부 내 음성 처리부(미도시)는, 역다중화된 음성 신호의 음성 처리를 수행할 수 있다. 이러한 음성 처리부(미도시)는 다양한 오디오 포맷을 처리하도록 지원할 수 있다. 일 예로, 음성 신호가 MPEG-2, MPEG-4, AAC, HE-AAC, AC-3, BSAC 등의 포맷으로 부호화된 경우에도 이에 대응되는 디코더를 구비하여 처리할 수 있다.
또한, 제어부 내 음성 처리부(미도시)는, 베이스(Base), 트레블(Treble), 음량 조절 등을 처리할 수 있다.
제어부 내 데이터 처리부(미도시)는, 역다중화된 데이터 신호의 데이터 처리를 수행할 수 있다. 예를 들어, 데이터 처리부는 역다중화된 데이터 신호가 부호화된 경우에도 이를 복호할 수 있다. 여기서, 부호화된 데이터 신호로는, 각 채널에서 방영되는 방송 프로그램의 시작시각, 종료시각 등의 방송 정보가 포함된 EPG 정보일 수 있다.
한편, 상술한 디지털 디바이스는 본 발명에 따른 예시로서, 각 구성요소는 실제 구현되는 디지털 디바이스의 사양에 따라 통합, 추가, 또는 생략될 수 있다. 즉, 필요에 따라, 2 이상의 구성요소가 하나의 구성요소로 합쳐지거나 하나의 구성요소가 2 이상의 구성요소로 세분화될 수 있다. 또한, 각 블록에서 수행하는 기능은 본 발명의 실시 예를 설명하기 위한 것이며, 그 구체적인 동작이나 디바이스는 본 발명의 권리범위를 제한하지 아니한다.
한편, 디지털 디바이스는, 디바이스 내에 저장된 영상 또는 입력되는 영상의 신호 처리를 수행하는 영상신호 처리디바이스일 수 있다. 영상신호 처리디바이스의 다른 예로는, 도 4에서 도시된 디스플레이부(480)와 오디오 출력부(485)가 제외된 셋톱-박스(STB), 상술한 DVD 플레이어, 블루-레이 플레이어, 게임 디바이스, 컴퓨터 등이 더 예시될 수 있다.
도 6은 본 발명의 일 실시 예에 따른 도 2 내지 4의 디지털 디바이스와 연결된 입력 수단을 도시한 도면이다.
디지털 디바이스(600)를 제어하기 위해 상기 디지털 디바이스(600) 상에 구비된 프론트 패널(front panel)(미도시)이나 제어 수단(입력 수단)이 이용된다.
한편, 제어 수단은 유, 무선 통신 가능한 사용자 인터페이스 디바이스(UID; User Interface Device)로써, 주로 디지털 디바이스(600)의 제어 목적으로 구현된 리모컨(610), 키보드(630), 포인팅 디바이스(620), 터치패드(touch-pad) 등이 포함되나, 상기 디지털 디바이스(600)에 연결된 외부 입력 전용의 제어 수단 역시 포함될 수 있다. 그 밖에, 디지털 디바이스(600) 제어 목적이 아니나 모드 전환 등을 통해 상기 디지털 디바이스(600)를 제어하는 스마트 폰, 태블릿 PC 등 모바일 디바이스 등도 제어 수단에 포함된다. 다만, 본 명세서에서는 편의상 포인팅 디바이스(pointing device)를 일 실시 예로 하여 설명하나, 이에 한정되는 것은 아니다.
입력 수단은, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA, infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance), RS 등의 통신 프로토콜을 필요에 따라 적어도 하나 이상 채용하여 디지털 디바이스와 통신 가능하다.
리모컨(610)은, 디지털 디바이스(600) 제어를 위해 필요한 다양한 키 버튼들이 구비된 통상의 입력 수단을 말한다.
포인팅 디바이스(620)는, 자이로 센서(Gyro Sensor) 등을 탑재하여 사용자의 움직임, 압력, 회전 등에 기초하여 디지털 디바이스(600)의 화면상에 대응되는 포인터(pointer)를 구현하여 상기 디지털 디바이스(600)에 소정 제어 명령을 전달한다. 이러한 포인팅 디바이스(620)는, 매직 리모컨, 매직 컨트롤러 등 다양한 이름으로 명명될 수 있다.
키보드(630)는, 디지털 디바이스(600)가 종래 방송만을 제공하던 것을 넘어 지능형 통합 디지털 디바이스로서 웹 브라우저, 애플리케이션, SNS(Social Network Service) 등 다양한 서비스를 제공함에 따라 종래 리모컨(610)만으로는 제어가 쉽지 않아 이를 보완하여 PC의 키보드와 유사하게 구현하여 텍스트 등의 입력 편의를 도모하기 위해 구현되었다.
한편, 리모컨(610), 포인팅 디바이스(620), 키보드(630) 등 제어수단은, 필요에 따라 터치패드를 구비함으로써 텍스트 입력, 포인터 이동, 사진 내지 동영상의 확대/축소 등 더욱 편리하고 다양한 제어 목적에 이용할 수 있다.
본 명세서에서 설명하는 디지털 디바이스는, OS 및/또는 플랫폼(platform)으로 Web OS를 이용한다. 이하 Web OS 기반의 구성 내지 알고리즘 등 처리 과정은, 전술한 디지털 디바이스의 제어부 등에서 수행될 수 있다. 여기서, 상기 제어부는 전술한 도 2 내지 5에서의 제어부를 포함하여 광의의 개념으로 사용한다. 따라서, 이하에서는 디지털 디바이스 내 Web OS 기반의 또는 그와 관련된 서비스, 애플리케이션, 컨텐트 등의 처리를 위해 구성은 관련 소프트웨어(software), 펌웨어(firmware) 등을 포함한 하드웨어 내지 구성요소는 제어부(controller)로 명명하여 설명한다.
이러한 Web OS 기반 플랫폼은 예컨대, 루나-서비스 버스(Luna-service Bus)에 기반하여 서비스, 애플리케이션 등을 통합함으로써, 개발 독립성과 기능 확장성을 제고하기 위한 것으로, Web 애플리케이션 프레임워크에 기반하여 애플리케이션 개발 생산성도 높일 수 있다. 또한, Web OS 프로세스와 리소스 관리(resource management)를 통해 시스템 리소스(system resource) 등을 효율적으로 활용하여 멀티-태스킹(multi-tasking)도 지원할 수 있다.
한편, 본 명세서에서 기술하는 Web OS 플랫폼은 PC, TV, 셋톱박스(STB)와 같은 고정 디바이스뿐만 아니라 휴대폰, 스마트 폰, 태블릿 pc, 노트북, 웨어러블 디바이스(wearable device) 등과 같은 모바일 디바이스에서도 이용 가능하다.
디지털 디바이스를 위한 소프트웨어의 구조는, 종래 문제 해결과 시장에 의존적인 모놀리틱 구조(monolithic structure)로 멀티쓰레딩 기술(multi-threading)에 기반한 단일 프로세스(single process)와 클로우즈드 제품(closed product)으로 외부 응용에 어려움이 있었고, 그 이후 새로운 플랫폼 기반 개발을 지향하고 칩-셋(chip-set) 교체를 통한 비용 혁신과 UI 응용 및 외부 응용 개발 효율화를 추구하여 레이어링 및 콤포넌티제이션(layering & componentization)이 이루어져 3-레이어드 구조와 애드-온(add-on), 싱글 소스(single source) 제품, 오픈 애플리케이션(open application)을 위한 애드-온 구조를 가졌었다. 최근에는 더 나아가 소프트웨어 구조가 기능 단위의 모듈화 아키텍처(modulating architecture), 에코-시스템(echo-system)을 위한 Web 오픈 API(Web Open API (Application Programming Interface)) 제공, 게임 엔진(game engine)을 위한 네이티브 오픈 API(Native Open API) 등을 위한 모듈화 디자인이 이루어지고 있으며, 이에 따라 서비스 구조 기반의 멀티-프로세스 구조(multi-process structure)로 생성되고 있다.
도 7은 본 발명의 일 실시 예에 따른 Web OS 아키텍처를 설명하기 위해 도시한 도면이다.
도 7을 참조하여, Web OS 플랫폼의 아키텍처에 대해 설명하면, 다음과 같다.
상기 플랫폼은 크게 커널, 시스템 라이브러리(system library) 기반의 Web OS 코어 플랫폼(Web OS core platform), 애플리케이션, 서비스 등으로 구분할 수 있다.
Web OS 플랫폼의 아키텍처는, 레이어드 구조(layered structure)로 최하위의 레이어에는 OS, 다음 레이어에는 시스템 라이브러리(들) 그리고 최상위에는 애플리케이션들(applications)이 존재한다.
먼저, 최하위 레이어는, OS 레이어로 리눅스 커널(Linux Kernel)이 포함되어 상기 디지털 디바이스의 OS로 리눅스를 포함할 수 있다.
상기 OS 레이어 상위에는, BSP(Board Support Package)/HAL(Hardware Abstraction Layer) 레이어, Web OS 코어 모듈 레이어(Web OS core modules layer), 서비스 레이어(service layer), 루나-서비스 버스 레이어(Luna-Service Bus layer), 엔요 프레임워크/NDK(Native Developer’s Kit)/QT 레이어(Enyo framework/NDK/QT layer) 그리고 최상위 레이어에는 애플리케이션 레이어(Application layer)가 순차로 존재한다.
한편, 상술한 Web OS 레이어 구조 중 일부 레이어는 생략 가능하며, 복수의 레이어가 하나의 레이어화 되거나 반대로 하나의 레이어가 복수의 레이어 구조가 될 수도 있다.
상기 Web OS 코어 모듈 레이어는, 서피스 윈도우(surface window) 등을 관리하는 LSM(Luna Surface Manager), 애플리케이션의 실행과 수행 상태 등을 관리하는 SAM(System & Application Manage), 웹키트(WebKit)에 기반하여 웹 애플리케이션 등을 관리하는 WAM(Web Application Manager) 등을 포함할 수 있다.
상기 LSM은, 화면에 보이는 애플리케이션 윈도우(application window)를 관리한다. 상기 LSM은, 디스플레이 하드웨어(Display HW)를 관장하며, 애플리케이션들에게 필요한 내용을 렌더링(rendering)할 수 있는 버퍼(buffer)를 제공하며, 복수의 애플리케이션들이 렌더링한 결과를 합성(Composition)하여 화면에 출력할 수 있다.
상기 SAM은, 시스템과 애플리케이션의 여러 조건별 수행 폴리시(policy)를 관리한다.
한편, WAM은, Web OS는 웹 애플리케이션(Web App)을 기본 애플리케이션으로 볼 수 있는바, 엔요 프레임워크(Enyo Framework)에 기반한다.
애플리케이션의 서비스 사용은, 루나-서비스 버스(Luna-service Bus)를 통해 이루어지며, 신규로 서비스를 버스에 등록할 수 있고, 애플리케이션은 자신이 필요로 하는 서비스를 찾아서 사용할 수도 있다.
상기 서비스 레이어는, TV 서비스, Web OS 서비스 등 다양한 서비스 레벨(service level)의 서비스들이 포함될 수 있다. 한편, 상기 Web OS 서비스에는, 미디어 서버, Node.JS 등이 포함될 수 있으며 특히, Node.JS 서비스는 예컨대, 자바스크립트(javascript)를 지원한다.
Web OS 서비스는, 기능 로직(function logic)을 구현한 리눅스 프로세스(Linux process)로 버스를 통해 커뮤니케이션 할 수 있다. 이는 크게 네 파트로 구분될 수 있으며, TV 프로세스와 기존 TV로부터 Web OS에 미티그레이션(Migration)되거나 제조사 차별화 서비스인 서비스들, Web OS 공통 서비스와 자바스크립트로 개발되고 Node.js를 통해 사용되는 Node.js 서비스로 구성된다.
상기 애플리케이션 레이어는, TV 애플리케이션, 쇼케이스(showcase) 애플리케이션, 네이티브 애플리케이션(native application), Web 애플리케이션 등 디지털 디바이스에서 지원 가능한 모든 애플리케이션들을 포함할 수 있다.
Web OS 상의 애플리케이션은, 구현 방법에 따라 웹 애플리케이션(Web Application), PDK(Palm Development Kit) 애플리케이션, QML(Qt Meta Language or Qt Modeling Language) 애플리케이션 등으로 구분될 수 있다.
상기 웹 애플리케이션은, 웹키트 엔진(WebKit engine)에 기반하고, WAM 런타임(Runtime) 상에서 수행된다. 이러한 웹 애플리케이션은 엔요 프레임워크에 기반하거나, 일반 HTML5, CSS(Cascading Style Sheets), 자바스크립트 기반으로 개발되어 수행될 수 있다.
상기 PDK 애플리케이션은, 써드-파티(3rd-Party) 또는 외부 개발자를 위해 제공된 PDK에 기반하여 C/C++로 개발되는 네이티브 애플리케이션 등을 포함한다. 상기 PDK는, 게임 등 써드 파티가 네이티브 애플리케이션(C/C++)을 개발할 수 있도록 제공된 개발 라이브러리 및 도구 집합을 말한다. 예를 들어, PDK 애플리케이션은, 그 성능이 중요한 애플리케이션의 개발에 이용될 수 있다.
상기 QML 애플리케이션은, Qt 기반의 네이티브 애플리케이션으로, 카드 뷰(card view), 홈 대시보드(Home dashboard), 가상 키보드(virtual keyboard) 등 Web OS 플랫폼과 함께 제공되는 기본 애플리케이션 등을 포함한다. 여기서, QML은, C++ 대신 스크립트 형태의 마크-업 언어(mark-up language)이다.
한편, 상기에서, 네이티브 애플리케이션은, C/C++로 개발되고 컴파일(compile)되어 바이너리(binary) 형태로 수행되는 애플리케이션을 말하는 것으로, 이러한 네이티브 애플리케이션은 그 수행 속도가 빠른 장점이 있다.
도 8은 본 발명의 일 실시 예에 따른 Web OS 디바이스의 아키텍처를 설명하기 위해 도시한 도면이다.
도 8은 Web OS 디바이스의 런타임(Runtime)에 기반한 블록도로서, 이는 도 7의 레이어드 구조를 참조하여 이해할 수 있다.
이하, 도 7과 8을 참조하여 설명하면, 다음과 같다.
도 8을 참조하면, 시스템 OS(Linux)와 시스템 라이브러리들 상에 서비스들과 애플리케이션들 그리고 Web OS 코어 모듈들이 포함되고 그들 사이의 커뮤니케이션은 루나-서비스 버스를 통해 이루어질 수 있다.
이메일(e-mail), 연락처(contact), 캘린더(calendar) 등 HTML5, CSS, 자바스크립트(java script)에 기초한 Node.js 서비스들, 로깅(Logging), 백업(backup), 파일 노티파이(file notify), 데이터베이스(DB), 액티비티 매니저(activity manager), 시스템 폴리시(system policy), 오디오 데몬(AudioD: Audio Daemon), 업데이트(update), 미디어 서버(media server) 등과 같이 Web OS 서비스들, EPG(Electronic Program Guide), PVR(Personal Video Recorder), 데이터 방송(data broadcasting) 등과 같은 TV 서비스들, 음성 인식(voice recognition), 나우 온(Now on), 노티피케이션(Notification), 검색(search), ACR(Auto Content Recognition), CBOX(Contents List Broswer), wfdd, DMR, 리모트 애플리케이션(Remote Application), 다운로드, SDPIF(Sony Philips Digital Interface Format) 등과 같은 CP 서비스들, PDK 애플리케이션들, 브라우저(browser), QML 애플리케이션 등과 같은 네이티브 애플리케이션들 그리고, 엔요 프레임워크 기반의 UI 관련 TV 애플리케이션들과 Web 애플리케이션들은, 루나-서비스 버스를 통하여 전술한 SAM, WAM, LSM과 같은 Web OS 코어 모듈을 통해 처리가 이루어진다. 한편, 상기에서, TV 애플리케이션들과 Web 애플리케이션들은 반드시 엔요 프레임워크 기반 또는 UI 관련이 아닐 수도 있다.
CBOX는 TV에 연결된 USB, DLNA, 클라우드 등과 같은 외부 디바이스의 컨텐트에 대한 리스트와 메타데이터 등을 관리할 수 있다. 한편, CBOX는 USB, DMS, DVR, 클라우드 등과 같은 다양한 컨텐트 컨테이너들(content containers)의 컨텐트 리스팅을 통합된 뷰(View)로 출력할 수 있다. 또한, CBOX는 픽쳐, 음악, 비디오 등 다양한 타입들의 컨텐트 리스팅을 보여주고, 그 메타데이터를 관리할 수 있다. 그 밖에, CBOX는, 어태치된 저장장치(attached storage)의 컨텐츠를 리얼-타임(Real-time)으로 출력할 수 있다. 예컨대, CBOX는, USB 등의 저장 디바이스가 플러그-인되면, 해당 저장 디바이스의 컨텐츠 리스트를 즉시 출력할 수 있어야 한다. 이때, 상기 컨텐트 리스팅 처리를 위한 표준화된 방식을 정의할 수도 있다. 또한, CBOX는 다양한 연결 프로토콜을 수용할 수 있다.
SAM은, 모듈 복잡도의 개선 및 확장성을 제고하기 위한 것이다. 이는 예컨대, 기존 시스템 매니저(System Manager)는 시스템 UI, 윈도우 관리, 웹 애플리케이션 런타임, UX 상의 제약 조건 처리 등의 여러 기능을 하나의 프로세스에서 처리하여 구현 복잡도가 커 이를 해소하고자 주요 기능을 분리하고 기능 간 인터페이스를 명확히 함으로써 구현 복잡도를 낮춘다.
LSM은, 카드 뷰, 런처(launcher) 등 시스템 UX 구현이 독립적으로 개발 통합될 수 있도록 지원하고, 제품 요구사항 변경 등에 쉽게 대응할 수 있도록 지원한다. 한편, LSM은, 앱온앱 등과 같이 복수의 애플리케이션 화면을 합성하는 경우에 하드웨어 리소스(HW resource)를 최대한 활용하여 멀티-태스킹이 가능하도록 하는데, 멀티-윈도우(multi-window)와 21:9 등을 위한 윈도우 매니지먼트 메커니즘(window management mechanism)을 제공할 수 있다.
LSM은, QML에 기반하여 시스템 UI의 구현을 지원하며, 그 개발 생산성을 제고한다. QML UX는 MVC에 기반하여, 화면 레이아웃(Layout) 및 UI 컴포넌트를 쉽게 뷰를 구성할 수 있고, 사용자 입력을 처리하기 위한 코드를 쉽게 개발할 수도 있다. 한편, QML과 Web OS 컴포넌트 간의 인터페이스는 QML 확장 플러그-인을 통해 이루어지며, 애플리케이션의 그래픽 오퍼레이션(graphic operation)은 웨이랜드 프로토콜(wayland protocol), 루나 서비스 콜(luna-service call) 등에 기반할 수 있다.
LSM은 전술한 바와 같이, Luna Surface Manager의 약어로서, 애플리케이션 윈도우 컴포지터(Application Window Compositor)의 기능을 한다.
LSM은 독립적으로 개발된 애플리케이션, UI 컴포넌트 등을 화면에 합성하여 출력하도록 한다. 관련하여, 리센츠(Recents) 애플리케이션, 쇼케이스 애플리케이션, 런처 애플리케이션 등과 같은 컴포넌트(component)들이 각자 자신의 내용을 렌더링(rendering)하면, LSM은 컴포지터로서 출력 영역, 연동 방법 등에 대해 정의한다. 다시 말해, 컴포지터인 LSM은 그래픽 합성, 포커스 관리(focus management), 입력 이벤트(input event) 등을 처리한다. 이때, LSM은 입력 매니저(input manager)로부터 이벤트, 포커스 등을 수신하는데 이러한 입력 매니저로 리모트 컨트롤러, 마우스 & 키보드와 같은 HID, 조이스틱, 게임 패드, 애플리케이션 리모트, 펜 터치 등이 포함될 수 있다.
이와 같이, LSM은 멀티플 윈도우 모델(multiple window model)을 지원하는데 시스템 UI 성격으로 모든 애플리케이션에서 동시에 수행 가능하다. 관련하여, 런쳐, 리센츠, 세팅(setting), 노티피케이션, 시스템 키보드, 볼륨 UI, 검색, 핑거 제스쳐(finger gesture), 음성인식(Voice Recognition)(STT(Sound to Text), TTS(Text to Sound), NLP(Natural Language Processing) 등), 패턴 제스쳐(pattern gesture)(카메라, MRCU(Mobile Radio Control Unit)), 라이브 메뉴(Live menu), ACR(Auto Content Recognition) 등을 LSM이 지원할 수 있다.
도 9는 본 발명의 일 실시 예에 따른 Web OS 디바이스에서 그래픽 컴포지션 플로우를 설명하기 위해 도시한 도면이다.
도 9를 참조하면, 그래픽 컴포지션 처리는, UI 프로세스를 담당하는 웹 애플리케이션 매니저(910), 웹 프로세스를 담당하는 웹키트(Webkit)(920), LSM(930) 그리고 그래픽 매니저(GM: Graphic Manager)(940)를 통해 이루어질 수 있다.
웹 애플리케이션 매니저(910)에서 UI 프로세스로서 웹 애플리케이션 기반의 그래픽 데이터(또는 애플리케이션)가 생성이 되면, 생성된 그래픽 데이터가 풀-스크린 애플리케이션이 아니면 LSM(930)으로 전달한다. 한편, 웹 애플리케이션 매니저(910)는 UI 프로세스와 웹 프로세스 사이에 그래픽 매니징을 위한 GPU(Graphic Processing Unit) 메모리 공유를 위하여 웹키트(920)에서 생성된 애플리케이션을 수신하여 이를 상기와 같이 풀-스크린 애플리케이션이 아닌 경우에는 LSM(930)으로 전달한다. 상기에서 풀-스크린 애플리케이션인 경우에는, LSM(930)을 바이패스(bypass)할 수 있으며, 이 경우 직접 그래픽 매니저(940)로 전달될 수 있다.
LSM(930)은 수신되는 UI 애플리케이션을 웨이랜드 서피스를 거쳐 웨이랜드 컴포지터(Wayland Compositor)로 전송하고, 웨이랜드 컴포지터에서 이를 적절히 처리하여 그래픽 매니저로 전달한다. 이렇게 LSM(930)에서 전달되는 그래픽 데이터는 예컨대, 그래픽 매니저(940)의 LSM GM 서피스를 거쳐 그래픽 매니저 컴포지터를 전달된다.
한편, 풀-스크린 애플리케이션은 전술한 바와 같이, LSM(930)을 거치지 않고 바로 그래픽 매니저(940)로 전달이 되는데 이러한 애플리케이션은 WAM GM 서피스로 거쳐 그래픽 매니저 컴포지터에서 처리된다.
그래픽 매니저는 Web OS 디바이스 내의 모든 그래픽 데이터를 처리하는데, 전술한 LSM GM 서피스를 거친 데이터, WAM GM 서피스를 거친 데이터뿐 아니라 데이터 방송 애플리케이션(Data Broadcasting application), 캡션 애플리케이션(caption application) 등과 같이 GM 서피스를 거친 그래픽 데이터를 모두 수신하여 화면상에 적절히 출력되도록 처리한다. 여기서, GM 컴포지터의 기능은 전술한 컴포지터와 동일 또는 유사한 기능이다.
도 10은 본 발명의 일 실시 예에 따른 미디어 서버를 설명하기 위해 도시한 도면이고, 도 11은 본 발명의 일 실시 예에 따른 미디어 서버의 구성 블록도를 설명하기 위해 도시한 도면이고, 도 12는 본 발명의 일 실시 예에 따른 미디어 서버와 TV 서비스의 관계를 설명하기 위해 도시한 도면이다.
미디어 서버는, 디지털 디바이스 내 다양한 멀티미디어의 실행을 지원 및 필요한 리소스를 관리한다. 미디어 서버는, 미디어 플레이(media play)에 필요한 하드웨어 리소스를 효율적으로 사용할 수 있다. 예컨대, 미디어 서버는, 멀티미디어의 실행을 위해서는 오디오/비디오 하드웨어 리소스가 필요하며, 리소스 사용 현황을 관리하여 효율적으로 활용할 수 있다. 일반적으로 모바일 디바이스보다 큰 화면을 가진 고정 디바이스는, 멀티미디어 실행 시 하드웨어 리소스가 더 필요하고, 많은 데이터 양으로 인해 인코딩/디코딩 및 그래픽 데이터 전달 속도도 빨라야 한다. 한편, 미디어 서버는, 스트리밍, 파일 기반 재생 이외에, 브로드캐스팅(Broadcasting), 레코딩(Recording) 및 튜닝(Tuning) 태스크, 시청과 동시에 녹화를 한다거나, 영상 통화 시 송신자와 수신자 화면을 동시에 보여준다거나 하는 태스크 등을 처리할 수 있어야 한다. 다만, 미디어 서버는, 인코더, 디코더, 튜너, 디스플레이 엔진(display engine) 등 하드웨어 리소스가 칩-셋 단위로 제한이 있어, 동시에 여러 태스크를 실행하는 것이 어려워 예를 들어, 사용 시나리오를 제약하거나 사용자 선택을 입력 받아 처리한다.
미디어 서버는, 시스템 안정성을 강화(robustness)할 수 있는데 이는 예컨대, 미디어 재생 중 에러(error)가 발생한 재생 파이프라인(pipeline)을 파이프라인별로 제거 가능하고 재 기동함으로써, 상기와 같이 에러가 발생하는 경우에도 다른 미디어 플레이에 영향을 주지 않을 수 있다. 이러한 파이프라인은, 미디어 재생 요청 시, 디코딩, 분석, 출력 등 각 단위 기능들을 연결한 체인(chain)으로, 미디어 타입(media type) 등에 따라, 필요 단위 기능들이 달라질 수 있다.
미디어 서버는, 확장성(extensibility)를 가질 수 있는데 예컨대, 새로운 타입의 파이프라인을 기존 구현 방식에 영향을 주지 않고 추가할 수 있다. 일 예로, 미디어 서버는, 카메라 파이프라인, 화상 회의(Skype) 파이프라인, 써드-파티 파이프라인 등을 수용할 수 있다.
미디어 서버는, 일반 미디어 재생과 TV 태스크 실행을 별개의 서비스로 처리할 수 있는데, 이는 TV 서비스의 인터페이스가 미디어 재생 경우와는 다르기 때문이다. 상기에서, 미디어 서버는, TV 서비스와 관련하여 ‘setchannel’, ‘channelup’, ‘channeldown’, ‘channeltuning’, ‘recordstart’ 등의 오퍼레이션을 지원하고, 일반 미디어 재생과 관련하여 ‘play’, ‘pause’, ‘stop’ 등의 오퍼레이션을 지원하여 양자에 대해 서로 다른 오퍼레이션을 지원하고, 별개의 서비스로 처리할 수 있다.
미디어 서버는 자원 관리 기능을 통제 또는 통합 관리할 수 있다. 디바이스 내 하드웨어 리소스 할당, 회수 등은, 미디어 서버에서 통합적으로 이루어지며 특히, TV 서비스 프로세스는 실행 중인 태스크와 리소스 할당 현황 등을 미디어 서버로 전달한다. 미디어 서버는, 각 미디어가 실행될 때마다 리소스를 확보하고 파이프라인이 실행되며, 각 파이프라인이 점유한 리소스 현황에 기반하여, 미디어 실행 요청 시 우선 순위(예를 들어, 폴리시)에 의한 실행 허용 및 다른 파이프라인의 리소스 회수 등을 수행한다. 여기서, 미리 정의된 실행 우선 순위와 특정 요청에 대한 필요 리소스 정보가 폴리시 매니저(policy manager)에 의해 관리되고, 리소스 매니저는 상기 폴리시 매니저와 커뮤니케이션하여 리소스 할당, 회수 등을 처리할 수 있다.
미디어 서버는 재생 관련 모든 오퍼레이션에 관한 식별 인자(ID: identifier)를 보유할 수 있다. 예컨대, 미디어 서버는 식별자에 근거하여 특정 파이프라인을 지시하여 명령을 내릴 수 있다. 미디어 서버는, 둘 이상의 미디어 재생을 위하여, 파이프라인들에 둘을 구분하여 명령을 내릴 수 있다.
미디어 서버는 HTML 5 표준 미디어의 재생을 담당할 수 있다.
그 밖에, 미디어 서버는 TV 파이프라인의 별도 서비스 프로세스화는 TV 재구조화 범위에 따를 수 있다. 미디어 서버는, TV 재구조화 범위와 무관하게 설계 구현될 수 있는데, TV가 별도 서비스 프로세스화가 되지 않으면, 특정 태스크에 문제가 생길 때 TV 전체를 재실행해야 할 수도 있다.
미디어 서버는, uMS 즉, 마이크로 미디어 서버(micro media server)라고도 한다. 여기서, 미디어 플레이어(media player)가 미디어 클라이언트(media client)인데, 이는 예컨대, HTML5 비디오 태그(video tag), 카메라(Camera), TV, 스카이프(Skype), 세컨드 스크린(2nd Screen) 등을 위한 웹키트(Webkit)을 의미할 수 있다.
미디어 서버는, 리소스 매니저(resource manager), 폴리시 매니저(policy manager) 등과 같은 마이크로 리소스(micro resource)의 관리가 핵심 기능이다. 관련하여, 미디어 서버는, 웹 표준 미디어 컨텐트에 대한 재생(playback) 제어 역할도 제어한다. 이와 관련하여, 미디어 서버는 파이프라인 컨트롤러 리소스(pipeline controller resource)도 관리할 수 있다.
이러한 미디어 서버는 예컨대, 확장성(extensibility), 신뢰성(reliability), 리소스의 효율적 사용(efficient resource usage) 등을 지원한다.
다시 말해, uMS 즉, 미디어 서버는, 클라우드 게임(cloud game), MVPD(pay service 등), 카메라 프리뷰(camera preview), 세컨드 스크린(2nd screen), 스카이프 등과 같은 리소스와 TV 리소스 등의 Web OS 디바이스 내에서 적절한 처리를 위한 리소스 사용을 전반적으로 관리하고 제어하여 효율적인 사용이 가능하도록 관리 제어하는 기능을 한다. 한편, 각 리소스는 그 이용 시에 예컨대, 파이프라인을 이용하는데 미디어 서버는 리소스 관리를 위한 파이프라인의 생성, 삭제, 이용 등을 전반적으로 관리 제어할 수 있다.
여기서, 파이프라인이라 함은 예컨대, 태스크(task)와 관련된 미디어가 요청(request), 디코딩 스트림(decoding stream), 비디오 출력(video output) 등의 파싱(parsing)과 같은 작업의 연속을 시작하면 생성될 수 있다. 예컨대, TV 서비스 내지 애플리케이션과 관련하여, 시청(watching), 녹화(recording), 채널 튜닝(channel tuning) 등은 각각 개별적으로 그 요청에 따라 생성된 파이프라인을 통하여 리소스 이용 등에 대해 제어를 받아 처리된다.
도 10을 참조하여, 미디어 서버의 처리 구조 등에 대해 더욱 상세하게 설명하면, 다음과 같다.
도 10에서는, 애플리케이션 또는 서비스는 미디어 서버(1020)와 루나-서비스 버스(1010)를 통해 연결되고, 상기 미디어 서버(1020)는 상기 루나-서비스 버스(1010)를 통해 다시 생성된 파이프라인들과 연결되고 관리한다.
애플리케이션 또는 서비스는 그 특성에 따라 다양한 클라이언트(client)를 구비하고 그를 통해 미디어 서버(1020) 또는 파이프라인과 데이터를 주고 받을 수 있다.
상기 클라이언트에는 예컨대, 미디어 서버(1020)와 연결을 위한 uMedia 클라이언트(웹키트)와 RM(resource manager) 클라이언트(C/C++) 등이 포함된다.
상기 uMedia 클라이언트를 포함한 애플리케이션은, 전술한 바와 같이, 미디어 서버(1020)와 연결된다. 더욱 상세하게는, uMedia 클라이언트는 예컨대, 후술할 비디오 오브젝트와 대응되고, 이러한 클라이언트는 요청 등에 의해 비디오의 동작을 위하여 미디어 서버(1020)를 이용한다.
여기서, 상기 비디오 동작은 비디오 상태에 관한 것으로, 로딩(loading), 언로딩(unloading), 재생(play, playback, or reproduce), 포즈(pause), 중단(stop) 등은 비디오 동작과 관련된 모든 상태 데이터를 포함할 수 있다. 이러한 비디오의 각 동작 내지 상태는 개별 파이프라인 생성을 통해 처리될 수 있다. 따라서, uMedia 클라이언트는 상기 비디오 동작과 관련된 상태 데이터를 미디어 서버 내 파이프라인 매니저(1022)로 전송한다.
파이프라인 매니저(1022)는, 리소스 매니저(1024)와 데이터 커뮤니케이션을 통해 현재 디바이스의 리소스에 대한 정보를 획득하고, 상기 uMedia 클라이언트의 상태 데이터에 대응되는 리소스의 할당을 요청한다. 이때, 파이프라인 매니저(1022) 또는 리소스 매니저(1024)는 상기 리소스 할당 등과 관련하여, 필요한 경우에 폴리시 매니저(1026)과 데이터 커뮤니케이션을 통해 리소스 할당에 대한 제어를 한다. 예컨대, 리소스 매니저(1024)에서 파이프라인 매니저(1022)의 요청에 따라 할당할 리소스가 없거나 부족한 경우에, 폴리시 매니저(1026)의 우선순위 비교 등에 따라 상기 요청에 따라 적절한 리소스 할당 등이 이루어지도록 할 수 있다.
한편, 파이프라인 매니저(1022)는, 상기 리소스 매니저(1024)의 리소스 할당에 따라 할당된 리소스에 대하여 상기 uMedia 클라이언트의 요청에 따른 동작을 위한 파이프라인 생성을 미디어 파이프라인 컨트롤러(1028)에 요청한다.
미디어 파이프라인 컨트롤러(1028)는 상기 파이프라인 매니저(1022)의 제어에 따라 필요한 파이프라인을 생성한다. 이렇게 생성된 파이프라인에는 도시된 바와 같이, 미디어 파이프라인, 카메라 파이프라인뿐만 아니라, 재생, 포즈, 중단 등과 관련된 파이프라인이 생성될 수 있다. 한편, 상기 파이프라인에는 HTML5, Web CP, 스마트쉐어(smartshare) 재생, 썸네일 추출, NDK, 시네마, MHEG(Multimedia and Hypermedia Information coding Experts Group) 등에 대한 파이프라인 등이 포함될 수 있다.
그 밖에, 파이프라인에는 예를 들어, 서비스 기반의 파이프라인(자체 파이프라인)과 URI 기반의 파이프라인(미디어 파이프라인)이 있을 수 있다.
도 10을 참조하면, RM 클라이언트를 포함한 애플리케이션 또는 서비스는 직접적으로 미디어 서버(1020)와 연결되지 않을 수 있다. 이는 애플리케이션 또는 서비스가 직접 미디어를 처리할 수도 있기 때문이다. 다시 말해, 애플리케이션 또는 서비스가 직접 미디어 처리하는 경우에는 미디어 서버를 통하지 않을 수 있다. 다만, 이때, 파이프라인 생성 및 그 이용을 위해 리소스 관리가 필요한바 이를 위해 uMS 커넥터가 기능한다. 한편, 상기 uMS 커넥터는 상기 애플리케이션 또는 서비스의 직접적인 미디어 처리를 위한 리소스 관리 요청이 수신되면, 리소스 매니저(1024)를 포함한 미디어 서버(1020) 통신한다. 이를 위하여 미디어 서버(1020) 역시 uMS 커넥터가 구비되어야 한다.
따라서, uMS 커넥터를 통해 리소스 매니저(1024)의 리소스 관리를 받아 애플리케이션 또는 서비스는 RM 클라이언트의 요청에 대응할 수 있다. 이러한 RM 클라이언트는 네이티브 CP, TV 서비스, 세컨드 스크린, 플래시 플레이어, 유투브 MSE(Medai Source Extensions), 클라우드 게임, 스카이프 등의 서비스를 처리할 수 있다. 이 경우, 전술한 바와 같이, 리소스 매니저(1024)는 리소스 관리에 필요한 경우에 폴리시 매니저(1026)와 적절하게 데이터 커뮤니케이션을 통해 리소스를 관리할 수 있다.
한편, URI 기반의 파이프라인은 전술한 RM 클라이언트와 같이 미디어를 직접 처리하는 경우가 아니라, 미디어 서버(1020)를 통해 이루어진다. 이러한 URI 기반 파이프라인에는, 플레이어 팩토리(player factory), G스트리머(Gstreamer), 스트리밍 플러그-인(streaming plug-in), DRM(Digital Rights Management) 플러그인 파이프라인 등이 포함될 수 있다.
한편, 애플리케이션과 미디어 서비스들 사이에 인터페이스 방법은 다음과 같을 수 있다.
웹 애플리케이션에서 서비스를 이용하여 인터페이스하는 방법이다. 이는 PSB(Palm Service Bridge)를 이용하여 루나 콜(Luna Call)하는 방법, 코르도바(Cordova)를 이용하는 방법인데 이는 디스플레이를 비디오 태그로 확장하는 것이다. 그 밖에, 비디오 태그나 미디어 엘리먼트(media element)에 관한 HTML5 표준을 이용하는 방법도 있을 수 있다.
그리고, PDK에서 서비스를 이용하여 인터페이스하는 방법이다.
또는, 기존 CP에서 서비스를 이용하는 방법이다. 이는 호환성(backward compatibility)를 위해 기존 플랫폼의 플러그-인을 루나 기반으로 확장하여 이용할 수 있다.
마지막으로, non-Web OS인 경우에 인터페이스하는 방법이다. 이 경우에는 직접 루나 버스를 호출하여 인터페이스할 수 있다.
씸리스 체인지(Seamless change)는 별도의 모듈(예를 들어, TVWIN)에 의해 처리되는데, 이는 Web OS 부팅 전 또는 부팅 동안에, Web OS 없이 TV를 화면에 먼저 보여주고 씸리스하게 처리하기 위한 프로세스이다. 이는 Web OS의 부팅 시간이 늦기 때문에 사용자의 파워 온(Power On) 요청에 빠른 응답을 위해 TV 서비스의 기본 기능을 우선 제공할 목적으로 이용된다. 또한, 상기 모듈은 TV 서비스 프로세스의 일부로, 빠른 부팅과 기본 TV 기능을 제공하는 씸리스 체인지, 공장 모드 등을 지원한다. 또한, 상기 모듈은, non-Web OS 모드에서 Web OS 모드로 전환도 담당할 수 있다.
도 11을 참조하면, 미디어 서버의 처리 구조를 도시하고 있다.
이때, 도 11에서, 실선 박스는 프로세스 처리 구성을 나타내고, 점선 박스는 프로세스 중 내부 처리 모듈을 나타낼 수 있다. 또한, 실선 화살표는 인터-프로세스 콜 즉, 루나 서비스 콜을 나타내고, 점선 화살표는 등록/알림(register/notify)와 같은 노티피케이션이나 데이터 플로우(data flow)를 나타낼 수 있다.
서비스 또는 웹 애플리케이션 또는 PDK 애플리케이션(이하 ‘애플리케이션’)은, 루나-서비스 버스를 통하여 각종 서비스 처리 구성들과 연결되고, 그를 통해 애플리케이션이 동작하거나 동작 제어된다.
애플리케이션의 타입에 따라 그 데이터 처리 경로는 달라진다. 예컨대, 애플리케이션이 카메라 센서와 관련된 이미지 데이터인 경우에는 카메라 처리부(1130)로 전송이 되어 처리된다. 이때, 카메라 처리부(1130)는 제스처(gesture), 안면 인식(face detection) 모듈 등을 포함하여 수신되는 애플리케이션의 이미지 데이터를 처리한다. 여기서, 카메라 처리부(1130)는 예컨대, 사용자의 선택이나 자동으로 파이프라인 등의 이용이 요구되는 데이터인 경우에는 미디어 서버 처리부(1110)를 통하여 파이프라인을 생성하여 해당 데이터를 처리할 수 있다.
또는, 애플리케이션이 오디오 데이터를 포함한 경우에는 오디오 처리부(AudioD)(1140)과 오디오 모듈(PulseAudio)(1150)을 통하여 해당 오디오를 처리할 수 있다. 예컨대, 오디오 처리부(1140)는 애플리케이션으로부터 수신되는 오디오 데이터를 처리하여 오디오 모듈(1150)로 전송한다. 이때, 오디오 처리부(1140)는 오디오 폴리시 매니저(audio policy manager)를 포함하여 오디오 데이터의 처리를 결정할 수 있다. 이렇게 처리된 오디오 데이터는 오디오 모듈(1160)에서 가공 처리된다. 한편, 상기 애플리케이션은, 오디오 데이터 처리와 관련된 데이터를 오디오 모듈(1160)로 노티피케이션할 수 있고, 이는 관련 파이프라인에서도 상기 오디오 모듈(1160)로 노피티케이션할 수 있다. 상기 오디오 모듈(1150)은 ALSA(Advanced Linux Sound Architecture)를 포함한다.
또는, 애플리케이션이 DRM이 걸려있는 컨텐트를 포함 또는 처리(이하 포함)하는 경우에는, 해당 컨텐트 데이터를 DRM 서비스 처리부(1160)로 전송하고, 상기 DRM 서비스 처리부(1170)는 DRM 인스턴스(instance)를 생성하여 DRM이 걸려 있는 컨텐트 데이터를 처리한다. 한편, DRM 서비스 처리부(1160)는 상기 DRM이 걸려 있는 컨텐트 데이터의 처리를 위하여, 미디어 파이프라인 내 DRM 파이프라인과 루나-서비스 버스를 통해 연결되어 처리할 수 있다.
이하에서는, 애플리케이션이 미디어 데이터이거나 TV 서비스 데이터(예컨대, 방송 데이터)인 경우의 처리에 관해 설명한다.
도 12는, 전술한 도 11에서 미디어 서버 처리부와 TV 서비스 처리부만을 더욱 상세하게 설명하기 위해 도시한 것이다.
따라서, 이하에서는, 도 11과 12를 함께 참고하여 설명한다.
먼저, 애플리케이션이 TV 서비스 데이터를 포함한 경우에는 TV 서비스 처리부(1120/1220)에서 처리된다.
여기서, TV 서비스 처리부(1120)는 예컨대, DVR/채널 매니저, 방송 모듈, TV 파이프라인 매니저, TV 리소스 매니저, 데이터 방송 모듈, 오디오 설정 모듈, 경로 매니저 등 중 적어도 하나 이상을 포함한다. 또는, 도 12에서 TV 서비스 처리부(1220)는, TV 방송 핸들러(TV broadcast handler), TV 방송 인터페이스부(TV Broadcast Interface), 서비스 처리부, TV 미들웨어(TV MW (middleware)), 경로 매니저, BSP(NetCast)를 포함할 수 있다. 여기서, 상기 서비스 처리부는 예를 들어, TV 파이프라인 매니저, TV 리소스 매니저, TV 폴리시 매니저, USM 커넥터 등을 포함한 모듈을 의미할 수 있다.
본 명세서에서, TV 서비스 처리부는, 도 11 또는 12와 같은 구성을 가지거나 양자의 조합으로 구현될 수 있으며, 상기에서 일부 구성은 생략되거나 도시되지 않은 일부 구성이 추가될 수도 있다.
TV 서비스 처리부(1120/1220)는 애플리케이션으로부터 수신된 TV 서비스 데이터의 속성 내지 타입에 기초하여, DVR이나 채널 관련 데이터인 경우에는 DVR/채널 매니저로 전송하고, 다시 TV 파이프라인 매니저로 전송하여 TV 파이프라인을 생성하여 처리한다. 한편, 상기 TV 서비스 데이터의 속성 내지 타입이 방송 컨텐트 데이터인 경우에는, TV 서비스 처리부(1120)는 방송 모듈을 거쳐 해당 데이터의 처리를 위하여 TV 파이프라인 매니저를 거쳐 TV 파이프라인을 생성하여 처리한다.
또는, json(Javascript standard object notation) 파일이나 c로 작성된 파일은 TV 방송 핸들러에서 처리되어 TV 방송 인터페이스부를 거쳐 TV 파이프라인 매니저로 전송하여 TV 파이프라인을 생성하여 처리한다. 이 경우, TV 방송 인터페이스부는 TV 방송 핸들러를 거친 데이터 또는 파일을 TV 서비스 폴리시에 기초하여 TV 파이프라인 매니저로 전송하여 파이프라인 생성시 참고할 수 있다.
한편, TV 파이프라인 매니저는, TV 서비스 내 처리 모듈 내지 매니저 등으로부터 TV 파이프라인 생성 요청에 따라 하나 또는 그 이상의 파이프라인 생성함에 있어서, TV 리소스 매니저의 제어를 받을 수 있다. 한편, TV 리소스 매니저는, TV 파이프라인 매니저의 TV 파이프라인 생성 요청에 따라 TV 서비스를 위해 할당된 리소스의 상태와 할당을 요청하기 위해, TV 폴리시 매니저의 제어를 받을 수 있으며, 미디어 서버 처리부(1110/1210)와 uMS 커넥터를 통해 데이터 커뮤니케이션을 한다. 미디어 서버 처리부(1110/1210) 내 리소스 매니저는 상기 TV 리소스 매니저의 요청에 따라 현재 TV 서비스를 위한 리소스의 상태와 할당 가부 등에 대해 전달한다. 예컨대, 미디어 서버 처리부(1110/1210) 내 리소스 매니저의 확인 결과 만약 TV 서비스를 위한 리소스가 이미 모두 할당된 경우에는, TV 리소스 매니저로 현재 모든 리소스가 할당 완료되었음을 노티파이할 수 있다. 이때, 미디어 서버 처리부 내 리소스 매니저는 상기 노티파이와 함께, TV 서비스를 위해 기할당된 TV 파이프라인들 중 우선순위나 소정 기준에 따라 소정 TV 파이프라인을 제거하고 요청된 TV 서비스를 위한 TV 파이프라인 생성을 요청 내지 할당할 수도 있다. 또는, TV 리소스 매니저에서 상기 미디어 서버 처리부(1110/1210) 내 리소스 매니저의 상태 보고에 따라 TV 리소스 매니저에서 적절히 TV 파이프라인을 제거, 추가, 신설 등 제어를 할 수 있다.
한편, BSP는 예컨대, 기존 디지털 디바이스와의 호환성(backward compatibility)를 지원한다.
이렇게 생성된 TV 파이프라인들은 그 처리 과정에서 경로 매니저의 제어에 따라 적절히 동작될 수 있다. 경로 매니저는 상기 처리 과정에서 TV 파이프라인만이 아니라 미디어 서버 처리부(1110/1210)에 의해 생성된 파이프라인의 동작까지 고려하여 파이프라인들의 처리 경로 내지 과정을 결정 내지 제어할 수 있다.
다음으로, 애플리케이션이 TV 서비스 데이터가 아니라 미디어 데이터를 포함한 경우에는, 미디어 서버 처리부(1110/1210)에서 처리된다. 여기서, 미디어 서버 처리부(1110/1210)는, 리소스 매니저, 폴리시 매니저, 미디어 파이프라인 매니저, 미디어 파이프라인 컨트롤러 등을 포함한다. 한편, 미디어 파이프라인 매니저와 미디어 파이프라인 컨트롤러의 제어에 따라 생성되는 파이프라인에는 카메라 프리뷰 파이프라인, 클라우드 게임 파이프라인, 미디어 파이프라인 등 다양하게 생성 가능하다. 한편, 미디어 파이프라인에는 스트리밍 프로토콜, 오토/스테이틱 gstreamer, DRM 등이 포함될 수 있는데, 이는 경로 매니저의 제어에 따라 그 처리 플로우가 결정될 수 있다. 상기 미디어 서버 처리부(1110/1210) 내 구체적인 처리 과정은 전술한 도 10의 설명을 원용하고, 여기서 중복 설명하지 않는다.
본 명세서에서 미디어 서버 처리부(1110/1210) 내 리소스 매니저는 예를 들어, 카운터 베이스로 리소스 매니징을 할 수 있다.
이하에서는 본 발명에 디지털 디바이스에 대해 다양한 실시예(들)을 첨부된 도면을 참조하여, 더욱 상세하게 설명한다.
도 13 및 도 14는 본 발명 이전에 디지털 디바이스에서 수행하는 AEC 기능에 대해 설명하기 위한 도면이다.
일반적인 AEC(Acoustic Echo Canceler)는 FET(Far-End Talker)가 발화한 음성이 스피커(Speaker)를 통과하여 마이크(Microphone)에 픽업(Pick-up)되어 전송되면 FET가 자신의 목소리를 듣게 되는데 이를 NET(Near-End Talker)의 시스템에서 레퍼런스 신호를 이용하여 ADF(Adaptive Filter)에서 제거하는 것이다. 일반적인 AEC로 사용되는 ADF의 종류는 LMS(Least Mean Square), NLMS(Normalized Least Mean Square), APA(Affine Projection Algorithm) 등 다양할 수 있다. 일반적으로 AEC는 ADF와 디시전 블록(Decision Block)(DTD : Dual Talk Detector), 제어 블록(Step Size Control, Filter Update Control), Residual Suppressor 등으로 구성된다.
본 발명 이전에 종래 AEC는 한 시스템 내에서 레퍼런스 신호를 버퍼링(Buffering)하여 동일 시스템에서 ADF를 이용하여 송신단의 에코(Echo)를 제거할 수 있다. 본 발명 이전의 AEC 중 타 시스템으로부터 레퍼런스 신호를 수신하여 다른 시스템에서 에코를 제거하는 시스템은 존재하지 않았다. 타 시스템의 스피커 소리를 제거하기 위해서는 마이크 신호만을 이용하여 노이즈 리덕션(Noise Reduction) 등의 방법을 사용해야 하는데, 이는 레퍼런스 신호를 이용하여 AEC 방법보다 잘 동작하기는 어려운 점이 있었다.
도 15는 본 발명의 다른 일 실시 예에 의한 디지털 디바이스의 구성 모듈을 상세히 도시한 블록도이다. 전술한 도 1 내지 14를 참조하여, 도 15의 디지털 디바이스의 모듈을 일부 추가하거나 변경 가능하며, 본 발명의 권리범위는 도 1 내지 도 15 등에 기재된 요소들로 결정되는 것이 아니라, 원칙적으로 특허청구범위에 기재된 사항에 따라 해석되어야 한다. 도 15에 도시된 바와 같이, 본 발명의 일 실시 예에 의한 디지털 디바이스(1500)는 커뮤니케이션 모듈(1510), 스토리지 모듈(1520) 및 컨트롤러(1530) 등을 포함하여 이루어진다.
커뮤니케이션 모듈(1510)은 중계기 및 외부 디바이스와 데이터 통신을 수행할 수 있다. 상기 커뮤니케이션 모듈(1510)은 유/무선 네트워크를 포함하는 다양한 통신 규격 내지 프로토콜을 지원하는 통신 네트워크를 통칭한다. 이러한 유/무선 네트워크는, 규격에 의해 현재 또는 향후 지원될 통신 네트워크를 모두 포함하며, 그를 위한 하나 또는 그 이상의 통신 프로토콜들을 모두 지원 가능하다. 이러한 유/무선 네트워크에는 예컨대, USB(Universal Serial Bus), CVBS(Composite Video Banking Sync), 컴포넌트(Component), S-비디오(아날로그), DVI(Digital Visual Interface), HDMI(High Definition Multimedia Interface), RGB, D-SUB와 같은 유선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜과, 블루투스(Bluetooth), RFID(Radio Frequency Identification), 적외선 통신(IrDA: infrared Data Association), UWB(Ultra Wideband), 지그비(ZigBee), DLNA(Digital Living Network Alliance), WLAN(Wireless LAN)(Wi-Fi), Wibro(Wireless broadband), Wimax(World Interoperability for Microwave Access), HSDPA(High Speed Downlink Packet Access), LTE/LTE-A(Long Term Evolution/LTE-Advanced), Wi-Fi 다이렉트(direct)와 같은 무선 연결을 위한 네트워크와 그를 위한 통신 규격 내지 프로토콜에 의하여 형성될 수 있다.
스토리지 모듈(1520)은 적어도 하나 이상의 오디오 레퍼런스 데이터를 저장할 수 있다. 상기 스토리지 모듈(1520)은 도 4에서 설명한 저장부(440)에 대응될 수 있다.
컨트롤러(1530)는 상기 커뮤니케이션 모듈(1510) 및 스토리지 모듈(1520) 등 도 15에 도시된 적어도 하나 이상의 모듈들의 기능을 전반적으로 관리하는 기능을 수행한다. 이와 관련하여, 이하 도 16 내지 22를 참조하여 더욱 상세히 후술하도록 하겠다.
도 16은 본 발명의 일 실시 예에 의한 디지털 디바이스 및 외부 디바이스가 동일한 중계기에 접속하여 데이터를 송/수신하는 일 예를 설명하기 위한 도면이다.
본 발명의 일 실시 예에 의한 디지털 디바이스(1610)의 컨트롤러는 중계기(1650)에 접속하고, 기 설정된 거리 이내에 위치하고 상기 중계기에 접속한 외부 디바이스(1620,1630,1640)를 감지하고, 상기 감지된 외부 디바이스(1620,1630,1640)로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하고, 상기 외부 디바이스(1620,1630,1640)에 상기 요청된 오디오 레퍼런스 데이터를 전송하도록 제어할 수 있다.
상기 중계기는 Wi-Fi(Wireless-fidelity) 공유기일 수 있다.
상기 기 설정된 거리는 Wi-Fi 신호의 크기(또는, 세기)가 기 설정된 정도 이상인 경우일 수 있다. 일례로, 상기 기 설정된 거리는 디지털 디바이스(1610)로부터의 거리 또는 중계기(1650)로부터의 거리를 의미할 수 있다.
상기 외부 디바이스는 가전 기기를 포함하고, 상기 가전 기기는 로봇 청소기, 냉장고, 세탁기 중 적어도 하나 수 있다.
상기 외부 디바이스는 음성인식 기능을 지원할 수 있다.
상기 외부 디바이스는 사용자로부터 기 설정된 음성인식 트리거 명령어가 입력되면, 즉, 기 설정된 음성인식 트리거 명령어가 수신되면, 상기 디지털 디바이스에 오디오 레퍼런스 데이터 송신 요청을 전송할 수 있다.
상기 오디오 레퍼런스 데이터는 방송 신호에 포함된 오디오 데이터 및 음악 컨텐츠에 포함된 오디오 데이터를 포함하고, 상기 오디오 레퍼런스 데이터는 상기 디지털 디바이스의 스피커를 통해 현재 출력되는 오디오 신호의 현재부터 기 설정된 구간까지의 오디오 데이터일 수 있다.
스피커를 포함하고 상기 중계기에 접속한 디지털 디바이스가 복수 개인 경우, 상기 중계기는 상기 복수 개의 디지털 디바이스 각각의 스피커를 통해 출력되는 오디오 레퍼런스 데이터를 동시에 상기 외부 디바이스에 전송할 수 있다.
상기 외부 디바이스는 상기 오디오 레퍼런스 데이터를 수신하면, AEC(Acoustic Echo Canceler) 기능을 수행할 수 있다.
도 16에 도시된 바와 같이, 본 발명의 일 실시 예에 의한 디지털 디바이스(1610)의 컨트롤러는, 중계기(1650)에 접속하고, 상기 중계기(1650)에 접속한 외부 디바이스(1620,1630,1640)를 감지하고, 상기 외부 디바이스(1620,1630,1640)로부터 오디오 레퍼런스 데이터 송신 요청을 수신하면 상기 외부 디바이스(1620,1630,1640)에 상기 요청된 오디오 레퍼런스 데이터를 전송하도록 제어할 수 있다.
이때, 상기 외부 디바이스(1620,1630,1640)는 상기 디지털 디바이스(1610)와 동일한 중계기에 접속하고, 기 설정된 신호 크기 이상의 데이터 통신 신호를 확보하고 있는 경우일 수 있다.
그리고, 상기 외부 디바이스(1620,1630,1640)는 상기 디지털 디바이스(1610)로부터 수신한 오디오 레퍼런스 데이터를 이용하여 AEC 기능을 수행할 수 있다.
도 16과 같이 설계함으로써, 홈 네트워크 시스템과 같은 시스템에서 다른 디바이스의 오디오 레퍼런스 데이터를 이용하여 AEC 기능을 수행함으로써, 근/원거리에서의 음성 인식률을 높이는 기술적 효과를 구현할 수 있다.
도 17 및 도 18은 본 발명의 일 실시 예에 의한 디지털 디바이스의 오디오 레퍼런스 데이터를 이용하여 음성 인식률을 높이는 일 예를 설명하기 위한 도면이다.
도 17에 도시된 바와 같이, 본 발명의 일 실시 예에 의한 디지털 디바이스(1700)는 실시간 방송 프로그램을 출력하고, 외부 디바이스(1710)와 동일한 중계기(1720)에 접속한 상황으로 가정하겠다.
도 18에 도시된 바와 같이, 사용자가 외부 디바이스(1710)를 음성으로 제어하기 위해 기 설정된 음성 인식 트리거 명령어를 발화하면, 상기 외부 디바이스(1710)는 상기 실시간 방송 프로그램을 출력하고 있는 디지털 디바이스(1700)에게 오디오 레퍼런스 데이터 전송 요청을 송신할 수 있다. 그리고, 상기 오디오 레퍼런스 데이터 전송 요청을 수신한 디지털 디바이스(1700)의 컨트롤러는, 상기 실시간 방송 프로그램의 방송 신호에 포함된 오디오 데이터를 추출하여 상기 외부 디바이스(1710)에 전송하도록 제어할 수 있다. 그리고, 상기 디지털 디바이스(1700)로부터 오디오 레퍼런스 데이터를 수신한 외부 디바이스(1710)는 상기 디지털 디바이스(1700)의 스피커에서 출력되는 오디오 신호와 싱크(Sync)를 맞추면서 AEC 기능을 수행할 수 있다. 따라서, 사용자는 본 발명 이전과 비교하였을 때 외부 디바이스(1710)를 제어하기 위한 음성 명령의 음성 인식률이 높아질 수 있는 장점이 있다.
도 19는 본 발명의 일 실시 예에 의한 디지털 디바이스가 외부 디바이스와 블루투스로 연결되어 데이터 통신을 수행하는 일 예를 설명하기 위한 도면이다.
도 19에 도시된 바와 같이, 본 발명의 일 실시 예에 의한 디지털 디바이스(1900)는 중계기를 통해서가 아닌 블루투스(Bluetooth)를 이용하여 외부 디바이스(1910)와 직접 페어링(Pairing)을 수행하여 데이터 통신을 수행할 수 있다. 사용자가 외부 디바이스(1910)를 음성으로 제어하기 위해 기 설정된 음성 인식 트리거 명령어를 발화하면, 상기 외부 디바이스(1910)는 상기 실시간 방송 프로그램을 출력하고 있는 디지털 디바이스(1900)에게 오디오 레퍼런스 데이터 전송 요청을 송신할 수 있다. 그리고, 상기 오디오 레퍼런스 데이터 전송 요청을 수신한 디지털 디바이스(1900)의 컨트롤러는, 상기 실시간 방송 프로그램의 방송 신호에 포함된 오디오 데이터를 추출하여 블루투스 방식으로 직접 상기 외부 디바이스(1910)에 전송하도록 제어할 수 있다. 그리고, 상기 디지털 디바이스(1900)로부터 오디오 레퍼런스 데이터를 수신한 외부 디바이스(1910)는 상기 디지털 디바이스(1900)의 스피커에서 출력되는 오디오 신호와 싱크(Sync)를 맞추면서 AEC 기능을 수행할 수 있다. 따라서, 데이터 통신 방법은 달라도 도 17과 마찬가지로 사용자는 본 발명 이전과 비교하였을 때 외부 디바이스(1910)를 제어하기 위한 음성 명령의 음성 인식률이 높아질 수 있는 장점이 있다.
도 20 및 도 21은 본 발명의 일 실시 예에 의한 디지털 디바이스가 복수 개인 경우 전체 오디오 레퍼런스 데이터를 외부 디바이스에 전송하는 일 예를 설명하기 위한 도면이다.
도 20에 도시된 바와 같이, 제1 디지털 디바이스, 제2 디지털 디바이스 및 제3 디지털 디바이스는 모두 오디오 신호를 출력하는 스피커를 포함하는 디지털 디바이스로서, 상기 제1 디지털 디바이스, 제2 디지털 디바이스 및 제3 디지털 디바이스 모두 동일한 중계기(2070)에 접속한 상태를 가정하겠다.
도 21에 도시된 바와 같이, 스피커를 포함하고 상기 중계기(2070)에 접속한 디지털 디바이스(2010,2020,2030)가 복수 개인 경우, 상기 중계기(2070)는 상기 복수 개의 디지털 디바이스(2010,2020,2030) 각각의 스피커를 통해 출력되는 오디오 레퍼런스 데이터를 동시에 외부 디바이스(2040,2050,2060)에 전송할 수 있다. 따라서, 사용자는 스피커를 포함하는 디지털 디바이스가 복수 개인 환경에서 외부 디바이스(2040,2050,2060)의 음성 인식 기능을 사용하는 경우에도, 각 스피커에서 출력되는 모든 오디오 레퍼런스 데이터를 반영하여 음성 인식률을 높이는 본 발명의 기술을 이용할 수 있는 장점이 있다.
도 22는 본 발명의 일 실시 예에 의한 디지털 디바이스의 제어 방법을 도시한 플로우 차트이다.
도 22에 도시된 바와 같이, 본 발명의 일 실시 예에 의한 디지털 디바이스의 제어 방법은, 중계기에 접속하는 단계(S2210), 기 설정된 거리 이내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하는 단계(S2220), 상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하는 단계(S2230) 및 상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하는 단계(S2240)를 포함하여 구현될 수 있다. 상기 각 단계에 대한 자세한 설명은 전술한 바와 같으므로, 반복 설명은 생략한다.
본 명세서에서 개시하는 디지털 디바이스는 상기 설명된 실시 예들의 구성과 방법이 한정되게 적용될 수 있는 것이 아니라, 상기 실시 예들은 다양한 변형이 이루어질 수 있도록 각 실시 예들의 전부 또는 일부가 선택적으로 조합되어 구성될 수도 있다.
본 명세서에서 개시된 디지털 디바이스의 동작방법은 디지털 디바이스에 구비된 프로세서가 읽을 수 있는 기록매체에 프로세서가 읽을 수 있는 코드로서 구현하는 것이 가능하다. 프로세서가 읽을 수 있는 기록매체는 프로세서에 의해 읽혀질 수 있는 데이터가 저장되는 모든 종류의 기록 디바이스를 포함한다. 프로세서가 읽을 수 있는 기록 매체의 예로는 ROM(Read Only Memory), RAM(Random Access Memory), CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장 디바이스 등이 있으며, 인터넷을 통한 전송 등과 같은 캐리어-웨이브(carrier-wave)의 형태로 구현되는 것도 포함한다. 또한, 프로세서가 읽을 수 있는 기록매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 프로세서가 읽을 수 있는 코드가 저장되고 실행될 수 있다.
한편, 본 명세서에서는 첨부된 도면을 참조하여 설명하였으나, 이는 실시 예일 뿐 특정 실시 예에 한정되지 아니하며, 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 변형실시가 가능한 다양한 내용도 청구범위에 따른 권리범위에 속한다. 또한, 그러한 변형실시들이 본 발명의 기술 사상으로부터 개별적으로 이해되어서는 안 된다.
본 발명은 디지털 디바이스 및 그 제어 방법에 관한 것으로 산업상 이용 가능성이 있다.
Claims (18)
- 디지털 디바이스의 제어 방법에 있어서,중계기에 접속하는 단계;상기 디지털 디바이스로부터 기 설정된 거리 내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하는 단계;상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하는 단계; 및상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하는 단계를 포함하여 이루어지는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 중계기는 Wi-Fi(Wireless-fidelity) 공유기인 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제2항에 있어서,상기 기 설정된 거리는 Wi-Fi 신호의 세기가 기 설정된 정도 이상인 경우임을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 외부 디바이스는 가전 기기를 포함하고, 상기 가전 기기는 로봇 청소기, 냉장고, 세탁기 중 적어도 하나를 포함하는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 외부 디바이스는 음성인식 기능을 지원하는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제5항에 있어서,상기 외부 디바이스는, 기 설정된 음성인식 트리거 명령어가 수신되면, 상기 디지털 디바이스에 오디오 레퍼런스 데이터 송신 요청을 전송하는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 오디오 레퍼런스 데이터는 방송 신호에 포함된 오디오 데이터 및 음악 컨텐츠에 포함된 오디오 데이터를 포함하고, 상기 오디오 레퍼런스 데이터는 상기 디지털 디바이스의 스피커를 통해 현재 출력되는 오디오 신호의 현재부터 기 설정된 구간까지의 오디오 데이터임을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 중계기에 접속한 디지털 디바이스가 복수 개이고 디지털 디바이스 각각이 스피커를 포함하는 경우, 상기 중계기는 상기 복수 개의 디지털 디바이스 각각의 스피커를 통해 출력되는 오디오 레퍼런스 데이터를 동시에 상기 외부 디바이스에 전송하는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 제1항에 있어서,상기 외부 디바이스는, 상기 오디오 레퍼런스 데이터가 수신되면, AEC(Acoustic Echo Canceler) 기능을 수행하는 것을 특징으로 하는 디지털 디바이스의 제어 방법.
- 디지털 디바이스에 있어서,중계기 및 외부 디바이스와 데이터 통신을 수행하는 커뮤니케이션 모듈(Communication module);오디오 레퍼런스 데이터를 저장하는 스토리지 모듈(Storage module); 및상기 디지털 디바이스의 작동을 제어하는 컨트롤러를 포함하고,상기 컨트롤러는, 중계기에 접속하고, 상기 디지털 디바이스로부터 기 설정된 거리 내에 위치하고 상기 중계기에 접속한 외부 디바이스를 감지하고, 상기 감지된 외부 디바이스로부터 오디오 레퍼런스(Audio Reference) 데이터 송신 요청을 수신하고, 상기 외부 디바이스에 상기 요청된 오디오 레퍼런스 데이터를 전송하도록 제어하는 것을 특징으로 하는 디지털 디바이스.
- 제10항에 있어서,상기 중계기는 WiFi(Wireless fidelity) 공유기임을 특징으로 하는 디지털 디바이스.
- 제11항에 있어서,상기 기 설정된 거리는 WiFi 신호의 세기가 기 설정된 정도 이상인 경우임을 특징으로 하는 디지털 디바이스.
- 제10항에 있어서,상기 외부 디바이스는 가전 기기를 포함하고, 상기 가전 기기는 로봇 청소기, 냉장고, 세탁기 중 적어도 하나를 포함하는 것을 특징으로 하는 디지털 디바이스.
- 제10항에 있어서,상기 외부 디바이스는 음성인식 기능을 지원하는 것을 특징으로 하는 디지털 디바이스.
- 제14 항에 있어서,상기 외부 디바이스는, 기 설정된 음성인식 트리거 명령어가 수신되면, 상기 디지털 디바이스에 오디오 레퍼런스 데이터 송신 요청을 전송하는 것을 특징으로 하는 디지털 디바이스.
- 제10항에 있어서,상기 오디오 레퍼런스 데이터는 방송 신호에 포함된 오디오 데이터 및 음악 컨텐츠에 포함된 오디오 데이터를 포함하고, 상기 오디오 레퍼런스 데이터는 상기 디지털 디바이스의 스피커를 통해 현재 출력되는 오디오 신호의 현재부터 기 설정된 구간까지의 오디오 데이터임을 특징으로 하는 디지털 디바이스.
- 제10항에 있어서,상기 중계기에 접속한 디지털 디바이스가 복수 개이고 디지털 디바이스 각각이 스피커를 포함하는 경우, 상기 중계기는 상기 복수 개의 디지털 디바이스 각각의 스피커를 통해 출력되는 오디오 레퍼런스 데이터를 동시에 상기 외부 디바이스에 전송하는 것을 특징으로 하는 디지털 디바이스.
- 제10 항에 있어서,상기 외부 디바이스는 상기 오디오 레퍼런스 데이터가 수신되면, AEC(Acoustic Echo Canceler) 기능을 수행하는 것을 특징으로 하는 디지털 디바이스.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US15/505,061 US10311866B2 (en) | 2014-08-21 | 2014-11-10 | Digital device and method for controlling same |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020140108898A KR20160023089A (ko) | 2014-08-21 | 2014-08-21 | 디지털 디바이스 및 그 제어 방법 |
KR10-2014-0108898 | 2014-08-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
WO2016027933A1 true WO2016027933A1 (ko) | 2016-02-25 |
Family
ID=55350863
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
PCT/KR2014/010746 WO2016027933A1 (ko) | 2014-08-21 | 2014-11-10 | 디지털 디바이스 및 그 제어 방법 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10311866B2 (ko) |
KR (1) | KR20160023089A (ko) |
WO (1) | WO2016027933A1 (ko) |
Cited By (92)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2018213415A1 (en) * | 2017-05-16 | 2018-11-22 | Apple Inc. | Far-field extension for digital assistant services |
CN109087662A (zh) * | 2018-10-25 | 2018-12-25 | 科大讯飞股份有限公司 | 一种回声消除方法及装置 |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11809783B2 (en) | 2016-06-11 | 2023-11-07 | Apple Inc. | Intelligent device arbitration and control |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US12010262B2 (en) | 2013-08-06 | 2024-06-11 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
US12021806B1 (en) | 2021-09-21 | 2024-06-25 | Apple Inc. | Intelligent message delivery |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9916839B1 (en) * | 2014-03-27 | 2018-03-13 | Amazon Technologies, Inc. | Shared audio functionality based on device grouping |
US10285227B2 (en) * | 2016-05-18 | 2019-05-07 | Avago Technologies International Sales Pte. Limited | Programmable and adaptable interface for dimming light emitting diodes |
WO2018006372A1 (zh) * | 2016-07-07 | 2018-01-11 | 深圳狗尾草智能科技有限公司 | 一种基于意图识别控制家电的方法、系统及机器人 |
KR102582494B1 (ko) * | 2016-12-09 | 2023-09-25 | 주식회사 케이티 | 오디오 컨텐츠를 분석하는 장치 및 방법 |
KR102320027B1 (ko) * | 2017-04-03 | 2021-11-01 | 주식회사 엘지유플러스 | 음성 전달 방법, 이를 구현하는 음성 전달 장치 및 이를 포함하는 시스템 |
JP6513749B2 (ja) * | 2017-08-09 | 2019-05-15 | レノボ・シンガポール・プライベート・リミテッド | 音声アシストシステム、サーバ装置、その音声アシスト方法、及びコンピュータが実行するためのプログラム |
US11151991B2 (en) * | 2018-03-30 | 2021-10-19 | Verizon Media Inc. | Electronic message transmission |
WO2020006699A1 (zh) * | 2018-07-04 | 2020-01-09 | 华为技术有限公司 | 语音处理的方法和装置 |
CN109192205B (zh) * | 2018-09-12 | 2021-05-04 | 深圳市酷搏创新科技有限公司 | 一种智能语音交互系统及其控制方法 |
US11040441B2 (en) * | 2018-09-20 | 2021-06-22 | Sony Group Corporation | Situation-aware robot |
US11606403B2 (en) * | 2019-04-22 | 2023-03-14 | Johnson Controls Tyco IP Holdings LLP | Systems and methods for echo management in conferencing over a network using mixed multicast |
KR20190092333A (ko) * | 2019-07-19 | 2019-08-07 | 엘지전자 주식회사 | 음성 인식 디바이스와 통신하는 장치, 음성 인식 능력을 가진 장치 및 음성 인식 능력을 가진 장치를 제어하는 방법 |
CN113715758B (zh) * | 2021-09-02 | 2024-04-16 | 潍柴动力股份有限公司 | 线束故障检测方法、装置及系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090066534A1 (en) * | 2007-09-07 | 2009-03-12 | Verizon Data Services Inc. | Network-based access and control of home automation systems |
US20120132057A1 (en) * | 2009-06-12 | 2012-05-31 | Ole Juul Kristensen | Generative Audio Matching Game System |
US20140012945A1 (en) * | 2007-10-12 | 2014-01-09 | Pie Digital, Inc. | System and method for automatic configuration and management of home network devices using a hierarchical index model |
EP2760024A1 (en) * | 2013-01-29 | 2014-07-30 | QNX Software Systems Limited | Noise estimation control system |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9489671B2 (en) * | 2002-10-01 | 2016-11-08 | Andrew H B Zhou | Systems and methods for mobile application, wearable application, transactional messaging, calling, digital multimedia capture and payment transactions |
US9219729B2 (en) * | 2004-05-19 | 2015-12-22 | Philip Drope | Multimedia network system with content importation, content exportation, and integrated content management |
US8676273B1 (en) * | 2007-08-24 | 2014-03-18 | Iwao Fujisaki | Communication device |
US8312660B1 (en) * | 2008-05-09 | 2012-11-20 | Iwao Fujisaki | Firearm |
US8369251B2 (en) * | 2008-06-20 | 2013-02-05 | Microsoft Corporation | Timestamp quality assessment for assuring acoustic echo canceller operability |
US8731940B2 (en) * | 2008-09-18 | 2014-05-20 | Koninklijke Philips N.V. | Method of controlling a system and signal processing system |
US8498749B2 (en) * | 2009-08-21 | 2013-07-30 | Allure Energy, Inc. | Method for zone based energy management system with scalable map interface |
WO2012036647A1 (ru) * | 2010-09-15 | 2012-03-22 | Panchenko Borys Evgenijovych | Способ автоматизированной цифровой многопрограммной мультисигнальной коммутации |
US8340975B1 (en) * | 2011-10-04 | 2012-12-25 | Theodore Alfred Rosenberger | Interactive speech recognition device and system for hands-free building control |
WO2013067526A1 (en) * | 2011-11-04 | 2013-05-10 | Remote TelePointer, LLC | Method and system for user interface for interactive devices using a mobile device |
KR101917126B1 (ko) * | 2012-12-12 | 2018-11-09 | 삼성전자주식회사 | 홈 네트워크 시스템에서 컨텐츠 재생 장치 및 방법 |
US9384754B2 (en) * | 2013-03-12 | 2016-07-05 | Comcast Cable Communications, Llc | Removal of audio noise |
US9812128B2 (en) * | 2014-10-09 | 2017-11-07 | Google Inc. | Device leadership negotiation among voice interface devices |
US9318107B1 (en) * | 2014-10-09 | 2016-04-19 | Google Inc. | Hotword detection on multiple devices |
-
2014
- 2014-08-21 KR KR1020140108898A patent/KR20160023089A/ko not_active Application Discontinuation
- 2014-11-10 US US15/505,061 patent/US10311866B2/en active Active
- 2014-11-10 WO PCT/KR2014/010746 patent/WO2016027933A1/ko active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090066534A1 (en) * | 2007-09-07 | 2009-03-12 | Verizon Data Services Inc. | Network-based access and control of home automation systems |
US20140012945A1 (en) * | 2007-10-12 | 2014-01-09 | Pie Digital, Inc. | System and method for automatic configuration and management of home network devices using a hierarchical index model |
US20120132057A1 (en) * | 2009-06-12 | 2012-05-31 | Ole Juul Kristensen | Generative Audio Matching Game System |
EP2760024A1 (en) * | 2013-01-29 | 2014-07-30 | QNX Software Systems Limited | Noise estimation control system |
Non-Patent Citations (1)
Title |
---|
DAVID QI: "Acoustic Echo Cancellation: Algorithms and Implementaion on the TMS320C8x''.", TEXAS INSTRUMENT, 31 May 1996 (1996-05-31), pages 1 - 2, Retrieved from the Internet <URL:http://www.ti.com/lit/an/spra063/spra063.pdf> * |
Cited By (149)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11928604B2 (en) | 2005-09-08 | 2024-03-12 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US11979836B2 (en) | 2007-04-03 | 2024-05-07 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US11671920B2 (en) | 2007-04-03 | 2023-06-06 | Apple Inc. | Method and system for operating a multifunction portable electronic device using voice-activation |
US11348582B2 (en) | 2008-10-02 | 2022-05-31 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11900936B2 (en) | 2008-10-02 | 2024-02-13 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US11423886B2 (en) | 2010-01-18 | 2022-08-23 | Apple Inc. | Task flow identification based on user intent |
US10741185B2 (en) | 2010-01-18 | 2020-08-11 | Apple Inc. | Intelligent automated assistant |
US12087308B2 (en) | 2010-01-18 | 2024-09-10 | Apple Inc. | Intelligent automated assistant |
US10692504B2 (en) | 2010-02-25 | 2020-06-23 | Apple Inc. | User profiling for voice input processing |
US11120372B2 (en) | 2011-06-03 | 2021-09-14 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US11321116B2 (en) | 2012-05-15 | 2022-05-03 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11269678B2 (en) | 2012-05-15 | 2022-03-08 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US11862186B2 (en) | 2013-02-07 | 2024-01-02 | Apple Inc. | Voice trigger for a digital assistant |
US10978090B2 (en) | 2013-02-07 | 2021-04-13 | Apple Inc. | Voice trigger for a digital assistant |
US12009007B2 (en) | 2013-02-07 | 2024-06-11 | Apple Inc. | Voice trigger for a digital assistant |
US11636869B2 (en) | 2013-02-07 | 2023-04-25 | Apple Inc. | Voice trigger for a digital assistant |
US11557310B2 (en) | 2013-02-07 | 2023-01-17 | Apple Inc. | Voice trigger for a digital assistant |
US10714117B2 (en) | 2013-02-07 | 2020-07-14 | Apple Inc. | Voice trigger for a digital assistant |
US11388291B2 (en) | 2013-03-14 | 2022-07-12 | Apple Inc. | System and method for processing voicemail |
US11798547B2 (en) | 2013-03-15 | 2023-10-24 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US11048473B2 (en) | 2013-06-09 | 2021-06-29 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US11727219B2 (en) | 2013-06-09 | 2023-08-15 | Apple Inc. | System and method for inferring user intent from speech inputs |
US10769385B2 (en) | 2013-06-09 | 2020-09-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US12073147B2 (en) | 2013-06-09 | 2024-08-27 | Apple Inc. | Device, method, and graphical user interface for enabling conversation persistence across two or more instances of a digital assistant |
US12010262B2 (en) | 2013-08-06 | 2024-06-11 | Apple Inc. | Auto-activating smart responses based on activities from remote devices |
US11314370B2 (en) | 2013-12-06 | 2022-04-26 | Apple Inc. | Method for extracting salient dialog usage from live data |
US11699448B2 (en) | 2014-05-30 | 2023-07-11 | Apple Inc. | Intelligent assistant for home automation |
US10417344B2 (en) | 2014-05-30 | 2019-09-17 | Apple Inc. | Exemplar-based natural language processing |
US12118999B2 (en) | 2014-05-30 | 2024-10-15 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US12067990B2 (en) | 2014-05-30 | 2024-08-20 | Apple Inc. | Intelligent assistant for home automation |
US10878809B2 (en) | 2014-05-30 | 2020-12-29 | Apple Inc. | Multi-command single utterance input method |
US10699717B2 (en) | 2014-05-30 | 2020-06-30 | Apple Inc. | Intelligent assistant for home automation |
US11670289B2 (en) | 2014-05-30 | 2023-06-06 | Apple Inc. | Multi-command single utterance input method |
US11133008B2 (en) | 2014-05-30 | 2021-09-28 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11810562B2 (en) | 2014-05-30 | 2023-11-07 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US11257504B2 (en) | 2014-05-30 | 2022-02-22 | Apple Inc. | Intelligent assistant for home automation |
US10714095B2 (en) | 2014-05-30 | 2020-07-14 | Apple Inc. | Intelligent assistant for home automation |
US11516537B2 (en) | 2014-06-30 | 2022-11-29 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11838579B2 (en) | 2014-06-30 | 2023-12-05 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10438595B2 (en) | 2014-09-30 | 2019-10-08 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10390213B2 (en) | 2014-09-30 | 2019-08-20 | Apple Inc. | Social reminders |
US11231904B2 (en) | 2015-03-06 | 2022-01-25 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US10930282B2 (en) | 2015-03-08 | 2021-02-23 | Apple Inc. | Competing devices responding to voice triggers |
US11087759B2 (en) | 2015-03-08 | 2021-08-10 | Apple Inc. | Virtual assistant activation |
US10529332B2 (en) | 2015-03-08 | 2020-01-07 | Apple Inc. | Virtual assistant activation |
US11842734B2 (en) | 2015-03-08 | 2023-12-12 | Apple Inc. | Virtual assistant activation |
US12001933B2 (en) | 2015-05-15 | 2024-06-04 | Apple Inc. | Virtual assistant in a communication session |
US11468282B2 (en) | 2015-05-15 | 2022-10-11 | Apple Inc. | Virtual assistant in a communication session |
US11127397B2 (en) | 2015-05-27 | 2021-09-21 | Apple Inc. | Device voice control |
US11070949B2 (en) | 2015-05-27 | 2021-07-20 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display |
US10681212B2 (en) | 2015-06-05 | 2020-06-09 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11010127B2 (en) | 2015-06-29 | 2021-05-18 | Apple Inc. | Virtual assistant for media playback |
US11947873B2 (en) | 2015-06-29 | 2024-04-02 | Apple Inc. | Virtual assistant for media playback |
US11500672B2 (en) | 2015-09-08 | 2022-11-15 | Apple Inc. | Distributed personal assistant |
US11126400B2 (en) | 2015-09-08 | 2021-09-21 | Apple Inc. | Zero latency digital assistant |
US11954405B2 (en) | 2015-09-08 | 2024-04-09 | Apple Inc. | Zero latency digital assistant |
US11809483B2 (en) | 2015-09-08 | 2023-11-07 | Apple Inc. | Intelligent automated assistant for media search and playback |
US11550542B2 (en) | 2015-09-08 | 2023-01-10 | Apple Inc. | Zero latency digital assistant |
US11853536B2 (en) | 2015-09-08 | 2023-12-26 | Apple Inc. | Intelligent automated assistant in a media environment |
US12051413B2 (en) | 2015-09-30 | 2024-07-30 | Apple Inc. | Intelligent device identification |
US11809886B2 (en) | 2015-11-06 | 2023-11-07 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US11526368B2 (en) | 2015-11-06 | 2022-12-13 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US11886805B2 (en) | 2015-11-09 | 2024-01-30 | Apple Inc. | Unconventional virtual assistant interactions |
US10942703B2 (en) | 2015-12-23 | 2021-03-09 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US11657820B2 (en) | 2016-06-10 | 2023-05-23 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US11037565B2 (en) | 2016-06-10 | 2021-06-15 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10580409B2 (en) | 2016-06-11 | 2020-03-03 | Apple Inc. | Application integration with a digital assistant |
US11809783B2 (en) | 2016-06-11 | 2023-11-07 | Apple Inc. | Intelligent device arbitration and control |
US11749275B2 (en) | 2016-06-11 | 2023-09-05 | Apple Inc. | Application integration with a digital assistant |
US11152002B2 (en) | 2016-06-11 | 2021-10-19 | Apple Inc. | Application integration with a digital assistant |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US11656884B2 (en) | 2017-01-09 | 2023-05-23 | Apple Inc. | Application integration with a digital assistant |
US10741181B2 (en) | 2017-05-09 | 2020-08-11 | Apple Inc. | User interface for correcting recognition errors |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11467802B2 (en) | 2017-05-11 | 2022-10-11 | Apple Inc. | Maintaining privacy of personal information |
US11599331B2 (en) | 2017-05-11 | 2023-03-07 | Apple Inc. | Maintaining privacy of personal information |
US11580990B2 (en) | 2017-05-12 | 2023-02-14 | Apple Inc. | User-specific acoustic models |
US11862151B2 (en) | 2017-05-12 | 2024-01-02 | Apple Inc. | Low-latency intelligent automated assistant |
US11380310B2 (en) | 2017-05-12 | 2022-07-05 | Apple Inc. | Low-latency intelligent automated assistant |
US11405466B2 (en) | 2017-05-12 | 2022-08-02 | Apple Inc. | Synchronization and task delegation of a digital assistant |
US11837237B2 (en) | 2017-05-12 | 2023-12-05 | Apple Inc. | User-specific acoustic models |
US11538469B2 (en) | 2017-05-12 | 2022-12-27 | Apple Inc. | Low-latency intelligent automated assistant |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
US12014118B2 (en) | 2017-05-15 | 2024-06-18 | Apple Inc. | Multi-modal interfaces having selection disambiguation and text modification capability |
EP3493202A1 (en) * | 2017-05-16 | 2019-06-05 | Apple Inc. | Far-field extension for digital assistant services |
US11532306B2 (en) | 2017-05-16 | 2022-12-20 | Apple Inc. | Detecting a trigger of a digital assistant |
US10909171B2 (en) | 2017-05-16 | 2021-02-02 | Apple Inc. | Intelligent automated assistant for media exploration |
US10748546B2 (en) | 2017-05-16 | 2020-08-18 | Apple Inc. | Digital assistant services based on device capabilities |
WO2018213415A1 (en) * | 2017-05-16 | 2018-11-22 | Apple Inc. | Far-field extension for digital assistant services |
US12026197B2 (en) | 2017-05-16 | 2024-07-02 | Apple Inc. | Intelligent automated assistant for media exploration |
CN110021300A (zh) * | 2017-05-16 | 2019-07-16 | 苹果公司 | 数字助理服务的远场延伸 |
US11217255B2 (en) | 2017-05-16 | 2022-01-04 | Apple Inc. | Far-field extension for digital assistant services |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US11675829B2 (en) | 2017-05-16 | 2023-06-13 | Apple Inc. | Intelligent automated assistant for media exploration |
CN110021300B (zh) * | 2017-05-16 | 2021-07-06 | 苹果公司 | 数字助理服务的远场延伸 |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US11710482B2 (en) | 2018-03-26 | 2023-07-25 | Apple Inc. | Natural assistant interaction |
US11907436B2 (en) | 2018-05-07 | 2024-02-20 | Apple Inc. | Raise to speak |
US11487364B2 (en) | 2018-05-07 | 2022-11-01 | Apple Inc. | Raise to speak |
US11169616B2 (en) | 2018-05-07 | 2021-11-09 | Apple Inc. | Raise to speak |
US11854539B2 (en) | 2018-05-07 | 2023-12-26 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US11900923B2 (en) | 2018-05-07 | 2024-02-13 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10720160B2 (en) | 2018-06-01 | 2020-07-21 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11431642B2 (en) | 2018-06-01 | 2022-08-30 | Apple Inc. | Variable latency device coordination |
US11630525B2 (en) | 2018-06-01 | 2023-04-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US12061752B2 (en) | 2018-06-01 | 2024-08-13 | Apple Inc. | Attention aware virtual assistant dismissal |
US12067985B2 (en) | 2018-06-01 | 2024-08-20 | Apple Inc. | Virtual assistant operations in multi-device environments |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
US11360577B2 (en) | 2018-06-01 | 2022-06-14 | Apple Inc. | Attention aware virtual assistant dismissal |
US12080287B2 (en) | 2018-06-01 | 2024-09-03 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11009970B2 (en) | 2018-06-01 | 2021-05-18 | Apple Inc. | Attention aware virtual assistant dismissal |
US10984798B2 (en) | 2018-06-01 | 2021-04-20 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11893992B2 (en) | 2018-09-28 | 2024-02-06 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
CN109087662A (zh) * | 2018-10-25 | 2018-12-25 | 科大讯飞股份有限公司 | 一种回声消除方法及装置 |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US12136419B2 (en) | 2019-03-18 | 2024-11-05 | Apple Inc. | Multimodality in digital assistant systems |
US11783815B2 (en) | 2019-03-18 | 2023-10-10 | Apple Inc. | Multimodality in digital assistant systems |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11705130B2 (en) | 2019-05-06 | 2023-07-18 | Apple Inc. | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11217251B2 (en) | 2019-05-06 | 2022-01-04 | Apple Inc. | Spoken notifications |
US11675491B2 (en) | 2019-05-06 | 2023-06-13 | Apple Inc. | User configurable task triggers |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
US11888791B2 (en) | 2019-05-21 | 2024-01-30 | Apple Inc. | Providing message response suggestions |
US11657813B2 (en) | 2019-05-31 | 2023-05-23 | Apple Inc. | Voice identification in digital assistant systems |
US11360739B2 (en) | 2019-05-31 | 2022-06-14 | Apple Inc. | User activity shortcut suggestions |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11237797B2 (en) | 2019-05-31 | 2022-02-01 | Apple Inc. | User activity shortcut suggestions |
US11790914B2 (en) | 2019-06-01 | 2023-10-17 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11488406B2 (en) | 2019-09-25 | 2022-11-01 | Apple Inc. | Text detection using global geometry estimators |
US11924254B2 (en) | 2020-05-11 | 2024-03-05 | Apple Inc. | Digital assistant hardware abstraction |
US11765209B2 (en) | 2020-05-11 | 2023-09-19 | Apple Inc. | Digital assistant hardware abstraction |
US11914848B2 (en) | 2020-05-11 | 2024-02-27 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11838734B2 (en) | 2020-07-20 | 2023-12-05 | Apple Inc. | Multi-device audio adjustment coordination |
US11750962B2 (en) | 2020-07-21 | 2023-09-05 | Apple Inc. | User identification using headphones |
US11696060B2 (en) | 2020-07-21 | 2023-07-04 | Apple Inc. | User identification using headphones |
US12021806B1 (en) | 2021-09-21 | 2024-06-25 | Apple Inc. | Intelligent message delivery |
Also Published As
Publication number | Publication date |
---|---|
KR20160023089A (ko) | 2016-03-03 |
US20170263247A1 (en) | 2017-09-14 |
US10311866B2 (en) | 2019-06-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
WO2016027933A1 (ko) | 디지털 디바이스 및 그 제어 방법 | |
WO2015099343A1 (ko) | 디지털 디바이스 및 그 제어 방법 | |
WO2016085094A1 (ko) | 멀티미디어 디바이스 및 그 제어 방법 | |
WO2016143965A1 (en) | Display device and controlling method thereof | |
WO2017003022A1 (ko) | 디스플레이 디바이스 및 그 제어 방법 | |
WO2016085070A1 (ko) | 디바이스 제어 시스템, 디지털 디바이스 및 디지털 디바이스 제어 방법 | |
WO2016104907A1 (ko) | 디지털 디바이스 및 상기 디지털 디바이스에서 데이터 처리 방법 | |
WO2017034065A1 (ko) | 디스플레이 디바이스 및 그 제어 방법 | |
WO2016175361A1 (ko) | 디스플레이 디바이스 및 그 제어 방법 | |
WO2016186254A1 (ko) | 디스플레이 디바이스 및 그 제어 방법 | |
WO2012081803A1 (ko) | 영상표시기기의 애플리케이션 메뉴 제공 방법 및 그에 따른 영상표시기기 | |
WO2016175356A1 (ko) | 디지털 디바이스 및 디지털 디바이스 제어 방법 | |
WO2017135585A2 (en) | Main speaker, sub speaker and system including the same | |
WO2012015116A1 (en) | Image display apparatus and method for operating the same | |
WO2012026651A1 (en) | Method for synchronizing contents and display device enabling the method | |
WO2012015117A1 (en) | Method for operating image display apparatus | |
WO2012081820A1 (en) | Network television processing multiple applications and method for controlling the same | |
WO2014209053A1 (en) | A digital device and method of processing service data thereof | |
WO2012074189A1 (ko) | 화면 표시 제어 방법 및 그를 이용한 영상 표시 기기 | |
WO2012070742A1 (ko) | 애플리케이션 설치 방법 및 그를 이용한 영상 표시 기기 | |
WO2012030025A1 (en) | Image display apparatus and method for operating the same | |
WO2017018737A1 (ko) | 디지털 디바이스 및 상기 디지털 디바이스에서 데이터 처리 방법 | |
WO2017200215A1 (en) | Digital device and controlling method thereof | |
WO2020149426A1 (ko) | 영상표시기기 및 그 제어방법 | |
WO2017047868A1 (ko) | 이동 단말기 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 14900022 Country of ref document: EP Kind code of ref document: A1 |
|
WWE | Wipo information: entry into national phase |
Ref document number: 15505061 Country of ref document: US |
|
NENP | Non-entry into the national phase |
Ref country code: DE |
|
122 | Ep: pct application non-entry in european phase |
Ref document number: 14900022 Country of ref document: EP Kind code of ref document: A1 |