Nothing Special   »   [go: up one dir, main page]

KR100428717B1 - Speech signal transmission method on data channel - Google Patents

Speech signal transmission method on data channel Download PDF

Info

Publication number
KR100428717B1
KR100428717B1 KR10-2001-0065514A KR20010065514A KR100428717B1 KR 100428717 B1 KR100428717 B1 KR 100428717B1 KR 20010065514 A KR20010065514 A KR 20010065514A KR 100428717 B1 KR100428717 B1 KR 100428717B1
Authority
KR
South Korea
Prior art keywords
voice
data channel
data
wireless
voice file
Prior art date
Application number
KR10-2001-0065514A
Other languages
Korean (ko)
Other versions
KR20030033510A (en
Inventor
경연정
천희진
김요섭
Original Assignee
에스케이 텔레콤주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 텔레콤주식회사 filed Critical 에스케이 텔레콤주식회사
Priority to KR10-2001-0065514A priority Critical patent/KR100428717B1/en
Publication of KR20030033510A publication Critical patent/KR20030033510A/en
Application granted granted Critical
Publication of KR100428717B1 publication Critical patent/KR100428717B1/en

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/06Protocols specially adapted for file transfer, e.g. file transfer protocol [FTP]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Mobile Radio Communication Systems (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

1. 청구범위에 기재된 발명이 속한 기술분야1. TECHNICAL FIELD OF THE INVENTION

본 발명은 무선 데이터 채널상에서의 음성파일 송수신 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것임.The present invention relates to a method for transmitting and receiving a voice file on a wireless data channel and a computer readable recording medium having recorded thereon a program for realizing the method.

2. 발명이 해결하려고 하는 기술적 과제2. The technical problem to be solved by the invention

본 발명은, 무선통신망에서 EVRC 보코더를 데이터 통신시 선택적으로 사용하여 압축된 음성을 데이터 채널로 전송하기 위한 음성파일 송수신 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하고자 함.The present invention provides a method of transmitting and receiving a voice file for transmitting a compressed voice to a data channel by selectively using an EVRC vocoder in a data communication in a wireless communication network and a computer-readable recording medium having recorded thereon a program for realizing the method. To do so.

3. 발명의 해결방법의 요지3. Summary of Solution to Invention

본 발명은, 무선통신망에서의 음성파일 송수신 방법에 있어서, 데이터 채널 연결 상태에서, 무선통신 단말기가 인터럽의 발생을 감지하는 데이터 채널 연결 및 인터럽트 발생 감지 단계; 사용자 요구에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 보코더를 동작시켜, 사용자가 발화한 음성을 압축하여 데이터에 실어 데이터 채널을 통해 서버로 전송하는 음성파일 전송단계; 및 상기 서버로부터의 명령에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 상기 보코더를 동작시켜, 데이터 채널을 통해 상기 서버로부터 제공되는 음성파일을 디코딩하여 재생하는 음성파일 재생단계를 포함함.According to an aspect of the present invention, there is provided a method of transmitting and receiving a voice file in a wireless communication network, the method comprising: detecting, by a wireless communication terminal, a data channel connection and interrupt occurrence detection in a data channel connection state; A voice file transmission step of operating the vocoder by the wireless communication terminal when the interrupt occurs according to a user's request, compressing the voice spoken by the user, loading the data into a data, and transmitting the data to a server through a data channel; And a voice file reproducing step of operating, by the wireless communication terminal, the vocoder to decode and reproduce the voice file provided from the server through a data channel when an interrupt is generated according to a command from the server.

4. 발명의 중요한 용도4. Important uses of the invention

본 발명은 무선 인터넷 서비스 등에 이용됨.The present invention is used for wireless Internet service.

Description

무선 데이터 채널상에서의 음성파일 송수신 방법{Speech signal transmission method on data channel}Speech file transmission method on data channel

본 발명은 무선통신망의 무선 데이터 채널상에서의 음성파일 송수신 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체에 관한 것으로, 특히 무선통신망에서 고도 가변율 코덱(EVRC : Enhanced Variable Rate CODEC) 보코더(VOCODER, 음성 코딩 칩)를 데이터 통신시 선택적으로 사용하여 압축된 음성을 데이터 채널로 전송할 수 있도록 하는 것이다. 즉, 데이터 채널 사용시에도 선택적으로 EVRC 코덱을 사용하여 압축된 음성을 전송할 수 있도록 하는 것이다.The present invention relates to a method of transmitting and receiving a voice file on a wireless data channel of a wireless communication network and a computer-readable recording medium recording a program for realizing the method. CODEC) A vocoder (VOCODER) is selectively used in data communication to transmit a compressed voice to a data channel. That is, even when using a data channel, it is possible to selectively transmit the compressed voice using the EVRC codec.

현재, 정보통신기술의 급속한 발전과 확장으로 이동통신 기술과 그에 따른 서비스는 현대인들에게 없어서는 안될 아주 중요한 생활의 일부분이 되었다. 이러한 상황에서 이용자들의 욕구는 날로 팽배해져 가고 있으며, 이를 만족시켜 줄만한 새로운 서비스의 개발이 아주 중요한 사항이 되었다.At present, with the rapid development and expansion of information and communication technology, mobile communication technology and its services have become an integral part of modern life. In this situation, users' desires are expanding day by day, and the development of new services to satisfy them has become very important.

현재까지, 유/무선 전화망의 각종 ARS/IVR 시스템에 음성인식을 대표로 하는 기술을 적용하고자 하는 시도가 많이 있었으나, 특히 무선망의 경우 음질상의 제한으로 인하여 기대만큼의 효과를 거두지 못하였다. 또한, 음성의 통화 채널상에서의 전송만이 있어 왔으므로, WAP(Wireless Application Protocol) 등을 이용한 무선 인터넷상에서는 음성인식 기술 등을 사용하지 못하는 문제점이 있었다.Until now, there have been many attempts to apply the technology representing voice recognition to various ARS / IVR systems of wired / wireless telephone networks, but in particular, wireless networks have not achieved the expected effects due to the limitations in sound quality. In addition, since only voice has been transmitted on a call channel, there is a problem that voice recognition technology cannot be used on the wireless Internet using a WAP (Wireless Application Protocol).

즉, 일반적으로 데이터 채널로 호 연결이 되면, 코덱(CODEC) 부분인 보코더(VOCODER)를 바이패스(Bypass)하게 되며, 아날로그 음성 자체(혹은 PCM(Pulse Code Modulation) 타입의 음성)를 전송하는 것은 그 용량이 너무 커서 대역폭(Bandwith)의 제약이 있는 무선 데이터 통신에는 적합하지 않다. 따라서, 데이터 채널과 음성 채널이 완전히 구분되어 있을 수 밖에 없다.That is, in general, when a call is connected to a data channel, the VOCODER, which is a codec part, is bypassed, and the transmission of analog voice itself (or voice code modulation (PCM) type voice) is performed. Its capacity is so large that it is not suitable for bandwidth-constrained wireless data communications. Therefore, the data channel and the voice channel must be completely separated.

따라서, 현재의 기술분야에서는 대역폭(Bandwith)의 제약이 있는 WAP 등의무선 데이터 채널상에서 음성파일을 전송할 수 있는 방안이 절실히 요구된다.Therefore, in the current technical field, there is an urgent need for a method of transmitting a voice file on a wireless data channel such as a WAP having a bandwidth limitation.

본 발명은, 상기한 바와 같은 요구에 부응하기 위하여 제안된 것으로, 무선통신망에서 EVRC 보코더를 데이터 통신시 선택적으로 사용하여 압축된 음성을 데이터 채널로 전송하기 위한 음성파일 송수신 방법 및 상기 방법을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공하는데 그 목적이 있다.SUMMARY OF THE INVENTION The present invention has been proposed to meet the above requirements, and a method and method for transmitting and receiving a voice file for transmitting a compressed voice to a data channel by selectively using an EVRC vocoder in a data communication in a wireless communication network Its purpose is to provide a computer readable recording medium having recorded thereon a program.

도 1 은 본 발명이 적용되는 무선통신 단말기의 구성 예시도.1 is an exemplary configuration of a wireless communication terminal to which the present invention is applied.

도 2 는 일반적인 보코더 처리 과정을 나타낸 설명도.2 is an explanatory diagram showing a general vocoder processing procedure.

도 3 은 일반적인 음성 (데이터 단어 삭제) 채널상에서의 음성파일 송수신 과정을 나타낸 설명도.3 is an explanatory diagram showing a process of transmitting and receiving a voice file on a general voice (data word deletion) channel.

도 4 는 일반적인 무선 데이터 채널상에서의 음성파일 송수신 과정을 나타낸 설명도.4 is an explanatory diagram showing a process of transmitting and receiving a voice file on a general wireless data channel.

도 5 는 본 발명에 따른 무선 데이터 채널상에서의 음성파일 송수신 방법에 대한 일실시예 흐름도.5 is a flowchart illustrating a method for transmitting and receiving a voice file on a wireless data channel according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명* Explanation of symbols for the main parts of the drawings

10 : 보코더(CODEC)10: Vocoder (CODEC)

상기 목적을 달성하기 위한 본 발명은, 무선통신망에서의 음성파일 송수신 방법에 있어서, 데이터 채널 연결 상태에서, 무선통신 단말기가 인터럽의 발생을 감지하는 데이터 채널 연결 및 인터럽트 발생 감지 단계; 사용자 요구에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 보코더를 동작시켜, 사용자가 발화한 음성을 압축하여 데이터에 실어 데이터 채널을 통해 서버로 전송하는 음성파일 전송단계; 및 상기 서버로부터의 명령에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 상기 보코더를 동작시켜, 데이터 채널을 통해 상기 서버로부터 제공되는 음성파일을 디코딩하여 재생하는 음성파일 재생단계를 포함하여 이루어진 것을 특징으로 한다.According to an aspect of the present invention, there is provided a method of transmitting and receiving a voice file in a wireless communication network, the method comprising: detecting a data channel connection and interrupt occurrence in a data channel connection state, the wireless communication terminal detecting the occurrence of an interrupt; A voice file transmission step of operating the vocoder by the wireless communication terminal when the interrupt occurs according to a user's request, compressing the voice spoken by the user, loading the data into a data, and transmitting the data to a server through a data channel; And a voice file reproducing step of operating the vocoder at the time of the interruption according to the command from the server to decode and reproduce the voice file provided from the server through a data channel. do.

또한, 본 발명은 상기 음성파일 전송단계 수행후에, 상기 서버가 데이터의 헤더 정보로부터 음성임을 감지하여, 해당 음성을 디코딩하여 음성을 복원하고, 음성에 대응되는 해당 무선 인터넷 서비스 기능을 수행하는 음성파일 복원 및 서비스 수행 단계를 더 포함하여 이루어진 것을 특징으로 한다.In addition, according to the present invention, after performing the voice file transmission step, the server detects that the voice is from the header information of the data, decodes the voice, restores the voice, and performs a voice internet service function corresponding to the voice. It further comprises the steps of performing the restoration and service.

한편, 본 발명은 무선 데이터 채널상에서의 음성파일 송수신을 위하여, 프로세서를 구비한 무선통신망에, 데이터 채널 연결 상태에서, 무선통신 단말기가 인터럽의 발생을 감지하는 데이터 채널 연결 및 인터럽트 발생 감지 기능; 사용자 요구에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 보코더를 동작시켜, 사용자가 발화한 음성을 압축하여 데이터에 실어 데이터 채널을 통해 서버로 전송하는 음성파일 전송기능; 및 상기 서버로부터의 명령에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 상기 보코더를 동작시켜, 데이터 채널을 통해 상기 서버로부터 제공되는 음성파일을 디코딩하여 재생하는 음성파일 재생기능을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.On the other hand, the present invention provides a wireless communication network having a processor for transmitting and receiving a voice file on a wireless data channel, the data channel connection and interrupt generation detection function for detecting the occurrence of an interrupt in the wireless channel, in the data channel connection state; A voice file transmission function in which the wireless communication terminal operates a vocoder at the time of an interruption according to a user's request, compresses the voice spoken by the user, loads it into data, and transmits the data to a server through a data channel; And a program for realizing a voice file reproducing function of operating the vocoder at the time of an interrupt in response to a command from the server to decode and reproduce the voice file provided from the server via a data channel. Provide a computer readable recording medium.

또한, 본 발명은 상기 음성파일 전송기능 수행후에, 상기 서버가 데이터의 헤더 정보로부터 음성임을 감지하여, 해당 음성을 디코딩하여 음성을 복원하고, 음성에 대응되는 해당 무선 인터넷 서비스 기능을 수행하는 음성파일 복원 및 서비스 수행 기능을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체를 제공한다.In addition, the present invention, after performing the voice file transmission function, the server detects that the voice from the header information of the data, decodes the voice to restore the voice, and performs a corresponding wireless Internet service function corresponding to the voice file Provided is a computer readable recording medium having recorded thereon a program for further realizing restoration and service performance functions.

본 발명은 WAP을 비롯한 무선 데이터 채널에서의 음성파일 송수신 방안에 관한 것으로서, 무선 데이터 채널에서 아날로그 음성 자체(혹은 PCM 타입의 음성)를 보내는 것은 그 용량 때문에 불가능하므로, 본 발명에서는 현재 무선통신 단말기에 내장되어 있는 EVRC 보코더를 통과시킨다. 이 EVRC 보코더를 통과하면, 선 스펙트럼 쌍(LSP : Line Spectral Pair) 파라미터가 추출되고, 이는 기존의 PCM 타입의 음성파일보다 현저하게 크기가 줄어들게 되므로 추출된 파라미터를 전송할 수 있다. 이때, 파라미터는 패킷 타입으로 전송하면 되고, 받는 쪽에서 디코더를 거쳐 원래의 음성파일을 복원할 수 있다.The present invention relates to a method for transmitting and receiving a voice file in a wireless data channel including a WAP, and it is impossible to send analog voice itself (or PCM type voice) in the wireless data channel. Pass the built-in EVRC vocoder. When passing through the EVRC vocoder, a line spectral pair (LSP) parameter is extracted, which can be significantly reduced in size than a conventional PCM type voice file and thus can transmit the extracted parameter. In this case, the parameter may be transmitted in a packet type, and the receiver may restore the original audio file through the decoder.

따라서, 본 발명에 따르면, 데이터 전송이므로 손실(Loss)이 발생되지 않으므로 일반 음성(Speech) 채널 사용시보다 고품질의 음성을 전송할 수 있고, 아울러 음성인식 등에서도 높은 인식율을 얻을 수 있는 장점이 있다. 또한, 무선 인터넷 서비스(예를 들면, n.Top, magic N 등) 사용시 문자 위주의 서비스외에 음성을 부가시킨 다양한 서비스가 가능해진다. 즉, EVRC 코덱을 데이터 채널에서도 선택적으로 사용하여 압축된 음성을 전송할 수 있도록 함으로써, 데이터 채널과 음성 채널이 완전히 구분되어 있지 않고, 비록 긴 음성은 어렵더라도(bandwidth 문제로) 한 두 단어 혹은 짧은 문장 등의 음성은 EVRC 코덱을 거친 압축된 형태로 데이터 채널로 전송 가능해진다.Therefore, according to the present invention, since loss does not occur because of data transmission, a higher quality voice can be transmitted than when using a speech channel, and a high recognition rate can be obtained even in voice recognition. In addition, when using a wireless Internet service (for example, n.Top, magic N, etc.), a variety of services in which voice is added in addition to a text-oriented service becomes possible. That is, the EVRC codec can be selectively used in the data channel to transmit the compressed voice, so that the data channel and the voice channel are not completely distinguished, and even though long voice is difficult (with bandwidth problem), one or two words or short sentences are provided. Voices can be transmitted over the data channel in compressed form via the EVRC codec.

상술한 목적, 특징들 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해 질 것이다. 이하, 첨부된 도면을 참조하여 본 발명에 따른 바람직한 일실시예를 상세히 설명한다.The above objects, features and advantages will become more apparent from the following detailed description taken in conjunction with the accompanying drawings. Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1 은 본 발명이 적용되는 무선통신 단말기의 구성 예시도로서, 공지의 CDMA(Code Division Multiple Access) 이동통신 단말기의 구조를 나타낸다.1 is an exemplary configuration diagram of a wireless communication terminal to which the present invention is applied and shows a structure of a known code division multiple access (CDMA) mobile communication terminal.

그러나, 도 1과 같은 구성을 갖는 무선통신 단말기의 하드웨어 환경은 당해 분야에서 이미 주지된 기술에 지나지 아니하므로, 여기에서는 그에 관한 자세한 설명은 생략하기로 한다. 다만, 보코더(VOCODER, 음성 코딩 칩)(10)에 대해 상세히 설명한다.However, since the hardware environment of the wireless communication terminal having the configuration as shown in FIG. 1 is only a technique well known in the art, detailed description thereof will be omitted herein. However, the vocoder 10 will be described in detail.

무선 데이터 채널을 통해 용량이 큰 PCM 타입의 음성파일을 직접 보내는 것은 그 용량 때문에 불가능하므로, 보코더(10)를 통과시킨다. 보코더(10)를 통과하게 되면, 선 스펙트럼 쌍(LSP) 파라미터가 추출되고, LSP 파라미터는 기존의 PCM 타입의 음성파일보다 현저하게 크기가 줄어들기 때문에 이러한 LSP 파라미터를 패킷 타입으로 전송하고, 수신측에서 디코더를 거쳐 원래의 음성파일을 복원하면 된다.Direct transmission of a large PCM type voice file via a wireless data channel is not possible because of its capacity and thus passes the vocoder 10. When passing through the vocoder 10, a line spectrum pair (LSP) parameter is extracted, and the LSP parameter is significantly reduced in size than a conventional PCM type voice file. Restore the original voice file via the decoder at.

일반적으로, 무선통신 사업자는 대부분 8kbps EVRC 보코더(10)를 사용하고 있다.In general, most wireless communication operators use the 8 kbps EVRC vocoder 10.

보코더(10)는 아날로그 음성신호를 디지털 음성신호로 변환하는 장치이다. 이 과정에서, 보코더(10)는 대량의 신호를 압축하게 된다. 즉, 아날로그의 음성 신호를 디지털화하면서 대량의 압축 효과를 갖는다.Vocoder 10 is a device for converting an analog voice signal into a digital voice signal. In this process, the vocoder 10 compresses a large amount of signals. That is, it has a large compression effect while digitizing the analog audio signal.

CDMA에 적용된 보코더(10)는 가변율(Variable Rate) 보코더로서, 음성신호의 많고 적음에 따라 1.2kbps ~ 8kbps로 전송된다. 또한, 보코더(10)에서 일반적으로 음성은 20ms 단위로 처리된다. EVRC 보코더(10)는 "루슨트"사, "모토로라"사, "노키아"사 등에서 개발한 것으로, 기존의 8kbps QCELP(Qualcomm Coded Excited Linear Predictive)의 문제점을 보완한 것이다.The vocoder 10 applied to the CDMA is a variable rate vocoder, and is transmitted at 1.2 kbps to 8 kbps according to the number of voice signals. In addition, in the vocoder 10, speech is generally processed in units of 20 ms. EVRC vocoder 10 is developed by "Lucent", "Motorola", "Nokia", etc., and complements the problems of the existing 8kbps Qualcomm Coded Excited Linear Predictive (QCELP).

도 2를 참조하여, 보코더(10)에서의 음성 처리 과정을 살펴보면, 아날로그의 음성신호(PCM 타입의 음성)가 보코더(10)의 입력으로 들어가고, 보코더(10)에서 이 음성신호를 20ms 단위로 디지털화한 후, 특징을 추출(digitizing feature extraction)하여 압축된 LSP 파라미터를 출력한다. 즉, 음성신호를 주파수 대역에서 좀더 잘 모델링할 수 있는 값으로 변환한다. 이 과정에서 많은 압축이 일어나며, 최종적으로 음성은 LSP 파라미터로 변환되어 전송된다.Referring to FIG. 2, referring to a voice processing process of the vocoder 10, an analog voice signal (PCM type voice) enters the input of the vocoder 10, and the vocoder 10 converts the voice signal in units of 20 ms. After digitization, the feature is extracted and the compressed LSP parameters are output. That is, the speech signal is converted into a value that can be better modeled in the frequency band. A lot of compression takes place in this process, and finally the voice is converted into LSP parameters and transmitted.

무선통신망에서, 단말기와 기지국간의 통신 채널을 보면, 음성 통신 채널을 일반적으로 트래픽(Traffic Channel)이라고 칭하며, 회선 채널(Circuit Channel)이 되고, 무선 데이터 통신 채널을 데이터 채널(Data Channel)이라 일반적으로 말하고 이는 패킷(Packet Channel)이라 한다. 이때, 단말기 내부의 호처리 과정을 보면 다음과 같다.In a wireless communication network, when a communication channel between a terminal and a base station is viewed, a voice communication channel is generally referred to as a traffic channel, becomes a circuit channel, and a wireless data communication channel is generally called a data channel. This is called a packet channel. At this time, the call processing process inside the terminal is as follows.

먼저, 음성 통신시에는 도 3에 도시된 바와 같이 보코더(10)를 통해 아날로그 음성신호를 디지털 음성신호로 압축 변환한다.First, during voice communication, an analog voice signal is compressed and converted into a digital voice signal through the vocoder 10 as shown in FIG. 3.

한편, 데이터 통신시에는 상기 도 3의 음성 통신과 달리 보코더(10) 부분은 바이패스(Bypass)하게 된다. 왜냐하면, 문자와 데이터만을 처리한다는 가정이 있으므로, 음성에 대한 고려가 전혀 없다.On the other hand, in the data communication, unlike the voice communication of FIG. 3, the vocoder 10 portion is bypassed. Because there is an assumption that only texts and data are processed, there is no consideration for voice.

그러나, 화상정보 뿐만 아니라 음성까지도 포함해야 하는 동영상 서비스에서, 음성/오디오에 대한 고려는 필수적이며, 도 4와 같은 데이터 채널상에서 효율적으로 음성을 전송할 수 있어야 한다.However, in a video service that must include not only image information but also voice, consideration of voice / audio is essential and it must be possible to efficiently transmit voice on a data channel as shown in FIG.

일반적으로, 데이터 채널로 호 연결이 되면 보코더(10) 부분이 바이패스(Bypass)되고, 아날로그 음성 자체(혹은 PCM 타입의 음성)를 전송하는 것이 그 용량이 너무 커서 대역폭(Bandwidth)의 제약이 있는 무선 데이터 통신에는 적합하지 않다.따라서, 도 3 및 도 4에 도시된 바와 같이 데이터 채널과 음성 채널이 완전히 구분되어 있다.In general, when a call is connected to a data channel, the vocoder 10 portion is bypassed, and the capacity of transmitting analog voice itself (or voice of PCM type) is too large to limit bandwidth. It is not suitable for wireless data communication. Thus, as shown in Figs. 3 and 4, the data channel and the voice channel are completely separated.

위 두 가지 사항을 고려하여 다음과 같은 무선 데이터 채널상에서의 음성파일 송수신 과정을 제안한다. 이러한 무선 데이터 채널상에서의 음성파일 송수신 프로그램은 메모리에 저장되며, 제어부의 제어하에 동작된다.Considering the above two issues, we propose the following voice file transmission / reception process over wireless data channel. The voice file transmission / reception program on the wireless data channel is stored in a memory and operated under the control of a control unit.

현재, 데이터 채널 연결시 소프트웨어적으로 무조건 보코더(10) 부분을 바이패스(bypass)하도록 되어 있는 단말기의 소프트웨어를 수정하여, 선택적으로 바이패스(Bypass)되도록 한다. 즉, 데이터 채널로 연결되어 있더라도, 사용자가 특정 키(예를 들면, "*", "#")를 누르면 마이크 입력이 인에이블(Enable)되면서보코더(10)가 동작되도록 하여 사용자가 발화한 음성을 압축(Encoding)한 후 그 출력(Output)인 압축된 음성형태의 LSP 파라미터를 일반 데이터와 동일하게 취급하여 서버로 전송한다. 아울러, 데이터 채널 연결중 서버로부터의 명령이 있을 때는 역으로 보코더(10)와 스피커의 동작을 인에이블(Enable)시켜 일반 데이터와 동일한 방식으로 수신된 음성/오디오 파일을 디코딩(Decoding)하여 출력한다.Currently, the software of the terminal, which is designed to bypass the vocoder 10 unconditionally by software when connecting the data channel, is modified to be selectively bypassed. That is, even when connected to a data channel, when a user presses a certain key (for example, "*" or "#"), the microphone input is enabled and the vocoder 10 is operated to make the voice spoken by the user. After encoding, the LSP parameter in the form of compressed voice, which is its output, is treated like general data and transmitted to the server. In addition, when there is a command from the server during the data channel connection, the operation of the vocoder 10 and the speaker is reversely enabled to decode and output the received voice / audio file in the same manner as general data. .

즉, 도 3 및 도 4와 같이 채널별로 고정되는 것이 아니라, 데이터 채널 연결 시에도 선택적으로 가능하게 되어 보코더(10)의 기능을 활용한다. 즉, 본 발명에서는 EVRC 코덱을 데이터 채널에서도 선택적으로 사용하여 압축된 음성을 전송할 수 있도록 하는 것이다. 이렇게 하면, 도 3 및 도 4와 같이 데이터 채널과 음성 채널이 완전히 구분되지 않고, 비록 긴 음성은 대역폭 문제로 다소 어렵더라도, 한 두 단어 혹은 짧은 문장 등의 음성은 EVRC 코덱을 거친 압축된 형태로 데이터 채널로 전송 가능해진다.That is, as shown in FIG. 3 and FIG. 4 is not fixed for each channel, it is possible to selectively when the data channel is connected to utilize the function of the vocoder 10. That is, in the present invention, the EVRC codec is selectively used in the data channel to transmit the compressed voice. In this case, the data channel and the voice channel are not completely separated as shown in FIGS. 3 and 4, and although the long voice is somewhat difficult due to a bandwidth problem, the voice such as one or two words or short sentences is compressed in the EVRC codec. The data channel can be transmitted.

도 5 는 본 발명에 따른 무선 데이터 채널상에서의 음성파일 송수신 방법에 대한 일실시예 흐름도이다.5 is a flowchart illustrating a method of transmitting and receiving a voice file on a wireless data channel according to the present invention.

도 5에 도시된 바와 같이, 본 발명에 따른 무선 데이터 채널상에서의 음성파일 송수신 방법은, 먼저 데이터 채널 연결 상태에서(501), 인터럽트(사용자가 특정 키(예를 들면, "*", "#")를 눌러 발생되는 사용자 요구 신호 또는 서버로부터의 서버 명령 신호)가 발생되면(502), 인터럽트의 종류를 분석한다(503).As shown in FIG. 5, in the method of transmitting and receiving a voice file on a wireless data channel according to the present invention, first, in a data channel connection state 501, an interrupt (a user inputs a specific key (for example, "*", "#"). When a user request signal generated by pressing ") or a server command signal from the server) is generated (502), the type of interrupt is analyzed (503).

분석 결과, 발생된 인터럽트가 사용자 요구 신호이면, 마이크 입력이 인에이블(Enable)되면서 보코더(10)가 동작되어(504) 사용자가 발화한 음성을 압축(Encoding)한 후 그 출력(Output)인 압축된 음성형태의 LSP 파라미터를 일반 데이터와 동일하게 취급하여 서버로 전송한다(505,506).As a result of the analysis, if the generated interrupt is a user request signal, the vocoder 10 is operated while the microphone input is enabled (504) to compress the voice spoken by the user and then compress the output (Output). The LSP parameter in the form of the voice is treated like general data and transmitted to the server (505, 506).

이후, 서버에서는 데이터의 헤더 정보로부터 음성임을 감지하여 디코딩후 음성을 복원하고(507), 음성에 대응되는 해당 기능을 수행한다(508). 상기 해당 기능에 대해서는 후술하기로 한다.Thereafter, the server detects the speech from the header information of the data, restores the speech after decoding (507), and performs a corresponding function corresponding to the speech (508). The corresponding function will be described later.

한편, 인터럽트가 서버의 명령 신호이면, 보코더(10)와 스피커의 동작을 인에이블(Enable)시켜 일반 데이터와 동일한 방식으로 수신된 음성/오디오 파일을 디코딩(Decoding)하여 재생한다(509,510).On the other hand, if the interrupt is a command signal of the server, the operations of the vocoder 10 and the speaker are enabled to decode and reproduce the received voice / audio file in the same manner as general data (509, 510).

따라서, 무선 데이터 채널상에서의 음성파일 송수신 과정을 지원하는 단말기에서는 다음과 같은 서비스가 가능하다.Accordingly, the following services are available in a terminal supporting a voice file transmission / reception process over a wireless data channel.

첫째, "n.Top"이나 "magic N" 등과 같은 무선 인터넷 서비스에 접속하여 복잡한 트리(Tree) 구조의 메뉴를 무시하고 특정키(예를 들면, "*", "#")를 눌러 원하는 메뉴를 발성한다. 이때, 발성된 음성은 압축(Encoding)되어 데이터로 전송되며, 서버에서는 데이터의 헤더 정보를 보고 음성임을 판단하여 음성인식기를 거쳐 사용자가 원하는 정보 화면으로 바로 넘어가도록 처리한다. 이러한 서비스를 통해 작고 불편한 단말기의 사용자 인터페이스(User Interface)를 개선하여 무선 인터넷 사용자 접속(User Access) 방식에 VUI(Voice User Interface)를 추가할 수 있게 된다.First, access the wireless Internet service such as "n.Top" or "magic N" and ignore the complicated tree structure menu and press specific key (for example, "*", "#") to select the desired menu. Utters. At this time, the spoken voice is encoded and transmitted as data, and the server determines that the voice is voice based on the header information of the data and processes the voice to go directly to the desired information screen through the voice recognizer. Through such a service, a user interface of a small and inconvenient terminal can be improved to add a Voice User Interface (VUI) to a wireless Internet user access method.

둘째, 무선 상거래(Mobile Commerce) 등의 본인 인증 수단으로 비밀번호 외에도 음성을 이용한 화자인증 적용이 가능해진다. 즉, 원하는 물건과 일차적 본인인증을 거친 뒤, 보안을 높이기 위해 특정 약속된 패스워드(Password)를 발성하게 한다. 이때, 서버에서 단말기로 보코더 인에이블(Enable)을 명령하게 되고, 발성된 패스워드(Password)는 압축(Encoding)되어 일반 데이터와 동일하게 서버로 전송된다. 화자인증 후, 올바른 사용자로 인식되면, 계속하여 무선 상거래 과정(MobileCommerce Process)을 진행하게 된다.Second, it is possible to apply speaker authentication using voice as well as a password as a means of identity authentication such as mobile commerce (Mobile Commerce). In other words, after the desired identity with the desired object, a specific promised password is generated to increase security. At this time, the server commands the vocoder enable (Enable) from the terminal, and the spoken password is encoded and transmitted to the server in the same manner as general data. After the speaker authentication, if recognized as the correct user, the mobile commerce process (MobileCommerce Process) continues.

셋째, 무선 인터넷 서비스를 통하여 제공되는 이메일(E-mail) 전송 기능에서 작은 화면에서 긴 메일을 읽기 곤란하던 점을 개선할 수 있다. E-mail 전송후, 사용자가 음성듣기 기능을 선택하면, 서버에서 E-mail을 TTS(Text-to-Speech) 등을 통해 음성으로 변환한 후 EVRC 모듈을 통해 압축하여 단말기로 전송한다. 이후, 단말기에서는 보코더와 스피커를 인에이블(Enable)하여 음성을 디코딩(Decoding)하여 스피커로 출력함으로써 사용자에게 메일 읽어주기 서비스를 제공할 수 있다.Third, it is possible to improve the difficulty in reading long mails on a small screen in an E-mail transmission function provided through a wireless Internet service. After the E-mail transmission, if the user selects the voice listening function, the server converts the E-mail to voice through TTS (Text-to-Speech), etc., and then compresses the E-mail to the terminal through the EVRC module. Thereafter, the terminal can provide a mail reading service to the user by enabling the vocoder and the speaker, decoding the voice, and outputting the voice to the speaker.

상술한 바와 같은 본 발명의 방법은 프로그램으로 구현되어 컴퓨터로 읽을 수 있는 기록매체(씨디롬, 램, 롬, 플로피 디스크, 하드 디스크, 광자기 디스크 등)에 저장될 수 있다.The method of the present invention as described above may be implemented as a program and stored in a computer-readable recording medium (CD-ROM, RAM, ROM, floppy disk, hard disk, magneto-optical disk, etc.).

이상에서 설명한 본 발명은 전술한 실시예 및 첨부된 도면에 의해 한정되는 것이 아니고, 본 발명의 기술적 사상을 벗어나지 않는 범위 내에서 여러 가지 치환, 변형 및 변경이 가능하다는 것이 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에게 있어 명백할 것이다.The present invention described above is not limited to the above-described embodiments and the accompanying drawings, and various substitutions, modifications, and changes are possible in the art without departing from the technical spirit of the present invention. It will be clear to those of ordinary knowledge.

상기한 바와 같은 본 발명은, 데이터 채널 연결 상태에서도 음성을 사용가능하도록 함으로써, 문자 위주의 무선 인터넷 서비스를 탈피하여 음성 및 문자를 지원할 수 있는 무선 인터넷 서비스로의 확장 및 음성을 통한 화자인증 무선 상거래 서비스, 무선 메일 읽어주기 서비스가 가능하며, 이외에도 데이터와 음성의 동시서비스가 필요한 많은 부분에 유용하게 사용할 수 있으며, 이는 데이터 채널과 음성 채널을 동시에 잡고 있는 WAP 2.0의 WTA와 달리 데이터 채널상에서 음성의 지원이 가능하게 하여 과금 등의 별도 소프트웨어 개발이 필요없어 망 사업자의 이윤을 극대화시킬 수 있는 효과가 있다.The present invention as described above, by enabling the use of voice even in the data channel connection state, to escape the text-oriented wireless Internet service to the wireless Internet service that can support voice and text and speaker authentication wireless commerce through voice Service, wireless mail reading service is available, and it can be useful for many parts that need simultaneous service of data and voice.This is different from WTA 2.0 of WAP 2.0, which holds data channel and voice channel simultaneously. By enabling the support, there is no need to develop additional software such as billing, which can maximize profits of network operators.

Claims (6)

무선통신망에서의 음성파일 송수신 방법에 있어서,In the voice file transmission and reception method in a wireless communication network, 데이터 채널 연결 상태에서, 무선통신 단말기가 인터럽의 발생을 감지하는 데이터 채널 연결 및 인터럽트 발생 감지 단계;A data channel connection and interrupt generation detection step of detecting, by the wireless communication terminal, occurrence of an interrupt in a data channel connection state; 사용자 요구에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 보코더를 동작시켜, 사용자가 발화한 음성을 압축하여 데이터에 실어 데이터 채널을 통해 서버로 전송하는 음성파일 전송단계; 및A voice file transmission step of operating the vocoder by the wireless communication terminal when the interrupt occurs according to a user's request, compressing the voice spoken by the user, loading the data into a data, and transmitting the data to a server through a data channel; And 상기 서버로부터의 명령에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 상기 보코더를 동작시켜, 데이터 채널을 통해 상기 서버로부터 제공되는 음성파일을 디코딩하여 재생하는 음성파일 재생단계A voice file reproducing step in which the wireless communication terminal operates the vocoder to decode and reproduce a voice file provided from the server through a data channel when an interrupt is generated according to a command from the server. 를 포함하는 무선 데이터 채널상에서의 음성파일 송수신 방법.Voice file transmission and reception method over a wireless data channel comprising a. 제 1 항에 있어서,The method of claim 1, 상기 음성파일 전송단계 수행후에, 상기 서버가 데이터의 헤더 정보로부터 음성임을 감지하여, 해당 음성을 디코딩하여 음성을 복원하고, 음성에 대응되는 해당 무선 인터넷 서비스 기능을 수행하는 음성파일 복원 및 서비스 수행 단계After performing the voice file transmission step, the server detects that the voice is from the header information of the data, decodes the corresponding voice to restore the voice, and restores the voice file to perform the corresponding wireless Internet service function corresponding to the voice. 를 더 포함하는 무선 데이터 채널상에서의 음성파일 송수신 방법.Voice file transmission and reception method over a wireless data channel further comprising. 제 2 항에 있어서,The method of claim 2, 상기 무선 인터넷 서비스 기능은,The wireless Internet service function, 음성 및 문자를 지원할 수 있는 무선 인터넷 서비스, 음성을 통한 화자인증 무선 상거래 서비스, 무선 메일 읽어주기 서비스를 포함하는 것을 특징으로 하는 무선 데이터 채널상에서의 음성파일 송수신 방법.A method of transmitting and receiving a voice file on a wireless data channel, comprising a wireless Internet service capable of supporting voice and text, a speaker authentication wireless commerce service, and a wireless mail reading service. 제 1 항 내지 제 3 항 중 어느 한 항에 있어서,The method according to any one of claims 1 to 3, 상기 무선통신 단말기는,The wireless communication terminal, 데이터 채널로 연결되어 있더라도, 사용자의 요구에 따라 마이크 입력을 인에이블(Enable)시켜 상기 보코더를 통해 사용자가 발화한 음성을 압축(Encoding)한 후 그 출력(Output)인 압축된 음성형태의 선 스펙트럼 쌍(LSP) 파라미터를 일반 데이터와 동일하게 취급하여 상기 서버로 전송하고, 데이터 채널 연결중 상기 서버로부터의 명령에 따라 상기 보코더와 스피커의 동작을 인에이블(Enable)시켜 일반 데이터와 동일한 방식으로 수신된 음성/오디오 파일을 디코딩(Decoding)하여 출력하는 것을 특징으로 하는 무선 데이터 채널상에서의 음성파일 송수신 방법.Even when connected to the data channel, the microphone input is enabled according to the user's request to compress the voice uttered by the user through the vocoder, and then output the compressed voice spectrum as the output. Treats pair (LSP) parameters to the same as general data and transmits them to the server, and enables the operation of the vocoder and the speaker according to commands from the server during data channel connection, and receives them in the same manner as general data. A method of transmitting and receiving a voice file on a wireless data channel, characterized by decoding and outputting the decoded voice / audio file. 무선 데이터 채널상에서의 음성파일 송수신을 위하여, 프로세서를 구비한 무선통신망에,In a wireless communication network having a processor for transmitting and receiving a voice file on a wireless data channel, 데이터 채널 연결 상태에서, 무선통신 단말기가 인터럽의 발생을 감지하는 데이터 채널 연결 및 인터럽트 발생 감지 기능;A data channel connection and interrupt generation detection function for detecting, by the wireless communication terminal, occurrence of an interrupt in a data channel connection state; 사용자 요구에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 보코더를 동작시켜, 사용자가 발화한 음성을 압축하여 데이터에 실어 데이터 채널을 통해 서버로 전송하는 음성파일 전송기능; 및A voice file transmission function in which the wireless communication terminal operates a vocoder at the time of an interruption according to a user's request, compresses the voice spoken by the user, loads it into data, and transmits the data to a server through a data channel; And 상기 서버로부터의 명령에 따른 인터럽트 발생시에, 상기 무선통신 단말기가 상기 보코더를 동작시켜, 데이터 채널을 통해 상기 서버로부터 제공되는 음성파일을 디코딩하여 재생하는 음성파일 재생기능When an interrupt occurs according to a command from the server, the wireless communication terminal operates the vocoder to decode and reproduce a voice file provided from the server through a data channel. 을 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium having recorded thereon a program for realizing this. 제 5 항에 있어서,The method of claim 5, wherein 상기 음성파일 전송기능 수행후에, 상기 서버가 데이터의 헤더 정보로부터 음성임을 감지하여, 해당 음성을 디코딩하여 음성을 복원하고, 음성에 대응되는 해당 무선 인터넷 서비스 기능을 수행하는 음성파일 복원 및 서비스 수행 기능After performing the voice file transmission function, the server detects that the voice is from the header information of the data, decodes the voice, restores the voice, and performs a voice file restore and service performing function corresponding to the voice. 을 더 실현시키기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 기록매체.A computer-readable recording medium that records a program for further realization.
KR10-2001-0065514A 2001-10-23 2001-10-23 Speech signal transmission method on data channel KR100428717B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR10-2001-0065514A KR100428717B1 (en) 2001-10-23 2001-10-23 Speech signal transmission method on data channel

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR10-2001-0065514A KR100428717B1 (en) 2001-10-23 2001-10-23 Speech signal transmission method on data channel

Publications (2)

Publication Number Publication Date
KR20030033510A KR20030033510A (en) 2003-05-01
KR100428717B1 true KR100428717B1 (en) 2004-04-28

Family

ID=29566051

Family Applications (1)

Application Number Title Priority Date Filing Date
KR10-2001-0065514A KR100428717B1 (en) 2001-10-23 2001-10-23 Speech signal transmission method on data channel

Country Status (1)

Country Link
KR (1) KR100428717B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7069211B2 (en) * 2003-04-30 2006-06-27 Motorola, Inc. Method and apparatus for transferring data over a voice channel
KR100737358B1 (en) * 2004-12-08 2007-07-09 한국전자통신연구원 Method for verifying speech/non-speech and voice recognition apparatus using the same

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000049417A (en) * 2000-02-29 2000-08-05 이만균 Method and system for processing a voice internet command language
KR20000059944A (en) * 1999-03-10 2000-10-16 김두용 Digital Portable Mobile Telephone and Methods for Inputting/Outputting and Storing/Retrieving Voice Data Therefor
JP2001268241A (en) * 2000-03-15 2001-09-28 Nec Corp Wireless mobile terminal communication system
WO2001075667A1 (en) * 2000-03-30 2001-10-11 Nokia Corporation Multi-modal method for browsing graphical information displayed on mobile devices
KR20020073357A (en) * 2001-03-16 2002-09-26 (주)옴니텔 Method of connecting wireless internet sites using ASR

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000059944A (en) * 1999-03-10 2000-10-16 김두용 Digital Portable Mobile Telephone and Methods for Inputting/Outputting and Storing/Retrieving Voice Data Therefor
KR20000049417A (en) * 2000-02-29 2000-08-05 이만균 Method and system for processing a voice internet command language
JP2001268241A (en) * 2000-03-15 2001-09-28 Nec Corp Wireless mobile terminal communication system
WO2001075667A1 (en) * 2000-03-30 2001-10-11 Nokia Corporation Multi-modal method for browsing graphical information displayed on mobile devices
KR20020073357A (en) * 2001-03-16 2002-09-26 (주)옴니텔 Method of connecting wireless internet sites using ASR

Also Published As

Publication number Publication date
KR20030033510A (en) 2003-05-01

Similar Documents

Publication Publication Date Title
US7346496B2 (en) Method and apparatus to perform speech recognition over a data channel
AU684872B2 (en) Communication system
US6407325B2 (en) Background music play device and method thereof for mobile station
US7289461B2 (en) Communications using wideband terminals
EP0909081B1 (en) Method and apparatus for storing and forwarding voice signals
US7343282B2 (en) Method for transcoding audio signals, transcoder, network element, wireless communications network and communications system
US20070112571A1 (en) Speech recognition at a mobile terminal
JP4842472B2 (en) Method and apparatus for providing feedback from a decoder to an encoder to improve the performance of a predictive speech coder under frame erasure conditions
JPH1065597A (en) Voice message transmitter, voice message receiver and portable radio voice message communication equipment
MXPA04007668A (en) Tandem-free intersystem voice communication.
US7139704B2 (en) Method and apparatus to perform speech recognition over a voice channel
KR100428717B1 (en) Speech signal transmission method on data channel
JP3075067B2 (en) Digital mobile radio equipment
US20030013465A1 (en) System and method for pseudo-tunneling voice transmissions
JP3954288B2 (en) Speech coded signal converter
JP4507822B2 (en) Music providing system, music providing method, and music providing program
KR100723679B1 (en) Method for Delivering Audio Bitstream in Ring Back Tone Section by Using Voice Slot Data Structure of Code Division Multiple Access Mobile Communication Network
JP3885989B2 (en) Speech complementing method, speech complementing apparatus, and telephone terminal device
JPH11163974A (en) Telephone system and voice recording method
KR100760905B1 (en) Method of processing audio signals for improving the quality of output audio signal which is transferred to subscriber?s terminal over network and audio signal pre-processing apparatus of enabling the method
KR20070036870A (en) Optional encoding system and method for operating the system
KR20070071760A (en) Voice recording method in mobile communication device and mobile communication device thereof
KR20040061792A (en) Multi Voice Signal Processing Mobile Phone using general DSP Chip and Voice Signal Processing Method using the Phone

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130403

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20140325

Year of fee payment: 11

FPAY Annual fee payment

Payment date: 20160328

Year of fee payment: 13

FPAY Annual fee payment

Payment date: 20170329

Year of fee payment: 14

FPAY Annual fee payment

Payment date: 20190328

Year of fee payment: 16