KR20200009556A - 통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 - Google Patents
통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 Download PDFInfo
- Publication number
- KR20200009556A KR20200009556A KR1020180084074A KR20180084074A KR20200009556A KR 20200009556 A KR20200009556 A KR 20200009556A KR 1020180084074 A KR1020180084074 A KR 1020180084074A KR 20180084074 A KR20180084074 A KR 20180084074A KR 20200009556 A KR20200009556 A KR 20200009556A
- Authority
- KR
- South Korea
- Prior art keywords
- text
- call
- voice data
- voice
- packet
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 27
- 238000006243 chemical reaction Methods 0.000 claims abstract description 23
- 238000005070 sampling Methods 0.000 claims description 8
- 230000000977 initiatory effect Effects 0.000 claims description 4
- 230000009977 dual effect Effects 0.000 claims description 3
- 238000012546 transfer Methods 0.000 claims description 3
- 238000004148 unit process Methods 0.000 claims 1
- 238000007726 management method Methods 0.000 description 49
- 238000010586 diagram Methods 0.000 description 16
- 238000012545 processing Methods 0.000 description 7
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M3/00—Automatic or semi-automatic exchanges
- H04M3/42—Systems providing special services or facilities to subscribers
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Telephonic Communication Services (AREA)
Abstract
Description
도 1은 본 발명의 일 실시예에 따른 통화 관리 시스템의 개략적 구성도이다.
도 2는 도 1의 텍스트 관리 서버의 개략적 구성도이다.
도 3은 도 2의 텍스트 관리 서버가 Tx 및 Rx의 음성 데이터를 분류하는 예시도이다.
도 4a 및 도 4b는 도 2의 텍스트 관리 서버가 통화 음성 패킷을 발신 음성 패킷 및 수신 음성 패킷으로 분류하는 예시도이다.
도 5는 도 2의 텍스트 관리 서버가 수신한 통화 음성 패킷 중에서 SID 패킷의 예시도이다.
도 6은 도 2의 텍스트 관리 서버가 도 5의 SID 패킷의 타임스탬프의 시간을 계산하는 예시도이다.
도 7은 본 발명의 다른 실시예에 따라 도 1의 텍스트 관리 서버가 발신 음성 데이터와 수신 음성 데이터를 하나의 통합된 음성 스트림으로 믹싱하는 예시도이다.
도 8a 및 도 8b는 도 7의 믹싱에서 늦게 도착된 발신 또는 수신 측의 음성 데이터의 시작 위치를 늦추는 예시도이다.
도 9는 본 발명의 일 실시예에 따른 통화 음성의 텍스트 관리 방법의 개략적 순서도이다.
120 : 텍스트 관리 서버 140 : TAS
150 : CSCF 170 : 수신자 통화 단말
Claims (18)
- 서비스 가입자의 통화 음성을 텍스트 변환하고, 변환된 텍스트를 관리하는 장치에 있어서,
상기 서비스 가입자가 발신자 또는 수신자가 되는 통화의 음성 데이터를 수신하는 수신부;
상기 수신된 음성 데이터를 발신 음성 데이터 및 수신 음성 데이터로 각각 분류하는 분류부;
상기 분류된 음성 데이터를 발신 텍스트 및 수신 텍스트의 데이터로 각각 변환하는 변환부;
상기 변환된 발신자의 발신 텍스트 및 수신자의 수신 텍스트를 구분하고 시간순으로 나열하여 통화 텍스트를 생성하는 통화 텍스트부; 및
서비스 가입자의 요청에 의해, 상기 생성된 통화 텍스트를 조회하여 서비스 가입자의 단말로 제공하는 제공부
를 포함하는 장치. - 제 1항에 있어서,
통화 중인 상기 서비스 가입자의 통화 단말로부터 텍스트 변환을 요청하는 DTMF(Dual Tone Multiple Frequency) 신호를 수신하는 DTMF부를 더 포함하고,
상기 분류부는 수신된 상기 DTMF 신호에 의해 분류 처리하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
상기 분류부는,
SIP(Session Initiation Protocol) 메시지의 발신 측 아이피 및 포트, 수신 측 아이피 및 포트와 RTP(Realtime Transfer Protocol) 패킷의 동기화 소스 아이디를 참조하여 발신 및 수신의 음성 데이터를 각각 분류하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
상기 분류된 발신 음성 데이터 및 수신 음성 데이터의 RTP 패킷 중에서 음성 패킷만을 남기기 위해 무음에 해당되는 SID(Silence Indicator) 패킷을 제거하는 무음 제거부를 더 포함하고,
상기 변환부는 남겨진 상기 음성 패킷에 대해 STT(Speech To Text) 엔진을 이용하여 텍스트로 변환하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
SIP 메시지의 SDP(Session Description Protocol)의 ptime 값에서 참조된 RTP 패킷의 시간 분량을 이용하여 변환된 텍스트의 타임스탬프 정보로서 음성 발생 시간을 계산하는 타임스탬프부를 더 포함하는 것을 특징으로 하는 장치. - 제 5항에 있어서,
상기 타임스탬프부는,
상기 RTP 패킷의 코덱 정보를 확인하고, 확인된 코덱의 샘플링 레이트로부터 초당 증가하는 타임스탬프를 확인하고, 직전 패킷으로부터 증가된 SID 패킷의 타임스탬프 값으로부터 상기 SID 패킷의 시간 분량을 계산하고, 상기 RTP 패킷의 시간 분량 및 상기 계산된 SID 패킷의 시간 분량을 이용하여, 상기 음성 발생 시간을 계산하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
상기 통화 텍스트부는,
발신 전화번호, 수신 전화번호, 총 통화 시간, 발신 텍스트 데이터 및 음성 발생 시간의 적어도 하나 이상의 세트, 수신 텍스트 데이터 및 음성 발생 시간의 적어도 하나 이상의 세트를 포함하는 상기 통화 텍스트를 저장하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
상기 발신 음성 데이터 및 상기 수신 음성 데이터 중에서 먼저 도착된 음성 데이터의 시작 위치에서, 상기 먼저 도착된 음성 데이터의 RTP 패킷의 시간만큼 시간을 뒤로하여 늦게 도착된 발신 또는 수신의 음성 데이터의 시작 위치를 설정하고, 설정된 시작 위치를 이용하여 각각의 상기 발신 음성 데이터 및 상기 수신 음성 데이터의 음성 스트림을 하나의 통합된 음성 데이터의 스트림으로 믹싱하는 믹싱부를 더 포함하고,
상기 제공부는 상기 통합된 음성 데이터를 제공하는 것을 특징으로 하는 장치. - 제 1항에 있어서,
상기 제공부는,
문자 메시지, 이메일, SNS(Social Network Service), 웹 페이지 중에서 적어도 하나 이상을 이용하여 상기 통화 텍스트를 서비스 가입자의 단말로 제공하는 것을 특징으로 하는 장치. - 장치가 서비스 가입자의 통화 음성을 텍스트 변환하고, 변환된 텍스트를 관리하는 방법에 있어서,
상기 서비스 가입자가 발신자 또는 수신자가 되는 통화의 음성 데이터를 수신하는 단계;
상기 수신된 음성 데이터를 발신 음성 데이터 및 수신 음성 데이터로 각각 분류하는 단계;
상기 분류된 음성 데이터를 발신 텍스트 및 수신 텍스트의 데이터로 각각 변환하는 단계;
상기 변환된 발신자의 발신 텍스트 및 수신자의 수신 텍스트를 구분하고 시간순으로 나열하여 통화 텍스트를 생성하는 단계; 및
상기 서비스 가입자의 요청에 의해, 상기 생성된 통화 텍스트를 조회하여 서비스 가입자의 단말로 제공하는 단계
를 포함하는 방법. - 제 10항에 있어서,
상기 분류하는 단계 이전에,
통화 중인 상기 서비스 가입자의 통화 단말로부터 텍스트 변환을 요청하는 DTMF(Dual Tone Multiple Frequency) 신호를 수신하는 단계를 더 포함하고,
상기 분류하는 단계는, 수신된 상기 DTMF 신호에 의해 분류 처리하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 분류하는 단계는,
SIP(Session Initiation Protocol) 메시지의 발신 측 아이피 및 포트, 수신 측 아이피 및 포트와 RTP(Realtime Transfer Protocol) 패킷의 동기화 소스 아이디를 참조하여 발신 및 수신의 음성 데이터를 각각 분류하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 분류하는 단계 이후로,
상기 분류된 발신 음성 데이터 및 수신 음성 데이터의 RTP 패킷 중에서 음성 패킷만을 남기기 위해 무음에 해당되는 SID(Silence Indicator) 패킷을 제거하는 단계를 더 포함하고,
상기 변환하는 단계는 남겨진 상기 음성 패킷에 대해 STT(Speech To Text) 엔진을 이용하여 텍스트로 변환하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 변환하는 단계 이후로,
SIP 메시지의 SDP(Session Description Protocol)의 ptime 값에서 참조된 RTP 패킷의 시간 분량을 이용하여 변환된 텍스트의 타임스탬프 정보로서 음성 발생 시간을 계산하는 단계를 더 포함하는 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 계산하는 단계는,
상기 RTP 패킷의 코덱 정보를 확인하고, 확인된 코덱의 샘플링 레이트로부터 초당 증가하는 타임스탬프를 확인하고, 직전 패킷으로부터 증가된 SID 패킷의 타임스탬프 값으로부터 상기 SID 패킷의 시간 분량을 계산하고, 상기 RTP 패킷의 시간 분량 및 상기 계산된 SID 패킷의 시간 분량을 이용하여, 상기 음성 발생 시간을 계산하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 생성하는 단계는,
발신 전화번호, 수신 전화번호, 총 통화 시간, 발신 텍스트 데이터 및 타임스탬프의 적어도 하나 이상의 세트, 수신 텍스트 데이터 및 타임스탬프의 적어도 하나 이상의 세트를 포함하는 상기 통화 텍스트를 저장하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 제공하는 단계 이전에,
상기 발신 음성 데이터 및 상기 수신 음성 데이터 중에서 먼저 도착된 음성 데이터의 시작 위치에서, 상기 먼저 도착된 음성 데이터의 RTP 패킷의 시간만큼 시간을 뒤로하여 늦게 도착된 발신 또는 수신의 음성 데이터의 시작 위치를 설정하고, 설정된 시작 위치를 이용하여 각각의 상기 발신 음성 데이터 및 상기 수신 음성 데이터의 음성 스트림을 하나의 통합된 음성 데이터의 스트림으로 믹싱하는 단계를 더 포함하고,
상기 제공하는 단계는 상기 통합된 음성 데이터를 제공하는 단계인 것을 특징으로 하는 방법. - 제 10항에 있어서,
상기 제공하는 단계는,
문자 메시지, 이메일, SNS(Social Network Service), 웹 페이지 중에서 적어도 하나 이상을 이용하여 상기 통화 텍스트를 서비스 가입자의 단말로 제공하는 단계인 것을 특징으로 하는 방법.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180084074A KR102136393B1 (ko) | 2018-07-19 | 2018-07-19 | 통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020180084074A KR102136393B1 (ko) | 2018-07-19 | 2018-07-19 | 통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20200009556A true KR20200009556A (ko) | 2020-01-30 |
KR102136393B1 KR102136393B1 (ko) | 2020-07-21 |
Family
ID=69321962
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180084074A KR102136393B1 (ko) | 2018-07-19 | 2018-07-19 | 통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102136393B1 (ko) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20220121456A (ko) | 2021-02-25 | 2022-09-01 | 박서현 | 대화 텍스트를 카테고리화하여 저장 가능한 화자구분 시스템 |
KR102666826B1 (ko) | 2021-02-25 | 2024-05-20 | 오동길 | Stt를 활용한 화자구분 시스템 |
KR20220122099A (ko) | 2021-02-26 | 2022-09-02 | 박서현 | 다중언어의 종류에 따른 화자구분 시스템 |
KR20220122098A (ko) | 2021-02-26 | 2022-09-02 | 박서현 | 실시간 화자구분 시스템 |
KR20230124395A (ko) | 2022-02-18 | 2023-08-25 | 오진주 | 일치율을 바탕으로 음성데이터 전송 시스템 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100935524B1 (ko) | 2003-01-13 | 2010-01-06 | 주식회사 케이티 | 발신자에 의한 전화 통화내용 녹음 및 통화내역관리서비스 방법 |
KR20150047150A (ko) * | 2013-10-23 | 2015-05-04 | 에스케이플래닛 주식회사 | 음성을 텍스트로 변환하는 채팅 서비스 장치 및 방법과, 채팅 서비스 시스템 |
KR101827320B1 (ko) * | 2017-06-08 | 2018-02-09 | 윤준호 | 인공지능 콜센터 서버 |
-
2018
- 2018-07-19 KR KR1020180084074A patent/KR102136393B1/ko active IP Right Grant
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100935524B1 (ko) | 2003-01-13 | 2010-01-06 | 주식회사 케이티 | 발신자에 의한 전화 통화내용 녹음 및 통화내역관리서비스 방법 |
KR20150047150A (ko) * | 2013-10-23 | 2015-05-04 | 에스케이플래닛 주식회사 | 음성을 텍스트로 변환하는 채팅 서비스 장치 및 방법과, 채팅 서비스 시스템 |
KR101827320B1 (ko) * | 2017-06-08 | 2018-02-09 | 윤준호 | 인공지능 콜센터 서버 |
Also Published As
Publication number | Publication date |
---|---|
KR102136393B1 (ko) | 2020-07-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102136393B1 (ko) | 통화 음성으로부터 변환된 텍스트를 관리하는 장치 및 방법 | |
US7656861B2 (en) | Method and apparatus for interleaving text and media in a real-time transport session | |
CA2612645C (en) | Method and system for configuring information regarding processing of calls involving a party | |
US20070263604A1 (en) | Ring back notification system and method therefor | |
US11962716B2 (en) | Method and system for providing captioned telephone services | |
US7486665B2 (en) | Transport of DTMF tones over VOATM/VOIP networks | |
CN103379232A (zh) | 通信服务器、通信终端和语音通信方法 | |
US20180324303A1 (en) | Web real-time communication from an audiovisual file | |
EP1786188B1 (en) | System and method for providing multimedia contents during a call setup phase | |
US9042526B2 (en) | Method and apparatus for enabling a calling party to leave a voice message for a called party in response to a command provided by the calling party | |
US20090290698A1 (en) | Method and device for transmitting voice data in a communication network | |
JP6606697B1 (ja) | 通話システム、及び通話プログラム | |
WO2010130193A1 (zh) | 音频媒体发包控制装置、方法及音频媒体服务器 | |
CN101577767A (zh) | 用于电信服务的实时语音至文本转换 | |
US7920831B2 (en) | PTT/PTS signaling in an internet protocol network | |
CN100426826C (zh) | 一种留言灯的实现方法及通信系统 | |
CA2705961C (en) | Method and apparatus for enabling a calling party to leave a voice message for a called party | |
CN108650425B (zh) | 监听方法及监听系统 | |
US8837459B2 (en) | Method and apparatus for providing asynchronous audio messaging | |
US8625577B1 (en) | Method and apparatus for providing audio recording | |
US9197754B2 (en) | Preconfigured sender communication | |
JP6552027B1 (ja) | 通信装置、通信データ記録システム、通信方法、およびプログラム | |
JP2005151044A (ja) | 音声ミキシング方法、音声ミキシングシステム及び音声ミキシングのためのプログラム | |
WO2019111810A1 (ja) | 通信装置、通信データ記録システム、通信方法、およびプログラム | |
EP2385691B1 (en) | Call handling during parking state |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180719 |
|
PA0201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20191210 Patent event code: PE09021S01D |
|
PG1501 | Laying open of application | ||
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20200427 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20200715 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20200715 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration | ||
PR1001 | Payment of annual fee |
Payment date: 20230628 Start annual number: 4 End annual number: 4 |
|
PR1001 | Payment of annual fee |
Payment date: 20240625 Start annual number: 5 End annual number: 5 |