Nothing Special   »   [go: up one dir, main page]

KR20130116128A - 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법 - Google Patents

티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법 Download PDF

Info

Publication number
KR20130116128A
KR20130116128A KR1020120038840A KR20120038840A KR20130116128A KR 20130116128 A KR20130116128 A KR 20130116128A KR 1020120038840 A KR1020120038840 A KR 1020120038840A KR 20120038840 A KR20120038840 A KR 20120038840A KR 20130116128 A KR20130116128 A KR 20130116128A
Authority
KR
South Korea
Prior art keywords
voice
answer
question
sentence
text
Prior art date
Application number
KR1020120038840A
Other languages
English (en)
Inventor
윤재민
Original Assignee
윤재민
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 윤재민 filed Critical 윤재민
Priority to KR1020120038840A priority Critical patent/KR20130116128A/ko
Publication of KR20130116128A publication Critical patent/KR20130116128A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L13/00Speech synthesis; Text to speech systems
    • G10L13/08Text analysis or generation of parameters for speech synthesis out of text, e.g. grapheme to phoneme translation, prosody generation or stress or intonation determination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/221Announcement of recognition results

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

본 발명은 티티에스를 이용한 음성인식 질의응답 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 사용자의 음성으로부터 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하며;
사용자가 음성으로 질문을 입력하면, 음성인식 후 텍스트로 변환하고, 질의응답을 수행하여, 상기 질의 응답에 의해서 입력한 문장에 대한 답변을 음성과 텍스트로 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템 및 그 방법에 관한 것이다.

Description

티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법{Question answering system using speech recognition by TTS, its application method thereof}
본 발명은 티티에스를 이용한 음성인식 질의응답 시스템 및 그 방법에 관한 것으로, 더욱 상세하게는 사용자의 음성으로부터 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하며;
사용자가 음성으로 질문을 입력하면, 음성인식 후 텍스트로 변환하고, 질의응답을 수행하여, 상기 질의 응답에 의해서 입력한 문장에 대한 답변을 음성과 텍스트로 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템 및 그 방법에 관한 것이다.
질의응답시스템은 사용자가 원하는 지식을 얻기 위해 시스템에게 질문을 하고, 시스템은 이를 분석하여 관련 답변을 출력하는 것으로써, 현재까지 다양한 방법으로 질의응답 시스템을 구현하여 왔다. 그러나, 기존 시스템은 모두 질문과 답변이 텍스트형태로 저장되고 표현되는 한계점을 가지고 있다.
본 발명은 상기한 문제점을 해결하기 위하여 제안된 것으로서, 음성으로 질문과 답변 문장을 저장하는 방법과, 음성으로 대화하는 방법을 제시하였다.
상기한 바와 같은 목적을 달성하기 위한 본 발명의 특징에 따른 티티에스를 이용한음성인식 질의응답 시스템은
사용자의 음성으로부터 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하며,
사용자가 음성으로 질문을 입력하면, 음성인식 후 텍스트로 변환하고, 질의응답을 수행하여, 상기 질의 응답에 의해서 입력한 문장에 대한 답변을 음성과 텍스트로 출력하는 것을 포함한다.
또한, 본 발명의 특징에 따른 티티에스를 이용한음성인식 질의응답 시스템은
음성을 입력받는 음성입력장치,
상기 음성입력장치를 통해서 전달된 아날로그 음성을 디지털신호로 변환하는 음성입력부,
상기 음성입력부에서 수신된 음성정보로부터 음성인식을 수행하는 음성인식부, 상기 음성인식부에 의해 음성에서 텍스트로 변환된 정보를 토대로 인덱싱하거나 질의응답을 수행하는 자연어처리부,
상기 자연어처리부로부터 전달된 답변을 텍스트로 모니터 화면에 출력하는 텍스트 출력부,
상기 답변 문장을 음성으로 바꾸는 티티에스부, 상기 음성을 디지털 신호에서 아날로그 신호로 변환하는 음성출력부,
상기 음성을 이어폰이나 스피커로 출력시키는 음성출력장치를 포함한다.
또한, 본 발명의 특징에 따른 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질문과 답변문장을 저장하는 방법은,
음성으로 질문과 답변을 입력받는 1단계;
음성인식하는 2단계;
음성인식한 문장을 질문과 답변 문장으로 저장하는 3단계;
상기 질문과 답변 문장을 인덱싱하는 4단계;
를 포함한다.
그리고, 본 발명의 특징에 따른 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질의응답 대화하는 방법은
음성으로 질문을 입력 받는 1단계;
음성인식하는 2단계;
상기 음성인식 후 발생한 문장정보(텍스트)로 질의응답처리하는 3단계;
상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계;
를 포함한다.
이와 같은 본 발명의 실시예에 따르면, 음성으로 질문과 답변 문장을 저장하거나, 음성으로 대화하는 효과가 있다.
도 1은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템의 내부 구성을 나타내는 도면이다.
도 2는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도이다.
도 3은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면이다.
도 4는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도이다.
도 5는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면이다.
도 6은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 대화하는 화면의 일예이다.
도 7은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 대화하는 화면의 일예이다.
도 8은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면의 일예이다.
도 9은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면의 일예이다.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세하게 설명하면 다음과 같다.
본 발명은 여러 가지 상이한 형태로 구현될 수 있으므로, 여기에서 설명하는 실시예에 한정되지 않으며, 도면에서 본 발명을 명확하게 설명하기 위하여 설명과 관계없는 부분은 생략하였다.
도 1은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템의 내부 구성을 나타내는 도면이다.
도 1에 도시된 바와 같이, 본 발명은
음성을 입력받는 음성입력장치(100),
상기 음성입력장치를 통해서 전달된 아날로그 음성을 디지털신호로 변환하는 음성입력부(110),
상기 음성입력부에서 수신된 음성정보로부터 음성인식을 수행하는 음성인식부(120), 상기 음성인식부에 의해 음성에서 텍스트로 변환된 정보를 토대로 인덱싱하거나 질의응답을 수행하는 자연어처리부(130),
상기 자연어처리부로부터 전달된 답변을 텍스트로 모니터(150) 화면에 출력하는 텍스트 출력부(140),
상기 답변 문장을 음성으로 바꾸는 티티에스부(161), 상기 음성을 디지털 신호에서 아날로그 신호로 변환하는 음성출력부(160),
상기 음성을 이어폰이나 스피커로 출력시키는 음성출력장치(170)를 포함한다.
이를 통해서 사용자의 음성으로부터 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하며,
사용자가 음성으로 질문을 입력하면, 음성인식 후 텍스트로 변환하고, 질의응답을 수행하여, 상기 질의 응답에 의해서 입력한 문장에 대한 답변을 음성과 텍스트로 출력할 수 있다.
본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템은 개인용 컴퓨터(PC), 노트북, 스마트폰(아이폰, 안드로이드폰, 구글폰 등) 등 쌍방향 음성 및 데이터 통신이 가능한 매체에서 운용될 수 있다.
여기서, 티티에스는 문자음성 자동변환 기술로써, Text to speech의 줄임말이다
상기 음성입력부(110)는 소정의 질문 입력부와 답변 입력부를 제공하고,
상기 질문 입력부는 사용자에게서 질문을 음성으로 입력받으면, 음성인식 후 질문음성을 질문문장으로 표시하고,
상기 답변 입력부는 사용자에게서 답변을 음성으로 입력받으면, 음성인식 후 답변음성을 답변문장으로 표시하고,
질문과 답변의 음성입력이 완료되어 사용자로부터 입력완료 버턴 클릭을 감지하면, 상기 질문문장과 상기 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템은 사용자의 음성을 감지해서 음성인식된 결과를 질문입력창에 표시하고, 질의응답에 의해 상기 질문에 대한 답변문장을 찾아 답변입력창에 답변문장을 표시하고, 티티에스를 이용해서 답변음성을 출력한다.
또한, 티티에스를 이용해서 답변을 출력할 때에는 목소리 종류별, 나이별, 성별로 다양한 티티에스목소리를 제공하여, 사용자가 선택할 수 있다.
또한, 사용자의 음성을 감지해서, 유의미한 음성으로 감지된 음성데이터를 음성인식 후, 음성인식된 결과가 없을 경우, 다시 음성을 입력하라는 메시지를 표시하여, 사용자에게 정확하게 음성을 입력하게 한다.
음성입력과 출력방법은 외부 마이크나 단말기 내부 마이크인 음성입력장치로 전달된 아날로그 신호인 질문음성을 음성입력부에서 디지털신호로 변환하고, 음성출력부로 전달된 답변음성을 이어폰이나 스피커로 구성되는 음성출력장치를 통해서 아날로그 신호로 변환하여 출력한다.
이때, 텍스트 출력부는 텍스트정보를 단말기 화면상에 표시한다.
상기 음성인식부(120)에서 음성인식 후, 음성인식한 결과인 문장 텍스트정보는 질의응답DB에 저장하여, 상기 질의응답DB(121)에 질문과 답변 문장의 쌍으로 구성된 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB(122)에 저장한다.
또한, 상기 음성인식부(120)는 소정의 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 상기 문장 텍스트는 텍스트정보로 저장한다.
상기 자연어처리부(130)는, 상기 음성인식부(120)에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈(132)에 의해서 답변을 찾거나 답변을 생성한다.
그리고, 상기 질의응답모듈(132)은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성하게 된다.
상기 질의응답모듈(132)은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성할 수 있다.
티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질문과 답변문장을 저장하는 방법은,
음성으로 질문과 답변을 입력받는 1단계(S100);
음성인식하는 2단계(S110);
음성인식한 문장을 질문과 답변 문장으로 저장하는 3단계(S120_;
상기 질문과 답변 문장을 인덱싱하는 4단계(S130);
를 포함한다.
도 2는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타내는 흐름도이다.
질문과 답변에 대한 사용자의 음성을 입력받아서(S200), 질문과 답변에 대한 음성을 인식(S210)해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 추출해서(S220), 질의응답DB(S230)에 저장하며, 상기 질문과 답변문장을 인덱싱하여(S240) 인덱싱DB(S250)저장한다.
인덱싱DB에는 질문과 답변 문장에 나타난 단어들의 형태소 정보리스트와 이 형태소가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
도 3은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로부터 질문과 답변을 저장하는 방법을 나타낸 도면이다.
상기 음성으로 질문과 답변을 입력 받는 절차는,
소정의 질문 입력부와 답변 입력부를 제공하고, 사용자에게 상기 질문 입력부를 제공하여 질문을 음성으로 입력받으면, 음성인식 결과를 회신 받아서, 질문음성을 질문텍스트로 표시하고,
사용자에게 상기 답변 입력부를 제공하여 답변을 음성으로 입력받으면, 음성인식 결과를 회신 받아서, 답변음성을 답변텍스트로 표시하고,
질문과 답변의 음성입력이 완료되어 사용자로부터 입력완료 버턴을 클릭이 감지되면, 상기 질문문장과 상기 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장한다.
음성인식하고 저장할 때에는,
질문입력음성과 답변입력음성을 각각 전달받아서 음성을 질문문장과 답변문장으로 변환하여 DB에 저장하고, 형태소 분석 과정을 거쳐서 키워드별로 인덱싱하여, 상기 키워드별 상기 키워드가 나타난 질문문장과 답변문장의 위치정보(문장번호)를 기록한다.
도 4는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타내는 흐름도이다.
티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질의응답 대화하는 방법은
음성으로 질문을 입력 받는 1단계(S300);
음성인식하는 2단계(S310);
상기 음성인식 후 발생한 문장정보(텍스트)로 질의응답처리하는 3단계(S320);
상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계(S330);
를 포함한다.
음성으로 질문을 입력 받는 1단계는,
사용자의 음성을 감지해서 음성인식된 결과를 회신받아 질문입력창에 표시하고, 상기 질문에 대한 답변문장을 질의응답 후, 답변입력창에 답변문장을 표시하고, 답변음성을 티티에스로 출력한다.
음성으로 질문을 입력 받는 1단계는,
별도의 음성입력장치가 단말기 외부에 부착되거나 내장된 음성입력장치(마이크)를 이용하여 사용자의 질문 음성을 실시간으로 입력 받을 수 있다.
여기서, 음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함한다.
음성인식하는 2단계는,
소정의 음성인식 알고리즘에 의해 음성을 인식해서 텍스트(문장)로 변환하는 것을 포함한다.
상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
음성에서 텍스트(문장)로 변환된 질문정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성한다.
상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
상기 질의응답모듈은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는다.
상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
상기 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성할 수 있다.
상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계는,
질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, 티티에스를 통해서 음성을 출력하고 해당 답변 문장을 텍스트(문장)로 표시한다.
상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계는,
질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, 티티에스를 통해서 음성을 출력할 때에는, 목소리 종류별, 나이별, 성별로 다양한 티티에스목소리를 제공하여, 사용자가 선택할 수 있다.
또한, 상기 1단계 이후에는,
음성인식한 결과를 정확하게 입력되었는지 확인 받는 단계를 더 포함한다.
도 5는 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 질의응답 대화하는 방법을 나타낸 도면이다.
사용자의 음성을 감지해서 질문을 입력받으면, 음성 아날로그 신호를 디지털신호로 변환하여 질문에 대한 음성을 인식해서(S400) 질문 문장으로 변환하며, 질의응답과정를 수행하여(S410), 상기 질문 문장에 대한 답변 텍스트 정보를 음성과 텍스트 형태로 출력한다.
상기 질의응답(S410)은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변(S430)을 요구하는 질문은 미리 구축된 답변DB(S431)에서 답변을 가져오고, 특정 정보를 요청(S440)할 때는 해당 정보를 토대로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법(S420)을 이용하여 인덱싱DB(S421)와 질의응답사전DB(S422)를 이용해서 답변문장을 찾는다.
즉, 질문 문장에 포함되어 있는 형태소(단어)정보를 인덱싱 DB(S421)에서 찾고, 해당 형태소 정보가 포함된 질문, 답변 문장 번호를 질의응답사전DB(S422)에서 찾아서, 질문 문장에 포함된 형태소 정보가 가장 많이 나타난 질문이나 답변을 질의응답사전DB(S422)에 찾아서, 해당 질문과 답변 쌍에서 답변을 추출하고 음성과 텍스트 형태로 출력하게 한다.
도 6은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 대화하는 화면의 일예이다.
음성으로 대화할 때에는 질문음성입력시작버턴(S500)을 클릭해서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 질문 음성입력창(S510)에 음성인식한 문장(너는 누구니?)이 표시된다.
보내기(S520)를 클릭하면 질의응답 기능에 의해 답변문장 텍스트를 리턴하고, 이 답변문장을 답변표시창(S540)에 표시하면 (나는 로봇입니다.)가 출력된다. 또한, 답변 문장을 티티에스를 이용해서 스피커나 이어폰으로 출력하게 된다.
보내기 버턴은 눌러도 되고 디폴트로 설정하여 누르지 않아도 질문 음성입력창에 음성인식한 문장을 표시하자 마자 질의응답 기능에 의해 답변 문장을 수신 받을 수 있다.
도 7은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 음성으로 대화하는 화면의 일예이다.
음성으로 대화할 때에는 자동으로 사용자의 음성을 입력 받을 수 있다. 또한, 자동 음성입력이 감지되면, 질의응답 기능에 의해 자동 답변을 음성과 텍스트 형태로 출력할 수도 있다.
도 8은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면의 일예이다.
음성으로부터 질문과 답변을 저장하기 위해서는 먼저, 음성입력 전에, 질문음성입력시작 버턴(S600)을 눌러서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 질문 음성입력창(S610)에 음성인식한 문장(사랑해요)이 표시된다.
또한, 답변음성입력시작 버턴(S630)을 눌러서 사용자의 음성을 입력 받는다. 입력 받은 후, 음성인식이 수행되면 답변입력창(S620)에 음성인식한 문장(나도 사랑해요)이 표시된다.
입력완료버턴(S660)을 누르면, 질의응답 기능에 의해 음성으로부터 입력한 질문과 답변에 해당하는 음성은, 음성인식되어 질문과 답변 문장 텍스트로 각각 저장된다.
초기화 버턴(S620, S650)을 누르면 음성입력창(S610)과 답변입력창(S620)에 입력된 문장을 삭제할 수 있다.
도 9은 본 발명의 실시예에 따른 티티에스를 이용한 음성인식 질의응답 시스템에서 질문과 답변 음성입력 후, 질문과 답변 문장 표시 화면의 일예이다.
음성으로부터 질문과 답변을 저장하기 위해서는 먼저, 질문 음성을 입력받고, 그 후 답변 음성을 입력 받는다.
입력완료버턴(S660_1)을 누르면, 질의응답 기능에 의해 음성으로부터 입력한 질문과 답변에 해당하는 음성은, 음성인식되어 질문과 답변 문장 텍스트로 각각 저장된다.
100 : 음성입력장치
110 : 음성입력부
120 : 음성인식부
130 : 자연어처리부
140 : 텍스트 출력부
150 : 모니터
160 : 음성출력부
161 : 티티에스부
170 : 음성출력장치

Claims (27)

  1. 사용자의 음성으로부터 질문과 답변에 대한 음성을 인식해서 질문과 답변 문장으로 변환하여, 상기 질문과 답변에 대한 텍스트파일을 저장하고, 상기 질문과 답변문장을 인덱싱하여 저장하며,
    사용자가 음성으로 질문을 입력하면, 음성인식 후 텍스트로 변환하고, 질의응답을 수행하여, 상기 질의 응답에 의해서 입력한 문장에 대한 답변을 음성과 텍스트로 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  2. 음성을 입력받는 음성입력장치,
    상기 음성입력장치를 통해서 전달된 아날로그 음성을 디지털신호로 변환하는 음성입력부,
    상기 음성입력부에서 수신된 음성정보로부터 음성인식을 수행하는 음성인식부, 상기 음성인식부에 의해 음성에서 텍스트로 변환된 정보를 토대로 인덱싱하거나 질의응답을 수행하는 자연어처리부,
    상기 자연어처리부로부터 전달된 답변을 텍스트로 모니터 화면에 출력하는 텍스트 출력부,
    상기 답변 문장을 음성으로 바꾸는 티티에스부, 상기 음성을 디지털 신호에서 아날로그 신호로 변환하는 음성출력부,
    상기 음성을 이어폰이나 스피커로 출력시키는 음성출력장치로 구성되는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  3. 제 1항 및 2항에 있어서,
    음성입력부는 소정의 질문 입력부와 답변 입력부를 제공하고,
    상기 질문 입력부는 사용자에게서 질문을 음성으로 입력받으면, 음성인식 후 질문음성을 질문문장으로 표시하고,
    상기 답변 입력부는 사용자에게서 답변을 음성으로 입력받으면, 음성인식 후 답변음성을 답변문장으로 표시하고,
    질문과 답변의 음성입력이 완료되어 사용자로부터 입력완료 버턴 클릭을 감지하면, 상기 질문문장과 상기 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  4. 제 1항 및 2항에 있어서,
    사용자의 음성을 감지해서 음성인식된 결과를 질문입력창에 표시하고, 질의응답에 의해 상기 질문에 대한 답변문장을 찾아 답변입력창에 답변문장을 표시하고, 티티에스를 이용해서 답변음성을 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  5. 제 1항 및 2항에 있어서,
    티티에스를 이용해서 답변을 출력할 때에는 목소리 종류별, 나이별, 성별로 다양한 티티에스목소리를 제공하여, 사용자가 선택할 수 있는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  6. 제 1항 및 2항에 있어서,
    사용자의 음성을 감지해서, 유의미한 음성으로 감지된 음성데이터를 음성인식 후, 음성인식된 결과가 없을 경우, 다시 음성을 입력하라는 메시지를 표시하여, 사용자에게 정확하게 음성을 입력하게 하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  7. 제 1항 및 2항에 있어서,
    외부 마이크나 단말기 내부 마이크인 음성입력장치로 전달된 아날로그 신호인 질문음성을 음성입력부에서 디지털신호로 변환하고, 음성출력부로 전달된 답변음성을 이어폰이나 스피커로 구성되는 음성출력장치를 통해서 아날로그 신호로 변환하여 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  8. 제 1항 및 2항에 있어서,
    텍스트 출력부는 텍스트정보를 단말기 화면상에 표시하는 것을 특징으로 티티에스를 이용한 음성인식 질의응답 시스템.
  9. 제 1항 및 2항에 있어서,
    상기 음성인식부에서 음성인식 후, 음성인식한 결과인 문장 텍스트정보는 질의응답DB에 저장하여, 상기 질의응답DB에 질문과 답변 문장의 쌍으로 구성된 정보를 바탕으로 인덱싱 과정을 수행하여 인덱싱DB에 저장하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  10. 제 1항 및 2항에 있어서,
    상기 음성인식부는 소정의 음성인식 알고리즘에 의해 음성을 인식해서 문장 텍스트로 변환하여, 상기 문장 텍스트는 텍스트정보로 저장하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  11. 제 1항 및 2항에 있어서,
    상기 자연어처리부는, 상기 음성인식부에 의해 음성에서 텍스트로 변환된 질문과 답변 문장정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  12. 제 1항 및 2항에 있어서,
    상기 질의응답모듈은 질문문장으로부터 문장분석과정을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  13. 제 1항 및 2항에 있어서,
    상기 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템.
  14. 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질문과 답변문장을 저장하는 방법은,
    음성으로 질문과 답변을 입력받는 1단계;
    음성인식하는 2단계;
    음성인식한 문장을 질문과 답변 문장으로 저장하는 3단계;
    상기 질문과 답변 문장을 인덱싱하는 4단계;
    를 포함하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  15. 상기 14항 에 있어서,
    음성으로 질문과 답변을 입력 받는 절차는,
    소정의 질문 입력부와 답변 입력부를 제공하고, 사용자에게 상기 질문 입력부를 제공하여 질문을 음성으로 입력받으면, 음성인식 결과를 회신 받아서, 질문음성을 질문텍스트로 표시하고,
    사용자에게 상기 답변 입력부를 제공하여 답변을 음성으로 입력받으면, 음성인식 결과를 회신 받아서, 답변음성을 답변텍스트로 표시하고,
    질문과 답변의 음성입력이 완료되어 사용자로부터 입력완료 버턴을 클릭이 감지되면, 상기 질문문장과 상기 답변문장을 인덱싱하여, 특정 단어(키워드)가 발생한 질문문장과 답변문장의 위치정보(문장번호)를 DB에 저장하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  16. 상기 14항 에 있어서,
    음성인식하고 저장할 때에는,
    질문입력음성과 답변입력음성을 각각 전달받아서 음성을 질문문장과 답변문장으로 변환하여 DB에 저장하고, 형태소 분석 과정을 거쳐서 키워드별로 인덱싱하여, 상기 키워드별 상기 키워드가 나타난 질문문장과 답변문장의 위치정보(문장번호)를 기록하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  17. 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법에서 음성으로 질의응답 대화하는 방법은
    음성으로 질문을 입력 받는 1단계;
    음성인식하는 2단계;
    상기 음성인식 후 발생한 문장정보(텍스트)로 질의응답처리하는 3단계;
    상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계;
    를 포함하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  18. 상기 17항 에 있어서,
    음성으로 질문을 입력 받는 1단계는,
    사용자의 음성을 감지해서 음성인식된 결과를 회신받아 질문입력창에 표시하고, 상기 질문에 대한 답변문장을 질의응답 후, 답변입력창에 답변문장을 표시하고, 답변음성을 티티에스로 출력하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  19. 상기 17항 에 있어서,
    음성으로 질문을 입력 받는 1단계는,
    별도의 음성입력장치가 단말기 외부에 부착되거나 내장된 음성입력장치(마이크)를 이용하여 사용자의 질문 음성을 실시간으로 입력받는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  20. 상기 17항 에 있어서,
    음성을 입력받지 못하면 텍스트를 입력받는 단계를 더 포함하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  21. 상기 17항 에 있어서,
    음성인식하는 2단계는,
    소정의 음성인식 알고리즘에 의해 음성을 인식해서 텍스트(문장)로 변환하는 것을 포함하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  22. 상기 17항 에 있어서,
    상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
    음성에서 텍스트(문장)로 변환된 질문정보를 토대로, 특정 질문에 대한 답변을 찾는 질의응답모듈에 의해서 답변을 찾거나 답변을 생성하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  23. 상기 17항 에 있어서,
    상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
    상기 질의응답모듈은 질문문장으로부터 문장분석과정(형태소분석, 구문분석, 의미분석, 화행분석)을 수행하여 정확한 질문 의도를 파악하고, 정확한 답변을 요구하는 질문은 미리 구축된 답변DB에서 답변을 가져오고, 특정 정보를 요청할 때는 해당 정보를 토대로 답변을 생성하고, 일상생활 또는 상식을 요구하는 답변은 유사도검색 방법을 이용하여 답변문장을 찾는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  24. 상기 17항 에 있어서,
    상기 음성인식 후 발생한 텍스트(문장)로 질의응답처리하는 3단계는,
    상기 질의응답모듈은 질문문장이 시간, 뉴스, 날씨와 같은 특정 정보를 요청할 때에는 유무선 유무선 통신 네트워크를 통해서 해당 정보를 가져와서 답변을 생성하는 것을 특징으로 하는 유무선 통신 네트워크와 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  25. 상기 17항 에 있어서,
    상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계는,
    질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, 티티에스를 통해서 음성을 출력하고 해당 답변 문장을 텍스트(문장)로 표시하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  26. 상기 17항 에 있어서,
    상기 질의응답에 의해서 추출되거나 생성된 답변을 답변 음성과 답변텍스트로 출력하는 4단계는,
    질의응답에 의해서 추출되거나 생성된 답변문장(텍스트) 전달받아서, 티티에스를 통해서 음성을 출력할 때에는, 목소리 종류별, 나이별, 성별로 다양한 티티에스목소리를 제공하여, 사용자가 선택할 수 있는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.
  27. 상기 17항 에 있어서,
    상기 1단계 이후에는,
    음성인식한 결과를 정확하게 입력되었는지 확인 받는 단계를 더 포함하는 것을 특징으로 하는 티티에스를 이용한 음성인식 질의응답 시스템의 운용방법.

KR1020120038840A 2012-04-14 2012-04-14 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법 KR20130116128A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020120038840A KR20130116128A (ko) 2012-04-14 2012-04-14 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120038840A KR20130116128A (ko) 2012-04-14 2012-04-14 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법

Publications (1)

Publication Number Publication Date
KR20130116128A true KR20130116128A (ko) 2013-10-23

Family

ID=49635399

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120038840A KR20130116128A (ko) 2012-04-14 2012-04-14 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법

Country Status (1)

Country Link
KR (1) KR20130116128A (ko)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613025B2 (en) 2014-11-19 2017-04-04 Electronics And Telecommunications Research Institute Natural language question answering system and method, and paraphrase module
CN110085316A (zh) * 2019-05-11 2019-08-02 北京康健数字化健康管理研究院 一种基于深度学习的高血压问答系统及其系统建立方法
CN114168104A (zh) * 2021-12-08 2022-03-11 杭州电子科技大学 一种面向视障人群的场景文字交互式理解系统

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9613025B2 (en) 2014-11-19 2017-04-04 Electronics And Telecommunications Research Institute Natural language question answering system and method, and paraphrase module
CN110085316A (zh) * 2019-05-11 2019-08-02 北京康健数字化健康管理研究院 一种基于深度学习的高血压问答系统及其系统建立方法
CN114168104A (zh) * 2021-12-08 2022-03-11 杭州电子科技大学 一种面向视障人群的场景文字交互式理解系统

Similar Documents

Publication Publication Date Title
US10332513B1 (en) Voice enablement and disablement of speech processing functionality
US8849628B2 (en) Software application for ranking language translations and methods of use thereof
KR101689290B1 (ko) 대화에서 정보를 추출하는 장치
US20180182396A1 (en) Multi-speaker speech recognition correction system
US10811005B2 (en) Adapting voice input processing based on voice input characteristics
US20200012724A1 (en) Bidirectional speech translation system, bidirectional speech translation method and program
KR20130108173A (ko) 유무선 통신 네트워크를 이용한 음성인식 질의응답 시스템 및 그 운용방법
JP5857090B2 (ja) 情報検索装置、情報検索プログラム、及び情報検索システム
US10699706B1 (en) Systems and methods for device communications
CN107909995B (zh) 语音交互方法和装置
CN107844470B (zh) 一种语音数据处理方法及其设备
CN111919249A (zh) 词语的连续检测和相关的用户体验
KR20140123369A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
KR20130086971A (ko) 음성인식 질의응답 시스템 및 그것의 운용방법
US20130253932A1 (en) Conversation supporting device, conversation supporting method and conversation supporting program
CN109543021B (zh) 一种面向智能机器人的故事数据处理方法及系统
CN106713111B (zh) 一种添加好友的处理方法、终端及服务器
US20180288109A1 (en) Conference support system, conference support method, program for conference support apparatus, and program for terminal
CN111640434A (zh) 用于控制语音设备的方法和装置
KR20210033850A (ko) 목소리 및 얼굴 안면 감정값의 산출 방법 및 이를 이용한 인공지능 스피커의 출력 방법
WO2019031268A1 (ja) 情報処理装置、及び情報処理方法
KR102140391B1 (ko) 검색 방법 및 이 방법을 적용하는 전자 장치
KR20120127773A (ko) 음성인식 정보검색 시스템 및 그 방법
WO2020022079A1 (ja) 音声認識データ処理装置、音声認識データ処理システムおよび音声認識データ処理方法
KR20130116128A (ko) 티티에스를 이용한 음성인식 질의응답 시스템 및 그것의 운영방법

Legal Events

Date Code Title Description
WITN Withdrawal due to no request for examination