Nothing Special   »   [go: up one dir, main page]

JP2019040194A - Electronic apparatus, speech output recording method, and program - Google Patents

Electronic apparatus, speech output recording method, and program Download PDF

Info

Publication number
JP2019040194A
JP2019040194A JP2018188848A JP2018188848A JP2019040194A JP 2019040194 A JP2019040194 A JP 2019040194A JP 2018188848 A JP2018188848 A JP 2018188848A JP 2018188848 A JP2018188848 A JP 2018188848A JP 2019040194 A JP2019040194 A JP 2019040194A
Authority
JP
Japan
Prior art keywords
sentence
control
word
voice
voice data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2018188848A
Other languages
Japanese (ja)
Inventor
航平 吉田
Kohei Yoshida
航平 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP2018188848A priority Critical patent/JP2019040194A/en
Publication of JP2019040194A publication Critical patent/JP2019040194A/en
Pending legal-status Critical Current

Links

Landscapes

  • Electrically Operated Instructional Devices (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To learn speech of a sentence in a text, and learn the speech of a word in the sentence.SOLUTION: A CPU 20 of an electronic dictionary 1 designates, on the basis of a user operation, a sentence in a text or a word in the sentence as an object to learn a speech, and, when the sentence is designated as the object to learn a speech, outputs model speech data 40AM corresponding to the sentence and performs control for recording a user speech about the sentence, or, when the word in the sentence is designated, outputs model speech data 50M corresponding to the word and performs control for recording the user speech about the word. When the user speech for the sentence is recorded, the CPU 20 outputs the model speech data 40AM corresponding to the sentence and performs control for outputting the user speech about the sentence. When the user speech for the word is recorded, the CPU outputs the model speech data 50M corresponding to the word and performs control for outputting the user speech about the word.SELECTED DRAWING: Figure 2

Description

本発明は、音声の録音と再生が可能な電子機器、音声出力録音方法及びプログラムに関する。   The present invention relates to an electronic device capable of recording and reproducing sound, a sound output recording method, and a program.

従来から、音声出力の可能な装置が語学学習に使用されている。
近年、このような装置では、ユーザが習熟レベルを指定すると、単語や文(例えば例文)の模範音声が再生されて、習熟レベルに対応した録音時間だけユーザによる発音が録音された後、その録音音声が再生されるようになっている(例えば特許文献1参照)。この装置によれば、模範音声と録音音声とを聞き比べて学習することができる。
Conventionally, a device capable of outputting voice has been used for language learning.
In recent years, in such an apparatus, when a user specifies a proficiency level, a model voice of a word or sentence (for example, an example sentence) is reproduced, and a pronunciation by the user is recorded for a recording time corresponding to the proficiency level. Audio is played back (see, for example, Patent Document 1). According to this apparatus, it is possible to learn by listening to and comparing the model voice and the recorded voice.

特開2008−175851号公報JP 2008-175851 A

しかしながら、従来の技術では、表示されているテキスト内から音声の学習対象の単語を任意に選択することができないため、テキスト内の文の音声を学習して、当該文中の単語の音声を学習することができず、学習効率が低い。
即ち、文の模範音声では、文が全体としてネイティブに発音されるため、単語ごとの模範音声が連続して再生される場合と異なり、単語の抑揚や強弱が変化していたり、前後に並んだ単語の発音がリエゾンしていたりして、単語単体での音声が聞き取り難くなってしまう場合が多い。このような場合に、従来の技術では、文中の任意の単語を音声の学習対象に選択することができないため、文の音声を学習し、さらに当該文中の聞き取りにくい単語の音声を学習することができず、学習効率が低い。
However, in the conventional technique, it is not possible to arbitrarily select a word for speech learning from the displayed text, so the speech of the sentence in the text is learned and the speech of the word in the sentence is learned. Learning efficiency is low.
That is, in the example voice of a sentence, the sentence is pronounced natively as a whole, and unlike the case where the example voice of each word is played continuously, the inflection and strength of the word are changed or lined up and down. In many cases, the pronunciation of a word is liaison, making it difficult to hear the sound of the word alone. In such a case, the conventional technique cannot select an arbitrary word in a sentence as a speech learning target, and therefore learns the speech of a sentence and further learns the speech of a word that is difficult to hear in the sentence. It is not possible and learning efficiency is low.

本発明の課題は、テキスト内の文の音声を学習するとともに、当該文中の単語の音声を学習することのできる電子機器、音声出力録音方法及びプログラムを提供することである。   An object of the present invention is to provide an electronic device, a voice output recording method, and a program capable of learning a voice of a sentence in a text and learning a voice of a word in the sentence.

以上の課題を解決するため、本発明の電子機器は、
単語と単語音声データが複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の文音声データとが対応付けられて複数記憶されている文音声記憶手段と、
前記文を含むテキストを表示する制御を行うテキスト表示制御手段と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定手段と、
前記文が前記音声学習対象として指定された場合には、当該文についてのユーザ音声データを録音する制御を行い、前記文中の単語が指定された場合には、当該単語についてのユーザ音声データを録音する制御を行う対象別録音制御手段と、
前記対象別録音制御手段により前記文についてのユーザ音声データが録音された場合には、当該文に対応する前記文音声データを出力し、当該文についてのユーザ音声データを出力する制御を行い、前記対象別録音制御手段により単語についてのユーザ音声データが録音された場合には、前記単語音声データを出力し、当該単語についてのユーザ音声データを出力する制御を行う対象別出力制御手段と、を備え、
前記文音声記憶手段には、
各文に対し、当該文の文音声データを含む動画データが対応付けて記憶されており、
前記対象別録音制御手段は、
前記文が前記音声学習対象として指定された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行い、
前記動画データを出力する制御が終了したことに応じて、出力内容を、前記動画データから、当該動画データが対応付けられた文を含む前記テキストへ切り替える制御を行い、
当該文を含む前記テキストを表示しながら、当該文についてのユーザ音声データを録音する制御を行う制御を行い、
前記対象別出力制御手段は、
前記対象別録音制御手段により前記文についてのユーザ音声データが録音された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声データを出力する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを特徴とする。
In order to solve the above problems, the electronic device of the present invention is
Word voice storage means for storing a plurality of words and word voice data;
A sentence voice storage means in which a sentence including a plurality of words and a sentence voice data of the sentence are associated and stored;
Text display control means for performing control to display text including the sentence;
Based on a user operation, a speech learning target specifying means for specifying the sentence in the text or a word in the sentence as a speech learning target;
When the sentence is designated as the speech learning target, the user voice data for the sentence is recorded, and when the word in the sentence is designated, the user voice data for the word is recorded. Recording control means for each object for performing control,
When the user voice data for the sentence is recorded by the subject recording control means, the sentence voice data corresponding to the sentence is output, the user voice data for the sentence is output, and control is performed. When the user voice data for a word is recorded by the target recording control means, the target voice output data is output, and the target output control means for performing control for outputting the user voice data for the word is provided. ,
In the sentence voice storage means,
For each sentence, video data including sentence voice data of the sentence is stored in association with each other,
The subject recording control means includes:
When the sentence is designated as the speech learning target,
As a control for outputting the sentence audio data corresponding to the sentence, a control for outputting the moving image data corresponding to the sentence is performed.
In response to the end of the control to output the moving image data, the output content is controlled from the moving image data to the text including the sentence associated with the moving image data,
While displaying the text containing the sentence, perform control to record the user voice data for the sentence,
The target output control means includes:
When the user voice data for the sentence is recorded by the subject recording control means,
As control for outputting the sentence audio data corresponding to the sentence, performing control for outputting the moving image data corresponding to the sentence,
When the control for outputting the user voice data for the sentence is performed, the control for displaying the text including the sentence is performed.

本発明によれば、テキスト内の文の音声を学習するとともに、当該文中の単語の音声を学習することができる。   ADVANTAGE OF THE INVENTION According to this invention, while learning the audio | voice of the sentence in a text, the audio | voice of the word in the said sentence can be learned.

(a)は電子辞書の概観を示す平面図であり、(b)はタブレットパソコン(或いはスマートフォン)の概観を示す平面図であり、(c)は外部再生装置に接続されるパソコンの外観図である。(A) is a plan view showing an overview of an electronic dictionary, (b) is a plan view showing an overview of a tablet personal computer (or smartphone), and (c) is an external view of a personal computer connected to an external playback device. is there. 電子辞書の内部構成を示すブロック図である。It is a block diagram which shows the internal structure of an electronic dictionary. 録音再生処理を示すフローチャートである。It is a flowchart which shows a recording / reproducing process. 録音再生処理を示すフローチャートである。It is a flowchart which shows a recording / reproducing process. 録音再生処理を示すフローチャートである。It is a flowchart which shows a recording / reproducing process. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 表示部の表示内容などを示す図である。It is a figure which shows the display content etc. of a display part. 変形例における電子辞書の内部構成等を示すブロック図である。It is a block diagram which shows the internal structure of the electronic dictionary in a modification, etc.

以下、図面を参照して、本発明に係る音声出力制御装置を電子辞書に適用した場合の実施形態について詳細に説明する。   DESCRIPTION OF EMBODIMENTS Hereinafter, an embodiment in the case where an audio output control device according to the present invention is applied to an electronic dictionary will be described in detail with reference to the drawings.

[外観構成]
図1は、電子辞書1の平面図である。
この図に示すように、電子辞書1は、メインディスプレイ10、サブディスプレイ11、カードスロット12、スピーカ13、マイク14及びキー群2を備えている。
[Appearance configuration]
FIG. 1 is a plan view of the electronic dictionary 1.
As shown in this figure, the electronic dictionary 1 includes a main display 10, a sub display 11, a card slot 12, a speaker 13, a microphone 14, and a key group 2.

メインディスプレイ10及びサブディスプレイ11は、ユーザによるキー群2の操作に応じた文字や符号等、各種データをカラーで表示する部分であり、LCD(Liquid Crystal Display)やELD(Electronic Luminescence Display)等によって構成されている。なお、本実施の形態におけるメインディスプレイ10及びサブディスプレイ11は、いわゆるタッチパネル110(図2参照)と一体的に形成されており、手書き入力等の操作を受け付け可能となっている。   The main display 10 and the sub-display 11 are portions for displaying various data such as characters and codes according to the operation of the key group 2 by the user in color, and are displayed by an LCD (Liquid Crystal Display), an ELD (Electronic Luminescence Display) or the like. It is configured. The main display 10 and the sub display 11 in the present embodiment are formed integrally with a so-called touch panel 110 (see FIG. 2) and can accept operations such as handwriting input.

カードスロット12は、種々の情報を記憶した外部情報記憶媒体12a(図2参照)と着脱可能に設けられている。
スピーカ13は、ユーザによるキー群2の操作に応じた音声を出力する部分であり、マイク14は外部から音声を取り込む部分である。
The card slot 12 is detachably attached to an external information storage medium 12a (see FIG. 2) that stores various information.
The speaker 13 is a part that outputs sound according to the operation of the key group 2 by the user, and the microphone 14 is a part that captures sound from the outside.

キー群2は、ユーザから電子辞書1を操作するための操作を受ける各種キーを有している。具体的には、キー群2は、決定キー2bと、文字キー2cと、カーソルキー2eと、音声キー2g等とを有している。   The key group 2 has various keys that receive operations for operating the electronic dictionary 1 from the user. Specifically, the key group 2 includes an enter key 2b, a character key 2c, a cursor key 2e, a voice key 2g, and the like.

決定キー2bは、検索の実行や、見出し語の決定等に使用されるキーである。文字キー2cは、ユーザによる文字の入力等に使用されるキーであり、本実施の形態においては“A”〜“Z”キーを備えている。   The determination key 2b is a key used for executing a search, determining a headword, and the like. The character key 2c is a key used for inputting characters by the user, and includes “A” to “Z” keys in the present embodiment.

カーソルキー2eは、画面内の反転表示位置、つまりカーソル位置の移動等に使用されるキーであり、本実施の形態においては上下左右の方向を指定可能となっている。音声キー2gは、音声を学習するとき等に使用されるキーである。   The cursor key 2e is a key used for the reverse display position in the screen, that is, the movement of the cursor position. In the present embodiment, the up / down / left / right directions can be designated. The voice key 2g is a key used when learning a voice.

[内部構成]
続いて、電子辞書1の内部構造について説明する。図2は、電子辞書1の内部構成を示すブロック図である。
[Internal configuration]
Next, the internal structure of the electronic dictionary 1 will be described. FIG. 2 is a block diagram showing an internal configuration of the electronic dictionary 1.

この図に示すように、電子辞書1は、表示部21、入力部22、音声入出力部70、記録媒体読取部60、CPU(Central Processing Unit)20、記憶部80を備え、各部はバスで相互にデータ通信可能に接続されて構成されている。   As shown in this figure, the electronic dictionary 1 includes a display unit 21, an input unit 22, a voice input / output unit 70, a recording medium reading unit 60, a CPU (Central Processing Unit) 20, and a storage unit 80, and each unit is a bus. They are connected to each other so that data communication is possible.

表示部21は、上述のメインディスプレイ10及びサブディスプレイ11を備えており、CPU20から入力される表示信号に基づいて各種情報をメインディスプレイ10やサブディスプレイ11に表示するようになっている。   The display unit 21 includes the main display 10 and the sub display 11 described above, and displays various information on the main display 10 and the sub display 11 based on a display signal input from the CPU 20.

入力部22は、上述のキー群2やタッチパネル110を備えており、押下されたキーやタッチパネル110の位置に対応する信号をCPU20に出力するようになっている。   The input unit 22 includes the key group 2 and the touch panel 110 described above, and outputs a signal corresponding to the pressed key or the position of the touch panel 110 to the CPU 20.

音声入出力部70は、上述のスピーカ13及びマイク14を備えており、CPU20から入力される音声出力信号に基づいてスピーカ13に音声出力を行わせたり、CPU20から入力される録音信号に基づいてマイク14に音声データの録音を行わせたりするようになっている。   The audio input / output unit 70 includes the speaker 13 and the microphone 14 described above, and causes the speaker 13 to output audio based on the audio output signal input from the CPU 20, or based on the recording signal input from the CPU 20. The microphone 14 is made to record voice data.

記録媒体読取部60は、上述のカードスロット12を備えており、当該カードスロット12に装着された外部情報記憶媒体12aから情報を読み出したり、当該外部情報記憶媒体12aに情報を記録したりするようになっている。   The recording medium reading unit 60 includes the card slot 12 described above, and reads information from the external information storage medium 12a attached to the card slot 12 or records information on the external information storage medium 12a. It has become.

ここで、外部情報記憶媒体12aには、辞書データベース30や教材コンテンツ40が格納されるようになっている。なお、これら辞書データベース30や教材コンテンツ40は後述の記憶部80における辞書データベース30や教材コンテンツ40と同様のデータ構造を有しているため、ここでは説明を省略する。   Here, the dictionary database 30 and the teaching material content 40 are stored in the external information storage medium 12a. Note that the dictionary database 30 and the learning material content 40 have the same data structure as the dictionary database 30 and the learning material content 40 in the storage unit 80 described later, and thus the description thereof is omitted here.

記憶部80は、電子辞書1の各種機能を実現するためのプログラムやデータを記憶するとともに、CPU20の作業領域として機能するメモリである。本実施の形態においては、記憶部80は、音声録音再生プログラム81と、辞書データベース群3と、単語音声データ群5と、教材コンテンツ群4等とを記憶している。   The storage unit 80 is a memory that stores programs and data for realizing various functions of the electronic dictionary 1 and functions as a work area of the CPU 20. In the present embodiment, the storage unit 80 stores a voice recording / playback program 81, a dictionary database group 3, a word voice data group 5, a teaching material content group 4, and the like.

音声録音再生プログラム81は、本発明に係る音声出力制御プログラムであり、後述の録音再生処理(図3〜図5参照)をCPU20に実行させるようになっている。   The audio recording / reproducing program 81 is an audio output control program according to the present invention, and causes the CPU 20 to execute a recording / reproducing process (see FIGS. 3 to 5) described later.

辞書データベース群3は、見出し語と、この見出し語の説明情報のテキストとを対応付けた見出し語情報が複数格納された辞書データベース30を複数有しており、本実施の形態においては、英和辞書の辞書データベース30Aを有している。   The dictionary database group 3 has a plurality of dictionary databases 30 in which a plurality of entry word information in which entry words are associated with texts of explanation information of the entry words are stored. In this embodiment, an English-Japanese dictionary is used. Dictionary database 30A.

この辞書データベース30Aは、学習対象の英語例文を複数含むテキストデータ30ATを説明情報のデータとして有するとともに、例文ごとの模範音声データ30AMを有している。なお、本実施の形態においては、テキストデータ30ATにおける各文のうち、模範音声データ30AMに対応する例文には、音声アイコンIg(図6参照)が付記されるようになっている。   The dictionary database 30A includes text data 30AT including a plurality of English example sentences to be learned as explanatory information data, and model voice data 30AM for each example sentence. In the present embodiment, a voice icon Ig (see FIG. 6) is appended to an example sentence corresponding to the model voice data 30AM among the sentences in the text data 30AT.

単語音声データ群5は、各辞書データベース30における見出し語の各単語の模範音声データ50Mを有している。なお、この単語音声データ群5は、同一の単語について複数の模範音声データ50Mを有していても良い。   The word voice data group 5 includes model voice data 50M of each word of the entry word in each dictionary database 30. The word sound data group 5 may have a plurality of model sound data 50M for the same word.

教材コンテンツ群4は、複数の教材コンテンツ40を有しており、本実施の形態においては、英会話の教材コンテンツ40Aと、物語動画の教材コンテンツ40Bとを有している。   The teaching material content group 4 has a plurality of teaching material contents 40, and in this embodiment, has teaching material content 40A for English conversation and teaching material content 40B for story videos.

このうち、英会話の教材コンテンツ40Aは、英会話に関する項目ごとに、学習対象の複数の英文を含むテキストデータ40ATと、文ごとの模範音声データ40AMとを有している。なお、本実施の形態においては、テキストデータ40ATにおける各文のうち、模範音声データ40AMに対応する文には、音声アイコンIgが付記されるようになっている。   Among them, the teaching material content 40A for English conversation has text data 40AT including a plurality of English sentences to be learned and model voice data 40AM for each sentence for each item related to English conversation. In the present embodiment, a voice icon Ig is appended to a sentence corresponding to the model voice data 40AM among the sentences in the text data 40AT.

また、物語動画の教材コンテンツ40Bは、物語の項目ごとに、音声付動画データ40BDと、音声テキストデータ40BTとを有している。   Moreover, the teaching material content 40B of the story moving image has moving image data with audio 40BD and audio text data 40BT for each item of the story.

音声付動画データ40BDは、音声を含む動画のデータであり、本実施の形態においては、経時的に連続する複数の音声付動画セグメント400Dから構成されている。なお、本実施の形態においては、音声付動画セグメント400Dは、音声付動画データ40BDを当該音声付動画データ40BDに含まれる音声の一文ごとに分割することで形成されている。また、各音声付動画セグメント400Dにおける音声データは、後述の音声テキストセグメント400Tの模範音声データとなっている。   The moving image data with sound 40BD is data of moving images including sound, and in the present embodiment, the moving image data with sound 40BD is composed of a plurality of moving image segments with sound 400D that are continuous over time. In the present embodiment, the moving image data with sound 400D is formed by dividing the moving image data with sound 40BD for each sentence of the sound included in the moving image data with sound 40BD. The audio data in each moving image segment with sound 400D is model audio data of an audio text segment 400T described later.

音声テキストデータ40BTは、音声付動画データ40BDに含まれる音声に対応するテキストデータであり、音声付動画データ40BDに含まれる音声を、その音声の言語でテキスト化したものである。この音声テキストデータ40BTは、本実施の形態においては、各音声付動画セグメント400Dに1対1で対応する複数の音声テキストセグメント400Tから構成されている。つまり、各音声テキストセグメント400Tは、複数の単語を含む文のテキストデータとなっている。   The voice text data 40BT is text data corresponding to the voice included in the moving image data with voice 40BD, and is obtained by converting the voice included in the moving image data with voice 40BD into a text in the language of the voice. In the present embodiment, the voice text data 40BT is composed of a plurality of voice text segments 400T that correspond one-to-one to the moving image segments with voice 400D. That is, each speech text segment 400T is text data of a sentence including a plurality of words.

CPU20は、入力される指示に応じて所定のプログラムに基づいた処理を実行し、各機能部への指示やデータの転送等を行い、電子辞書1を統括的に制御するようになっている。具体的には、CPU20は、入力部22から入力される操作信号等に応じて記憶部80に格納された各種プログラムを読み出し、当該プログラムに従って処理を実行する。そして、CPU20は、処理結果を記憶部80に保存するとともに、当該処理結果を音声入出力部70や表示部21に適宜出力させる。   The CPU 20 executes processing based on a predetermined program in accordance with an input instruction, performs an instruction to each function unit, data transfer, and the like, and comprehensively controls the electronic dictionary 1. Specifically, the CPU 20 reads various programs stored in the storage unit 80 in accordance with an operation signal or the like input from the input unit 22, and executes processing according to the program. Then, the CPU 20 saves the processing result in the storage unit 80 and causes the voice input / output unit 70 and the display unit 21 to appropriately output the processing result.

[動作]
続いて、電子辞書1の動作について、図面を参照しつつ説明する。
[Operation]
Next, the operation of the electronic dictionary 1 will be described with reference to the drawings.

図3〜図5は、CPU20が音声録音再生プログラム81を読み出して実行する録音再生処理の流れを示すフローチャートである。   3 to 5 are flowcharts showing the flow of a recording / playback process in which the CPU 20 reads out and executes the voice recording / playback program 81.

図3に示すように、この録音再生処理においては、まずCPU20は、記憶部80に含まれる辞書データベース30や教材コンテンツ40のタイトルをメインディスプレイ10に一覧表示させ、ユーザ操作に基づいて、何れかの辞書データベース30または教材コンテンツ40を選択する(ステップS1)。   As shown in FIG. 3, in this recording / playback process, first, the CPU 20 displays a list of the titles of the dictionary database 30 and the teaching material content 40 included in the storage unit 80 on the main display 10, and either The dictionary database 30 or the teaching material content 40 is selected (step S1).

次に、CPU20は、物語動画の教材コンテンツ40Bが選択されたか否かを判定し(ステップS3)、選択されていないと判定した場合(ステップS3;No)には、英和辞書の辞書データベース30Aや英会話の教材コンテンツ40Aが選択されたか否かを判定する(ステップS5)。   Next, the CPU 20 determines whether or not the story video content 40B has been selected (step S3), and if it is determined that it has not been selected (step S3; No), the English-Japanese dictionary database 30A or It is determined whether or not the teaching material content 40A for English conversation has been selected (step S5).

このステップS5において英和辞書の辞書データベース30Aや英会話の教材コンテンツ40Aが選択されていないと判定した場合(ステップS5;No)には、CPU20は、他の処理へ移行する。   If it is determined in step S5 that the English-Japanese dictionary database 30A or English conversation teaching material 40A is not selected (step S5; No), the CPU 20 proceeds to another process.

また、ステップS5において英和辞書の辞書データベース30Aや英会話の教材コンテンツ40Aが選択されたと判定した場合(ステップS5;Yes)には、CPU20は、ユーザ操作に基づいて、英和辞書の辞書データベース30Aにおける何れかの見出し語、或いは、英会話の教材コンテンツ40Aにおける何れかの項目を選択する(ステップS7)。   If it is determined in step S5 that the English-Japanese dictionary database 30A or the English conversation teaching material content 40A has been selected (step S5; Yes), the CPU 20 determines which of the English-Japanese dictionary database 30A based on the user operation. Or any item in the teaching material content 40A for English conversation is selected (step S7).

次に、CPU20は、選択された見出し語の説明情報のテキストデータ30AT、或いは選択された項目のテキストデータ40ATをメインディスプレイ10に表示させる(ステップS9)。また、このときCPU20は、テキストデータ30AT,40ATにおける各文のうち、模範音声データ30AM,40AMに対応付けられた文の先頭に音声アイコンIgを表示させる。   Next, the CPU 20 causes the main display 10 to display the text data 30AT of the explanation information of the selected headword or the text data 40AT of the selected item (step S9). At this time, the CPU 20 displays a voice icon Ig at the head of a sentence associated with the model voice data 30AM and 40AM among the sentences in the text data 30AT and 40AT.

次に、CPU20は、音声キー2gが操作されるか否かを判定し(ステップS11)、操作されないと判定した場合(ステップS11;No)には他の処理へ移行する。   Next, the CPU 20 determines whether or not the voice key 2g is operated (step S11). When it is determined that the voice key 2g is not operated (step S11; No), the CPU 20 proceeds to another process.

また、ステップS11において音声キー2gが操作されたと判定した場合(ステップS11;Yes)には、CPU20は、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbと、読み上げアイコンIcとの3つを、この順に上から並べて表示させ、前回の録音再生処理で操作されたアイコンを指定表示させる(ステップS13。図6(b)参照)。   If it is determined in step S11 that the voice key 2g has been operated (step S11; Yes), the CPU 20 uses the listening icon Ia and the listening comparison icon Ib as the voice mode designation icon I at the end of the main display 10. And the read-out icon Ic are displayed side by side in this order, and the icon operated in the previous recording / playback process is designated and displayed (step S13; see FIG. 6B).

ここで、これら音声モード指定アイコンIは、電子辞書1の動作モードを音声モードに移行させるためのアイコンである。
具体的には、聞くアイコンIaは動作モードを、音声モードの「聞くモード」に移行させるためのアイコンであり、「聞くモード」とは、模範音声データ30AM、40AMや音声付動画データ40BDを再生(音声出力)させるモードである。
また、聞き比べアイコンIbは動作モードを、音声モードの「聞き比べモード」に移行させるためのアイコンであり、「聞き比べモード」とは、模範音声データ30AM、40AMや音声付動画データ40BDを再生(音声出力)させるとともにユーザ音声を録音した後、両者を交互に再生させるモードである。
また、読み上げアイコンIcは動作モードを、音声モードの「読み上げモード」に移行させるためのアイコンであり、「読み上げモード」とは、テキストの文字列に対応する合成音声を生成して再生(音声出力)させるモードである。
Here, these voice mode designation icons I are icons for shifting the operation mode of the electronic dictionary 1 to the voice mode.
Specifically, the listen icon Ia is an icon for shifting the operation mode to the “listen mode” of the audio mode, and the “listen mode” reproduces the model audio data 30AM, 40AM and the moving image data with audio 40BD. This is a mode for (sound output).
Also, the listening comparison icon Ib is an icon for shifting the operation mode to the “listening comparison mode” of the audio mode. The “listening comparison mode” reproduces the model audio data 30AM, 40AM and the moving image data with audio 40BD. In this mode, after the user voice is recorded and the user voice is recorded, both are reproduced alternately.
The reading icon Ic is an icon for shifting the operation mode to the “reading mode” of the voice mode. The “reading mode” generates and reproduces the synthesized voice corresponding to the character string of the text (voice output). ) Mode.

次に、CPU20は、何れの音声モード指定アイコンIが指定表示されているかに基づいて、指定された音声モードが「聞くモード」、「聞き比べモード」及び「読み上げモード」の何れであるかを判定する(ステップS15)。   Next, the CPU 20 determines whether the designated voice mode is “listening mode”, “listening comparison mode”, or “reading mode” based on which voice mode designation icon I is designated and displayed. Determination is made (step S15).

このステップS15において指定された音声モードが「読み上げモード」であると判定した場合(ステップS15;読み上げモード)には、CPU20は、音声モード指定アイコンIに対する操作によって音声モードの切替操作が行われるか否かを判定する(ステップS16)。   If it is determined that the voice mode designated in step S15 is the “reading mode” (step S15; reading mode), the CPU 20 performs a voice mode switching operation by operating the voice mode designation icon I. It is determined whether or not (step S16).

このステップS16において音声モードの切替操作が行われたと判定した場合(ステップS16;Yes)には、CPU20は、切替操作に応じたアイコンを指定表示させ、上述のステップS15に移行する。   If it is determined in step S16 that the voice mode switching operation has been performed (step S16; Yes), the CPU 20 designates and displays an icon corresponding to the switching operation, and proceeds to step S15 described above.

また、ステップS16において音声モードの切替操作が行われないと判定した場合(ステップS16;No)には、CPU20は、読み上げモード処理を行った後(ステップS17)、上述のステップS16に移行する。   When it is determined in step S16 that the voice mode switching operation is not performed (step S16; No), the CPU 20 performs the reading mode process (step S17), and then proceeds to the above-described step S16.

ここで、この読み上げモード処理においてCPU20は、ユーザ操作に基づいて再生回数を設定した後、メインディスプレイ10に表示されているテキスト内の文字列うち、ユーザ操作により指定される文字列に対応する合成音声を生成して、再生回数だけ再生させる。ここで、再生回数の設定に当たっては、後述の図12(b)に示すような回数設定アイコンIkが表示されることが好ましい。この回数設定アイコンIkは、現時点で設定されている再生回数をアイコン内に表示し、操作される毎に再生回数を1,3,5,1,3,…の順に切り替えるようになっている。   Here, in this reading mode processing, the CPU 20 sets the number of reproductions based on the user operation, and then composes the character string corresponding to the character string designated by the user operation among the character strings in the text displayed on the main display 10. Generate audio and play it as many times as you like. Here, when setting the number of reproductions, it is preferable to display a number setting icon Ik as shown in FIG. The number-of-times setting icon Ik displays the number of times of reproduction set at the current time in the icon, and switches the number of times of reproduction in the order of 1, 3, 5, 1, 3,.

また、上述のステップS15において指定された音声モードが「聞くモード」であると判定した場合(ステップS15;聞くモード)には、CPU20は、音声モード指定アイコンIに対する操作によって音声モードの切替操作が行われるか否かを判定する(ステップS18)。   On the other hand, when it is determined that the audio mode designated in step S15 described above is the “listening mode” (step S15; listening mode), the CPU 20 performs an operation for switching the audio mode by operating the audio mode designation icon I. It is determined whether or not it is performed (step S18).

このステップS18において音声モードの切替操作が行われたと判定した場合(ステップS18;Yes)には、CPU20は、切替操作に応じたアイコンを指定表示させ、上述のステップS15に移行する。   If it is determined in step S18 that the voice mode switching operation has been performed (step S18; Yes), the CPU 20 designates and displays an icon corresponding to the switching operation, and proceeds to step S15 described above.

また、ステップS18において音声モードの切替操作が行われないと判定した場合(ステップS18;No)には、CPU20は、聞くモード処理を行った後(ステップS19)、上述のステップS18に移行する。   If it is determined in step S18 that the voice mode switching operation is not performed (step S18; No), the CPU 20 performs listening mode processing (step S19), and then proceeds to the above-described step S18.

ここで、この聞くモード処理においてCPU20は、ユーザ操作に基づいて再生回数を設定した後、メインディスプレイ10に表示されているテキスト内でユーザ操作により指定される単語の模範音声データ50M、或いは当該テキスト内でユーザ操作により指定される文の模範音声データ30AM、40AMを、再生回数だけ再生(音声出力)させる。なお、再生回数の設定に当たっては、上述のステップS17と同様の回数設定アイコンIkが表示されることが好ましい。また、指定された単語について模範音声データ50Mが複数存在する場合には、CPU20は、ユーザ操作により指定される何れかの模範音声データ50Mを再生(音声出力)させる。   Here, in this listening mode process, the CPU 20 sets the number of times of reproduction based on the user operation, and then the exemplary voice data 50M of the word specified by the user operation in the text displayed on the main display 10, or the text The exemplary voice data 30AM and 40AM of the sentence designated by the user operation are reproduced (sound output) by the number of times of reproduction. In setting the number of times of reproduction, it is preferable to display a number-of-times setting icon Ik similar to step S17 described above. Further, when there are a plurality of model voice data 50M for the designated word, the CPU 20 reproduces (sound outputs) any model voice data 50M designated by the user operation.

また、上述のステップS15において指定された音声モードが「聞き比べモード」であると判定した場合(ステップS15;聞き比べモード)には、図4に示すように、CPU20は、メインディスプレイ10に表示されている音声アイコンIgのうち、先頭の音声アイコンIgを指定表示する(ステップS21)。   Further, when it is determined that the voice mode designated in the above-described step S15 is the “listening / comparison mode” (step S15; listening / comparison mode), the CPU 20 displays on the main display 10 as shown in FIG. Of the voice icons Ig being displayed, the head voice icon Ig is designated and displayed (step S21).

次に、CPU20は、音声モード指定アイコンIに対する操作によって音声モードの切替操作が行われるか否かを判定する(ステップS23)。   Next, the CPU 20 determines whether or not a voice mode switching operation is performed by an operation on the voice mode designation icon I (step S23).

このステップS23において音声モードの切替操作が行われたと判定した場合(ステップS23;Yes)には、図3に示すように、CPU20は、切替操作に応じたアイコンを指定表示させ、上述のステップS15に移行する。   If it is determined in step S23 that the voice mode switching operation has been performed (step S23; Yes), as shown in FIG. 3, the CPU 20 designates and displays an icon corresponding to the switching operation, and the above-described step S15. Migrate to

また、図4に示すように、ステップS23において音声モードの切替操作が行われないと判定した場合(ステップS23;No)には、メインディスプレイ10に表示されている何れかの音声アイコンIgまたは単語をユーザが指定すると、CPU20は、当該音声アイコンIgに対応する文か、或いは当該単語自体を音声学習対象として指定する(ステップS25)。   Also, as shown in FIG. 4, when it is determined in step S23 that the voice mode switching operation is not performed (step S23; No), any voice icon Ig or word displayed on the main display 10 is displayed. When the user designates, the CPU 20 designates a sentence corresponding to the speech icon Ig or the word itself as a speech learning target (step S25).

次に、CPU20は、訳/決定キー2bが操作されるか否かを判定し(ステップS27)、操作されないと判定した場合(ステップS27;No)には、キー群2における他のキーが操作されるか否かを判定する(ステップS29)。   Next, the CPU 20 determines whether or not the translation / decision key 2b is operated (step S27). When it is determined that the translation / determination key 2b is not operated (step S27; No), another key in the key group 2 is operated. It is determined whether or not (step S29).

そして、ステップS29において他のキーが操作されたと判定した場合(ステップS29;Yes)には、CPU20は、当該キーに応じた他の処理へ移行する。また、ステップS29において他のキーが操作されないと判定した場合(ステップS29;No)には、図3に示すように、CPU20は、上述のステップS15に移行する。   If it is determined in step S29 that another key has been operated (step S29; Yes), the CPU 20 proceeds to another process corresponding to the key. If it is determined in step S29 that no other key is operated (step S29; No), the CPU 20 proceeds to step S15 described above as shown in FIG.

また、図4に示すように、ステップS27において訳/決定キー2bが操作されたと判定した場合(ステップS27;Yes)には、CPU20は、上述のステップS25で音声アイコンIgに対して指定操作が行われたか否か、つまり音声アイコンIgの付された文が音声学習対象として指定されたか否かを判定する(ステップS31)。   Also, as shown in FIG. 4, when it is determined in step S27 that the translation / decision key 2b has been operated (step S27; Yes), the CPU 20 performs a designation operation on the voice icon Ig in step S25 described above. It is determined whether or not it has been performed, that is, whether or not the sentence with the voice icon Ig is designated as a voice learning target (step S31).

このステップS31において音声アイコンIgに対して指定操作が行われたと判定した場合(ステップS31;Yes)には、CPU20は、指定された音声アイコンIg(以下、指定音声アイコンIgSとする)に対応する文、つまり音声学習対象の文の模範音声データ30AM(または40AM)を再生(音声出力)させる(ステップS33)。   If it is determined in step S31 that the designation operation has been performed on the voice icon Ig (step S31; Yes), the CPU 20 corresponds to the designated voice icon Ig (hereinafter, designated voice icon IgS). The sentence, that is, the model voice data 30AM (or 40AM) of the sentence that is the target of voice learning is reproduced (voice output) (step S33).

次に、CPU20は、指定音声アイコンIgSに対応する文(音声学習対象の文)についてのユーザ音声をマイク14に録音させて記憶部80に記憶させる(ステップS35)。なお、本実施の形態においては、録音時間は所定時間(例えば1分間)だけ行われるが、ユーザにより終了操作が行われるまでの時間だけ行われても良い。   Next, the CPU 20 causes the microphone 14 to record the user voice for the sentence (speech learning target sentence) corresponding to the designated voice icon IgS and store it in the storage unit 80 (step S35). In the present embodiment, the recording time is performed for a predetermined time (for example, 1 minute), but may be performed only for the time until the end operation is performed by the user.

次に、CPU20は、模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われるか否かを判定し(ステップS37)、行われないと判定した場合(ステップS37;No)には、図3に示すように、上述のステップS15に移行する。   Next, the CPU 20 determines whether or not a user operation for listening and comparing the model voice and the user voice is performed (step S37), and if it is determined not to be performed (step S37; No), As shown in FIG. 3, the process proceeds to step S15 described above.

また、図4に示すように、ステップS37において模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われたと判定した場合(ステップS37;Yes)には、CPU20は、指定音声アイコンIgSに対応する文(音声学習対象の文)の模範音声データ30AM(または40AM)を再生(音声出力)させ(ステップS39)、ステップS35で録音したユーザ音声を再生(音声出力)させた後(ステップS41)、上述のステップS37に移行する。   Also, as shown in FIG. 4, when it is determined in step S37 that a user operation has been performed to hear and compare the model voice and the user voice (step S37; Yes), the CPU 20 displays the designated voice icon IgS. The model voice data 30AM (or 40AM) of the corresponding sentence (speech learning target sentence) is played back (voice output) (step S39), and the user voice recorded in step S35 is played back (voice output) (step S41). ), The process proceeds to step S37 described above.

また、上述のステップS31において音声アイコンIgに対して指定操作が行われなかったと判定した場合、つまり単語に対して指定操作が行われた場合(ステップS31;No)には、CPU20は、単語音声データ群5を参照し、指定された単語、つまり音声学習対象の単語(以下、指定単語とする)について複数の模範音声データ50Mが存在するか否かを判定する(ステップS51)。   If it is determined in step S31 that the designation operation has not been performed on the voice icon Ig, that is, if a designation operation has been performed on the word (step S31; No), the CPU 20 With reference to the data group 5, it is determined whether or not there are a plurality of exemplary speech data 50M for a designated word, that is, a speech learning target word (hereinafter referred to as a designated word) (step S51).

このステップS51において指定単語について複数の模範音声データ50Mが存在すると判定した場合(ステップS51;Yes)には、CPU20は、ユーザ操作に基づいて何れか1つの模範音声データ50Mを指定した後(ステップS53)、後述のステップS55に移行する。   If it is determined in step S51 that there are a plurality of model voice data 50M for the specified word (step S51; Yes), the CPU 20 specifies any one model voice data 50M based on a user operation (step S51). S53), the process proceeds to step S55 described later.

また、ステップS51において指定単語について複数の模範音声データ50Mが存在しないと判定した場合、つまり1つの模範音声データ50Mしか存在しない場合(ステップS51;No)には、CPU20は、当該模範音声データ50Mを指定した後、指定されている模範音声データ50Mを再生(音声出力)させる(ステップS55)。   In addition, when it is determined in step S51 that the plurality of model voice data 50M does not exist for the specified word, that is, when only one model voice data 50M exists (step S51; No), the CPU 20 determines the model voice data 50M. Then, the designated model voice data 50M is reproduced (voice output) (step S55).

次に、CPU20は、指定単語についてのユーザ音声をマイク14に録音させて記憶部80に記憶させる(ステップS57)。なお、本実施の形態においては、録音時間は所定時間(例えば1分間)だけ行われるが、ユーザにより終了操作が行われるまでの時間だけ行われても良い   Next, the CPU 20 records the user voice for the designated word on the microphone 14 and stores it in the storage unit 80 (step S57). In the present embodiment, the recording time is performed for a predetermined time (for example, 1 minute), but may be performed only for the time until the end operation is performed by the user.

次に、CPU20は、模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われるか否かを判定し(ステップS59)、行われないと判定した場合(ステップS59;No)には、図3に示すように、上述のステップS15に移行する。   Next, the CPU 20 determines whether or not a user operation for listening and comparing the model voice and the user voice is performed (step S59), and when it is determined that the user operation is not performed (step S59; No), As shown in FIG. 3, the process proceeds to step S15 described above.

また、図4に示すように、ステップS59において模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われたと判定した場合(ステップS59;Yes)には、CPU20は、指定単語(音声学習対象の単語)の模範音声データ50Mを再生(音声出力)させ(ステップS61)、ステップS57で録音したユーザ音声を再生(音声出力)させた後(ステップS63)、上述のステップS59に移行する。   As shown in FIG. 4, when it is determined in step S59 that a user operation has been performed to hear and compare the model voice and the user voice (step S59; Yes), the CPU 20 determines the designated word (voice learning). The exemplary voice data 50M of the target word) is played back (voice output) (step S61), the user voice recorded in step S57 is played back (voice output) (step S63), and the process proceeds to step S59 described above.

また、図3に示すように、上述のステップS3において物語動画の教材コンテンツ40Bが選択されたと判定した場合(ステップS3;Yes)には、図5に示すように、CPU20は、ユーザ操作に基づいて、物語動画の教材コンテンツ40Bの項目を選択する(ステップS71)。   As shown in FIG. 3, when it is determined that the story video material 40 </ b> B is selected in step S <b> 3 (step S <b> 3; Yes), as shown in FIG. 5, the CPU 20 is based on a user operation. Then, the item of the teaching material content 40B of the story video is selected (step S71).

次に、CPU20は、動画学習を行う旨のユーザ操作が行われるか否かを判定し(ステップS73)、行われないと判定した場合(ステップS73;No)には他の処理へ移行する。   Next, the CPU 20 determines whether or not a user operation for performing moving image learning is performed (step S73). When it is determined that the user operation is not performed (step S73; No), the CPU 20 proceeds to another process.

また、ステップS73において動画学習を行う旨のユーザ操作が行われたと判定した場合(ステップS73;Yes)には、CPU20は、選択された項目の音声テキストデータ40BTをメインディスプレイ10に表示させる(ステップS75)。より具体的には、このときCPU20は、選択された項目の音声テキストデータ40BTに含まれる音声テキストセグメント920をメインディスプレイ10に一覧表示させる。また、このステップS75においてCPU20は、メインディスプレイ10の端部に動画学習アイコンIhを表示させるとともに、各音声テキストセグメント920の文頭にも動画学習アイコンIhを表示させる。ここで、動画学習アイコンIhは、電子辞書1の動作モードを動画学習モードに移行させるためのアイコンであり、動画学習モードとは、音声付の動画を再生(音声出力)させるモードである。   On the other hand, when it is determined in step S73 that a user operation for performing moving image learning has been performed (step S73; Yes), the CPU 20 displays the audio text data 40BT of the selected item on the main display 10 (step S73). S75). More specifically, at this time, the CPU 20 causes the main display 10 to display a list of speech text segments 920 included in the speech text data 40BT of the selected item. In step S <b> 75, the CPU 20 displays the moving image learning icon Ih at the end of the main display 10 and also displays the moving image learning icon Ih at the beginning of each voice text segment 920. Here, the moving image learning icon Ih is an icon for shifting the operation mode of the electronic dictionary 1 to the moving image learning mode, and the moving image learning mode is a mode for reproducing (sound outputting) a moving image with sound.

次に、CPU20は、動画学習アイコンIhが操作されるか否かを判定し(ステップS77)、操作されないと判定した場合(ステップS77;No)には他の処理へ移行する。   Next, the CPU 20 determines whether or not the moving image learning icon Ih is operated (step S77). When it is determined that the moving image learning icon Ih is not operated (step S77; No), the CPU 20 proceeds to another process.

また、ステップS20において動画学習アイコンIhが操作されたと判定した場合(ステップS77;Yes)には、CPU20は、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbとの2つを、この順に上から並べて表示させ、前回の録音再生処理で操作されたアイコンを指定表示させる(ステップS79)。   If it is determined in step S20 that the moving image learning icon Ih has been operated (step S77; Yes), the CPU 20 uses the listening icon Ia as the audio mode designation icon I at the end of the main display 10 and the listening comparison icon. The two Ib are displayed side by side in this order, and the icon operated in the previous recording / playback process is designated and displayed (step S79).

次に、CPU20は、何れの音声モード指定アイコンIが指定表示されているかに基づいて、指定された音声モードが「聞くモード」及び「聞き比べモード」の何れであるかを判定する(ステップS81)。   Next, the CPU 20 determines whether the designated voice mode is “listening mode” or “listening comparison mode” based on which voice mode designation icon I is designated and displayed (step S81). ).

このステップS81において指定された音声モードが「聞くモード」である場合(ステップS81;聞くモード)には、CPU20は、音声モード指定アイコンIに対する操作によって音声モードの切替操作が行われるか否かを判定する(ステップS83)。   When the audio mode specified in step S81 is the “listening mode” (step S81; listening mode), the CPU 20 determines whether or not the audio mode switching operation is performed by operating the audio mode specifying icon I. Determination is made (step S83).

このステップS83において音声モードの切替操作が行われたと判定した場合(ステップS83;Yes)には、CPU20は、切替操作に応じたアイコンを指定表示させ、上述のステップS81に移行する。   If it is determined in step S83 that the voice mode switching operation has been performed (step S83; Yes), the CPU 20 designates and displays an icon corresponding to the switching operation, and proceeds to the above-described step S81.

また、ステップS83において音声モードの切替操作が行われないと判定した場合(ステップS83;No)には、CPU20は、聞くモード処理を行った後(ステップS85)、上述のステップS83に移行する。なお、このステップS85での聞くモード処理においてCPU20は、ユーザ操作に基づいて再生回数を設定した後、メインディスプレイ10に表示されているテキスト内でユーザ操作により指定される音声テキストセグメント400Tの音声付動画セグメント400Dを、再生回数だけ再生(音声・動画出力)させる。この際、テキスト表示から動画表示に切り替えて、再生(音声・動画出力)させる。ここで、再生回数の設定に当たっては、上述のステップS17と同様に、回数設定アイコンIkが表示されることが好ましい。   If it is determined in step S83 that the voice mode switching operation is not performed (step S83; No), the CPU 20 performs listening mode processing (step S85), and then proceeds to step S83 described above. In the listening mode process in step S85, the CPU 20 sets the number of times of reproduction based on the user operation, and then adds the audio text segment 400T specified by the user operation within the text displayed on the main display 10. The moving image segment 400D is played back (sound / moving image output) for the number of times of playback. At this time, the display is switched from the text display to the moving image display and reproduced (sound / moving image output). Here, when setting the number of times of reproduction, it is preferable that the number-of-times setting icon Ik is displayed as in step S17 described above.

また、上述のステップS81において指定された音声モードが「聞き比べモード」である場合(ステップS81;聞き比べモード)には、CPU20は、メインディスプレイ10に表示されている動画学習アイコンIhのうち、先頭の動画学習アイコンIhを指定表示する(ステップS91)。   When the audio mode specified in step S81 is “listening / comparison mode” (step S81; listening / comparison mode), the CPU 20 selects the moving image learning icon Ih displayed on the main display 10 from among the video learning icons Ih. The first moving image learning icon Ih is designated and displayed (step S91).

次に、CPU20は、音声モード指定アイコンIに対する操作によって音声モードの切替操作が行われるか否かを判定する(ステップS93)。   Next, the CPU 20 determines whether or not a voice mode switching operation is performed by an operation on the voice mode designation icon I (step S93).

このステップS93において音声モードの切替操作が行われたと判定した場合(ステップS93;Yes)には、CPU20は、切替操作に応じたアイコンを指定表示させ、上述のステップS81に移行する。   If it is determined in step S93 that the voice mode switching operation has been performed (step S93; Yes), the CPU 20 designates and displays an icon corresponding to the switching operation, and proceeds to the above-described step S81.

また、ステップS93において音声モードの切替操作が行われないと判定した場合(ステップS93;No)には、メインディスプレイ10に表示されている何れかの音声テキストセグメント920の動画学習アイコンIhをユーザが指定すると、CPU20は、当該動画学習アイコンIhに対応する音声テキストセグメント920を音声学習対象として指定する(ステップS95)。   If it is determined in step S93 that the voice mode switching operation is not performed (step S93; No), the user selects the moving image learning icon Ih of one of the voice text segments 920 displayed on the main display 10. When designated, the CPU 20 designates the speech text segment 920 corresponding to the video learning icon Ih as a speech learning target (step S95).

次に、CPU20は、訳/決定キー2bが操作されるか否かを判定し(ステップS97)、操作されないと判定した場合(ステップS97;No)には、キー群2における他のキーが操作されるか否かを判定する(ステップS99)。   Next, the CPU 20 determines whether or not the translation / decision key 2b is operated (step S97). If it is determined that the translation / determination key 2b is not operated (step S97; No), the other keys in the key group 2 are operated. It is determined whether or not to be performed (step S99).

そして、ステップS99において他のキーが操作されたと判定した場合(ステップS99;Yes)には、CPU20は、当該キーに応じた他の処理へ移行する。また、ステップS99において他のキーが操作されないと判定した場合(ステップS99;No)には、CPU20は、上述のステップS81に移行する。   If it is determined in step S99 that another key has been operated (step S99; Yes), the CPU 20 proceeds to another process corresponding to the key. If it is determined in step S99 that no other key is operated (step S99; No), the CPU 20 proceeds to step S81 described above.

また、上述のステップS97において訳/決定キー2bが操作されたと判定した場合(ステップS97;Yes)には、CPU20は、メインディスプレイ10の表示内容を、音声テキストセグメント920の一覧表示から、指定されている動画学習アイコンIh(以下、指定動画学習アイコンIhSとする)に対応する音声付動画セグメント400D(音声学習対象の文(音声テキストセグメント920)に対応する音声付動画セグメント400D)の先頭部分に切り替える(ステップS101)。   If it is determined in step S97 that the translation / decision key 2b has been operated (step S97; Yes), the CPU 20 designates the display content of the main display 10 from the list display of the voice text segment 920. At the beginning of the video segment with voice 400D corresponding to the video learning icon Ih (hereinafter referred to as the designated video learning icon IhS) (video segment with voice 400D corresponding to the speech learning target sentence (voice text segment 920)) Switching (step S101).

次に、CPU20は、指定動画学習アイコンIhSに対応する音声テキストセグメント920、つまり音声学習対象の文の音声付動画セグメント400Dを再生(音声・動画出力)させる(ステップS103)。   Next, the CPU 20 reproduces (sound / moving image output) the audio text segment 920 corresponding to the designated moving image learning icon IhS, that is, the sound-added moving image segment 400D of the speech learning target sentence (step S103).

指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの再生が終了したら、次に、CPU20は、メインディスプレイ10の表示内容を、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの末尾部分から、音声テキストセグメント920の一覧表示に戻す(ステップS105)。   When the reproduction of the moving image segment with sound 400D corresponding to the designated moving image learning icon IhS is completed, the CPU 20 then displays the display content of the main display 10 from the end portion of the moving image segment with sound 400D corresponding to the designated moving image learning icon IhS. Return to the list display of the voice text segment 920 (step S105).

次に、CPU20は、指定動画学習アイコンIhSに対応する音声テキストセグメント920(音声学習対象の文)が表示された状態で、この音声テキストセグメント920(音声学習対象の文)についてのユーザ音声をマイク14に録音させて記憶部80に記憶させる(ステップS107)。なお、本実施の形態においては、録音時間は所定時間(例えば1分間)だけ行われるが、ユーザにより終了操作が行われるまでの時間だけ行われても良い。   Next, in a state in which the speech text segment 920 (speech learning target sentence) corresponding to the designated moving image learning icon IhS is displayed, the CPU 20 mics the user speech for the speech text segment 920 (speech learning target sentence) with a microphone. 14 is recorded and stored in the storage unit 80 (step S107). In the present embodiment, the recording time is performed for a predetermined time (for example, 1 minute), but may be performed only for the time until the end operation is performed by the user.

次に、CPU20は、模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われるか否かを判定し(ステップS109)、行われないと判定した場合(ステップS109;No)には、上述のステップS81に移行する。   Next, the CPU 20 determines whether or not a user operation for listening and comparing the model voice and the user voice is performed (step S109). When it is determined that the user operation is not performed (step S109; No), The process proceeds to step S81 described above.

また、ステップS109において模範音声とユーザ音声とを聞き比べする旨のユーザ操作が行われたと判定した場合(ステップS109;Yes)には、CPU20は、メインディスプレイ10の表示内容を、音声テキストセグメント920の一覧表示から、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの先頭部分に切り替える(ステップS111)。   If it is determined in step S109 that a user operation has been performed to hear and compare the model voice and the user voice (step S109; Yes), the CPU 20 displays the content displayed on the main display 10 as the voice text segment 920. Is switched to the head portion of the moving image segment with sound 400D corresponding to the designated moving image learning icon IhS (step S111).

次に、CPU20は、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dを再生(音声・動画出力)させる(ステップS113)。   Next, the CPU 20 plays back (sound / moving image output) the moving image segment with sound 400D corresponding to the designated moving image learning icon IhS (step S113).

指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの再生(音声・動画出力)が終了したら、次に、CPU20は、メインディスプレイ10の表示内容を、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの末尾部分から、音声テキストセグメント920の一覧表示に戻す(ステップS115)。   When the reproduction (sound / moving image output) of the moving image segment with sound 400D corresponding to the designated moving image learning icon IhS is completed, the CPU 20 then changes the display content of the main display 10 to the moving image with sound corresponding to the designated moving image learning icon IhS. Returning to the list display of the speech text segment 920 from the end of the segment 400D (step S115).

次に、CPU20は、音声テキストセグメント920の一覧表示された状態で、指定動画学習アイコンIhSに対応する音声テキストセグメント920についてステップS107で録音したユーザ音声を再生(音声出力)させた後(ステップS117)、上述のステップS109に移行する。   Next, the CPU 20 plays back the user voice recorded in step S107 for the voice text segment 920 corresponding to the designated moving image learning icon IhS in a state where the voice text segment 920 is listed (step S117). ), The process proceeds to step S109 described above.

[動作例]
続いて、図6〜図14を参照しつつ、上記の録音再生処理を具体的に説明する。なお、これらの図においては、図中の右側にメインディスプレイ10の表示画面等を示し、図中の左側に操作内容等を示している。また、これらの図においては、音声の出力内容を吹き出しで図示しており、より詳細には、模範音声と、ユーザ音声と、読み上げ音声とを異なる態様の吹き出しで図示している。
[Operation example]
Next, the recording / playback process will be described in detail with reference to FIGS. In these figures, the display screen of the main display 10 is shown on the right side of the figure, and the operation contents etc. are shown on the left side of the figure. In these drawings, the output content of the voice is illustrated by a balloon, and more specifically, the model voice, the user voice, and the reading voice are illustrated by different types of balloons.

(動作例1)
まず、ユーザが英会話の教材コンテンツ40Aを選択し(ステップS5;Yes)、当該教材コンテンツ40Aにおける項目「受付で」を選択すると(ステップS7)、図6(a)に示すように、選択された項目「受付で」のテキストデータ40ATがメインディスプレイ10に表示される(ステップS9)。また、このときテキストデータ40ATにおける各文のうち、模範音声データ40AMに対応付けられた文の先頭に音声アイコンIgが表示される。
(Operation example 1)
First, when the user selects the teaching material content 40A for English conversation (step S5; Yes) and selects the item “at reception” in the teaching material content 40A (step S7), the selection is made as shown in FIG. The text data 40AT of the item “at reception” is displayed on the main display 10 (step S9). At this time, among the sentences in the text data 40AT, the voice icon Ig is displayed at the head of the sentence associated with the model voice data 40AM.

次に、ユーザが音声キー2gを操作すると(ステップS11;Yes)、図6(b)に示すように、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbと、読み上げアイコンIcとの3つが、この順に上から並べて表示される(ステップS13)。   Next, when the user operates the voice key 2g (step S11; Yes), as shown in FIG. 6B, the listening icon Ia and the listening comparison icon are displayed as the voice mode designation icon I at the end of the main display 10. Three Ib and a reading icon Ic are displayed side by side in this order (step S13).

次に、ユーザが聞き比べアイコンIbを操作して「聞き比べモード」を指定すると(ステップS15;聞き比べモード)、メインディスプレイ10に表示されている音声アイコンIgのうち、先頭の音声アイコンIgが指定表示される(ステップS21)。   Next, when the user operates the listening / comparison icon Ib to designate “listening / comparison mode” (step S15; listening / comparison mode), the first speech icon Ig among the speech icons Ig displayed on the main display 10 is displayed. Designated and displayed (step S21).

次に、図6(c)に示すように、ユーザが英文「What company do you represent?」の音声アイコンIgを指定し(ステップS25)、訳/決定キー2bを操作すると(ステップS27;Yes)、指定音声アイコンIgSに対応する文の模範音声データ40AMが再生(音声出力)される(ステップS33)。   Next, as shown in FIG. 6C, when the user designates the voice icon Ig of the English sentence “What company do you represent?” (Step S25) and operates the translation / decision key 2b (step S27; Yes). Then, the model voice data 40AM corresponding to the designated voice icon IgS is reproduced (voice output) (step S33).

次に、図6(d)に示すように、指定音声アイコンIgSに対応する文「What company do you represent?」についてのユーザ音声がマイク14によって録音される(ステップS35)。   Next, as shown in FIG. 6D, the user voice about the sentence “What company do you represent?” Corresponding to the designated voice icon IgS is recorded by the microphone 14 (step S35).

次に、図7(a)に示すように、模範音声とユーザ音声とを聞き比べするか否かの選択肢がメインディスプレイ10に表示され、聞き比べする旨の選択肢をユーザが選択すると(ステップS37;Yes)、図7(b)、図7(c)に示すように、指定音声アイコンIgSに対応する文「What company do you represent?」の模範音声データ40AMが再生(音声出力)され(ステップS39)、録音されたユーザ音声が再生(音声出力)される(ステップS41)。   Next, as shown in FIG. 7 (a), an option as to whether or not to compare the model voice and the user voice is displayed on the main display 10, and when the user selects the option of comparing and listening (step S37). Yes), as shown in FIG. 7B and FIG. 7C, the model voice data 40AM of the sentence “What company do you represent?” Corresponding to the designated voice icon IgS is reproduced (voice output) (step S39), the recorded user voice is played back (voice output) (step S41).

一方、上述の図6(b)に示した状態から、ユーザが聞き比べアイコンIbを操作して「聞き比べモード」を指定した後(ステップS15;聞き比べモード)、図8(a)、図8(b)に示すように、メインディスプレイ10に表示されている単語「represent」を指定して(ステップS25)、訳/決定キー2bを操作すると(ステップS27;Yes)、指定されている単語「represent」の模範音声データ50Mが再生(音声出力)される(ステップS55)。なお、このとき指定単語「represent」について複数の模範音声データ50Mが存在する場合(ステップS51;Yes)には、図8(c)に示すように、模範音声データ50Mの候補が選択肢として表示され、ユーザ操作に基づいて何れか1つの模範音声データ50Mが指定される(ステップS53)。   On the other hand, from the state shown in FIG. 6B described above, after the user operates the listening comparison icon Ib to designate “listening comparison mode” (step S15; listening comparison mode), FIG. 8A, FIG. As shown in FIG. 8B, when the word “represent” displayed on the main display 10 is designated (step S25) and the translation / decision key 2b is operated (step S27; Yes), the designated word The “represent” model voice data 50M is reproduced (voice output) (step S55). At this time, when there are a plurality of model voice data 50M for the designated word “represent” (step S51; Yes), candidates for the model voice data 50M are displayed as options as shown in FIG. 8C. Any one model voice data 50M is designated based on the user operation (step S53).

次に、図8(d)に示すように、指定単語「represent」についてのユーザ音声がマイク14によって録音される(ステップS57)。   Next, as shown in FIG. 8D, the user voice for the designated word “represent” is recorded by the microphone 14 (step S57).

次に、図9(a)に示すように、模範音声とユーザ音声とを聞き比べするか否かの選択肢がメインディスプレイ10に表示され、聞き比べする旨の選択肢をユーザが選択すると(ステップS59;Yes)、図9(b)、図9(c)に示すように、指定単語「represent」の模範音声データ50Mが再生(音声出力)され(ステップS61)、録音されたユーザ音声が再生(音声出力)される(ステップS63)。   Next, as shown in FIG. 9 (a), an option as to whether or not to compare the model voice and the user voice is displayed on the main display 10, and when the user selects the option of comparing and listening (step S59). ; Yes), as shown in FIGS. 9B and 9C, the model voice data 50M of the designated word “represent” is played back (voice output) (step S61), and the recorded user voice is played back (step S61). Audio output) (step S63).

(動作例2)
まず、ユーザが物語動画の教材コンテンツ40Bを選択し(ステップS3;Yes)、当該教材コンテンツ40Bにおける項目「NY編」を選択して(ステップS71)、動画学習を行う旨の操作を行うと(ステップS73;Yes)図10(a)に示すように、選択された項目「NY編」の音声テキストデータ40BTに含まれる音声テキストセグメント920がメインディスプレイ10に一覧表示される(ステップS9)。また、このときメインディスプレイ10の端部に動画学習アイコンIhが表示されるとともに、各音声テキストセグメント920の文頭にも動画学習アイコンIhが表示される。なお、本動作例においては、各音声テキストセグメント920に対し、日本語での訳文が付記されている。
(Operation example 2)
First, when the user selects the teaching material content 40B of the story video (step S3; Yes), selects the item “NY edition” in the teaching material content 40B (step S71), and performs an operation to perform the video learning (step S71). Step S73; Yes) As shown in FIG. 10A, a list of the speech text segments 920 included in the speech text data 40BT of the selected item “NY” is displayed on the main display 10 (Step S9). At this time, the moving image learning icon Ih is displayed at the end of the main display 10, and the moving image learning icon Ih is also displayed at the beginning of each voice text segment 920. In this operation example, a translation in Japanese is appended to each speech text segment 920.

次に、図10(b)に示すように、ユーザが動画学習アイコンIhを操作すると(ステップS77;Yes)、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbとの2つが、この順に上から並べて表示される(ステップS79)。   Next, as shown in FIG. 10 (b), when the user operates the moving image learning icon Ih (step S77; Yes), the listening icon Ia is compared with the listening icon Ia at the end of the main display 10 as the voice mode designation icon I. Two icons Ib are displayed side by side in this order (step S79).

次に、ユーザが聞き比べアイコンIbを操作して「聞き比べモード」を指定すると(ステップS81;聞き比べモード)、メインディスプレイ10に表示されている動画学習アイコンIhのうち、先頭の動画学習アイコンIhが指定表示される(ステップS91)。   Next, when the user operates the listening / comparison icon Ib to specify “listening / comparison mode” (step S81; listening / comparison mode), the first video learning icon among the video learning icons Ih displayed on the main display 10 is displayed. Ih is designated and displayed (step S91).

次に、メインディスプレイ10に表示されている先頭の動画学習アイコンIh(「I’m hungry…」に対応する動画学習アイコンIh)をユーザが指定し(ステップS95)、図10(c)に示すように、訳/決定キー2bを操作すると(ステップS97;Yes)、メインディスプレイ10の表示内容が、音声テキストセグメント920の一覧表示から、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの先頭部分に切り替えられる(ステップS101)。   Next, the user designates the first moving image learning icon Ih displayed on the main display 10 (the moving image learning icon Ih corresponding to “I'm hungry...”) (Step S95), and is shown in FIG. As described above, when the translation / decision key 2b is operated (step S97; Yes), the display content of the main display 10 is changed from the list display of the audio text segment 920 to the head of the audio-added video segment 400D corresponding to the designated video learning icon IhS. Switching to the part is made (step S101).

次に、指定動画学習アイコンIhSに対応する音声付動画セグメント400D(「I’m hungry…」)が再生(音声・動画出力)される(ステップS103)。   Next, the moving image segment with sound 400D ("I'm hungry ...") corresponding to the designated moving image learning icon IhS is played back (voice / moving image output) (step S103).

次に、図10(d)に示すように、メインディスプレイ10の表示内容が指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの末尾部分から、音声テキストセグメント920の一覧表示に戻される(ステップS105)。   Next, as shown in FIG. 10 (d), the display content of the main display 10 is returned to the list display of the audio text segment 920 from the end portion of the audio video segment 400D corresponding to the designated video learning icon IhS (step). S105).

次に、指定動画学習アイコンIhSに対応する音声テキストセグメント920(「I’m hungry…」)についてのユーザ音声がマイク14によって録音される(ステップS107)。   Next, the user voice for the voice text segment 920 ("I'm hungry ...") corresponding to the designated moving image learning icon IhS is recorded by the microphone 14 (step S107).

次に、図11(a)に示すように、模範音声とユーザ音声とを聞き比べするか否かの選択肢がメインディスプレイ10に表示され、聞き比べする旨の選択肢をユーザが選択すると(ステップS109;Yes)、図11(b)に示すように、メインディスプレイ10の表示内容が、音声テキストセグメント920の一覧表示から、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dの先頭部分に切り替えられて(ステップS111)、指定動画学習アイコンIhSに対応する音声付動画セグメント400Dが再生(音声・動画出力)される(ステップS113)。   Next, as shown in FIG. 11 (a), an option as to whether or not to compare the model voice and the user voice is displayed on the main display 10, and when the user selects the option of comparing and listening (step S109). 11), as shown in FIG. 11B, the display content of the main display 10 is switched from the list display of the audio text segment 920 to the head portion of the audio-added video segment 400D corresponding to the designated video learning icon IhS. (Step S111), the audio-added video segment 400D corresponding to the designated video learning icon IhS is played back (audio / video output) (Step S113).

そして、図11(c)に示すように、メインディスプレイ10の表示内容が音声付動画セグメント400Dの末尾部分から、音声テキストセグメント920の一覧表示に戻され(ステップS115)、録音されたユーザ音声が再生(音声出力)される(ステップS117)。   Then, as shown in FIG. 11C, the display content of the main display 10 is returned to the list display of the audio text segment 920 from the end portion of the moving image segment with audio 400D (step S115), and the recorded user audio is recorded. Playback (audio output) is performed (step S117).

(動作例3)
まず、ユーザが英会話の教材コンテンツ40Aを選択し(ステップS5;Yes)、当該教材コンテンツ40Aにおける項目「受付で」を選択すると(ステップS7)、図12(a)に示すように、選択された項目「受付で」のテキストデータ40ATがメインディスプレイ10に表示される(ステップS9)。また、このときテキストデータ40ATにおける各文のうち、模範音声データ40AMに対応付けられた文の先頭に音声アイコンIgが表示される。
(Operation example 3)
First, when the user selects the teaching material content 40A for English conversation (step S5; Yes) and selects the item “at reception” in the teaching material content 40A (step S7), the selection is made as shown in FIG. The text data 40AT of the item “at reception” is displayed on the main display 10 (step S9). At this time, among the sentences in the text data 40AT, the voice icon Ig is displayed at the head of the sentence associated with the model voice data 40AM.

次に、ユーザが音声キー2gを操作すると(ステップS11;Yes)、図12(b)に示すように、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbと、読み上げアイコンIcとの3つが、この順に上から並べて表示される(ステップS13)。   Next, when the user operates the voice key 2g (step S11; Yes), as shown in FIG. 12B, as a voice mode designation icon I at the end of the main display 10, a listening icon Ia and a listening comparison icon Three Ib and a reading icon Ic are displayed side by side in this order (step S13).

次に、ユーザが聞くアイコンIaを操作して「聞くモード」を指定すると(ステップS15;聞くモード)、聞くモード処理が行われる(ステップS19)。   Next, when the user operates the listening icon Ia to designate “listening mode” (step S15; listening mode), listening mode processing is performed (step S19).

具体的には、まずメインディスプレイ10の端部に回数設定アイコンIkが表示され、前回の録音再生処理で設定された再生回数が回数設定アイコンIkに表示される。次に、ユーザが回数設定アイコンIkを操作すると、操作される毎に再生回数が1,3,5,1,3,…の順に切り替えられる。そして、ユーザが再生回数を「3」に設定した後、メインディスプレイ10に表示されている英文「May I have your name please?」の音声アイコンIgを指定すると、図12(c)に示すように、この文の模範音声データ40AMが再生回数「3」だけ再生(音声出力)される。次に、図13(a)に示すように、メインディスプレイ10に表示されている単語「represent」をユーザが指定すると、指定単語「represent」について複数の模範音声データ50Mが存在すると判定されて、図13(b)に示すように、模範音声データ50Mの候補が選択肢として表示される。そして、ユーザが何れか1つの模範音声データ50Mを指定すると、図13(c)に示すように、指定されている単語「represent」の模範音声データ50Mが再生回数「3」だけ再生(音声出力)される。   Specifically, first, the number setting icon Ik is displayed at the end of the main display 10, and the number of reproductions set in the previous recording / reproducing process is displayed on the number setting icon Ik. Next, when the user operates the number setting icon Ik, the number of reproductions is switched in the order of 1, 3, 5, 1, 3,. Then, after the user sets the number of playbacks to “3”, if the voice icon Ig of the English sentence “May I have your name please?” Displayed on the main display 10 is specified, as shown in FIG. The exemplary voice data 40AM of this sentence is played back (voice output) by the number of times of playback “3”. Next, as illustrated in FIG. 13A, when the user designates the word “represent” displayed on the main display 10, it is determined that a plurality of exemplary voice data 50 </ b> M exists for the designated word “represent”. As shown in FIG. 13B, candidates for the model voice data 50M are displayed as options. When the user designates any one of the model voice data 50M, as shown in FIG. 13C, the model voice data 50M of the designated word “represent” is played back by the number of times of playback “3” (voice output). )

(動作例4)
まず、ユーザが英会話の教材コンテンツ40Aを選択し(ステップS5;Yes)、当該教材コンテンツ40Aにおける項目「紹介」を選択すると(ステップS7)、図14(a)に示すように、選択された項目「紹介」のテキストデータ40ATがメインディスプレイ10に表示される(ステップS9)。また、このときテキストデータ40ATにおける各文のうち、模範音声データ40AMに対応付けられた文の先頭に音声アイコンIgが表示される。
(Operation example 4)
First, when the user selects the teaching material content 40A for English conversation (step S5; Yes) and selects the item “introduction” in the teaching material content 40A (step S7), the selected item is displayed as shown in FIG. The “introduction” text data 40AT is displayed on the main display 10 (step S9). At this time, among the sentences in the text data 40AT, the voice icon Ig is displayed at the head of the sentence associated with the model voice data 40AM.

次に、ユーザが音声キー2gを操作すると(ステップS11;Yes)、図14(b)に示すように、メインディスプレイ10の端部に音声モード指定アイコンIとして、聞くアイコンIaと、聞き比べアイコンIbと、読み上げアイコンIcとの3つが、この順に上から並べて表示される(ステップS13)。   Next, when the user operates the voice key 2g (step S11; Yes), as shown in FIG. 14B, the listening icon Ia and the listening comparison icon as the voice mode designation icon I at the end of the main display 10 are displayed. Three Ib and a reading icon Ic are displayed side by side in this order (step S13).

次に、ユーザが読み上げアイコンIcを操作して「読み上げモード」を指定すると(ステップS15;読み上げモード)、読み上げモード処理が行われる(ステップS17)。   Next, when the user operates the reading icon Ic to designate “reading mode” (step S15; reading mode), reading mode processing is performed (step S17).

具体的には、まずメインディスプレイ10の端部に回数設定アイコンIkが表示され、前回の録音再生処理で設定された再生回数が回数設定アイコンIkに表示される。次に、ユーザが回数設定アイコンIkを操作すると、操作される毎に再生回数が1,3,5,1,3,…の順に切り替えられる。そして、ユーザが再生回数を「3」に設定した後、図14(c)に示すように、メインディスプレイ10に表示されている英文「Let me introduce my assistant, Mr. Suzuki.」を指定すると、図14(d)に示すように、この文に対応する合成音声が生成され、再生回数「3」だけ再生(音声出力)される。   Specifically, first, the number setting icon Ik is displayed at the end of the main display 10, and the number of reproductions set in the previous recording / reproducing process is displayed on the number setting icon Ik. Next, when the user operates the number setting icon Ik, the number of reproductions is switched in the order of 1, 3, 5, 1, 3,. Then, after the user sets the playback count to “3”, as shown in FIG. 14 (c), when the English sentence “Let me introduce my assistant, Mr. Suzuki.” Displayed on the main display 10 is specified, As shown in FIG. 14D, a synthesized voice corresponding to this sentence is generated and played back (voice output) for the number of times of playback “3”.

以上の電子辞書1によれば、図4のステップS33〜S41、S55〜S63や図6〜図9などに示したように、文が音声学習対象として指定された場合には、当該文に対応する模範音声データ30AM、40AMを出力する制御と、当該文についてのユーザ音声を録音する制御とを行って、模範音声データ30AM,40AMを出力する制御と、当該文についてのユーザ音声を出力する制御とを行い、一方、文中の単語が指定された場合には、当該単語に対応する模範音声データ50Mを出力する制御と、当該単語についてのユーザ音声を録音する制御とを行って、模範音声データ50Mを出力する制御と、当該単語についてのユーザ音声を出力する制御とを行うので、テキスト内の文の音声を学習するとともに、当該文中の単語の音声を学習することができる。   According to the electronic dictionary 1 described above, when a sentence is designated as a speech learning target, as shown in steps S33 to S41, S55 to S63 in FIGS. Control to output the model voice data 30AM, 40AM, control to record the user voice for the sentence, control to output the model voice data 30AM, 40AM, and control to output the user voice for the sentence On the other hand, when a word in the sentence is designated, control for outputting the model voice data 50M corresponding to the word and control for recording the user voice for the word are performed. Since the control for outputting 50M and the control for outputting the user voice for the word are performed, the voice of the sentence in the text is learned, and the voice of the word in the sentence is It is possible to learn.

また、図5のステップS101〜S117や図10〜図11などに示したように、物語動画の教材コンテンツ40Bが選択された場合には、文が音声学習対象として指定された場合に、当該文に対応する模範音声データを出力する制御として、当該文に対応する音声付動画データ40BD(音声付動画セグメント400D)を出力する制御を行い、当該文についてのユーザ音声を録音する制御を行うときや、当該文についてのユーザ音声を出力する制御を行うときに、当該文を含む音声テキストセグメント400Tを表示する制御を行うので、音声の含まれた動画を用いて、テキスト内の文の音声を学習することができる。また、動画を用いる場合であっても、テキストの内容を把握しつつ音声学習を行うことができる。   Further, as shown in steps S101 to S117 of FIG. 5 and FIGS. 10 to 11 and the like, when the teaching material content 40B of the story video is selected, the sentence is specified when the sentence is designated as a speech learning target. As the control for outputting the model voice data corresponding to the sentence, when performing the control for outputting the moving image data with sound 40BD (the moving image segment with sound 400D) corresponding to the sentence and recording the user voice for the sentence, When performing control to output a user voice for the sentence, control is performed to display the voice text segment 400T including the sentence, so that the voice of the sentence in the text is learned using the moving image including the voice. can do. Further, even when a moving image is used, speech learning can be performed while grasping the content of the text.

また、図3のステップS13や図6(b)などに示したように、テキストが表示されている状態で、「聞くモード」を指定するための聞くアイコンIaと、「聞き比べモード」を指定するための聞き比べアイコンIbと、「読み上げモード」を指定するための読み上げアイコンIcとがこの順に並べて表示されるので、使用頻度の高い順にアイコンが表示される。従って、他の順にアイコンが表示される場合と比較して、使い勝手を向上させることができる。   Also, as shown in step S13 of FIG. 3, FIG. 6B, etc., the listening icon Ia for designating the “listening mode” and the “listening comparison mode” are designated while the text is displayed. Since the listening comparison icon Ib for reading and the reading icon Ic for designating the “reading mode” are displayed side by side in this order, the icons are displayed in descending order of frequency of use. Therefore, usability can be improved as compared with the case where icons are displayed in other order.

また、図4のステップS18や図12(b)などに示したように、文の再生回数を設定するための回数設定アイコンIkが表示され、この回数設定アイコンIkによって設定された再生回数だけ、模範音声データ30AM,40AMが出力されるので、音声学習の学習効果を高めることができる。   Further, as shown in step S18 of FIG. 4, FIG. 12B, and the like, a number setting icon Ik for setting the number of times of reproduction of the sentence is displayed, and the number of times of reproduction set by the number of times setting icon Ik is Since the model voice data 30AM and 40AM are output, the learning effect of voice learning can be enhanced.

[変形例]
続いて、上記実施形態の変形例について説明する。なお、上記の実施形態と同様の構成要素には同一の符号を付し、その説明を省略する。
[Modification]
Then, the modification of the said embodiment is demonstrated. In addition, the same code | symbol is attached | subjected to the component similar to said embodiment, and the description is abbreviate | omitted.

本変形例における電子辞書1Aは、図15に示すように、通信部90と、記憶部80Aとを備えている。
通信部90は、ネットワークNに接続可能となっており、これにより、ネットワークNに接続される外部機器、例えばデータサーバDとの通信が可能となっている。このデータサーバDには、単語音声データ群5及び教材コンテンツ群4等が格納されるようになっている。
As shown in FIG. 15, the electronic dictionary 1A in the present modification includes a communication unit 90 and a storage unit 80A.
The communication unit 90 can be connected to the network N, thereby enabling communication with an external device connected to the network N, for example, the data server D. The data server D stores a word voice data group 5, a teaching material content group 4, and the like.

また、この通信部90には、外部再生装置Gが接続可能となっている。外部再生装置Gは、表示部G1や音声入出力部G2を備えている。表示部G1は、上述のメインディスプレイ10と同様のディスプレイG10を有しており、入力される表示信号に基づいて各種情報をディスプレイG10に表示するようになっている。音声入出力部G2は、上述のスピーカ13、マイク14と同様のスピーカG20、マイクG21を有しており、入力される音声出力信号に基づいてスピーカG20に音声出力を行わせたり、入力される録音信号に基づいてマイクG21に音声データの録音を行わせたりするようになっている。   Further, an external playback device G can be connected to the communication unit 90. The external playback device G includes a display unit G1 and an audio input / output unit G2. The display unit G1 has a display G10 similar to the main display 10 described above, and displays various information on the display G10 based on an input display signal. The audio input / output unit G2 includes the speaker G20 and the microphone G21 similar to the speaker 13 and the microphone 14 described above, and causes the speaker G20 to perform audio output based on the input audio output signal. The microphone G21 is made to record voice data based on the recording signal.

記憶部80Aは、本発明に係る音声録音再生プログラム81Aを記憶している。
この音声録音再生プログラム81Aは、上記実施形態と同様の録音再生処理(図3〜図5参照)をCPU20に実行させるためのプログラムである。
The storage unit 80A stores a voice recording / reproducing program 81A according to the present invention.
The voice recording / playback program 81A is a program for causing the CPU 20 to execute the same recording / playback processing (see FIGS. 3 to 5) as in the above embodiment.

但し、音声録音再生プログラム81Aにより実行される録音再生処理では、CPU20は、記憶部80A内の単語音声データ群5や教材コンテンツ群4等の代わりに、データサーバD内の単語音声データ群5や教材コンテンツ群4等を、通信部90により取得して用いるようになっている。   However, in the recording / playback process executed by the voice recording / playback program 81A, the CPU 20 replaces the word voice data group 5 in the storage unit 80A, the teaching material content group 4 and the like with the word voice data group 5 in the data server D or the like. The teaching material content group 4 and the like are acquired by the communication unit 90 and used.

また、CPU20は、テキストデータ40ATや音声テキストセグメント400Tを表示する制御と、ユーザ音声を録音する制御と、模範音声データ50M、40AMや音声付動画セグメント400D、ユーザ音声の録音データを再生(音声出力)して音声出力する制御とを、電子辞書1Aの表示部21や音声入出力部70に対して行う代わりに、通信部90を介して外部再生装置Gの表示部G1及び音声入出力部G2に対して行うようになっている。   Further, the CPU 20 controls the display of the text data 40AT and the voice text segment 400T, the control of recording the user voice, and reproduces the model voice data 50M and 40AM, the moving image segment with voice 400D, and the recorded data of the user voice (voice output). ) And outputting the audio to the display unit 21 and the audio input / output unit 70 of the electronic dictionary 1A, instead of performing the control to the display unit 21 and the audio input / output unit 70, the display unit G1 and the audio input / output unit G2 of the external playback device G To do.

以上の電子辞書1Aによっても、上記実施形態における電子辞書1と同様の作用効果を得ることができる。   Also with the electronic dictionary 1A described above, the same operational effects as those of the electronic dictionary 1 in the above embodiment can be obtained.

なお、本発明を適用可能な実施形態は、上述した実施形態や変形例に限定されることなく、本発明の趣旨を逸脱しない範囲で適宜変更可能である。   The embodiments to which the present invention can be applied are not limited to the above-described embodiments and modifications, and can be appropriately changed without departing from the spirit of the present invention.

例えば、本発明に係る音声出力制御装置を電子辞書1,1Aとして説明したが、本発明が適用可能なものは、このような製品に限定されず、例えば図1(b)に示すようなタブレットパソコン1B(或いはスマートフォン),図1(c)に示すような外部再生装置Gに接続されるパソコン1Cの他、デスクトップパソコンやノートパソコン、携帯電話、PDA(Personal Digital Assistant)、ゲーム機などの電子機器全般に適用可能である。また、本発明に係る音声録音再生プログラム81,81Aは、電子辞書1,1Aに対して着脱可能なメモリカード、CD等に記憶されることとしてもよい。   For example, although the audio output control device according to the present invention has been described as the electronic dictionary 1, 1 </ b> A, what can be applied to the present invention is not limited to such a product, for example, a tablet as shown in FIG. In addition to a personal computer 1B (or a smartphone), a personal computer 1C connected to an external playback device G as shown in FIG. Applicable to all devices. The audio recording / playback programs 81 and 81A according to the present invention may be stored in a memory card, CD, or the like that is detachable from the electronic dictionary 1 or 1A.

また、物語動画の教材コンテンツ40Bが選択されて聞き比べモードに移行した場合には、ユーザ操作により指定される動画学習アイコンIhに対応する音声付動画セグメント400Dを再生(音声・動画出力)して、そのユーザ音声を録音した後、改めて音声付動画セグメント400Dを再生(音声・動画出力)し、ユーザ音声を再生(音声出力)することとして説明したが、ユーザ操作に応じて、音声付動画セグメント400D内でユーザ操作により指定される単語の模範音声データ30AMを再生し、そのユーザ音声を録音した後、改めて単語の模範音声データ30AMとユーザ音声とを再生することとしても良い。この場合には、音声の含まれた動画を用いて、テキスト内の文の音声を学習するとともに、当該文中の単語の音声を学習することができる。   Also, when the story video material 40B is selected and the mode is changed to the listening comparison mode, the audio video segment 400D corresponding to the video learning icon Ih designated by the user operation is reproduced (audio / video output). In the above description, after recording the user voice, the audio segment with audio 400D is reproduced (audio / video output) and the user audio is reproduced (audio output). It is also possible to reproduce the exemplary voice data 30AM of the word specified by the user operation within 400D, record the user voice, and then reproduce the exemplary voice data 30AM of the word and the user voice again. In this case, it is possible to learn the voice of the sentence in the text and learn the voice of the word in the sentence using the moving image including the voice.

以上、本発明のいくつかの実施形態を説明したが、本発明の範囲は、上述の実施の形態に限定するものではなく、特許請求の範囲に記載された発明の範囲とその均等の範囲を含む。
以下に、この出願の願書に最初に添付した特許請求の範囲に記載した発明を付記する。付記に記載した請求項の項番は、この出願の願書に最初に添付した特許請求の範囲の通りである。
〔付記〕
<請求項1>
単語の模範音声データが複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の模範音声データとが対応付けられて複数記憶されている文音声記憶手段と、
前記文を含むテキストを表示する制御を行うテキスト表示制御手段と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定手段と、 前記文が前記音声学習対象として指定された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を録音する制御とを行うか或いは、前記文中の単語が指定された場合に、当該単語に対応する模範音声データを出力する制御と、当該単語についてのユーザ音声を録音する制御とを行う対象別録音制御手段と、
前記対象別録音制御手段により前記文についてのユーザ音声が録音された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を出力する制御とを行うか或いは、前記対象別再生録音制御手段により単語についてのユーザ音声が録音された場合に、当該単語に対応する前記模範音声データを出力する制御と、当該単語についてのユーザ音声を出力する制御とを行う対象別出力制御手段と、
を備えることを特徴とする音声出力制御装置。
<請求項2>
請求項1記載の音声出力制御装置において、
前記文音声記憶手段には、
各文に対し、当該文の模範音声データを含む動画データが対応付けて記憶されており、
前記対象別録音制御手段は、
前記文が前記音声学習対象として指定された場合には、
当該文に対応する前記模範音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声を録音する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを特徴とする音声出力制御装置。
<請求項3>
請求項2記載の音声出力制御装置において、
前記対象別出力制御手段は、
前記対象別録音制御手段により前記文についてのユーザ音声が録音された場合には、
当該文に対応する前記模範音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声を出力する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを特徴とする音声出力制御装置。
<請求項4>
請求項1〜3の何れか一項に記載の音声出力制御装置において、
前記文が前記音声学習対象として指定された場合に、当該文の前記模範音声データを出力する制御を行う模範音声出力制御手段と、
前記文が前記音声学習対象として指定された場合に、当該文の文字列に対応する合成音声を生成して出力する制御を行う合成音声出力制御手段と、
前記テキスト表示制御手段によりテキストが表示されている状態で、第1のアイコン、第2のアイコン及び第3のアイコンをこの順に並べて表示する制御を行うアイコン表示制御手段と、
前記第1のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記模範音声出力制御手段を機能させ、前記第2のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記対象別録音制御手段を機能させ、前記第3のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記合成音声出力制御手段を機能させる機能制御手段と、
を備えることを特徴とする音声出力制御装置。
<請求項5>
請求項4に記載の音声出力制御装置において、
前記模範音声出力制御手段は、
前記文の再生回数を設定するための回数設定アイコンを表示する制御を行う回数アイコン表示制御手段を有し、
前記回数設定アイコンによって設定された再生回数だけ、前記模範音声データを再生する制御を行うことを特徴とする音声出力制御装置。
<請求項6>
単語の模範音声データを取得する単語音声取得手段と、
複数の単語を含む文と、当該文の模範音声データとを取得する文音声取得手段と、
前記文を含むテキストを表示する制御を行うテキスト表示制御手段と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定手段と、
前記文が前記音声学習対象として指定された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を録音する制御とを行うか或いは、前記文中の単語が指定された場合に、当該単語に対応する模範音声データを出力する制御と、当該単語についてのユーザ音声を録音する制御とを行う対象別録音制御手段と、
前記対象別録音制御手段により前記文についてのユーザ音声が録音された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を出力する制御とを行うか或いは、前記対象別録音制御手段により単語についてのユーザ音声が録音された場合に、当該単語に対応する前記模範音声データを出力する制御と、当該単語についてのユーザ音声を出力する制御とを行う対象別出力制御手段と、
を備えることを特徴とする音声出力制御装置。
<請求項7>
単語の模範音声データが複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の模範音声データとが対応付けられて複数記憶されている文音声記憶手段と、
を備えるコンピュータに、
前記文を含むテキストを表示する制御を行うテキスト表示制御機能と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定機能と、
前記文が前記音声学習対象として指定された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を録音する制御とを行うか或いは、前記文中の単語が指定された場合に、当該単語に対応する模範音声データを出力する制御と、当該単語についてのユーザ音声を録音する制御とを行う対象別録音制御機能と、
前記対象別録音制御機能により前記文についてのユーザ音声が録音された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を出力する制御とを行うか或いは、前記対象別録音制御機能により単語についてのユーザ音声が録音された場合に、当該単語に対応する前記模範音声データを出力する制御と、当該単語についてのユーザ音声を出力する制御とを行う対象別出力制御機能と、
を実現させることを特徴とする音声出力制御プログラム。
<請求項8>
単語の模範音声データを取得する単語音声取得手段と、
複数の単語を含む文と、当該文の模範音声データとを取得する文音声取得手段と、
を備えるコンピュータに、
前記文を含むテキストを表示する制御を行うテキスト表示制御機能と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定機能と、
前記文が前記音声学習対象として指定された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を録音する制御とを行うか或いは、前記文中の単語が指定された場合に、当該単語に対応する模範音声データを出力する制御と、当該単語についてのユーザ音声を録音する制御とを行う対象別録音制御機能と、
前記対象別録音制御機能により前記文についてのユーザ音声が録音された場合に、当該文に対応する前記模範音声データを出力する制御と、当該文についてのユーザ音声を出力する制御とを行うか或いは、前記対象別録音制御機能により単語についてのユーザ音声が録音された場合に、当該単語に対応する前記模範音声データを出力する制御と、当該単語についてのユーザ音声を出力する制御とを行う対象別出力制御機能と、
を実現させることを特徴とする音声出力制御プログラム。
As mentioned above, although several embodiment of this invention was described, the scope of the present invention is not limited to the above-mentioned embodiment, The range of the invention described in the claim, and its equivalent range Including.
The invention described in the scope of claims attached to the application of this application will be added below. The item numbers of the claims described in the appendix are as set forth in the claims attached to the application of this application.
[Appendix]
<Claim 1>
Word speech storage means for storing a plurality of word speech data of words;
Sentence voice storage means in which a sentence including a plurality of words and model voice data of the sentence are associated and stored,
Text display control means for performing control to display text including the sentence;
Based on a user operation, speech learning target designating means for designating the sentence in the text or a word in the text as a speech learning target, and corresponding to the sentence when the sentence is designated as the speech learning target Control to output the exemplary voice data and control to record user voice for the sentence, or control to output exemplary voice data corresponding to the word when a word in the sentence is specified , Subject-specific recording control means for controlling the recording of the user voice for the word;
When a user voice for the sentence is recorded by the subject-specific recording control means, a control for outputting the model voice data corresponding to the sentence and a control for outputting a user voice for the sentence, or When a user voice for a word is recorded by the target reproduction recording control means, a target for performing control to output the exemplary voice data corresponding to the word and control to output a user voice for the word Another output control means;
An audio output control device comprising:
<Claim 2>
The sound output control device according to claim 1,
In the sentence voice storage means,
For each sentence, video data including exemplary voice data of the sentence is stored in association with each other,
The subject recording control means includes:
When the sentence is designated as the speech learning target,
As control for outputting the exemplary audio data corresponding to the sentence, while performing control to output the moving image data corresponding to the sentence,
An audio output control device that performs control to display the text including the sentence when performing control to record the user voice for the sentence.
<Claim 3>
The audio output control device according to claim 2,
The target output control means includes:
When a user voice for the sentence is recorded by the subject recording control means,
As control for outputting the exemplary audio data corresponding to the sentence, while performing control to output the moving image data corresponding to the sentence,
An audio output control apparatus that performs control to display the text including the sentence when performing control to output a user voice for the sentence.
<Claim 4>
In the audio output control device according to any one of claims 1 to 3,
When the sentence is designated as the speech learning target, exemplary speech output control means for performing control to output the exemplary speech data of the sentence;
Synthesized speech output control means for performing control to generate and output synthesized speech corresponding to a character string of the sentence when the sentence is designated as the speech learning target;
Icon display control means for performing control to display the first icon, the second icon, and the third icon in this order in a state where the text is displayed by the text display control means;
When the user operation is performed on the first icon and the sentence is designated as the speech learning target, the model voice output control unit is caused to function, and the user operation is performed on the second icon. And when the sentence is designated as the speech learning target, the recording control unit for each object is caused to function, a user operation is performed on the third icon, and the sentence is Function control means for causing the synthesized voice output control means to function when designated as a speech learning target;
An audio output control device comprising:
<Claim 5>
The sound output control device according to claim 4,
The exemplary voice output control means includes:
A number-of-times icon display control means for performing control to display a number-of-times setting icon for setting the number of times of reproduction of the sentence;
An audio output control apparatus that controls to reproduce the exemplary audio data for the number of reproduction times set by the number of times setting icon.
<Claim 6>
Word voice acquisition means for acquiring word exemplary voice data;
Sentence sound acquisition means for acquiring a sentence including a plurality of words and exemplary sound data of the sentence;
Text display control means for performing control to display text including the sentence;
Based on a user operation, a speech learning target specifying means for specifying the sentence in the text or a word in the sentence as a speech learning target;
When the sentence is designated as the speech learning target, the control for outputting the model voice data corresponding to the sentence and the control for recording the user voice for the sentence are performed, or the word in the sentence is When specified, recording control means for each target that performs control to output exemplary voice data corresponding to the word and control to record user voice for the word;
When a user voice for the sentence is recorded by the subject-specific recording control means, a control for outputting the model voice data corresponding to the sentence and a control for outputting a user voice for the sentence, or When a user voice for a word is recorded by the recording control means for each object, control for outputting the exemplary voice data corresponding to the word and control for outputting a user voice for the word Output control means;
An audio output control device comprising:
<Claim 7>
Word speech storage means for storing a plurality of word speech data of words;
Sentence voice storage means in which a sentence including a plurality of words and model voice data of the sentence are associated and stored,
On a computer with
A text display control function for performing control to display text including the sentence;
A speech learning target designating function for designating the sentence in the text or a word in the sentence as a speech learning target based on a user operation;
When the sentence is designated as the speech learning target, the control for outputting the model voice data corresponding to the sentence and the control for recording the user voice for the sentence are performed, or the word in the sentence is When specified, a recording control function for each object that performs control to output exemplary voice data corresponding to the word and control to record user voice for the word;
When the user voice for the sentence is recorded by the recording control function for each object, the control for outputting the model voice data corresponding to the sentence and the control for outputting the user voice for the sentence are performed. When a user voice for a word is recorded by the target recording control function, control for outputting the exemplary voice data corresponding to the word and control for outputting a user voice for the word Output control function,
An audio output control program characterized by realizing the above.
<Claim 8>
Word voice acquisition means for acquiring word exemplary voice data;
Sentence sound acquisition means for acquiring a sentence including a plurality of words and exemplary sound data of the sentence;
On a computer with
A text display control function for performing control to display text including the sentence;
A speech learning target designating function for designating the sentence in the text or a word in the sentence as a speech learning target based on a user operation;
When the sentence is designated as the speech learning target, the control for outputting the model voice data corresponding to the sentence and the control for recording the user voice for the sentence are performed, or the word in the sentence is When specified, a recording control function for each object that performs control to output exemplary voice data corresponding to the word and control to record user voice for the word;
When the user voice for the sentence is recorded by the recording control function for each object, the control for outputting the model voice data corresponding to the sentence and the control for outputting the user voice for the sentence are performed. When a user voice for a word is recorded by the target recording control function, control for outputting the exemplary voice data corresponding to the word and control for outputting a user voice for the word Output control function,
An audio output control program characterized by realizing the above.

1 電子辞書
20 CPU
30 入力部
40 表示部
81 音声録音再生プログラム
1 Electronic Dictionary 20 CPU
30 Input unit 40 Display unit 81 Voice recording / playback program

本発明の課題は、動画を用いる場合であっても、テキストの内容を把握しつつ音声学習を行うことのできる電子機器、音声出力録音方法及びプログラムを提供することである。 An object of the present invention is to provide an electronic device, a voice output recording method, and a program that can perform voice learning while grasping the content of text even when a moving image is used .

以上の課題を解決するため、本発明の電子機器は、
記憶手段に記憶された文が音声学習対象として指定された場合に、
当該文に対応付けて前記記憶手段に記憶された動画データを表示手段によって出力させる出力処理と、
前記出力処理の終了したことに応じて、前記表示手段による出力内容を、前記動画データから、当該文に対応付けて前記記憶手段に記憶されたテキストへ切り替える切替処理と、
前記テキストを前記表示手段によって表示させながら、音声を録音手段によって録音させる録音処理と、を実行する制御手段を備えることを特徴とする。
In order to solve the above problems, the electronic device of the present invention is
When a sentence stored in the storage means is designated as a speech learning target,
An output process for causing the display means to output the moving image data stored in the storage means in association with the sentence;
A switching process for switching the output content by the display unit from the moving image data to the text stored in the storage unit in association with the sentence in response to the completion of the output process;
And recording means for recording a voice by a recording means while displaying the text on the display means .

Claims (6)

単語と単語音声データが複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の文音声データとが対応付けられて複数記憶されている文音声記憶手段と、
前記文を含むテキストを表示する制御を行うテキスト表示制御手段と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定手段と、
前記文が前記音声学習対象として指定された場合には、当該文についてのユーザ音声データを録音する制御を行い、前記文中の単語が指定された場合には、当該単語についてのユーザ音声データを録音する制御を行う対象別録音制御手段と、
前記対象別録音制御手段により前記文についてのユーザ音声データが録音された場合には、当該文に対応する前記文音声データを出力し、当該文についてのユーザ音声データを出力する制御を行い、前記対象別録音制御手段により単語についてのユーザ音声データが録音された場合には、前記単語音声データを出力し、当該単語についてのユーザ音声データを出力する制御を行う対象別出力制御手段と、を備え、
前記文音声記憶手段には、
各文に対し、当該文の文音声データを含む動画データが対応付けて記憶されており、
前記対象別録音制御手段は、
前記文が前記音声学習対象として指定された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行い、
前記動画データを出力する制御が終了したことに応じて、出力内容を、前記動画データから、当該動画データが対応付けられた文を含む前記テキストへ切り替える制御を行い、
当該文を含む前記テキストを表示しながら、当該文についてのユーザ音声データを録音する制御を行う制御を行い、
前記対象別出力制御手段は、
前記対象別録音制御手段により前記文についてのユーザ音声データが録音された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声データを出力する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを特徴とする電子機器。
Word voice storage means for storing a plurality of words and word voice data;
A sentence voice storage means in which a sentence including a plurality of words and a sentence voice data of the sentence are associated and stored;
Text display control means for performing control to display text including the sentence;
Based on a user operation, a speech learning target specifying means for specifying the sentence in the text or a word in the sentence as a speech learning target;
When the sentence is designated as the speech learning target, the user voice data for the sentence is recorded, and when the word in the sentence is designated, the user voice data for the word is recorded. Recording control means for each object for performing control,
When the user voice data for the sentence is recorded by the subject recording control means, the sentence voice data corresponding to the sentence is output, the user voice data for the sentence is output, and control is performed. When the user voice data for a word is recorded by the target recording control means, the target voice output data is output, and the target output control means for performing control for outputting the user voice data for the word is provided. ,
In the sentence voice storage means,
For each sentence, video data including sentence voice data of the sentence is stored in association with each other,
The subject recording control means includes:
When the sentence is designated as the speech learning target,
As a control for outputting the sentence audio data corresponding to the sentence, a control for outputting the moving image data corresponding to the sentence is performed.
In response to the end of the control to output the moving image data, the output content is controlled from the moving image data to the text including the sentence associated with the moving image data,
While displaying the text containing the sentence, perform control to record the user voice data for the sentence,
The target output control means includes:
When the user voice data for the sentence is recorded by the subject recording control means,
As control for outputting the sentence audio data corresponding to the sentence, performing control for outputting the moving image data corresponding to the sentence,
An electronic apparatus characterized by performing control to display the text including the sentence when performing control to output user voice data for the sentence.
請求項1記載の電子機器において、
前記対象別録音制御手段は、前記文が前記音声学習対象として指定された場合には、当該文に対応する前記文音声データを出力した後に、当該文についてのユーザ音声データを録音する制御を行い、前記文中の単語が指定された場合には、当該単語に対応する単語音声データを出力した後に、当該単語についてのユーザ音声データを録音する制御とを行う、
ことを特徴とする電子機器。
The electronic device according to claim 1,
When the sentence is designated as the speech learning target, the target recording control unit performs control to record user voice data for the sentence after outputting the sentence voice data corresponding to the sentence. When a word in the sentence is designated, after outputting the word voice data corresponding to the word, control to record the user voice data for the word,
An electronic device characterized by that.
請求項1又は請求項2に記載の電子機器において、
前記文が前記音声学習対象として指定された場合に、当該文の前記文音声データを出力する制御を行う文音声出力制御手段と、
前記文が前記音声学習対象として指定された場合に、当該文の文字列に対応する合成音声データを生成して出力する制御を行う合成音声出力制御手段と、
前記テキスト表示制御手段によりテキストが表示されている状態で、第1のアイコン、第2のアイコン及び第3のアイコンをこの順に並べて表示する制御を行うアイコン表示制御手段と、
前記第1のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記文音声出力制御手段を機能させ、前記第2のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記対象別録音制御手段を機能させ、前記第3のアイコンに対してユーザ操作が行われ、かつ、前記文が前記音声学習対象として指定された場合に、前記合成音声出力制御手段を機能させる機能制御手段と、
を備えることを特徴とする電子機器。
The electronic device according to claim 1 or 2,
Sentence voice output control means for performing control to output the sentence voice data of the sentence when the sentence is designated as the voice learning target;
Synthesized speech output control means for performing control to generate and output synthesized speech data corresponding to a character string of the sentence when the sentence is designated as the speech learning target;
Icon display control means for performing control to display the first icon, the second icon, and the third icon in this order in a state where the text is displayed by the text display control means;
When a user operation is performed on the first icon and the sentence is designated as the speech learning target, the sentence voice output control unit is caused to function, and the user operation is performed on the second icon. And when the sentence is designated as the speech learning target, the recording control unit for each object is caused to function, a user operation is performed on the third icon, and the sentence is Function control means for causing the synthesized voice output control means to function when designated as a speech learning target;
An electronic device comprising:
請求項3に記載の電子機器において、
前記文音声出力制御手段は、
前記文の再生回数を設定するための回数設定アイコンを表示する制御を行う回数アイコン表示制御手段を有し、
前記回数設定アイコンによって設定された再生回数だけ、前記文音声データを再生する制御を行うことを特徴とする電子機器。
The electronic device according to claim 3,
The sentence voice output control means includes:
A number-of-times icon display control means for performing control to display a number-of-times setting icon for setting the number of times of reproduction of the sentence;
An electronic apparatus that controls to reproduce the sentence voice data for the number of times of reproduction set by the number of times setting icon.
単語と単語音声データが対応付けられて複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の文音声データとが対応付けられて複数記憶されている文音声記憶手段と、
を備えるコンピュータの音声出力録音方法であって、
前記文を含むテキストを表示させ、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定し、
前記文が前記音声学習対象として指定された場合には、当該文についてのユーザ音声データを録音する制御を行い、前記文中の単語が指定された場合には、当該単語についてのユーザ音声データを録音する制御を行い、
前記文についてのユーザ音声データが録音された場合には、当該文に対応する前記文音声データを出力し、当該文についてのユーザ音声データを出力する制御を行い、単語についてのユーザ音声が録音された場合には、当該単語に対応する前記単語音声データを出力し、当該単語についてのユーザ音声データを出力する制御を行い、
前記文音声記憶手段には、
各文に対し、当該文の文音声データを含む動画データが対応付けて記憶されており、
前記録音する制御は、
前記文が前記音声学習対象として指定された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行い、
前記動画データを出力する制御が終了したことに応じて、出力内容を、前記動画データから、当該動画データが対応付けられた文を含む前記テキストへ切り替える制御を行い、
当該文を含む前記テキストを表示しながら、当該文についてのユーザ音声データを録音する制御を行う制御を行うことを含み、
前記出力する制御は、
前記録音する制御により前記文についてのユーザ音声データが録音された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声データを出力する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを含む、ことを特徴とする音声出力録音方法。
A word voice storage means for storing a plurality of words and word voice data in association with each other;
A sentence voice storage means in which a sentence including a plurality of words and a sentence voice data of the sentence are associated and stored;
An audio output recording method for a computer comprising:
Display text containing the sentence,
Based on a user operation, the sentence in the text or a word in the sentence is designated as a speech learning target,
When the sentence is designated as the speech learning target, the user voice data for the sentence is recorded, and when the word in the sentence is designated, the user voice data for the word is recorded. Control to
When the user voice data for the sentence is recorded, the sentence voice data corresponding to the sentence is output, the user voice data for the sentence is output, and the user voice for the word is recorded. If so, control is performed to output the word voice data corresponding to the word, and output user voice data for the word,
In the sentence voice storage means,
For each sentence, video data including sentence voice data of the sentence is stored in association with each other,
The recording control is
When the sentence is designated as the speech learning target,
As a control for outputting the sentence audio data corresponding to the sentence, a control for outputting the moving image data corresponding to the sentence is performed.
In response to the end of the control to output the moving image data, the output content is controlled from the moving image data to the text including the sentence associated with the moving image data,
Including controlling to record user voice data for the sentence while displaying the text including the sentence,
The output control is
When user voice data for the sentence is recorded by the recording control,
As control for outputting the sentence audio data corresponding to the sentence, performing control for outputting the moving image data corresponding to the sentence,
A voice output recording method comprising: performing control to output user voice data for the sentence, and displaying the text including the sentence.
単語と単語音声データが複数記憶されている単語音声記憶手段と、
複数の単語を含む文と、当該文の文音声データとが対応付けられて複数記憶されている文音声記憶手段と、
を備えるコンピュータに、
前記文を含むテキストを表示する制御を行うテキスト表示制御機能と、
ユーザ操作に基づいて、前記テキスト内の前記文又は当該文中の単語を音声学習対象として指定する音声学習対象指定機能と、
前記文が前記音声学習対象として指定された場合には、当該文についてのユーザ音声データを録音する制御を行い、前記文中の単語が指定された場合には、当該単語についてのユーザ音声データを録音する制御を行う対象別録音制御機能と、
前記対象別録音制御機能により前記文についてのユーザ音声データが録音された場合には、当該文に対応する前記文音声データを出力し、当該文についてのユーザ音声データを出力する制御を行い、前記対象別録音制御機能により単語についてのユーザ音声データが録音された場合には、前記単語音声データを出力し、当該単語についてのユーザ音声データを出力する制御を行う対象別出力制御機能と、を実現させ、
前記文音声記憶手段には、
各文に対し、当該文の文音声データを含む動画データが対応付けて記憶されており、
前記対象別録音制御機能は、
前記文が前記音声学習対象として指定された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行い、
前記動画データを出力する制御が終了したことに応じて、出力内容を、前記動画データから、当該動画データが対応付けられた文を含む前記テキストへ切り替える制御を行い、
当該文を含む前記テキストを表示しながら、当該文についてのユーザ音声データを録音する制御を行う制御を行い、
前記対象別出力制御機能は、
前記対象別録音制御機能により前記文についてのユーザ音声データが録音された場合には、
当該文に対応する前記文音声データを出力する制御として、当該文に対応する前記動画データを出力する制御を行うとともに、
当該文についてのユーザ音声データを出力する制御を行うときに、当該文を含む前記テキストを表示する制御を行うことを特徴とするプログラム。
Word voice storage means for storing a plurality of words and word voice data;
A sentence voice storage means in which a sentence including a plurality of words and a sentence voice data of the sentence are associated and stored;
On a computer with
A text display control function for performing control to display text including the sentence;
A speech learning target designating function for designating the sentence in the text or a word in the sentence as a speech learning target based on a user operation;
When the sentence is designated as the speech learning target, the user voice data for the sentence is recorded, and when the word in the sentence is designated, the user voice data for the word is recorded. Recording control function for each subject that performs control,
When user voice data for the sentence is recorded by the recording control function for each subject, the sentence voice data corresponding to the sentence is output, and control for outputting user voice data for the sentence is performed, When a user voice data for a word is recorded by the target recording control function, the word voice data is output, and a target output control function for controlling to output the user voice data for the word is realized. Let
In the sentence voice storage means,
For each sentence, video data including sentence voice data of the sentence is stored in association with each other,
The target recording control function is:
When the sentence is designated as the speech learning target,
As a control for outputting the sentence audio data corresponding to the sentence, a control for outputting the moving image data corresponding to the sentence is performed.
In response to the end of the control to output the moving image data, the output content is controlled from the moving image data to the text including the sentence associated with the moving image data,
While displaying the text containing the sentence, perform control to record the user voice data for the sentence,
The target output control function is:
When user voice data about the sentence is recorded by the subject recording control function,
As control for outputting the sentence audio data corresponding to the sentence, performing control for outputting the moving image data corresponding to the sentence,
A program for performing control to display the text including the sentence when performing control to output user voice data for the sentence.
JP2018188848A 2018-10-04 2018-10-04 Electronic apparatus, speech output recording method, and program Pending JP2019040194A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018188848A JP2019040194A (en) 2018-10-04 2018-10-04 Electronic apparatus, speech output recording method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018188848A JP2019040194A (en) 2018-10-04 2018-10-04 Electronic apparatus, speech output recording method, and program

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013195214A Division JP6413216B2 (en) 2013-09-20 2013-09-20 Electronic device, audio output recording method and program

Publications (1)

Publication Number Publication Date
JP2019040194A true JP2019040194A (en) 2019-03-14

Family

ID=65726474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018188848A Pending JP2019040194A (en) 2018-10-04 2018-10-04 Electronic apparatus, speech output recording method, and program

Country Status (1)

Country Link
JP (1) JP2019040194A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251222A1 (en) * 2020-06-08 2021-12-16 ソニーグループ株式会社 Learning device, presentation device, and technique acquisition method

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337595A (en) * 2000-05-25 2001-12-07 Hideo Ando Language learning support program and constituting method for the program
CN1450446A (en) * 2002-04-09 2003-10-22 无敌科技股份有限公司 Speech learning pronunciation follow read system and method for portable electronic apparatus
JP2008175851A (en) * 2007-01-16 2008-07-31 Seiko Instruments Inc Recording time calculator, device for pronunciation practice, method of calculating recording time, processing method for pronunciation practice, its program, and electronic dictionary
KR20090075052A (en) * 2008-01-03 2009-07-08 황인도 Network english study system using multimedia file
JP2010271615A (en) * 2009-05-25 2010-12-02 Nintendo Co Ltd Program and device for evaluating pronunciation
KR20110108005A (en) * 2010-03-26 2011-10-05 주식회사 스픽케어 System and method of providing contents for learning foreign language

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001337595A (en) * 2000-05-25 2001-12-07 Hideo Ando Language learning support program and constituting method for the program
CN1450446A (en) * 2002-04-09 2003-10-22 无敌科技股份有限公司 Speech learning pronunciation follow read system and method for portable electronic apparatus
JP2008175851A (en) * 2007-01-16 2008-07-31 Seiko Instruments Inc Recording time calculator, device for pronunciation practice, method of calculating recording time, processing method for pronunciation practice, its program, and electronic dictionary
KR20090075052A (en) * 2008-01-03 2009-07-08 황인도 Network english study system using multimedia file
JP2010271615A (en) * 2009-05-25 2010-12-02 Nintendo Co Ltd Program and device for evaluating pronunciation
KR20110108005A (en) * 2010-03-26 2011-10-05 주식회사 스픽케어 System and method of providing contents for learning foreign language

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021251222A1 (en) * 2020-06-08 2021-12-16 ソニーグループ株式会社 Learning device, presentation device, and technique acquisition method

Similar Documents

Publication Publication Date Title
US8656283B2 (en) Interactive storybook system and method
Wilkinson et al. The state of research and practice in augmentative and alternative communication for children with developmental/intellectual disabilities
JP5502351B2 (en) Instruction system, instruction method, and program
JP2015026069A (en) Program for implementing display recording method for recording audio correspondingly to display contents, the display recording method and display recording device
US20130332859A1 (en) Method and user interface for creating an animated communication
JP5765593B2 (en) Movie playback device, movie playback method, movie playback program, movie playback control device, movie playback control method, and movie playback control program
US20210005097A1 (en) Language-adapted user interfaces
JP5083155B2 (en) Electronic device and program with dictionary function
KR102645880B1 (en) Method and device for providing english self-directed learning contents
JP6413216B2 (en) Electronic device, audio output recording method and program
KR20080055383A (en) Electronic lecture apparatus
JP2019040194A (en) Electronic apparatus, speech output recording method, and program
JP2018146961A (en) Voice reproduction device and voice reproduction program
JP6641680B2 (en) Audio output device, audio output program, and audio output method
JP7165517B2 (en) Learning support program, learning support device and learning support method
JP5765592B2 (en) Movie playback device, movie playback method, movie playback program, movie playback control device, movie playback control method, and movie playback control program
JP7279754B2 (en) Learning control method and learning system
JP2004325905A (en) Device and program for learning foreign language
Harnett Learning Articulate Storyline
JP2019144507A (en) Output device, data output system, and outputting method
JP4099907B2 (en) Information reproducing apparatus and method, and information providing medium
JP2005148727A (en) Learning support device
KR20160086169A (en) Method for Learning English Phonics Using User&#39;s Terminal utilizing the overlapping mode of English alphabet and Korean, and Media Being Recorded with Program Executing the Method for Learning English Phonics
JP2007219219A (en) Electronic device for language learning and creation method of sentence list for learning
KR100879667B1 (en) Method of learning language in multimedia processing apparatus

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181019

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20181019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190729

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190820

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20191017

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20200310

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20200915