Nothing Special   »   [go: up one dir, main page]

JP2002157112A - 音声情報変換装置 - Google Patents

音声情報変換装置

Info

Publication number
JP2002157112A
JP2002157112A JP2000353435A JP2000353435A JP2002157112A JP 2002157112 A JP2002157112 A JP 2002157112A JP 2000353435 A JP2000353435 A JP 2000353435A JP 2000353435 A JP2000353435 A JP 2000353435A JP 2002157112 A JP2002157112 A JP 2002157112A
Authority
JP
Japan
Prior art keywords
date
text
time
information
time information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000353435A
Other languages
English (en)
Inventor
Toshihiko Hamada
俊彦 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Teac Corp
Original Assignee
Teac Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Teac Corp filed Critical Teac Corp
Priority to JP2000353435A priority Critical patent/JP2002157112A/ja
Priority to US10/001,474 priority patent/US20020062210A1/en
Publication of JP2002157112A publication Critical patent/JP2002157112A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/11Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information not detectable on the record carrier
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/107Programmed access in sequence to addressed parts of tracks of operating record carriers of operating tapes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/34Indicating arrangements 
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/765Interface circuits between an apparatus for recording and another apparatus
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/20Disc-shaped record carriers
    • G11B2220/25Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
    • G11B2220/2508Magnetic discs
    • G11B2220/2512Floppy disks
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B2220/00Record carriers by type
    • G11B2220/90Tape-like record carriers

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)

Abstract

(57)【要約】 【課題】 音声情報又は音声情報を伴なった画像情報の
検索を容易に行うことが困難であった。 【解決手段】 音声入力を音声認識ソフトを使用してテ
キストに変換する音声テキスト変換手段2を設ける。日
時情報をテキスト形式で発生する日時情報生成手段3を
設ける。音声テキストをセグメントに分割し、各セグメ
ントに日時テキストを付加して記録する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声情報の検索を
容易に行うことができる音声情報変換装置に関する。
【0002】
【従来の技術】音声認識ソフトウエアを有するパソコン
によって、音声入力を文字データ即ちテキストデータに
変換して記録する方式は既に存在する。
【0003】
【発明が解決しようとする課題】ところで、音声情報を
テキストデータに変換して記録しても、テキストに含ま
れている情報検索を容易に行うことができない。
【0004】そこで、本発明の目的は、検索を可能にす
るための音声情報変換装置を提供することにある。
【0005】
【課題を解決するための手段】上記課題を解決し、上記
目的を達成するための本発明は、音声信号をテキストデ
ータに変換する音声テキスト変換手段と、日時情報を単
位時間或いは任意の時間間隔毎に生成する日時情報生成
手段と、前記音声テキスト変換手段によって得られたテ
キストデータのセグメントに対して前記日時情報生成手
段から得られた日時情報を付加する情報混合手段とから
成る音声情報変換装置に係わるものである。
【0006】なお、請求項2に示すように、前記情報混
合手段から出力された日時情報を伴なったテキストデー
タを記録する記録手段を有していることが望ましい。ま
た、請求項3に示すように、音声信号をテキストデータ
に変換する音声テキスト手段と、日時情報を単位時間或
いは任意の時間間隔毎に生成する日時情報生成手段と、
前記音声テキスト変換手段によって得られたテキストデ
ータを構文解析によって単語又は文節から成るセグメン
トに分離し、前記セグメントの相互間にセパレータを配
置するテキスト解析手段と、前記テキスト解析手段によ
って得られたセパレータを含むテキストデータに対し、
前記日時情報生成手段にて得られた日時情報をセパレー
タに対応するように配置する情報混合手段とを設けるこ
とが望ましい。また、請求項4に示すように、前記情報
混合手段から出力された日時情報を伴なったテキストデ
ータを記録する記録手段を有していることが望ましい。
また、請求項5に示すように、前記日時情報生成手段は
日時情報をテキスト形式の日時テキストで出力するもの
であることが望ましい。また、請求項6に示すように、
前記情報混合手段は、前記日時テキストと前記セグメン
トとの間にフィールドセパレータを配置し、前記日時テ
キストと前記セグメントと前記フィールドセパレータと
を組み合せたもの毎にレコードセパレータを配置するこ
とが望ましい。また、請求項7に示すように、前記日時
情報生成手段は、前記音声テキスト変換手段に音声信号
を入力させる時の日時情報を発生させるものであること
が望ましい。また、請求項8に示すように、音声信号が
記録済の記録媒体を再生して前記音声テキスト変換手段
に音声信号を供給する再生手段を有し、前記日時情報生
成手段は、前記記録媒体に音声信号を記録した日時を発
生するものであることが望ましい。また、請求項9に示
すように、前記日時情報生成手段は、任意の初期日時情
報を入力される初期日時情報設定手段と、前記初期日時
情報設定手段から入力された初期日時情報に、前記音声
テキスト変換手段による音声テキスト変換開始時点から
の経過時間を加算する手段とを有していることが望まし
い。
【0007】
【発明の効果】各請求項の発明によれば、音声信号に対
応するテキストデータが日時情報を伴なっているので、
テキストデータの情報に関する日時情報を容易に得るこ
とができる。また、日時情報をアドレスとしてテキスト
データを検索することが可能になる。
【0008】
【実施形態】次に、図1〜図6を参照して本発明の実施
形態を説明する。
【0009】
【第1の実施形態】図1に示す第1の実施形態の音声情
報変換装置は、マイクロホン1と、音声テキスト変換手
段2と、日時情報生成手段3と、情報混合手段4と、記
録手段5と、表示手段6とから成る。
【0010】マイクロホン1は自然言語の会話音声を電
気信号即ち音声信号に変換する周知の音声電気変換器で
ある。マイクロホン1が接続された音声テキスト変換手
段2は、音声認識ソフトウエアがインストールされたコ
ンピュータシステムから成り、音声入力を自動的に文章
入力に変換することができるものである。音声認識ソフ
トウエアは、音声辞書と単語辞書とを参照してほぼリア
ルタイムで自然言語音声をテキストデータに変換する周
知のものである。この種の音声認識方法はコンピュータ
の分野で周知であるので、詳しい説明を省略する。な
お、この説明では、音声テキスト変換手段2から得られ
たテキストデータ等を音声テキストと呼ぶことにする。
【0011】日時情報生成手段3は、現在の日時を示す
テキストデータ(以下日時テキストと呼ぶ)を秒単位で
出力するものであり、計測用データレコーダのタイムコ
ード又はパソコンに含まれている時計部のデータ等を使
用することができる。
【0012】情報混合手段4は、音声テキスト変換手段
2から供給された音声テキストと日時情報生成手段3か
ら供給された日時テキストとを単位時間毎に混合するも
のである。図2は日時テキストと音声テキストとを混合
したものを示す。日時テキストは音声信号が音声テキス
ト変換手段2に入力する日時が秒単位で配置される。即
ち、図2のAの区間に示すように2000年9月13日
15時30分00秒から2000年9月13日15時3
0分03秒のための「2000.9.13.15:3
0:00」から「2000.9.13.15:30:0
3」の日時テキストAと「東京の」「天気は」「晴天」
「です」の音声テキストのセグメントBとの間に例えば
双方向矢印で示すタブコ−ド(09H)から成るフィー
ルドセパレータCを配置し、単位時間 (1秒)毎のテ
キスト相互間にレコードセパレータDを配置する。フィ
ールドセパレータCは、自然言語音声に含まれていない
文字データが望ましく、図2の矢印、又はカンマやタブ
が望ましい。レコードセパレータDは、テキストエディ
タやワープロ等で周知の改行コード等が望ましい。な
お、単位時間の区切りで音声テキストを区切ることがで
きない時は、時間の区切りにかかった文字の前又は後で
テキストを区切る。情報混合手段4の出力はテキストス
トリームの形でEIA規格のRS−232C等のインタ
ーフェースを介して送出するのが望ましい。
【0013】記録手段5は、例えばハードディスクドラ
イブ(HDD)又はフロッピー(登録商標)ディスクド
ライブ(FDD)であり、パソコンのHDD、FDDを
使用することも可能である。情報混合手段4の出力を記
録手段5に記録する時には、パソコン通信ソフトウエア
等を使用してテキストストリームをログファイルの形で
記録媒体に記録するように形成されている。なお、音声
テキスト変換手段2、日時情報生成手段3、情報混合手
段4を1台のパソコンに内蔵させるように構成すること
ができる。
【0014】表示手段6は記録手段5に記録されたテキ
ストを例えば図2に示すように表示することができるも
のであり、記録手段5がパソコンの場合にはこのディス
プレイを使用することができる。
【0015】本実施形態に従う日時情報を含むテキスト
データは、例えばプレーンテキストファイルに記録さ
れ、そのファイルは任意のテキストエディタ、ワープ
ロ、或いはデータベースソフトウエア等で極めて容易に
記録し、編集することが可能になる。本装置はそのまま
では単に日時情報を含むテキストデータを出力するだけ
の装置であるが、音声テキストデータBが単位時間(1
秒)毎にレコードセパレータDにて区切られているた
め、汎用の検索ツール等で、対応する日時情報を容易に
参照することが可能である。検索ツールは例えばデータ
ベースソフトや、テキストエディタやワープロ等のイン
タラクティブなアプリケーションソフトウエアだけでな
く、UNIX(登録商標)系OSにて周知の“grep”、
“sed ”、“awk ”、“perl”等の非対話型テキスト
検索ツール等、テキストデータを検索する機能を持つも
のであれば何でも良い。
【0016】上述から明らかなように、本実施形態によ
れば、音声テキストに関係する日時情報を容易に得るこ
とができる。また、日時情報特定することによって音声
テキストを容易に検索することができる。
【0017】
【第2の実施形態】次に、図3及び図4に示す第4の実
施形態に従う音声情報変換装置を説明する。但し、図3
及び図4において図1及び図2と実質的に同一の部分に
は同一の符号を付してその説明を省略する。図3の音声
情報変換装置は図1の音声情報変換装置に構文解析手段
7を付加し、且つ変形された情報混合手段4aを設け、
この他は図1と同一に構成したものである。構文解析手
段7は、音声テキスト変換手段2から出力された音声テ
キストを、メモリに格納されている構文解析辞書を参照
して単語又は分節から成るセグメントに区切って出力す
る。図4に示す例では、音声テキストセグメントB′と
して「本発明は」「自然言語音声を」「文字情報に」
「変換する」「技術に」「関する」ように1つの文章が
6個の文節即ちセグメントに分解されている。構文解析
手段7は、セグメント間にセミコロン;等のワードセパ
レータ又はセグメントセパレータを付加して音声テキス
トを出力する。例えば「;本発明は;自然言語音声を;
文字情報に;変換する;技術に;関する;」を混合手段
4aに送る。
【0018】混合手段4aは、構文解析手段7から供給
された音声テキストのセグメントセパレータの箇所に一
致する日時テキストを抽出し、セグメントセパレータの
箇所に挿入する。なお、音声テキストの最初のセグメン
トの前に開始日時テキストを配置する。また、図4に示
すように、図2の場合と同様に日時テキストAと音声テ
キストセグメントB′との間にフィールドセパレータC
を配置し、音声テキストセグメントB′の後に改行コー
ドのレコードセパレータDを配置する。図4に示すテキ
ストストリームは図1の場合と同様に記録手段5に送ら
れる。
【0019】第2の実施形態では文節単位のセグメント
に日時情報を付加するので、検索が容易になる。また、
第2の実施形態によって、第1の実施形態と同様な効果
も得ることもできる。
【0020】
【第3の実施形態】図5に示す第3の実施形態は本発明
の音声情報変換装置を使用したニュース検索システムを
示す。このシステムは、VTR(ビデオテープレコー
ダ)11と、モニタ12と、音声情報変換装置13と、
パソコン14とから成る。VTR11は、既にニュース
の音声と画像とが記録されたビデオテープを再生し、音
声信号を音声情報変換装置13に送る。図5の音声情報
変換装置13は、図1に示した形式の音声情報変換装置
の他にテンキーから成る入力装置15を有する。即ち、
音声情報変換装置13は、図1の音声テキスト変換手段
2と日時情報生成手段3と混合手段4に相当するものを
有する他に、記録手段5に相当するものとしてフロッピ
ーディスク装置(FDD)5aを有し、表示手段6に相
当する液晶ディスプレイ6aを有し、更に入力装置15
を有する。なお、図5の実施形態では、日時情報形成手
段3が初期値を加算することができるように変形されて
いる。図5の音声情報変換装置13の基本構成は図1と
同一であるので、第3の実施形態の説明においても図1
を参照する。
【0021】操作者は、VTR11の音声信号をテキス
トデータに変換してFDD5aに記録するのに先立っ
て、VTR11のニュースが既にテレビ放送されたもの
である場合には、放送された日時の開始情報を初期値と
して入力装置15及びディスプレイ6aを使用して入力
させる。またVTR11のニュースがこれから放送され
るものである場合は、放送予定日時を初期値として入力
装置15で入力する。図5の実施形態では、図1の日時
情報生成手段3が、上記初期値に経過時間を加算した値
を示す日時テキストを発生するように変形されている。
ここでの経過時間とは、VTR11から音声情報変換装
置13に音声情報の供給を開始した時点からの経過を示
す時間である。VTR11を再生状態にしてニュースの
音声信号を音声情報変換装置13に送ると、上記初期値
に経過時間が加算されたものから成る日時テキストが単
位時間毎に音声テキストに付加される。図2と同様に1
秒単位で日時テキストを付加してもよいが、図6では5
秒単位で付加されている。即ち、図6はフロッピーディ
スクに記録したニュースのテキストをパソコン14で表
示した状態を示し、初期値は2000年9月13日19
時03分00秒を示す「2000.9.13.19:0
3:00」である。音声テキストのセグメントは5秒単
位で例えば「こんばんわ7時のニュースをお伝えしま
す」「先進7カ国国際会議は」のように分割され、これ
等の前に日時テキスト「2000.9.13.19:0
3:00」「2000.9.13.19:03:05」
が5秒間隔で付加されている。
【0022】パソコン14の信号処理部から成る本体部
14aはRC−232Cインターフェースを介してVT
R11に接続されている。パソコン14の本体部14a
はFDD16を含み、ここに表示装置17が接続されて
いる。また、パソコン14にはVTR11のリモコン機
能を有するソフトウエアがインストールされている。な
お、VTR11はパソコン14で指定された時間情報に
基づいて頭出し検索する機能を有している。
【0023】操作者は音声情報変換装置13でニュース
が記録されたフロッピーディスクをパソコン14のFD
D16に装着し、フロッピーディスクからテキストファ
イルを読み出し、これをVTRリモコンソフトに読み込
ませる。これにより、表示装置17のデスクトップに図
6に示すリモコンソフトの画面が得られる。この画面の
タイトルバー直下にVTR操作用の再生ボタン、停止ボ
タン等が表示され、これ等の下のウインドウに日時テキ
ストを伴なった音声テキストが表示される。VTR11
に音声情報変換したものと同一のテープを装着し、画面
上の再生ボタンをクリックすると、再生命令がパソコン
14からVTR11に送信されると共に、VTR11に
おける現在の再生時間情報がパソコン14に通知され
る。VTR11における再生時間情報とはニュースの記
録日時をセグメント毎に示す情報又は絶対時間即ち再生
経過時間である。VTR11からパソコン14に再生経
過時間が通知された時には、音声テキストに伴なってい
る日時情報の初期値にVTR11の再生経過時間を加算
してVTR11における日時情報を得る。図6の表示画
面においては、VTR11から通知された日時情報に該
当する欄の表示が別の欄と異なる色、又は点滅表示、又
は反転表示になる。例えば、VTR11から2000.
9.13.19:03:00を示す日時情報が通知され
たら、この表示又は「こんばんわ7時のニュースをお伝
えします」又はこれ等の両方が下の欄と異なる色にな
る。これによるVTR11における再生の進行状況を知
ることができる。
【0024】ニュースの特定された音声テキストセグメ
ントに対応するVTR11のテープの映像及び音声をパ
ソコン14でモニタしたい時には、パソコン14の画面
上のそのセグメントにカーソルを合せてマウスをダブル
クリックする。これにより、このセグメントの日時情報
がVTR11に送信され、VTR11はこの日時情報に
一致する記録の頭出しを実行し、両方の日時が一致した
点から再生を開始する。従って、VTRにおける頭出し
を容易且つ迅速に行うことができる。なお、VTR11
が再生経過時間又はテ−プ走行時間の情報しか有さない
場合は、パソコン14側で、特定セグメントの日時情報
から初期値を差し引いた値をVTR11に送る。例えば
「2000.9.13.19:03:05」の場合には
時間情報として「00:00:05」をVTR11に送
る。
【0025】図6には音声情報変換装置13で記録した
テキストが無編集の状態で示されているが、パソコン1
4において音声テキストを編集し、検索しやすい画面に
することができる。例えば、「こんばんわ7時のニュー
スをお伝えします」を「7時ニュース」のように編集す
る。また、テキストが放送予定のものであれば、パソコ
ン14の表示装置17の上のテキスト上で例えば原稿の
読み間違えを訂正し、これをVTRのテープの編集の参
考にすることができる。
【0026】上述のように、日時情報生成手段3に初期
値設定手段を付加し、初期値に対して記録経過時間を加
算するように構成すると、現在の日時に拘束されない日
時情報の記録が可能になり、検索に好都合になる。
【0027】
【変形例】本発明は、上述の実施形態に限定されるもの
でなく、例えば次の変形が可能なものである。 (1) 記録済の記録媒体から記録を読み出して本発明
に従う音声情報変換装置に日時情報を伴なって記録する
場合には、再生速度を標準速度のN倍にして、日時情報
生成手段の日時情報の速度をN倍にして混合することが
できる。この場合には、勿論、高速な処理装置を用意す
る。 (2) 音声テキスト変換処理の後、或いは音声テキス
ト変換処理完了後に文法チェックを行う文章校正手段を
設けることができる。これにより、正確な音声テキスト
の生成が可能になる。勿論、これは実時間処理でなくて
も良い。 (3) インターネット上に動画ファイルを複数抱えた
動画配信サーバを設け、それぞれの動画ファイルに対応
した、本発明の装置によって生成された音声テキストを
検索する機能を設けることにより、検索結果から瞬時に
目的の動画を再生させることができる。 (4) 例えばVTRに本発明の装置を組み込む際に、
日時情報の代りに、テープに記録されているタイムコー
ドそのものを記録するように構成しても良い。 (5) 例えばビデオカメラに本発明の装置を組み込
み、生成された音声テキストファイルのファイル名に当
該ビデオテ‐プに記録された映像に関連する情報(例え
ば撮影日時、撮影者名、撮影場所)を持たせ、所定の検
索エンジンに登録することにより、膨大なビデオライブ
ラリから瞬時に目的の撮影記録を検索することが可能に
なる。
【図面の簡単な説明】
【図1】第1の実施形態に従う音声情報変換装置を示す
ブロック図である。
【図2】第1の実施形態に従う日時テキストと音声テキ
ストとの混合を示す図である。
【図3】第2の実施形態の音声情報変換装置を示すブロ
ック図である。
【図4】第2の実施形態に従う日時テキストと音声テキ
ストとの混合を示す図である。
【図5】第3の実施形態の本発明に従う音声情報変換装
置を使用したニュース検索システムを示すブロック図で
ある。
【図6】図5のパソコンの表示装置における表示を示す
図である。
【符号の説明】
1 マイクロホン 2 音声テキスト変換手段 3 日時情報生成手段 4 混合手段 5 記録装置 6 表示装置 7 構文解析手段
フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) G06F 17/30 230 G06F 17/30 230Z G10L 15/00 G10L 3/00 551G 15/28 551P 15/22 561C

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 音声信号をテキストデータに変換する音
    声テキスト変換手段と、 日時情報を単位時間或いは任意の時間間隔毎に生成する
    日時情報生成手段と、 前記音声テキスト変換手段によって得られたテキストデ
    ータのセグメントに対して前記日時情報生成手段から得
    られた日時情報を付加する情報混合手段とから成る音声
    情報変換装置。
  2. 【請求項2】 更に、前記情報混合手段から出力された
    日時情報を伴なったテキストデータを記録する記録手段
    を有していることを特徴とする請求項1記載の音声情報
    変換装置。
  3. 【請求項3】 音声信号をテキストデータに変換する音
    声テキスト手段と、 日時情報を単位時間或いは任意の時間間隔毎に生成する
    日時情報生成手段と、 前記音声テキスト変換手段によって得られたテキストデ
    ータを構文解析によって単語又は文節から成るセグメン
    トに分離し、前記セグメントの相互間にセパレータを配
    置するテキスト解析手段と、 前記テキスト解析手段によって得られたセパレータを含
    むテキストデータに対し、前記日時情報生成手段にて得
    られた日時情報をセパレータに対応するように配置する
    情報混合手段とから成る音声情報変換装置。
  4. 【請求項4】 更に、前記情報混合手段から出力された
    日時情報を伴なったテキストデータを記録する記録手段
    を有していることを特徴とする請求項3記載の音声情報
    変換装置。
  5. 【請求項5】 前記日時情報生成手段は日時情報をテキ
    スト形式の日時テキストで出力するものである請求項1
    乃至4のいずれかに記載の音声情報変換装置。
  6. 【請求項6】 前記情報混合手段は、前記日時テキスト
    と前記セグメントとの間にフィールドセパレータを配置
    し、前記日時テキストと前記セグメントと前記フィール
    ドセパレータとを組み合せたもの毎にレコードセパレー
    タを配置することを特徴とする請求項1乃至5のいずれ
    かに記載の音声情報変換装置。
  7. 【請求項7】 前記日時情報生成手段は、前記音声テキ
    スト変換手段に音声信号を入力させる時の日時情報を発
    生させるものである請求項1乃至6のいずれかに記載の
    音声情報変換装置。
  8. 【請求項8】 更に、音声信号が記録済の記録媒体を再
    生して前記音声テキスト変換手段に音声信号を供給する
    再生手段を有し、 前記日時情報生成手段は、前記記録媒体に音声信号を記
    録した日時を発生するものである請求項1乃至6のいず
    れかに記載の音声情報変換装置。
  9. 【請求項9】 前記日時情報生成手段は、任意の初期日
    時情報を入力される初期日時情報設定手段と、 前記初期日時情報設定手段から入力された初期日時情報
    に、前記音声テキスト変換手段による音声テキスト変換
    開始時点からの経過時間を加算する手段とを有している
    ことを特徴とする請求項1乃至8のいずれかに記載の音
    声情報変換装置。
JP2000353435A 2000-11-20 2000-11-20 音声情報変換装置 Pending JP2002157112A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000353435A JP2002157112A (ja) 2000-11-20 2000-11-20 音声情報変換装置
US10/001,474 US20020062210A1 (en) 2000-11-20 2001-11-01 Voice input system for indexed storage of speech

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000353435A JP2002157112A (ja) 2000-11-20 2000-11-20 音声情報変換装置

Publications (1)

Publication Number Publication Date
JP2002157112A true JP2002157112A (ja) 2002-05-31

Family

ID=18826201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000353435A Pending JP2002157112A (ja) 2000-11-20 2000-11-20 音声情報変換装置

Country Status (2)

Country Link
US (1) US20020062210A1 (ja)
JP (1) JP2002157112A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044669A1 (fr) * 2006-10-10 2008-04-17 Toshifumi Okuhara Programme de recherche d'informations audio et son support d'enregistrement, système de recherche d'informations audio, et procédé de recherche d'informations audio
JP6382423B1 (ja) * 2017-10-05 2018-08-29 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3658651B2 (ja) * 2000-11-30 2005-06-08 アークレイ株式会社 コメント入力機能付測定装置
US20050228665A1 (en) * 2002-06-24 2005-10-13 Matsushita Electric Indusrial Co, Ltd. Metadata preparing device, preparing method therefor and retrieving device
JP4378284B2 (ja) * 2002-09-27 2009-12-02 インターナショナル・ビジネス・マシーンズ・コーポレーション ワールド・ワイド・ウェブからの情報を使用してライブ・スピーチの機能を拡張するためのシステムおよび方法
US7668721B2 (en) * 2006-05-22 2010-02-23 Microsoft Corporation Indexing and strong verbal content
ES2386673T3 (es) * 2008-07-03 2012-08-24 Mobiter Dicta Oy Procedimiento y dispositivo de conversión de voz
TW201417093A (zh) * 2012-10-19 2014-05-01 Hon Hai Prec Ind Co Ltd 具有影音檔處理功能的電子裝置及影音檔處理方法
KR102172149B1 (ko) * 2013-12-03 2020-11-02 주식회사 케이티 컨텐츠 재생 방법, 대사 구간 데이터 제공 방법 및 동영상 컨텐츠 재생 단말
CN105389350B (zh) * 2015-10-28 2019-02-15 浪潮(北京)电子信息产业有限公司 一种分布式文件系统元数据信息获取方法
CN109215661A (zh) * 2018-08-30 2019-01-15 上海与德通讯技术有限公司 语音转文字方法、装置设备及存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07182365A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd マルチメディア会議録作成支援装置および方法
JPH07191690A (ja) * 1993-12-24 1995-07-28 Canon Inc 議事録作成装置及び多地点議事録作成システム
JP2000112931A (ja) * 1998-10-08 2000-04-21 Toshiba Corp インテリジェント会議サポートシステム

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5600756A (en) * 1994-05-11 1997-02-04 Sony Corporation Method of labelling takes in an audio editing system
US5835667A (en) * 1994-10-14 1998-11-10 Carnegie Mellon University Method and apparatus for creating a searchable digital video library and a system and method of using such a library
JPH0990973A (ja) * 1995-09-22 1997-04-04 Nikon Corp 音声処理装置
US5960447A (en) * 1995-11-13 1999-09-28 Holt; Douglas Word tagging and editing system for speech recognition
US5794249A (en) * 1995-12-21 1998-08-11 Hewlett-Packard Company Audio/video retrieval system that uses keyword indexing of digital recordings to display a list of the recorded text files, keywords and time stamps associated with the system
DE19740119A1 (de) * 1997-09-12 1999-03-18 Philips Patentverwaltung System zum Schneiden digitaler Video- und Audioinformationen
US6151576A (en) * 1998-08-11 2000-11-21 Adobe Systems Incorporated Mixing digitized speech and text using reliability indices

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07182365A (ja) * 1993-12-24 1995-07-21 Hitachi Ltd マルチメディア会議録作成支援装置および方法
JPH07191690A (ja) * 1993-12-24 1995-07-28 Canon Inc 議事録作成装置及び多地点議事録作成システム
JP2000112931A (ja) * 1998-10-08 2000-04-21 Toshiba Corp インテリジェント会議サポートシステム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008044669A1 (fr) * 2006-10-10 2008-04-17 Toshifumi Okuhara Programme de recherche d'informations audio et son support d'enregistrement, système de recherche d'informations audio, et procédé de recherche d'informations audio
JP6382423B1 (ja) * 2017-10-05 2018-08-29 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム
JP2019066785A (ja) * 2017-10-05 2019-04-25 株式会社リクルートホールディングス 情報処理装置、画面出力方法及びプログラム

Also Published As

Publication number Publication date
US20020062210A1 (en) 2002-05-23

Similar Documents

Publication Publication Date Title
Rubin et al. Content-based tools for editing audio stories
US10034028B2 (en) Caption and/or metadata synchronization for replay of previously or simultaneously recorded live programs
KR100828884B1 (ko) 데이터베이스 주석 및 검색
US8966360B2 (en) Transcript editor
EP0786114B1 (en) Method and apparatus for creating a searchable digital video library
US6148304A (en) Navigating multimedia content using a graphical user interface with multiple display regions
US7739116B2 (en) Subtitle generation and retrieval combining document with speech recognition
Van Thong et al. Speechbot: an experimental speech-based search engine for multimedia content on the web
US20080027726A1 (en) Text to audio mapping, and animation of the text
US20100299131A1 (en) Transcript alignment
JP6280312B2 (ja) 議事録記録装置、議事録記録方法及びプログラム
JP2003517738A (ja) 同期した音声とビデオをキャプチャし著し再生するために音声認識およびせりふを使用する装置および方法
JPH1021261A (ja) マルチメディアデータベース検索方法及びシステム
CN110781328A (zh) 基于语音识别的视频生成方法、系统、装置和存储介质
JP2008537856A (ja) ビデオ編集方法およびその装置
JP2009522845A (ja) サーチ可能なマルチメディア・ストリーム
US20230281248A1 (en) Structured Video Documents
JP2002157112A (ja) 音声情報変換装置
KR20060100646A (ko) 영상물의 특정 위치를 검색하는 방법 및 영상 검색 시스템
WO2021167238A1 (ko) 내용 기반 동영상 목차 자동생성 방법 및 시스템
JP2008217447A (ja) コンテンツ生成装置及びコンテンツ生成プログラム
JP4865469B2 (ja) コンテンツ制作サーバ、コンテンツ提示装置、コンテンツ制作プログラム、及びコンテンツ提示プログラム
JP2002312370A (ja) マルチメディアデータ検索装置、マルチメディアデータ検索方法およびマルチメディアデータ検索プログラム
KR101783872B1 (ko) 동영상 검색 시스템 및 방법
US7353175B2 (en) Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041207

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060104