Nothing Special   »   [go: up one dir, main page]

JP2011511499A - 画像を再生するための方法及び装置 - Google Patents

画像を再生するための方法及び装置 Download PDF

Info

Publication number
JP2011511499A
JP2011511499A JP2010538982A JP2010538982A JP2011511499A JP 2011511499 A JP2011511499 A JP 2011511499A JP 2010538982 A JP2010538982 A JP 2010538982A JP 2010538982 A JP2010538982 A JP 2010538982A JP 2011511499 A JP2011511499 A JP 2011511499A
Authority
JP
Japan
Prior art keywords
image
electronic device
voice message
audio
playback time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010538982A
Other languages
English (en)
Other versions
JP5765940B2 (ja
Inventor
シェン ジン
シン チェン
ヤン ペン
ニンジャン チェン
ユンジ シャ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2011511499A publication Critical patent/JP2011511499A/ja
Application granted granted Critical
Publication of JP5765940B2 publication Critical patent/JP5765940B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/26Speech to text systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/435Filtering based on additional data, e.g. user or group profiles
    • G06F16/436Filtering based on additional data, e.g. user or group profiles using biological or physiological data of a human being, e.g. blood pressure, facial expression, gestures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/40Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
    • G06F16/43Querying
    • G06F16/438Presentation of query results
    • G06F16/4387Presentation of query results by the use of playlists
    • G06F16/4393Multimedia presentations, e.g. slide shows, multimedia albums
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/19Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier
    • G11B27/28Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording
    • G11B27/32Indexing; Addressing; Timing or synchronising; Measuring tape travel by using information detectable on the record carrier by using information signals recorded by the same method as the main recording on separate auxiliary tracks of the same or an auxiliary record carrier
    • G11B27/327Table of contents
    • G11B27/329Table of contents on a disc [VTOC]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Biophysics (AREA)
  • Physiology (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Television Signal Processing For Recording (AREA)
  • Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)

Abstract

画像を再生する方法は、音声メッセージを受信するステップ11と、前記音声メッセージから重要な特徴を抽出するステップ12と、前記重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップ13と、選択された前記画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成するステップ14と、前記画像音声シーケンスを再生するステップ15とを有する。また、本発明は、本発明の方法の異なるステップを実行するための処理ユニットを有する電子装置を提供する。

Description

本発明は、画像を再生するための方法及び装置に関する。
例えば、PDA(携帯情報端末)、携帯電話、TV(テレビ)、PC(パーソナルコンピュータ)、デジタルフォトフレーム等の電子装置が画像を再生するためにますます用いられる。画像を再生するために用いられる電子装置は、写真を格納、管理及び共有することができる。これらは、内蔵ディスプレイスクリーン上で、これらの内部メモリ又は外部メモリカードに格納されるデジタル画像のスライドショーも再生することができる。画像は、写真、画像、グラフィックス等である。
格納されたデジタル画像のスライドショーを最新の電子装置上で非常に簡単に再生することが可能である。しかしながら、ユーザは、ユーザと電子装置との間の双方向性を増大させるためにスライドショーに付随するより多くの機能を要求するかもしれない。電子装置とユーザとの間の双方向性を向上させるために、音声記録により格納媒体を介して画像を分類するためのデバイスである既知の電子装置が、特開2000−58205号公報に開示されている。このデバイスは、予め格納された音声データ及び画像データと、画像データに付随する音声データを認識するための認識手段と、認識手段により認識された予め格納された音声データに基づいて画像データを分類するための分類手段と、予め格納された音声データに類似する入力音声データにより画像又は画像カテゴリを検索するための検索手段とを有する。
しかしながら、既知の電子装置は、予め規定された及び固定された音声に基づいてユーザとインタラクトするだけであり、これは、ユーザインタフェースを非知能的及び非ユーザフレンドリなものにし、ユーザと電子装置との間の双方向性を十分に向上させていない。
本発明の目的は、画像を再生するための改良された方法及び装置を提供することである。
画像を再生する方法は、音声メッセージを受信するステップと、前記音声メッセージからの重要な特徴を抽出するステップと、前記重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップと、選択された前記画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成するステップと、前記画像音声シーケンスを再生するステップとを有する。
また、本発明は、本発明の方法の異なるステップを実行するための処理ユニットを有する電子装置を提供する。
この方法及び装置において、ユーザによりランダムに入力された音声メッセージと前記音声メッセージに関連する対応する画像とが、画像音声再生シーケンスに統合され、これは、ユーザと電子装置との間の双方向性を向上させる。
本発明の画像を再生するための方法及び装置のこれら及び他の態様は、添付図面を参照して後述された実装及び実施形態から明らかになりこれらに関して説明されるだろう。
本発明の一実施形態の方法のフローチャートである。 本発明の一実施形態の装置を示す概略的な図である。
同一の参照符号は図中の同様のパーツを示すために用いられる。
図1は本発明の一実施形態の方法のフローチャートである。
画像を再生する方法は以下のステップを有する。
音声メッセージを受信するステップ11。音声メッセージは、ユーザ、又は、PDA(携帯情報端末)、携帯電話、TV(テレビ)、PC(パーソナルコンピュータ)、デジタルフォトフレーム等の第2の電子装置から受信される。音声メッセージの内容は、ユーザによりランダムに決定され得る。音声メッセージは、単語、文、音楽等から成り得る。受信するステップ11は、音声メッセージを記録し、これを第1の電子装置のメモリに格納することを意図している。例えば、息子が学校から帰宅したときに、彼は、第1の電子装置を介して彼の母に対して、"私はバスケットボールをしに行って午後7時に帰る"等の音声メッセージを残したいかもしれない。また、第1の電子装置は、PDA(携帯情報端末)、携帯電話、TV(テレビ)、PC(パーソナルコンピュータ)、デジタルフォトフレーム等である。
音声メッセージから重要な特徴(key feature)を抽出するステップ12。抽出するステップ12は、キーワード、ユーザ識別子、及び/又は、対応するイントネーションのような重要な特徴を抽出するために単語単位で音声メッセージの内容を解析することを意図している。イントネーションは、"楽しい"、"悲しい"、"中間"のような異なるカテゴリで予め分類され、第1の電子装置のメモリに格納され得る。例えば、キーワードは"バスケットボール"であり、イントネーションは"楽しい"であり、ユーザ識別子は"息子"である。抽出するステップ12は、音声メッセージの再生時間を計算することを更に意図しており、例えば、計算後、音声メッセージを再生する期間は1分である。
重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップ13。予め格納された画像情報は、第1の電子装置のメモリに格納される。予め格納された画像情報は、画像名、画像内容の簡単な説明等を含み得る。例えば、"バスケットボール"、"楽しい"及び"息子"に関連する画像は、これらが音声メッセージの重要な特徴とマッチするので選択される。マッチングの重み付けは、選択された画像が例えば4つのレベルに分類されるように、メモリ内に予め規定され得る。マッチングの重み付けは、第1のレベルに対して100であり、これは、第1のレベルに含まれる選択された画像が音声メッセージに非常に関連することを意味し、前記重み付けは、第2のレベルに対して60であり、第3のレベルに対して20であり、第4のレベルに対して0である。レベル1の画像は、再生されるべき最も高い優先度をもち、レベル2,3,4の順に続く。
選択された画像及び音声メッセージを統合することにより画像音声シーケンスを生成するステップ14。生成するステップ14は、音声メッセージの重要な特徴、音声メッセージの期間、及び、予め格納された画像情報に従って画像音声シーケンスを生成することを意図している。生成するステップ14は、画像音声シーケンスの再生時間、選択された画像の再生順序、及び、各選択画像の再生時間を決定することを更に意図している。画像音声シーケンスの再生時間は、音声メッセージの期間に等しい。選択された画像の再生順序は、マッチングの重み付けに従って決定され得る。例えば、マッチングの重み付けが高い場合には、対応する選択画像はより早い時点で再生され得、マッチングの重み付けが低い場合には、対応する選択画像はより遅い時点で再生され得る。各選択画像の再生時間は、そのマッチングの重み付けに従って決定されてもよい。例えば、マッチングの重み付けが高い場合には、対応する画像はより長い時間で再生され得、マッチングの重み付けが低い場合には、対応する画像はより短い時間で再生され得る。勿論、再生される各選択画像は、同一の再生時間の長さをもってもよい。音声メッセージが1分の再生時間をもつ場合には、画像音声シーケンスの再生時間も1分であってもよい。従って、例えば6つの画像が選択されて各選択画像が同一の再生時間の長さで再生されるべきである場合には、各選択画像は、10秒の再生時間をもつだろう。
画像音声シーケンスを再生するステップ15。再生するステップ15は、3つの状況を有する。第1の状況は、この画像音声シーケンスを生成した直後に画像音声シーケンスを再生する。第2の状況は、再生が中断されるまで画像音声シーケンスを循環的に再生する。第3の状況は、ユーザの命令に従って画像音声シーケンスを再生する。第3の状況において、ユーザは、画像音声シーケンスのためのリマインディングフラッシュライト(例えばLED)又は電子装置上で示される他の警告に気付くときに、画像音声シーケンスを再生するように第1の電子装置に指示する。ユーザが画像音声シーケンスを再生するために命令を与える前に、画像音声シーケンスは、第1の電子装置のメモリに格納され得る。例えば、母が帰宅したときに、彼女は、フォトフレームのような電子装置のフラッシュライトに気付き、これは、彼女に家族の誰かが音声メッセージを残したことを気付かせ、そして、彼女は、画像音声シーケンスを閲覧するようにフォトフレーム上のボタンを押すことができる。前述した3つの状況の全てにおいて、画像音声シーケンスは、このシーケンスが再生された後にメモリに自動的に格納され得る。1つよりも多い画像シーケンスが生成される場合には、再生するステップ15は、各画像音声シーケンスの生成時間に従って或る順番で画像音声シーケンスを再生することを意図し得る。
図2は、本発明の一実施形態の装置を示す概略的な図である。電子装置20は、PDA(携帯情報端末)、携帯電話、TV(テレビ)、PC(パーソナルコンピュータ)、デジタルフォトフレーム等である。
画像を再生するための電子装置20は以下のユニットを有する。
音声メッセージを受信する受信ユニット21。音声メッセージは、ユーザ、又は、PDA(携帯情報端末)、携帯電話、TV(テレビ)、PC(パーソナルコンピュータ)、デジタルフォトフレーム等の他の電子装置から受信される。音声メッセージの内容は、ユーザによりランダムに決定され得る。音声メッセージは、単語、文、音楽等から成り得る。受信ユニット21は、音声メッセージを記録し、これを第1の電子装置のメモリに格納するために用いられる。受信ユニット21は、無線ユニット、レコーダ等である。
音声メッセージから重要な特徴を抽出する抽出ユニット22。抽出ユニット22は、キーワード、ユーザ識別子、及び、対応するイントネーションのような重要な特徴を抽出するために単語単位で音声メッセージの内容を解析するために用いられる。イントネーションは、"楽しい"、"悲しい"、"中間"のような異なるカテゴリで予め分類され、予め分類されたイントネーション基準は電子装置20のメモリに格納され得る。抽出ユニット22は、音声メッセージの再生時間を計算するために更に用いられる。
重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択する選択ユニット23。予め格納された画像情報は、電子装置20のメモリに格納される。画像情報は、画像名、画像内容の簡単な説明等を含み得る。マッチングの重み付けは、選択された画像が例えば4つのレベルに分類されるように、メモリ内に予め規定され得る。マッチングの重み付けは、第1のレベルに対して100であり、これは、第1のレベルに含まれる選択された画像が音声メッセージに非常に関連することを意味し、前記重み付けは、第2のレベルに対して60であり、第3のレベルに対して20であり、第4のレベルに対して0である。レベル1の画像は、再生されるべき最も高い優先度をもち、レベル2,3,4の順に続く。
選択された画像及び音声メッセージを統合することにより画像音声シーケンスを生成する生成ユニット24。生成ユニット24は、音声メッセージの重要な特徴、音声メッセージの期間、及び、予め格納された画像情報に従って画像音声シーケンスを生成するために用いられる。生成ユニット24は、画像音声シーケンスの再生時間、選択された画像の再生順序、及び、各選択画像の再生時間を決定するために更に用いられる。画像音声シーケンスの再生時間は、音声メッセージの期間に等しい。選択された画像の再生順序は、マッチングの重み付けに従って生成ユニット24により決定され得る。各選択画像の再生時間は、マッチングの重み付けに従って生成ユニット24により決定されてもよい。勿論、再生される各選択画像は、同一の再生時間の長さをもってもよい。
画像音声シーケンスを再生する再生ユニット25。再生ユニット25は、以下の3つの状況において画像音声シーケンスを再生するために用いられる。第1の状況は、この画像音声シーケンスを生成した直後に画像音声シーケンスを再生する。第2の状況は、再生が中断されるまで画像音声シーケンスを循環的に再生する。第3の状況は、ユーザの命令に従って画像音声シーケンスを再生する。第3の状況において、ユーザは、画像音声シーケンスのためのリマインディングフラッシュライト(例えばLED)又は電子装置上で示される他の警告に気付くときに、画像音声シーケンスを再生するように第1の電子装置に指示する。ユーザが画像音声シーケンスを再生するために命令を与える前に、画像音声シーケンスは、メモリに格納され得る。前述した3つの状況の全てにおいて、画像音声シーケンスは、このシーケンスが再生された後にメモリに自動的に格納され得る。1つよりも多い画像シーケンスが生成される場合には、再生ユニット25は、各画像音声シーケンスの生成時間に従って或る順番で画像音声シーケンスを再生するために用いられ得る。
電子装置20の構成要素は、少なくとも1つのCPUによりサポートされている。
前述した実施形態は本発明を限定するよりはむしろ例示であり、当業者は特許請求の範囲から逸脱することなく多くの代替実施形態を設計可能であることが留意されるべきである。特許請求の範囲において、括弧内の如何なる参照符号も特許請求の範囲を限定するものとして考慮されるべきではない。"有する"という用語の使用及びその活用は、特許請求の範囲に記載されたもの以外の要素又はステップの存在を除外するものではない。要素の単数表記の使用は、斯様な要素の複数の存在を除外するものではない。本発明は、幾つかの別個の要素を有するハードウェアにより、及び、適切にプログラムされたコンピュータにより、実行され得る。幾つかの手段を列挙する装置に係る請求項において、これらの手段の幾つかは、同一アイテムのハードウェアにより具現されてもよい。第1、第2及び第3等の用語の使用は、いずれかの順番を示すものではない。これらの用語は名前として解釈されるべきである。

Claims (22)

  1. 画像を再生する方法であって、
    音声メッセージを受信するステップと、
    前記音声メッセージから重要な特徴を抽出するステップと、
    前記重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択するステップと、
    選択された前記画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成するステップと、
    前記画像音声シーケンスを再生するステップとを有する、方法。
  2. 前記抽出するステップは、前記重要な特徴を抽出するために単語単位で前記音声メッセージの内容を解析する、請求項1に記載の方法。
  3. 前記重要な特徴は、キーワード、ユーザ識別子、及び/又は、対応するイントネーションである、請求項1に記載の方法。
  4. 前記抽出するステップは、前記音声メッセージの再生時間を計算する、請求項1に記載の方法。
  5. 前記予め格納された画像情報は、画像名、及び、前記画像の内容の簡単な説明を有する、請求項4に記載の方法。
  6. 前記生成するステップは、前記音声メッセージの前記重要な特徴、前記音声メッセージの期間、及び、前記予め格納された画像情報に従って画像音声シーケンスを生成する、請求項5に記載の方法。
  7. 前記生成するステップは、前記画像音声シーケンスの再生時間、前記選択された画像の再生順序、及び、各選択画像の再生時間を決定する、請求項1に記載の方法。
  8. 前記画像音声シーケンスの再生時間は、前記音声メッセージの期間に等しい、請求項7に記載の方法。
  9. 前記選択された画像の再生順序は、予め規定されたマッチングの重み付けに従って決定される、請求項7に記載の方法。
  10. 各選択画像の再生時間は、予め規定されたマッチングの重み付けに従って決定される、請求項7に記載の方法。
  11. 再生される各選択画像は、同一の再生時間の長さをもつ、請求項1に記載の方法。
  12. 画像を再生するための電子装置であって、
    音声メッセージを受信する受信ユニットと、
    前記音声メッセージから重要な特徴を抽出する抽出ユニットと、
    前記重要な特徴を予め格納された画像情報とマッチングすることにより画像を選択する選択ユニットと、
    選択された前記画像及び前記音声メッセージを統合することにより画像音声シーケンスを生成する生成ユニットと、
    前記画像音声シーケンスを再生する再生ユニットとを有する、電子装置。
  13. 前記抽出ユニットは、前記重要な特徴を抽出するために単語単位で前記音声メッセージの内容を解析するために用いられる、請求項12に記載の電子装置。
  14. 前記重要な特徴は、キーワード、ユーザ識別子、及び/又は、対応するイントネーションである、請求項12に記載の電子装置。
  15. 前記抽出ユニットは、前記音声メッセージの再生時間を計算するために用いられる、請求項12に記載の電子装置。
  16. 前記予め格納された画像情報は、画像名、及び、前記画像の内容の簡単な説明を有する、請求項15に記載の電子装置。
  17. 前記生成ユニットは、前記音声メッセージの前記重要な特徴、前記音声メッセージの期間、及び、前記予め格納された画像情報に従って画像音声シーケンスを生成するために用いられる、請求項16に記載の電子装置。
  18. 前記生成ユニットは、前記画像音声シーケンスの再生時間、前記選択された画像の再生順序、及び、各選択画像の再生時間を決定するために更に用いられる、請求項12に記載の電子装置。
  19. 前記画像音声シーケンスの再生時間は、前記音声メッセージの期間に等しい、請求項18に記載の電子装置。
  20. 前記生成ユニットは、予め規定されたマッチングの重み付けに従って、前記選択された画像の再生順を序決定するために用いられる、請求項18に記載の電子装置。
  21. 前記生成ユニットは、予め規定されたマッチングの重み付けに従って、各選択画像の再生時間を決定するために用いられる、請求項18に記載の電子装置。
  22. 再生される各選択画像は、同一の再生時間の長さをもつ、請求項12に記載の電子装置。
JP2010538982A 2007-12-21 2008-12-11 画像を再生するための方法及び装置 Expired - Fee Related JP5765940B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200710162187.5 2007-12-21
CN200710162187 2007-12-21
PCT/IB2008/055219 WO2009083845A2 (en) 2007-12-21 2008-12-11 Method and apparatus for playing pictures

Publications (2)

Publication Number Publication Date
JP2011511499A true JP2011511499A (ja) 2011-04-07
JP5765940B2 JP5765940B2 (ja) 2015-08-19

Family

ID=40578247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010538982A Expired - Fee Related JP5765940B2 (ja) 2007-12-21 2008-12-11 画像を再生するための方法及び装置

Country Status (6)

Country Link
US (1) US8438034B2 (ja)
EP (1) EP2225758A2 (ja)
JP (1) JP5765940B2 (ja)
KR (1) KR101513847B1 (ja)
CN (1) CN101971262A (ja)
WO (1) WO2009083845A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019174783A (ja) * 2018-03-26 2019-10-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像とオーディオの同期再生の処理方法及びデバイス

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8909531B2 (en) * 2009-10-02 2014-12-09 Mediatek Inc. Methods and devices for displaying multimedia data emulating emotions based on image shuttering speed
TWI509506B (zh) * 2010-04-02 2015-11-21 Transcend Information Inc 影像顯示裝置及其方法
US20110307255A1 (en) * 2010-06-10 2011-12-15 Logoscope LLC System and Method for Conversion of Speech to Displayed Media Data
JP2012075039A (ja) * 2010-09-29 2012-04-12 Sony Corp 制御装置、および制御方法
CN102055845A (zh) * 2010-11-30 2011-05-11 深圳市五巨科技有限公司 移动通信终端及其音乐播放器图片切换方法
CN103188366B (zh) * 2011-12-30 2015-11-11 中国移动通信集团福建有限公司 一种短信处理方法及装置
CN104022942B (zh) * 2014-06-26 2018-09-11 北京奇虎科技有限公司 处理交互式消息的方法、客户端、电子设备及系统
CN104409087B (zh) * 2014-11-18 2017-06-16 广东欧珀移动通信有限公司 歌曲文件播放方法和系统
CN104821109A (zh) * 2015-05-26 2015-08-05 北京云江科技有限公司 一种基于图像和语音信息的在线答疑系统
CN105208439B (zh) * 2015-09-11 2018-09-04 深圳Tcl数字技术有限公司 音频文件播放方法及装置
CN106060394B (zh) * 2016-06-28 2019-08-02 Oppo广东移动通信有限公司 一种拍照方法、装置和终端设备
KR101966803B1 (ko) 2017-01-20 2019-04-08 동우 화인켐 주식회사 착색 감광성 수지 조성물, 이를 사용하여 제조된 블랙 매트릭스, 컬럼 스페이서 또는 블랙 컬럼 스페이서를 포함하는 컬러필터, 및 상기 컬러필터를 포함하는 표시장치
CN107547748A (zh) * 2017-09-07 2018-01-05 深圳市金立通信设备有限公司 一种图片管理方法、终端及计算机可读存储介质
WO2019114582A1 (zh) * 2017-12-15 2019-06-20 广州市百果园信息技术有限公司 视频图像处理方法及计算机存储介质、终端
CN111399794B (zh) * 2019-01-02 2024-03-22 中国移动通信有限公司研究院 一种语音播放方法、装置及终端设备
CN111724795A (zh) * 2020-06-17 2020-09-29 海尔优家智能科技(北京)有限公司 一种相册播放方法及装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863176A (ja) * 1994-08-19 1996-03-08 Pfu Ltd 音楽映像データ再生装置
JPH09288681A (ja) * 1996-04-23 1997-11-04 Toshiba Corp 背景映像検索表示装置および背景映像検索方法
JP2005049773A (ja) * 2003-07-31 2005-02-24 Denso Corp 音楽再生装置
JP2006092430A (ja) * 2004-09-27 2006-04-06 Denso Corp 音楽再生装置
JP2006244002A (ja) * 2005-03-02 2006-09-14 Sony Corp コンテンツ再生装置およびコンテンツ再生方法
JP2007174503A (ja) * 2005-12-26 2007-07-05 Fujifilm Corp 音楽画像再生装置及び音楽画像情報管理方法
JP2007174026A (ja) * 2005-12-20 2007-07-05 Sony Corp 画像収集システム、電子機器および画像送信方法、プログラム、並びに記録媒体
US7248857B1 (en) * 2004-02-27 2007-07-24 Cingular Wireless Ii, Llc System and method for enhanced message notification
JP2007281618A (ja) * 2006-04-03 2007-10-25 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956682A (en) 1991-06-06 1999-09-21 Lj Laboratories, Llc Picture frame with associated audio messages and position sensitive or speech recognition device
US5734794A (en) * 1995-06-22 1998-03-31 White; Tom H. Method and system for voice-activated cell animation
US5651055A (en) 1995-06-29 1997-07-22 Lucent Technologies Inc. Digital secretary
SE519244C2 (sv) * 1995-12-06 2003-02-04 Telia Ab Anordning och metod vid talsyntes
US6084582A (en) * 1997-07-02 2000-07-04 Microsoft Corporation Method and apparatus for recording a voice narration to accompany a slide show
US6721001B1 (en) * 1998-12-16 2004-04-13 International Business Machines Corporation Digital camera with voice recognition annotation
JP2000358205A (ja) 1999-06-17 2000-12-26 Fuji Photo Film Co Ltd 音声認識による画像分類装置、方法及び記憶媒体
US6499016B1 (en) * 2000-02-28 2002-12-24 Flashpoint Technology, Inc. Automatically storing and presenting digital images using a speech-based command language
JP2002082684A (ja) * 2000-09-07 2002-03-22 Sony Corp プレゼンテーションシステム及びプレゼンテーションデータ生成方法、並びに記録媒体
US20020099552A1 (en) * 2001-01-25 2002-07-25 Darryl Rubin Annotating electronic information with audio clips
JP2003219327A (ja) * 2001-09-28 2003-07-31 Canon Inc 画像管理装置、画像管理方法、制御プログラム、情報処理システム、画像データ管理方法、アダプタ、及びサーバ
GB2383247A (en) 2001-12-13 2003-06-18 Hewlett Packard Co Multi-modal picture allowing verbal interaction between a user and the picture
TW565811B (en) * 2001-12-31 2003-12-11 Ji-Ching Jou Computer digital teaching method
JP4224250B2 (ja) * 2002-04-17 2009-02-12 パイオニア株式会社 音声認識装置、音声認識方法および音声認識プログラム
US7133535B2 (en) * 2002-12-21 2006-11-07 Microsoft Corp. System and method for real time lip synchronization
US7711560B2 (en) * 2003-02-19 2010-05-04 Panasonic Corporation Speech recognition device and speech recognition method
US7127127B2 (en) * 2003-03-04 2006-10-24 Microsoft Corporation System and method for adaptive video fast forward using scene generative models
US7349010B2 (en) * 2003-04-11 2008-03-25 Eastman Kodak Company Digital camera including an on-line sales mode
US20050057578A1 (en) 2003-09-16 2005-03-17 Shan-Jang Chen Digital photo frame
TW200540732A (en) * 2004-06-04 2005-12-16 Bextech Inc System and method for automatically generating animation
US7738637B2 (en) * 2004-07-24 2010-06-15 Massachusetts Institute Of Technology Interactive voice message retrieval
CN100594527C (zh) * 2004-11-22 2010-03-17 马里奥·皮尔基奥 多媒体播示中的使音频与图形同步的方法
US7613613B2 (en) * 2004-12-10 2009-11-03 Microsoft Corporation Method and system for converting text to lip-synchronized speech in real time
US7574453B2 (en) * 2005-01-03 2009-08-11 Orb Networks, Inc. System and method for enabling search and retrieval operations to be performed for data items and records using data obtained from associated voice files
US7412389B2 (en) * 2005-03-02 2008-08-12 Yang George L Document animation system
US7721301B2 (en) * 2005-03-31 2010-05-18 Microsoft Corporation Processing files from a mobile device using voice commands
US8015009B2 (en) * 2005-05-04 2011-09-06 Joel Jay Harband Speech derived from text in computer presentation applications
US8077179B2 (en) * 2005-07-11 2011-12-13 Pandoodle Corp. System and method for creating animated video with personalized elements
US20070263266A1 (en) * 2006-05-09 2007-11-15 Har El Nadav Method and System for Annotating Photographs During a Slide Show
US20110289073A1 (en) * 2010-05-18 2011-11-24 Rovi Technologies Corporation Generating browsing hierarchies

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0863176A (ja) * 1994-08-19 1996-03-08 Pfu Ltd 音楽映像データ再生装置
JPH09288681A (ja) * 1996-04-23 1997-11-04 Toshiba Corp 背景映像検索表示装置および背景映像検索方法
JP2005049773A (ja) * 2003-07-31 2005-02-24 Denso Corp 音楽再生装置
US7248857B1 (en) * 2004-02-27 2007-07-24 Cingular Wireless Ii, Llc System and method for enhanced message notification
JP2006092430A (ja) * 2004-09-27 2006-04-06 Denso Corp 音楽再生装置
JP2006244002A (ja) * 2005-03-02 2006-09-14 Sony Corp コンテンツ再生装置およびコンテンツ再生方法
JP2007174026A (ja) * 2005-12-20 2007-07-05 Sony Corp 画像収集システム、電子機器および画像送信方法、プログラム、並びに記録媒体
JP2007174503A (ja) * 2005-12-26 2007-07-05 Fujifilm Corp 音楽画像再生装置及び音楽画像情報管理方法
JP2007281618A (ja) * 2006-04-03 2007-10-25 Sony Corp 情報処理装置、情報処理方法、およびプログラム

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JPN5012010734; DAVID A SHAMMA: 'MUSICSTORY: A PERSONALIZED MUSIC VIDEO CREATOR' PROCEEDINGS OF THE ACM INTERNATIONAL CONFERENCE ON MULTIMEDIA , 20051111 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019174783A (ja) * 2018-03-26 2019-10-10 バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド 画像とオーディオの同期再生の処理方法及びデバイス

Also Published As

Publication number Publication date
US20100312559A1 (en) 2010-12-09
KR101513847B1 (ko) 2015-04-21
JP5765940B2 (ja) 2015-08-19
EP2225758A2 (en) 2010-09-08
WO2009083845A3 (en) 2009-08-27
WO2009083845A2 (en) 2009-07-09
CN101971262A (zh) 2011-02-09
US8438034B2 (en) 2013-05-07
KR20100095633A (ko) 2010-08-31

Similar Documents

Publication Publication Date Title
JP5765940B2 (ja) 画像を再生するための方法及び装置
US7945439B2 (en) Information processing apparatus, information processing method, and computer program
US8321203B2 (en) Apparatus and method of generating information on relationship between characters in content
JP2011217197A (ja) 電子機器、再生制御システム、再生制御方法及びプログラム
US20120060093A1 (en) Multimedia file playing method and multimedia player
KR20070106537A (ko) 콘텐츠 재생장치 및 콘텐츠 재생방법
US20110274406A1 (en) Information processing method, information processing device, scene metadata extraction device, loss recovery information generation device, and programs
CN111279709A (zh) 提供视频推荐
JP2010509830A (ja) ビデオデータストリームの要約を生成するための方法及び装置
WO2014154097A1 (en) Automatic page content reading-aloud method and device thereof
JP2009145785A (ja) 携帯端末装置、音声コンテンツの再生方法、及び音声コンテンツの再生プログラム
JP4030440B2 (ja) メッセージ再生装置、メッセージ記録および再生方法、およびプログラム
US20140297285A1 (en) Automatic page content reading-aloud method and device thereof
JP2011049707A (ja) 動画再生装置、動画再生方法及びプログラム
CN107147842B (zh) 一种儿童照相的方法及装置
JP4609556B2 (ja) 情報処理装置及び情報処理方法
KR100944958B1 (ko) 특정 구간의 멀티미디어 데이터 및 캡션 데이터를 제공하는장치 및 서버
KR101465258B1 (ko) 사진 디스플레이 방법 및 이를 이용한 단말기
JP6202998B2 (ja) 放送受信機
WO2006030995A9 (en) Index-based authoring and editing system for video contents
JP7243447B2 (ja) 声優評価プログラム、声優評価方法及び声優評価システム
JP2006133672A (ja) 携帯型語学学習装置及び携帯型語学学習システム
US20090172015A1 (en) Apparatus and method for playing mapped objects
JP5605083B2 (ja) 映像再生装置及び映像再生プログラム
JP2023162711A (ja) 撮像装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111208

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130212

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140130

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140428

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20141125

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150324

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20150401

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150609

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150616

R150 Certificate of patent or registration of utility model

Ref document number: 5765940

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees