Nothing Special   »   [go: up one dir, main page]

JP2011203821A - 情報処理装置、情報処理方法、プログラム - Google Patents

情報処理装置、情報処理方法、プログラム Download PDF

Info

Publication number
JP2011203821A
JP2011203821A JP2010068264A JP2010068264A JP2011203821A JP 2011203821 A JP2011203821 A JP 2011203821A JP 2010068264 A JP2010068264 A JP 2010068264A JP 2010068264 A JP2010068264 A JP 2010068264A JP 2011203821 A JP2011203821 A JP 2011203821A
Authority
JP
Japan
Prior art keywords
thumbnail
feature
importance
frames
frame
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010068264A
Other languages
English (en)
Inventor
Michimasa Obana
通雅 尾花
Hiroshige Okamoto
裕成 岡本
Masashi Ota
正志 太田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP2010068264A priority Critical patent/JP2011203821A/ja
Publication of JP2011203821A publication Critical patent/JP2011203821A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

【課題】サムネイル画像を用いたシーンサーチを良好に行うことのできる情報処理装置を提供する。
【解決手段】動画コンテンツの視聴時にユーザより入力される操作情報などをもとに、特徴フレーム毎のサムネイル表示回数、動画の表示回数などを調べてユーザ操作ログ情報として記録しておく。このユーザ操作ログ情報をもとに特徴フレーム毎の第2の重要度を算出し、この第2の重要度と、特徴フレームの特徴を強さを反映した第1の重要度からサムネイル化する特徴フレームを決定し、この特徴フレームに対応するサムネイル画像を表示する。特徴フレーム毎に、特徴の強さを反映した第1の重要度とユーザがサーチで見逃している可能性の高さを反映した第2の重要度とからサムネイル化する特徴フレームが決定されるので、ユーザに良好なシーンサーチ環境を提供することができる。
【選択図】図1

Description

本発明は、動画コンテンツのサムネイル画像を表示してユーザによるシーンサーチが可能な情報処理装置、情報処理方法、プログラムに関する。
録画機能を有するテレビジョン装置やパーソナルコンピュータなどの情報処理装置では、録画された映像コンテンツのユーザによるシーンサーチを補助するために、録画された映像コンテンツの一部のフレームをサムネイル化して表示することが行われる。その際、ユーザが素早く視覚的に目的のシーンを検索することが可能なように、映像コンテンツの一定時間(例えば10秒、10分)置きのフレームをサムネイル化して時系列順に一覧表示する方法も知られている。さらには、(重要な)被写体の顔が映っているフレームや、シーンの切り替わり位置のフレームなど、ハイライトと推定されるフレームを検出して、これらのフレームのサムネイル画像を生成する方法も知られている(例えば特許文献1参照)。
また、特許文献1においては、ユーザがサムネイル画像の時系列であるフィルム・ロール上の任意のサムネイルを選択することにより、動画のその位置から再生処理が起動することとされている。ここで、フィルム・ロールは、動画の時刻に対応するサムネイル画像を含む、複数のサムネイル画像による横一列の時系列で構成され、再生中の動画の時刻とともに進行することとされている。
特開2006−086612号公報(段落[0121−0124]、図16、図17)
しかしながら、画像や音声のマッチング処理の精度の限界などにより、ユーザにとって興味のある被写体を含むフレームがシステム側で特徴的なフレームとして判定されるとは限らない。このためユーザがサーチしようとしている被写体を含むフレームが動画コンテンツ内に存在しているにもかかわらず、そのフレームに対応するサムネイル画像が表示されないことがあった。
以上のような事情に鑑み、本発明の目的は、サムネイル画像を用いたシーンサーチを良好に行うことのできる情報処理装置、情報処理方法、プログラムを提供することにある。
上記目的を達成するため、本発明の一形態に係る情報処理装置は、複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、前記特徴フレーム毎の重要度を算出する重要度算出部と、前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部と、前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択する選択部と、前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示するサムネイル画像表示部と、前記ユーザより入力された第1の操作情報を記録する操作情報記録部とを具備し、前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与えるものである。
本発明では、重要度算出部が、記録された第1の操作情報をもとに、サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に決定部で前記サムネイルフレームとして決定されるようにそれぞれの特徴フレームに重要度を与える。これにより、サムネイル画像として表示されたことのない特徴フレームに対応するサムネイル画像が表示される確率が高くなり、それまでユーザがサーチ範囲から外していた時間区間のサムネイル画像を対象にシーンサーチを行うことが可能になる。
本発明の情報処理装置は、前記動画を再生可能な再生処理部と、前記ユーザより入力された第2の操作情報をもとに前記再生処理部に前記動画の再生を開始させる制御部とをさらに具備し、前記操作情報記録部は、前記第2の操作情報をさらに記録し、前記重要度算出部は、前記記録された第2の操作情報をもとに、前記動画として再生されたことのない時間範囲の1以上の前記特徴フレームが、前記動画として再生されたことのある時間範囲の1以上の前記特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与えるようにしてもよい。
これにより、動画として再生されたことのない時間範囲の特徴フレームに対応するサムネイル画像が表示される確率が高くなり、それまでユーザがサーチ範囲から外していた時間区間のサムネイル画像を対象にシーンサーチを行うことが可能になる。
本発明の情報処理装置は、前記抽出された特徴フレームの特徴に応じた特徴重要度を算出する特徴重要度算出部をさらに具備し、前記決定部は、前記算出された特徴重要度と、前記重要度算出部により算出された重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定するものであってもよい。
本発明の情報処理装置は、ユーザの嗜好データが記録される嗜好データ記録部をさらに具備し、前記重要度算出部は、前記特徴フレーム抽出部により抽出された前記特徴フレームの特徴データと前記嗜好データ記録部に記録された前記嗜好データとの相関度を加味して前記特徴フレームに重要度を与えるものであってもよい。
本発明の他の形態に係る情報処理方法は、特徴フレーム抽出部が、複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出し、決定部が、前記特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定し、選択部が、前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択し、サムネイル画像表示部が、前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示し、操作情報記録部が、前記ユーザより入力された第1の操作情報を記録し、前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与えることによるものである。
本発明のさらに他の形態に係るプログラムは、複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、前記特徴フレーム毎の重要度を算出する重要度算出部と、前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部と、前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択する選択部と、前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示するサムネイル画像表示部と、前記ユーザより入力された第1の操作情報を記録する操作情報記録部としてコンピュータを機能させ、かつ前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与えるようにコンピュータを機能させるものである。
本発明のさらに他の形態に係る情報処理装置は、複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、ユーザの嗜好データが記録される嗜好データ記録部と、前記特徴フレーム毎の重要度を算出する重要度算出部と、前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部とを具備し、前記重要度算出部は、前記特徴フレーム抽出部により抽出された前記特徴フレームの特徴データと前記嗜好データ記録部に記録された前記嗜好データとの相関度を求め、前記嗜好データとの前記相関度の高い特徴データを有する前記特徴フレームが、優先的に前記決定部で前記サムネイルフレームとして決定されるように当該特徴フレームに重要度を与えるものとする。
本発明では、重要度算出部が、特徴フレーム抽出部により抽出された特徴フレームの特徴データと嗜好データ記録部に記録された嗜好データとの相関度を求め、嗜好データとの相関度の高い特徴データを有する特徴フレームが、優先的に決定部でサムネイルフレームとして決定されるように当該特徴フレームに重要度を与える。これにより、ユーザの嗜好との相関を反映した重要度とからサムネイル化する特徴フレームが決定されるので、ユーザに良好なシーンサーチ環境を提供することができる。
本発明によれば、サムネイル画像を用いたシーンサーチを良好に行うことができる。
本発明の第1の実施形態に係る情報処理装置の構成を示すブロック図である。 図1の情報処理装置による動画コンテンツの特徴フレームの検出に関するフローチャートである。 図1の情報処理装置によるサムネイル表示処理に関するフローチャートである。 図1の情報処理装置によるサムネイル表示処理のタイミング図である。 図1の情報処理装置による特徴フレームの第1の重要度の第1の計算例を示す図である。 図1の情報処理装置による特徴フレームの第1の重要度の第2の計算例を示す図である。 図1の情報処理装置による特徴フレームの第1の重要度の第3の計算例を示す図である。 ユーザ操作ログの例を示す図である。 図1の情報処理装置のユーザ情報処理部による特徴フレームの第2の重要度の計算例を示す図である。 図1の情報処理装置によるページ単位のサムネイル画像の配置方法を示す図である。 図1の情報処理装置のサムネイル表示枚数決定部によるサムネイル表示枚数の算定手順を示すフローチャートである。 サムネイル表示枚数の算定方法の説明図である。 図1の情報処理装置の表示サムネイル選択部による表示サムネイルページの選択方法に関する第1の説明図である。 図13の表示サムネイル選択部による表示サムネイルページの選択方法に関する第2の説明図である。 図1の情報処理装置におけるシステム状態およびユーザからの操作情報と、サムネイル画像の表示形態との関係を示す図である。 図1の情報処理装置における通常再生時のシーンサーチ画面の例を示す図である。 図1の情報処理装置において通常再生時に動画の時刻の切り替えが発生してからユーザがサムネイル画像に対する操作を何もしないで所定の時間が経過した時点でのシーンサーチ画面の例を示す図である。 図1の情報処理装置における動画の高速再生時のシーンサーチ画面の例を示す図である。 動画の高速再生時にポップアップ表示の移動速度が一定とならない場合を説明する図である。 図1の情報処理装置においてポップアップ表示の移動速度が一定となるように動画の再生速度を制御する方法を説明する図である。 図1の情報処理装置においてポップアップ表示対象の複数のサムネイルフレームが複数ページに跨る場合の処理に関する説明図である。 図1の情報処理装置においてポップアップ表示対象として判定された複数のサムネイルフレームが複数の行に跨る場合の処理に関する説明図である。 図1の情報処理装置において特徴フレームの重要度をサムネイル画像の表示形態に反映させたシーンサーチ画面の例である。 本発明の第2の実施形態に係る情報処理装置の構成を示すブロック図である。 第2の実施形態の情報処理装置におけるユーザ情報処理部による特徴フレームの第2の重要度の計算例を示す図である。 本発明の第3の実施形態に係る情報処理装置の構成を示すブロック図である。 第2の実施形態の情報処理装置におけるユーザ情報処理部による特徴フレームの最終的な第2の重要度の計算例を示す図である。 サムネイル間引き処理の例を示す図である。 表示サムネイルページの選択からサムネイル間引き処理までのフローチャートである。
以下、図面を参照しながら、本発明の実施形態を説明する。
<第1の実施形態>
[情報処理装置の構成]
図1は本発明の第1の実施形態に係る情報処理装置の構成を示すブロック図である。
本実施形態の情報処理装置は、少なくとも映像信号と音声信号とが多重化された動画コンテンツを伝送媒体を通じて受信し、蓄積して、映像と音声をそれぞれ再生することが可能な機器である。映像信号と音声信号とが多重化された動画コンテンツは、より具体的には、例えば、地上デジタル放送、衛星デジタル放送などの放送波や、IP(Internet Protocol)回線などの伝送媒体を通じて伝送されるMPEG(Moving Picture Expert Group)−2トランスポートストリームなどである。
図1に示すように、本実施形態の情報処理装置100は、映像・音声信号記録部111、再生処理部112、表示処理部113、特徴フレーム抽出部114、特徴フレーム情報記録部115、画音特徴判定部116、サムネイルフレーム決定部117、サムネイル表示枚数決定部118、表示サムネイル選択部119、静止画作成部120、静止画記録部121、サムネイル表示加工部122、I/F部123、システムコントローラ124、ユーザ情報処理部125、ユーザ操作ログ処理部126、およびユーザ操作ログ記録部127を有する。
映像・音声信号記録部111は、本情報処理装置100にて取得した動画コンテンツの映像信号および音声信号が記録される記録領域である。
再生処理部112は、映像・音声信号記録部111に記録された映像信号および音声信号をそれぞれ復号して再生するための処理を行う部分である。
表示処理部113は、再生処理部112によって再生された映像と、後述するサムネイル表示加工部122によって作成されたサムネイル画像それぞれの表示データを生成し、物理的な画面を有する表示手段に動画として出力する部分である。物理的な画面を有する表示手段は、本情報処理装置100に接続された外部の表示装置であってもよいし、本情報処理装置100に内蔵された表示装置であってもよい。
特徴フレーム抽出部114は、取得した映像信号からカット点、フェード区間の中間点など、映像において特徴的な場面のフレームを特徴フレームとして検出し、この特徴フレームの動画コンテンツにおけるフレームの時間位置である時刻情報を「特徴フレーム情報」として得る。
特徴フレーム情報記録部115は、特徴フレーム抽出部114にて得られた特徴フレーム情報が記録される記録領域である。
画音特徴判定部116(特徴重要度算出部)は、特徴フレーム情報記録部115に記録された特徴フレーム情報に対応する特徴フレーム毎の映像信号および音声信号をもとに特徴データを生成し、この特徴の強さを反映した重要度を第1の重要度(特徴重要度)として計算する部分である。
ユーザ操作ログ処理部126は、ユーザからシステムコントローラ124に入力される指示操作の内容を示す操作情報、ならびにシステムの動作情報を日時情報とともにシステムコントローラ124よりユーザ操作ログとして取得する。ユーザ操作ログ処理部126は、取得したユーザ操作ログから、特徴フレーム毎の重要度計算に利用しやすい情報を生成してユーザ操作ログ情報(第1の操作情報)としてユーザ操作ログ記録部127に記録する。
ユーザ操作ログ記録部127(操作情報記録部)は、ユーザ操作ログ処理部126により生成されたユーザ操作ログ情報の記録保存が行われる領域である。
ユーザ情報処理部125(重要度算出部)は、ユーザ操作ログ記録部127に保存されたユーザ操作ログ情報をもとに、特徴フレーム毎の重要度を第2の重要度(重要度)として算出する処理をユーザ情報処理として行う。
サムネイルフレーム決定部117(決定部)は、画音特徴判定部116により得られた第1の重要度とユーザ情報処理部125により得られた第2の重要度をもとにサムネイル対象とする1以上のフレームをそれぞれ「サムネイルフレーム」として決定し、そのサムネイルフレームの動画コンテンツにおける時間位置である時刻情報を「サムネイルフレーム情報」としてサムネイル表示枚数決定部118に出力する。
サムネイル表示枚数決定部118は、サムネイルフレーム決定部117より供給されたサムネイルフレーム情報などをもとに、総てのサムネイルフレームを時系列的に連続する複数のサムネイルフレームの集合からなるページの単位に分割するように、1画面に表示するサムネイルの数を「サムネイル表示枚数」としてページ毎に決定する。そして、サムネイル表示枚数決定部118は、ページ毎のサムネイル表示枚数と、ページ毎のサムネイルフレーム情報を表示サムネイル選択部119に供給する。
表示サムネイル選択部119(選択部)は、再生中の動画の時刻に最も近いサムネイルフレームを「最近サムネイルフレーム」として、この最近サムネイルフレームを含むページ単位のサムネイルフレームを、サムネイル画像の表示対象として選択する部分である。また、表示サムネイル選択部119(選択部)は、サムネイルフレームの中から、ユーザより入力された"再生"、"ジャンプ"、"サーチ"などの操作情報をもとに、サムネイル画像として表示させるページ単位のサムネイルフレームを選択することが可能である。
静止画作成部120は、サムネイルフレーム決定部117により決定されたサムネイルフレームに対応する静止画を映像・音声信号記録部111に記録された映像信号を用いて作成する部分である。
静止画記録部121は、静止画作成部120により作成されたサムネイルフレーム毎の静止画が記録される記録領域である。
サムネイル表示加工部122(サムネイル画像表示部)は、表示サムネイル選択部119により選択された最近サムネイルフレームを含むページ単位のサムネイルフレームについて、静止画記録部121に記録された対応する静止画を用いてサムネイル画像を作成する。また、サムネイル表示加工部122は、ページ単位のサムネイル画像を時系列的に行列状に配置した形で連結するなどして、その結果を表示処理部113に供給する。
I/F部123は、ユーザからの、サムネイル表示のオン/オフの切り替え、動画の再生速度(サーチ速度)、動画の再生位置を指定するためのサムネイルフレームの選択など、各種の操作情報の入力を受け付けてシステムコントローラ124に供給するインタフェースである。具体的には、キー入力装置、マウス、タッチパネルセンサー、リモートコントローラなどである。
システムコントローラ124(制御部)は、例えば、I/F部123を通じてユーザより入力された各種の操作情報をもとにサムネイル表示に関する制御などを行う。
以上説明した情報処理装置100における各部は、より具体的には、CPU(Central Processing Unit)、メインメモリを含む典型的なコンピュータ・ハードウェアとこれを動作させるプログラムによって実現される。映像・音声信号記録部111、特徴フレーム情報記録部115、静止画記録部121、ユーザ操作ログ記録部127は、より具体的には、メインメモリや、HDD(Hard disk drive)、SDD(Solid State Drive)、ODD(Optical Disc Drive)などのストレージ装置である。
なお、情報処理装置100は、図1に示される構成のほか、放送信号処理部を備える。放送信号処理部は、伝送媒体を通じてデジタル放送信号を受信する放送受信部と、受信したデジタル放送信号から動画コンテンツの映像信号および音声信号などを分離する信号処理部とを備える。上記の放送受信部は、より具体的には、放送局から地上波、衛星波などの放送媒体を介してデジタル放送信号をアンテナを介して選局して受信するチューナや、IP(Internet Protocol)回線を通じてIPマルチキャスト放送信号を受信するIPネットワーク接続部である。
本実施形態の情報処理装置100では、ユーザによる動画コンテンツのシーンサーチが可能なように、特徴フレームのうち特に重要度の高いフレームに対応するサムネイル画像を時系列的に配置して表示し、特にユーザがシーンを確認したいと思った時刻をサムネイル画像の選択によって指定することができる。サムネイル画像がユーザによって選択されると、そのサムネイル画像に対応するサムネイルフレームの時刻に動画の再生時刻がジャンプして、その時刻から動画の再生が継続される。本実施形態の情報処理装置100は、このようなサムネイル画像を用いたシーンサーチを、より良好に行うことを目的とし、特に、特徴フレームの中からサムネイル化するのに適した特徴フレームを選択するために用いられる特徴フレームの重要度の生成方式に着目してなされたものである。
[情報処理装置100の動作概要]
次に、図2から図4を用いて、本実施形態の情報処理装置100によるサムネイル表示処理の動作の概要を説明する。図2は、本実施形態の情報処理装置100による動画コンテンツの特徴フレームの検出に関するフローチャートである。図3は、本実施形態の情報処理装置100によるサムネイル表示処理に関するフローチャートである。図4は、上記のサムネイル表示処理の例のタイミング図である。同図において、tは動画コンテンツの時間軸である。
まず、図2のフローチャートにおいて、情報処理装置100は、図示しない放送信号処理部にて、動画コンテンツの受信と、受信した動画コンテンツからの映像信号および音声信号の分離などを行う(ステップS101)。このようにして得られた動画コンテンツの映像信号および音声信号は、映像・音声信号記録部111に記録されるとともに、映像信号は特徴フレーム抽出部114にも供給される。
特徴フレーム抽出部114は、映像信号からカット点、フェード区間の中間点(フェードイン点とフェードアウト点との間の中間点)などの特徴フレームの検出を行う(ステップS102)。特徴フレーム抽出部114は、検出した特徴フレームの、動画コンテンツにおける時間位置である時刻情報を特徴フレーム情報として特徴フレーム情報記録部115に動画コンテンツの指定情報と関連付けて記録する(ステップS103)。特徴フレーム情報記録部115には、動画コンテンツ毎の複数の特徴フレーム情報が記録される。図4の例は、f1からf14の特徴フレームが検出された場合を示している。このように特徴フレームは動画コンテンツの時間軸t上の不規則な時間位置(時刻)にある。なお、特徴フレーム情報記録部115には、1つの動画コンテンツの特徴フレーム情報だけではなく、複数の動画コンテンツの特徴フレーム情報を記録可能である。
以後、ユーザは、動画コンテンツの特徴フレーム情報が特徴フレーム情報記録部115に記録された動画コンテンツの中から、シーンサーチを実行したい動画コンテンツを指定してシーンサーチの指示を与えることができる。
次に、図3のフローチャートにおいて、ユーザより、シーンサーチ対象の動画コンテンツの指定情報と再生速度情報(サーチ速度情報)を含む、シーンサーチの起動指示の操作情報が、I/F部123を通じてシステムコントローラ124に入力されたこととする(ステップS201)。なお、再生速度(サーチ速度)は、例えば、1倍速刻みで、通常再生(等倍速=1倍速)からn倍速の高速再生までの間でユーザが自由に選択することができる。なお、ユーザ操作ログ記録部127には現時点までのユーザの操作ログが記録されているものとする。ユーザ操作ログ記録部127へのユーザ操作ログの記録について後で説明する。
システムコントローラ124は、シーンサーチの起動指示の操作情報を入力すると、画音特徴判定部116に当該動画コンテンツの指定情報を含む起動命令を出力する。画音特徴判定部116は、起動命令を受けると、当該動画コンテンツの指定情報をもとに、特徴フレーム情報記録部115から該当する動画コンテンツの各特徴フレーム情報を読み込む。画音特徴判定部116は、それぞれの特徴フレーム情報をもとに映像・音声信号記録部111から対応する時刻の特徴フレームの映像信号および音声信号を読み込み、予め設定された様々なオブジェクトの映像および音声の基準パターンとのマッチング処理などによって判定された特徴データから特徴フレームの第1の重要度を計算する(ステップS202)。例えば、図4では、f1からf14の特徴フレームに対して、"1"から"8"までの重要度が与えられる。"1"は重要度の最小値、"8"は重要度の最大値である。特徴フレームの第1の重要度を計算する具体的な方法については後で説明する。画音特徴判定部116は、計算された特徴フレーム毎の第1の重要度をサムネイルフレーム決定部117に供給する。
一方、ユーザ情報処理部125は、ユーザ操作ログ記録部127に保存されたユーザ操作ログ情報をもとに特徴フレーム毎の第2の重要度として算出する(ステップS203)。この処理を以後「ユーザ情報処理」と記述する。ユーザ情報処理では、例えば、図4では、f1からf14の特徴フレームに対して、"1"から"3"までの重要度が与えられる。"1"は重要度の最小値、"3"は重要度の最大値である。ユーザ情報処理のより具体的な方法については後で説明する。ユーザ情報処理部125は、計算された特徴フレーム毎の第2の重要度をサムネイルフレーム決定部117に供給する。
この後、サムネイルフレーム決定部117は、画音特徴判定部116より供給された特徴フレームの第1の重要度とユーザ情報処理部125により得られた同じ特徴フレームの第2の重要度をもとにサムネイルフレームを決定し、そのサムネイルフレームの時間位置を示す情報をサムネイルフレーム情報として表示サムネイル選択部119に出力するとともに、サムネイルフレームの総数をサムネイル表示枚数決定部118に通知する(ステップS204)。例えば、図4では、重要度が5以上の特徴フレームがサムネイルフレームとして決定される。この結果、f2,f3,f5,f6,f8,f11,f13,f14の特徴フレームがサムネイルフレームとして決定される。サムネイルフレームを決定するための、より具体的な方法については後で説明する。
次に、サムネイル表示枚数決定部118は、サムネイルフレーム決定部117より供給されたサムネイルフレーム総数などをもとに、総てのサムネイルフレームを時系列的に連続する複数のサムネイルフレームの集合からなるページの単位に分割するように、1画面に表示するサムネイルの数を「サムネイル表示枚数」として決定する(ステップS205)。そしてサムネイル表示枚数決定部118は、サムネイル表示枚数を表示サムネイル選択部119に供給する。例えば、図4では、サムネイルフレーム総数N、コンテンツ時間長Tなどからサムネイル表示枚数Mが求められる。なお、サムネイル表示枚数を決定する具体的な方法については後で説明する。
サムネイル表示枚数が決定されたところで、システムコントローラ24は再生処理部112に、当該動画コンテンツのシーンサーチのための動画再生を指示する。再生処理部112は、当該指示を受けると、映像・音声信号記録部111から当該動画コンテンツの映像信号を読み出し、復号して、先頭からの動画の再生を開始する(ステップS206)。
一方、表示サムネイル選択部119は、サムネイルフレーム決定部117からのサムネイルフレーム情報をサムネイル表示枚数決定部118からのサムネイル表示枚数をもとに、ページ単位のサムネイルフレーム情報に分割する。動画の再生が開始されると、表示サムネイル選択部119は、再生中の動画の時刻に最も近いサムネイルフレームを「最近サムネイルフレーム」として判定し、この最近サムネイルフレームを含むページ単位のサムネイルフレーム情報をサムネイル表示加工部122に供給する(ステップS207)。例えば、図4では、動画の時刻T1に最も近いf5の特徴フレームが最近サムネイルフレームとして判定され、この最近サムネイルフレームf5を含むページ1に属するM個のサムネイルフレームf2,f3,f5のサムネイルフレーム情報がサムネイル表示加工部122に供給される。なお、図4の例では、ページ単位のサムネイルフレームの数を3としているが、実際には各サムネイル画像は行列状に並べて配置されるようになっており、サムネイル表示枚数の値Mは、行列の行数をR、列数をCとして、R×Cの値である。
次に、サムネイル表示加工部122は、表示サムネイル選択部119よりページ単位のサムネイルフレーム情報を受け取ると、それぞれのサムネイルフレーム情報をもとに静止画記録部121から該当する時刻の特徴フレームの静止画をそれぞれ読み出す。そして、サムネイル表示加工部122は、読み出した静止画からサムネイル画像を作成し、表示処理部113に供給する(ステップS208)。サムネイル画像を作成するための具体的な方法については後で説明する。
表示処理部113は、サムネイル表示加工部122より供給されたページ単位のサムネイル画像の表示データを作成し、物理的な表示手段に出力する。これにより、再生中の動画の時刻に対応するページ単位のサムネイル画像が画面に表示される(ステップS209)。
この後、システムコントローラ124は、ユーザからのシーンサーチの終了の指示の有無を調べる(ステップS209)。ユーザからのシーンサーチの終了の指示がない場合には(ステップS210のNO)、システムコントローラ124は、続いてシーンサーチ対象の動画コンテンツを変更する指示の有無を調べる(ステップS211)。シーンサーチ対象の動画コンテンツを変更する指示が発生していない場合(ステップS211のNO)、システムコントローラ124は表示サムネイル選択部119に再生中の動画の時刻を通知する。
表示サムネイル選択部119は、動画の時刻を取得すると、この時刻が現在表示中のページ単位のサムネイル画像(サムネイルフレーム)の時刻の範囲内であるかどうかを判定する(ステップS212)。動画の時刻が現在表示中のページ単位のサムネイル画像の時刻の範囲内であれば(ステップS212のYES)、表示サムネイル選択部119は、サムネイル画像の表示の更新が不要であることを判定し、現在のサムネイル画像の表示状態を継続する。この後、表示サムネイル選択部119は、再度ステップS210に戻って、ユーザからのシーンサーチの終了の指示の有無を判定する。
一方、再生中の動画の時刻が現在表示中のページ単位のサムネイル画像の時刻の範囲内でないことが判定された場合(ステップS212のNO)、表示サムネイル選択部119は、ステップS206に戻って再度、最近サムネイルフレームを含むページ単位のサムネイルフレーム情報をサムネイル表示加工部122に供給する。この結果、ステップS208で、再生中の動画の時刻に対応する、新たなページ単位のサムネイル画像が画面に表示され、サムネイルフレームの表示が更新される。
また、ステップS211で、システムコントローラ124は、シーンサーチ対象の動画コンテンツを変更する指示の発生を判定した場合(ステップS211のYES)、ステップS201に戻って、ユーザより、新たなシーンサーチ対象の動画コンテンツの指定情報と再生速度情報(サーチ速度情報)を含む、シーンサーチの起動指示の操作情報を入力する。以後の動作は前記の同様である。
そしてシステムコントローラ124は、ステップS210で、ユーザよりI/F部123を通じてシーンサーチ終了の指示を受けたとき(ステップS210のYES)、動画の再生およびサムネイル画像の表示を終了する。
次に、上記の画音特徴判定、ユーザ情報処理、サムネイルフレーム決定、サムネイル表示枚数決定、表示サムネイルページ選択、サムネイル表示加工についての詳細を説明する。
[画音特徴判定その1]
特徴フレームの第1の重要度は、その特徴フレームの動画(映像と音声)の内容から求めることができる。第1の重要度の高い特徴フレームとしては、例えば、次のようなものがある。
・人の顔を含む特徴フレーム
・テロップ等の文字情報を含む特徴フレーム
・チャプターの開始直後の特徴フレーム
・音声の盛り上がり途中の特徴フレーム
・誘目度(人目を引きやすい色)が高い特徴フレーム
・ディテールのある領域が多く含む特徴フレーム
例えば、上記各々の特徴フレームの特徴に対して第1の重要度を予め設定しておき、1つの特徴フレームに含まれる全ての特徴に対する第1の重要度の合計を、その特徴フレームの第1の重要度の計算結果とすればよい。但し、CM中の特徴フレームやフェードアウト直後の特徴フレームは、第1の重要度の計算対象外とする。
図5は特徴フレームの第1の重要度の計算例を示す図である。ここでは、説明の簡単のため、第1の重要度を"低"、"中"、"高"の3段階に求める場合を示している。"低"、"中"、"高"は実際には数値データである。f3の特徴フレームには顔が1つ含まれていることから第1の重要度は"中"とされ、f5の特徴フレームには顔が2つ含まれていることから第1の重要度は"高"とされている。このように顔の数を第1の重要度に反映してもよい。また、f6の特徴フレームには顔が1つしか含まれていないが、特徴フレーム内で顔が占める割合が高いことから、第1の重要度は"高"とされている。f7の特徴フレームにはテロップが含まれていることから第1の重要度は"中"とされている。f8の特徴フレームにはテロップと1つの顔が含まれていることから第1の重要度は"高"とされている。そして、f11の特徴フレームには1つの顔が含まれ、かつ音声の盛り上がり途中であることから第1の重要度は"高"とされている。
[画音特徴判定その2]
画音特徴判定部116は、特徴フレームの第1の重要度を、その特徴フレームと過去の特徴フレームとの相関から求めるようにしてもよい。例えば、次のようなルールが考えられる。
・ルール1:過去の特徴フレームに対して新しい顔が出現した特徴フレームの第1の重要度を"高"とする。
・ルール2:過去の特徴フレームに出現したことのある顔が再び出現した特徴フレームであることと、それぞれの特徴フレームの時間差が閾値以上であることを満足する場合には第1の重要度を"高"とする。
・ルール3:過去の特徴フレームに出現したことのある顔が再び出現した特徴フレームであることと、それぞれの特徴フレームの背景が異なることを満足する場合には第1の重要度を"中"とする。
・ルール4:過去の特徴フレームに出現したことのある顔が再び出現した特徴フレームであることと、それぞれの特徴フレームの背景が同じであることを満足する場合には第1の重要度を"低"とする。
図6は上記のルールに基づく特徴フレームの第1の重要度の計算例を示す図である。ここで、f21の特徴フレームはルール1により第1の重要度は"高"とされている。f17の特徴フレームはルール4により第1の重要度は"低"とされている。f20の特徴フレームはルール3により第1の重要度は"中"とされている。そしてf31の特徴フレームはルール2により第1の重要度は"高"とされている。
[画音特徴判定その3]
画音特徴判定部116は、予め決められた時間区間を越えて連続する特徴フレームを単位に特徴フレームの第1の重要度を求めるようにしてもよい。例えば、次のようなルールが考えられる。
・ルール1:予め決められた時間区間を越えて同一の人物が連続して、あるいは高い頻度で出現する特徴フレームの連続において、その人物の顔全体や全身がもっともはっきりと認識できる特徴フレームの第1の重要度を"高"とする。
・ルール2:ルール1の特徴フレームの連続において第1の重要度が"高"とされた特徴フレーム以外の特徴フレームの第1の重要度を"低"とする。
図7は上記のルールに基づく特徴フレームの第1の重要度の計算例を示す図である。ここで、f42からf59までの区間の特徴フレームに同一の人物が連続して、あるいは高い頻度で出現しており、その時間区間が予め決められた時間区間を越えたこととする。そして、f48の特徴フレームがその人物の顔全体が最もはっきりと認識できるフレームであるとする。この場合にはf48の特徴フレームの第1の重要度はルール1により"高"とされ、f42からf59までの時間区間内のf48以外の特徴フレームの第1の重要度はルール2により"低"とされる。
なお、上記では説明の簡単のため、第1の重要度を"1"から"8"の8段階や"低"、"中"、"高"の3段階に計算する場合について説明したが、本発明にこれに限定されるものではなく、適宜計算に適した段階数を選定すればよい。
[ユーザ情報処理]
ユーザ情報処理部125は、ユーザ操作ログ記録部127に保存されたユーザ操作ログ情報をもとに特徴フレーム毎の重要度を第2の重要度として算出するユーザ情報処理を行う。このユーザ情報処理を行うためには、事前にユーザ操作ログ処理部126によってユーザ操作ログ情報がユーザ操作ログ記録部127に記録されている必要がある。そこで、このユーザ操作ログ処理部126によるユーザ操作ログの記録処理を説明する。
ユーザ操作ログ処理部126は、動画コンテンツを視聴しながらユーザからシステムコントローラ124に入力される指示操作の内容を示す操作情報、ならびにシステムの動作情報を日時情報とともにシステムコントローラ124よりユーザ操作ログとして取得する。
図8は、取得されるユーザ操作ログの例を示す。この例は、ユーザにより1つの動画コンテンツの視聴およびシーンサーチの際に得られた一連のユーザ操作ログである。同図に示すように、ユーザ操作ログは、日時、ユーザ操作・システム動作の内容、コンテンツ情報、サムネイル情報などで構成される。
本例において、最初のユーザ操作ログ41のユーザ操作・システム動作の内容は"コンテンツ切換"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ41は"MHKニュース"という動画コンテンツへの切り替えのユーザ操作に基づくログである。
次のユーザ操作ログ42のユーザ操作・システム動作の内容は"再生"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ42は当該動画コンテンツの再生開始に関するシステム動作に基づくログである。このユーザ操作ログ42には、当該動画コンテンツの再生が開始された先頭の時間位置を示す情報が付加される。"TIME00:00:00"はその先頭の時間位置を示す情報の例である。
次の2つのユーザ操作ログ43、44それぞれのユーザ操作・システム動作の内容は"サーチ、30倍速"、コンテンツ情報は"MHKニュース"である。これらのユーザ操作ログ43、44は、当該動画コンテンツの30倍速での高速サーチに関するユーザ操作・システム動作に基づくログである。このとき画面には30倍速で高速再生された動画が表示されるとともに、再生中の動画の時間位置に最も近いサムネイルフレームを含むページ単位の複数のサムネイル画像が表示される。このときの表示方式の詳細については後で説明する。また、これらのユーザ操作ログ43、44には、動画コンテンツの高速サーチの時間区間を示す情報つまりその時間区間に表示されたサムネイル画像の時間位置を示すサムネイルフレーム情報が付加される。
次のユーザ操作ログ45のユーザ操作・システム動作の内容は"決定"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ45は当該動画コンテンツの高速サーチの終了決定に関するユーザ操作に基づくログである。また、このユーザ操作ログ45には、当該動画コンテンツの高速サーチの終了直前に表示されたページ単位のサムネイル画像の時間位置を示すサムネイルフレーム情報が付加される。
次のユーザ操作ログ46のユーザ操作・システム動作の内容は"サーチ、1倍速"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ46は当該動画コンテンツの1倍速でのサーチに関するユーザ操作・システム動作に基づくログである。このとき画面には、1倍速で再生された動画が表示されるとともに、表示中の動画の時間位置に最も近いサムネイルフレームを含むページ単位の複数のサムネイル画像が表示される。このユーザ操作ログ46にも、システムの動作情報として、当該動画コンテンツの高速サーチの終了直前に表示されたページ単位のサムネイル画像の時間位置を示すサムネイルフレーム情報が付加される。
次のユーザ操作ログ47のユーザ操作・システム動作の内容は"ジャンプ"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ47は、再生中の動画の時間位置をジャンプさせるためのユーザによるサムネイル画像の選択に関するユーザ操作に基づくログである。このユーザ操作ログ47には、選択されたサムネイル画像に対応するサムネイルフレーム情報が付加される。なお、サムネイル画像の選択により再生中の動画の時間位置をジャンプさせる処理の詳細については後で説明する。
次のユーザ操作ログ48のユーザ操作・システム動作の内容は"再生"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ48は、上記のサムネイル画像の選択による再生中の動画の時間位置のジャンプに関するシステム動作に基づくログである。このユーザ操作ログ48には、動画のジャンプ先の時間位置を示す情報が付加される。"TIME00:10:00"はその動画のジャンプ先の時間位置を示す情報の例である。
次のユーザ操作ログ49のユーザ操作・システム動作の内容は"終了"、コンテンツ情報は"MHKニュース"である。このユーザ操作ログ49は、当該動画コンテンツの動画の再生の終了に関するシステム動作に基づくログである。このユーザ操作ログ49には、動画の再生の終了の時間位置を示す情報が付加される。
次のユーザ操作ログ50のユーザ操作・システム動作の内容は"コンテンツ切換"、コンテンツ情報は"ドラマ***"である。このユーザ操作ログ50は"ドラマ***"という動画コンテンツへの切り替えのユーザ操作に基づくログであり、上記の最初のユーザ操作ログ41と同様である。
ユーザ操作ログ処理部126は、取得した上記のようなユーザ操作ログから、特徴フレーム毎の第2の重要度を算出するために必要な情報をユーザ操作ログ情報として生成する。例えば、ユーザ操作ログ処理部126は、動画コンテンツ中の各々の特徴フレームについて、サムネイル画像として表示された回数(以下「サムネイル表示回数C1」と記述する。)、ジャンプ先として選択された回数(以下「サムネイル選択回数C2」と記述する。)、動画ウィンドウ内に動画として表示された回数(以下「ウィンドウ動画表示回数C3」と記述する。)、フル画面で動画として表示された回数(以下「フル動画表示回数C4」と記述する。)などをユーザ操作ログ情報として生成する。そしてユーザ操作ログ処理部126は、生成されたユーザ操作ログ情報をユーザ操作ログ記録部127に記録する。ユーザ情報処理部125は、このユーザ操作ログ記録部127に保存されたユーザ操作ログ情報をもとに、特徴フレーム毎の重要度を第2の重要度として算出する処理をユーザ情報処理として行う。次に、このユーザ情報処理について説明する。
図9は、ユーザ情報処理部125による特徴フレームの第2の重要度の計算例を示す図である。ここでtは時間軸、f1−f7はそれぞれ特徴フレームである。但し同図は、各特徴フレームf1−f7の時間的な前後の関係のみを示し、時間の距離的な関係は省略されているものとする。本例のユーザ情報処理では、ユーザ操作ログ情報として、上記のサムネイル表示回数C1、サムネイル選択回数C2、ウィンドウ動画表示回数C3、およびフル動画表示回数C4が用いられることとする。
ユーザ情報処理部125は、上記のユーザ操作ログ情報と所定のルールに基づいて第2の重要度を計算する。ここで、前述した第1の重要度は特徴フレームの特徴の強さに応じて与えられるものであるのに対し、第2の重要度はユーザがサーチで見逃している可能性の高さに応じて与えられる重要度である。例えば、ユーザがはじめからサーチの範囲から外してしまったフレームは、ユーザにとって興味深いフレームであったとしてもユーザに発見されないことになる。このためルールとしては、例えば、
・ルール1:動画をフル画面で表示したことのある特徴フレームは重要度を"低"とする。
・ルール2:サムネイル画像として表示されたことのない特徴フレームの重要度を"高"とする。
・ルール3:サムネイル画像として表示されたことのがあるものの、選択されたことのない特徴フレームは重要度を"中"とする。
・ルール4:サムネイル画像として表示されたことがあり、かつ選択されたこともある特徴フレームは重要度を"低"とする。
等が用いられる。
これらのルールに拠ると、
特徴フレームf1のユーザ操作ログ情報は、C1=0、C2=0、C3=0、C4=1であるから、ルール1に該当し、この結果、第2の重要度は"低"と計算される。
特徴フレームf2のユーザ操作ログ情報は、C1=0、C2=0、C3=0、C4=0、つまり全て"0"であるから、ルール2に該当し、この結果、第2の重要度は"高"と計算される。
特徴フレームf3のユーザ操作ログ情報は、C1=5、C2=0、C3=0、C4=0であるから、ルール3に該当し、この結果、第2の重要度は"中"と計算される。
特徴フレームf4のユーザ操作ログ情報は、C1=1、C2=0、C3=0、C4=0であるから、ルール3に該当し、この結果、第2の重要度は"中"と計算される。
特徴フレームf5のユーザ操作ログ情報は、C1=1、C2=0、C3=0、C4=1であるから、ルール1に該当し、この結果、第2の重要度は"低"と計算される。
特徴フレームf6のユーザ操作ログ情報は、C1=2、C2=1、C3=2、C4=0であるから、ルール4に該当し、この結果、第2の重要度は"低"と計算される。
特徴フレームf7のユーザ操作ログ情報は、C1=1、C2=1、C3=1、C4=1であるから、ルール1とルール4に該当し、この結果、第2の重要度は"低"と計算される。
なお、上記では説明の簡単のため、第2の重要度を"1"から"8"の8段階や"低"、"中"、"高"の3段階に計算する場合について説明したが、本発明にこれに限定されるものではなく、適宜計算に適した段階数を選定すればよい。
[サムネイルフレーム決定]
サムネイルフレーム決定部117は、例えば、画音特徴判定部116より供給された特徴フレームの第1の重要度とユーザ情報処理部125により得られた同じ特徴フレームの第2の重要度との積を重要度の統合値として求め、この統合値が予め設定されたサムネイルフレーム決定用の閾値以上の特徴フレームをサムネイルフレームとして決定する。あるいは、サムネイルフレーム決定部117は、重要度の統合値の高い上位所定数の特徴フレームをサムネイルフレームとして決定するようにしてもよい。
図4に戻ってサムネイルフレーム決定の具体例を説明する。ここでサムネイルフレーム決定用の閾値を"10"とする。特徴フレームf1の第1の重要度は"1"、第2の重要度は"3"であるから統合値は"3"となり、閾値"10"より小さいため、特徴フレームf1はサムネイルフレームとされない。特徴フレームf2の第1の重要度は"8"、第2の重要度は"3"であるから統合値は"24"となり、閾値"10"より大きいため、特徴フレームf2はサムネイルフレームとして決定される。このようにして特徴フレームf2、f3,f5,f6,f8,f11,f13,f14がサムネイルフレームとして決定される。
[サムネイル表示枚数決定]
サムネイル表示枚数決定部118は、サムネイルフレーム決定部117より供給されたサムネイルフレーム総数などをもとに、総てのサムネイルフレームを時系列的に連続する複数のサムネイルフレームの集合からなるページの単位に分割するように、1画面に表示するサムネイル画像の数を「サムネイル表示枚数」として決定する。
図10はページ単位のサムネイル画像の配置方法を示す図である。同図に示すように、画面Dにおいて、それぞれサムネイル画像31は行列状に配置して表示される。行列内での時間の向きは、例えば、行列内の左上端の位置を(0,0)、右下端の位置を(R,C)として、(0,0)→(1,0)→(2,0)→・・・→(R,0)→(0,1)→(1,1)→・・・→(R,C)である。したがって、1画面に表示されるサムネイル画像の数(サムネイル表示枚数)はR×Cとなる。
次に、このサムネイル表示枚数決定部118によるサムネイル表示枚数の算定方法の一例を説明する。
図11はサムネイル表示枚数決定部118によるサムネイル表示枚数の算定手順を示すフローチャートである。図12は図11のサムネイル表示枚数の算定方法の説明図である。ここで、行数Rおよび列数Cはそれぞれの初期値が予め決められており、コンテンツ時間長に対応するページ数Pも予め決められている。
サムネイル表示枚数決定部118は、まず、動画コンテンツの時間長を入力する(ステップS201)。動画コンテンツの時間長の情報は、例えば、MPEG−2トランスポートストリームに映像信号に多重化されて配信されるSI(Service Information)、EIT(Event Information Table)などの番組情報の中に含まれている。情報処理装置100は、受信したMPEG−2トランスポートストリームに多重化されたデータ信号を分離し、デコードすることで動画コンテンツの時間長の情報を得ることができる。
次に、サムネイル表示枚数決定部118は、行数Rおよび列数Cそれぞれの初期値を設定するとともに、ページ数Pの初期値を設定する(ステップS302)。ここで、行数Rおよび列数Cそれぞれの初期値は予め決められた値である。ページ数Pの初期値も、例えば、コンテンツ時間長との相関により予め決められている。したがって、ステップS301で取得したコンテンツ時間長からページ数Pの初期値が得られる。
次に、サムネイル表示枚数決定部118は、サムネイルフレーム決定部117により決定されたサムネイルフレームの総数Fiを取得する(ステップS303)。そして、サムネイル表示枚数決定部118は、行数R、列数C、ページ数P、サムネイルフレームの総数Fiが以下の条件を満足するかどうかを判定する(ステップS304)。
Fi<=P×R×C ・・・(1)
条件を満足しない場合(ステップS304のNO)、サムネイル表示枚数決定部118は、図12に示すように、行数Rの値をインクリメントして(ステップS305)、上記の条件を満足するかどうかを再度判定する(ステップS306)。それでも条件を満足しない場合には、サムネイル表示枚数決定部118は、列数Cの値をインクリメントして(ステップS307)、上記の条件を満足するかどうかを再度判定する(ステップS308)。それでも条件を満足しない場合には、サムネイル表示枚数決定部118は、ステップS305に戻り、以降、条件を満足するまでステップS305からステップS308までの処理を繰り返す。
サムネイル表示枚数決定部118は、条件を満足すると、次式(2)によりページ数Pを再計算する(ステップS309)。
P=Fi/(R×C) 但し、Pは小数点を繰り上げる。 ・・・(2)
この計算されたPの値は、(現在画面に表示されているページ番号)/(ページ総数)の形式で画面に表示されるページ情報(例えば図16の符号33)の中のページ総数として用いられる。
以上のようにしてサムネイル表示枚数(R×C)が決定される。
ところで、1つのサムネイル画像の表示サイズを固定とした場合、サムネイル表示枚数(R×C)を増やすと、画面にページ単位の総てのサムネイル画像を表示しきれなくなる可能性がある。そこで、全体的なサムネイル表示領域が略一定となるように、サムネイル表示枚数(R×C)に応じて1つのサムネイル画像の表示サイズを可変にしてもよい。あるいは、サムネイル表示枚数(R×C)の上限値を予め決めておき、サムネイル表示枚数(R×C)が予め決められた上限値を超える場合には、ページ数Pを増やすようにしてもよい。
[表示サムネイルページの選択]
表示サムネイル選択部119は、図4に示したように、再生中の動画の時刻T1が表示中のサムネイル画像のページ1の時刻範囲にあるように表示するページ(以下「表示サムネイルページ」と記述する。)を選択する。したがって、例えば、図13に示すように、再生中の動画の時刻がTaからTbに進んでも、これら動画の2つの時刻Ta、Tbはいずれも同一のページ2の時刻範囲にあるので、表示サムネイルページは変化しないことになる。その後、例えば、図14に示すように、再生中の動画の時刻がTbからTcに進むと、この時刻Tcはページ3の時刻範囲にあるので、表示サムネイルページはページ2からページ3に変化する。このようにサムネイル画像はページの単位で切り替えて表示されるので、ユーザは表示サムネイルページ内での各々のサムネイル画像と表示位置とを自身の記憶の中で関連付けてシーンサーチを行うことができ、結果的にシーンサーチの効率を向上させることができる。
[サムネイル表示加工]
サムネイル表示加工部122は、表示サムネイル選択部119により選択された表示サムネイルページに属する各サムネイルフレームについて、静止画記録部121に記録された対応する静止画をベースにサムネイル画像を作成し、これらを表示サムネイル選択部119により供給された行列数の情報に従って行列状に並べた表示画像を生成する。また、サムネイル表示加工部122は、特徴フレームの重要度などをサムネイル画像の表示形態に反映させたり、システム状態と、ユーザからの操作情報によって、サムネイル画像の表示形態を個別に変えたりすることが可能である。これにより、シーンサーチを行うユーザは、サムネイル画像の中で重要度の高いものを即座に認識することができ、効率的にシーンサーチを行うことができる。
静止画からサムネイル画像を作成する処理の例としては次のようなものである。
・サムネイル表示加工部122は、静止画を単純縮小することによってサムネイル画像を生成する。
・サムネイル表示加工部122は、静止画の中央部のみ切り抜いて縮小したものをサムネイル画像とする。この場合、サムネイル表示加工部122は、静止画の中央部を、例えば縦横1:1比の正方形で切り抜いたり、縦横4:3比の矩形で切り抜いたり、サムネイル表示枚数に応じて最適な縦横比で切り抜いたものをサムネイル画像とする。
・サムネイル表示加工部122は、静止画から人の顔部分や、テロップなどの文字情報のように重要部分を矩形で切り抜き縮小したものをサムネイル画像として生成する。
特徴フレームの重要度をサムネイル画像の表示形態に反映させる処理の例としては次のようなものがある。図23は、特徴フレームの重要度をサムネイル画像の表示形態に反映させたシーンサーチ画面の例である。
・サムネイル表示加工部122は、重要度の高いサムネイル画像をカラー画像とし、重要度が低いサムネイル画像はモノクロ画像にするなど、重要度が低いものほど画像を表現する色情報を制限する。
・サムネイル表示加工部122は、重要度の高いサムネイル画像を鮮明な画像とし、重要度が低いサムネイル画像をぼかすなど、重要度が低いサムネイル画像ほど、強いぼかし処理をかける。
なお、サムネイル画像の表示形態に反映させる重要度は、第1の重要度であっても、第2の重要度であってもよい。もしくは第1の重要度と第2の重要度との積や和などの統合値であってもよい。
[サムネイル画像の表示形態]
次に、システム状態およびユーザからの操作情報によってサムネイル画像の表示形態を変更する処理の例を説明する。
サムネイル画像の表示形態に関係するシステム状態としては、例えば、通常再生状態と高速再生状態(高速サーチ)がある。通常再生時は、ページ単位のサムネイル画像が1倍速で再生された動画とともに表示される。高速再生(高速サーチ)時は、ページ単位のサムネイル画像が高速再生された動画とともに表示される。これらのシステム状態は、ユーザからの操作情報により更新される。ユーザからの操作情報には、例えば、ページ単位のサムネイル画像の中から1つのサムネイル画像を選択する操作情報、動画の再生速度を指示する操作情報などがある。動画の再生速度には、通常再生のための1倍速と、早送りや早戻し再生のためのN倍速がある。
サムネイル表示加工部122は、ユーザからの操作情報とシステム状態に基づいてサムネイル画像の表示形態を次のように変更することが可能である。
図15はシステム状態およびユーザからの操作情報と、サムネイル画像の表示形態との関係を示す図である。
通常再生時に、例えば、ユーザによる十字カーソルキー、マウス、あるいはタッチセンサーパネルなどの操作手段の操作により、任意の時刻のサムネイル画像が選択されると、このサムネイル画像の選択に関する操作情報がシステムコントローラ124を通じてサムネイル表示加工部122に通知される。サムネイル表示加工部122は、この操作情報をもとに、選択された時刻に対応するサムネイル画像の表示形態を表示形態Aから表示形態Bへと変更する。なお、サムネイル画像の表示をオフにして動画のみでのシーンサーチも行うことが可能である。
図16は、通常再生時のシーンサーチ画面の例を示す図である。同図に示すように、通常再生時のシーンサーチ画面には、行列状に配置された複数のサムネイル画像31とともに動画表示領域としての動画ウィンドウ32が表示される。なお、同図では、行列の左上端と右下端だけにサムネイル画像が存在しているように記載されているが、実際には行列中の全ての位置にサムネイル画像が表示されている。この行列状に配置された複数のサムネイル画像31において、ユーザによって任意のサムネイル画像が選択されたとき、そのサムネイル画像の表示形態が表示形態Aから表示形態Bに変更される。例えば、図16において、符号31aはユーザにより選択されたことで表示形態Bに変更されたサムネイル画像を示している。ここで、表示形態Aのサムネイル画像は、例えば、静止画の中央部から正方形または矩形の部分を切り抜き縮小して得られる画像などである。表示形態Bのサムネイル画像は、例えば、静止画をそのまま縮小した画像に外枠を付加することによって得られ、いわゆる「ホップアップ」と呼ばれる表示形態である。各表示形態A、Bのサイズの関係はB>Aである。
システムコントローラ124は、上記のように、サムネイル画像の選択に関する操作情報をサムネイル表示加工部122に通知する一方で、選択されたサムネイル画像の時刻情報を再生処理部112に通知する。再生処理部112は、動画ウィンドウ32に表示する動画の時刻をシステムコントローラ124より通知された時刻に切り替え、そのまま動画の通常再生を継続する。このように、通常再生時は、ユーザが任意のサムネイル画像を選択する操作を行うことによって、そのサムネイル画像の時刻へと動画をジャンプさせることができる。
図17は、通常再生時に動画の時刻の切り替えが発生してからユーザがサムネイル画像に対する操作を何もしないで所定の時間(数秒程度)が経過した時点でのシーンサーチ画面の例を示す図である。動画の時刻が切り替えられた後、ユーザからのシーンサーチに関する操作情報が何も入力されないままでいると、そのまま動画の再生が通常再生の速度で進んで行く。そしてシステムコントローラ124は、ユーザからの指示による動画の時刻の切り替えが発生してから所定時間が経過したところで、サムネイル表示加工部122に対して現在の動画の時刻を通知する。サムネイル表示加工部122は、システムコントローラ124から通知された動画の時刻に最も近いサムネイル画像を判定する。サムネイル表示加工部122は、判定したサムネイル画像がそれまでポップアップで表示されていたサムネイル画像以外である場合には、例えば図17に示すように、動画の時刻に最も近いサムネイル画像31bの表示形態を表示形態Aから表示形態Bに変更するとともに、それまでポップアップで表示されていたサムネイル画像の表示形態を表示形態Bから表示形態Aに変更する。このようにしてページ単位で表示される複数のサムネイル画像において、動画の時刻に最も近いサムネイル画像をポップアップで表示することができる。
上記のように、ポップアップで表示されたサムネイル画像は、動画の時刻に同期する「動画同期サムネイル画像」として、表示中の他のサムネイル画像に対して識別可能な形態で表示される。これにより、シーンサーチを行うユーザは、動画に同期するサムネイル画像を一目で捉えることができ、両方を参照しながら目的のシーンをサーチすることができる。さらに、ユーザは興味のあるサムネイル画像を見つけたなら、そのサムネイル画像を選択することによって、そのサムネイル画像の時刻に動画をジャンプさせ、動画からさらにそのシーン内容を確認することなどによっても効率的にシーンサーチを行うことができる。
図18は、動画の高速再生時のシーンサーチ画面の例を示す図である。動画の高速再生時は、動画の時刻に最も近いサムネイル画像を含む1行分のサムネイル画像31cが表示形態Cで表示される。この1行分のサムネイル画像31cは、例えば、上記1行分のサムネイルフレームについて、静止画の中央部から正方形または矩形の部分を切り抜き縮小して互いに連結し、さらにこの連結画像に外枠が付加されることによって得られる。なお、動画の高速再生時も、ポップアップで表示された1行分のサムネイル画像31c以外のサムネイル画像31の表示形態には表示形態Aが採用される。各表示形態A、Cのサイズの関係はC>Aである。
[ポップアップ表示の移動速度制御]
ところで、時間的に隣り合うサムネイルフレームの時刻間の差は様々であることから、動画の通常再生時や高速再生時にサムネイル画像のポップアップ表示の移動速度は一定とならないことが普通である。
図19は、動画の高速再生時にポップアップ表示の移動速度が一定とならない場合を説明する図である。ここでaからjは時間軸上のサムネイルフレームの時間位置を示している。時間的に隣り合う2つのサムネイルフレームの時間位置の間の距離(時間間隔)は様々であるが、ここでは仮にa−b間、b−c間、c−d間の距離を2(秒)とし、d−e間、e−f間、f−g間の距離を6(秒)とし、g−h間、h−i間、i−j間の距離を4(秒)とする。1行分のサムネイル画像の数は3とし、1行目はa,b,cの3つのサムネイル画像で構成され、2行目はd,e,fの3つのサムネイル画像で構成され、3行目はg,h,iの3つのサムネイル画像で構成されることとする。ユーザによって指定された再生速度は3倍速とする。
ポップアップ表示される行は時間の経過に従って1行目、2行目、3行目の順に移動する。このとき動画の再生速度が3倍速で一定である場合、
1行目のポップアップ表示時間t1は2秒(=(2+2+2)/3))、
2行目のポップアップ表示時間t2は6秒(=(6+6+6)/3))、
3行目のポップアップ表示時間t3は4秒(=(4+4+4)/3))とそれぞれ計算される。
すなわち、単位時間当たりのサムネイルフレームの数によってポップアップ表示時間が違ってくる。ユーザによるシーンサーチは各サムネイル画像に対して平均的な重みで行われることが好ましい場合が多く、サムネイル画像毎のポップアップ表示時間の長短はユーザに違和感を与えるおそれがある。そこで、ポップアップ表示の移動速度が一定となるように、再生処理部112にて動画の再生速度を制御する方法が考えられる。次に、この方法を説明する。
図20は、ポップアップ表示の移動速度が一定となるように動画の再生速度を制御する方法を説明する図である。ここで、aからjの時間軸上のサムネイルフレームの時間位置、時間的に隣り合う2つのサムネイルフレームの時間位置の間の距離(時間間隔)、ユーザによって設定された再生速度はいずれも図17の条件と同じである。但しこの方法では、行毎のポップアップ表示時間が予め設定されている。ポップアップ表示時間の設定値はユーザにより変更可能である。ここでは、ポップアップ表示時間を4(秒)とする。
aのサムネイルフレームの時間位置からdのサムネイルフレームの時間位置直前までの動画の再生速度v1は1.5倍速(=(2+2+2)/4)、
dのサムネイルフレームの時間位置からgのサムネイルフレームの時間位置直前までの動画の再生速度v2は4.5倍速(=(6+6+6)/4)、
gのサムネイルフレームの時間位置からjのサムネイルフレームの時間位置直前までの動画の再生速度v3は3.0倍速(=(4+4+4)/4)と計算される。
このように単位時間当たりのサムネイルフレームの数とは無関係にポップアップ表示の移動速度を一定にすることができる。
なお、ここでは1行分のサムネイル画像がポップアップで表示される場合のポップアップ表示の移動速度を一定する場合について説明したが、1つずつサムネイル画像がポップアップで表示される場合にも、ポップアップ表示の移動速度を一定にするように再生速度を制御してもよい。また、ここでは早送り再生の場合について説明したが、早戻し再生の場合も同様である。
次に、ポップアップ表示対象の複数のサムネイルフレームが複数ページに跨る場合について説明する。この場合、サムネイル表示加工部122は、ポップアップ表示対象のサムネイルフレーム数がより多い方のページに属するポップアップ表示対象のサムネイルフレームのみを有効とする。例えば、図21に示すように、ポップアップ表示数として3が判定された場合で、かつ動画の時刻に最も近いサムネイルフレームがページの先頭(または最後)にあるような場合、サムネイル表示加工部122は、ページNに属するポップアップ表示対象のサムネイルフレーム35−2、35−3のみを有効として、これらのサムネイル画像31gを生成する。ポップアップ数が5以上の奇数である場合においても同様である。複数ページに跨るポップアップ表示対象のサムネイルフレーム数が偶数である場合にも、予め決められた前後一方のページに属するサムネイルフレームのみを有効とすればよい。
なお、再生速度に応じてポップアップ表示数の制御が行われる場合、ポップアップ表示対象として判定された複数のサムネイルフレームが複数の行に跨る場合がある。このような場合、サムネイル表示加工部122は、図22に示すように、そのまま複数の行に跨った状態にて、全てのサムネイルフレームに対応するサムネイル画像31hをポップアップで表示する。
以上説明したように、本実施形態によれば、特徴フレーム毎に、特徴の強さを反映した第1の重要度とユーザがサーチで見逃している可能性の高さを反映した第2の重要度とからサムネイル化する特徴フレームが決定されるので、ユーザに良好なシーンサーチ環境を提供することができる。
<第2の実施形態>
次に、本発明の第2の実施形態を説明する。
本実施形態は、ユーザ情報処理が第1の実施形態と異なるものである。すなわち、第1の実施形態では、各々の特徴フレームに対して、ユーザ操作ログをもとにユーザがサーチで見逃している可能性の高さに応じた第2の重要度を与えることとした。これに対して第2の実施形態では、特徴フレームの画音の特徴データとユーザの嗜好データとのマッチングにより得られる相関度の高さに応じて第2の重要度を計算することとしている。
図24は第2の実施形態に係る情報処理装置200の構成を示すブロック図である。同図において、図1と対応するもしくは同一の部分には、200番台の対応する符号を付してある。ユーザ嗜好データ処理部228は、第1の実施形態におけるユーザ操作ログ処理部126に代わるものである。ユーザ嗜好データ処理部228は、I/F部223を使ってユーザより入力された嗜好データを受け入れてユーザ嗜好データ記録部229に記録する処理を行う。ユーザ嗜好データ記録部229は第1の実施形態におけるユーザ操作ログ記録部127に代わるものであり、ユーザの嗜好データの記録保存が行われる領域である。ユーザ情報処理部225は、第1の実施形態におけるユーザ情報処理部125に代わるものである。ユーザ情報処理部225は、特徴フレームの画音の特徴データと、ユーザ嗜好データ記録部229に保存されたユーザの嗜好データとのマッチングにより得られる相関度の高さに応じてその特徴フレームの第2の重要度を計算する。図24におけるその他のブロックの機能は第1の実施形態の図1と同様である。
[ユーザの嗜好データの記録]
次に、ユーザの嗜好データの設定について説明する。
例えば、ユーザ嗜好データ処理部228はI/F部223を通じてユーザに嗜好データ入力用の画面を、画像や音声などによる嗜好データ入力用のガイダンスとともに提供する。このガイダンスに従ってユーザは、嗜好データ入力用の画面に対して自分の興味ある事物のデータをI/F部223を通じて入力することができる。ユーザ嗜好データ処理部228はその入力データをユーザ嗜好データとして受け入れてユーザ嗜好データ記録部229に記録する。
ところで、ユーザによる嗜好データの選択と入力をさらに容易にするために、ユーザの嗜好データのカテゴリは階層化されている。例えば、最上位のカテゴリは、動画コンテンツを対象としたカテゴリと、コマーシャルを対象としたカテゴリとに別けられている。動画コンテンツを対象としたカテゴリは、さらにオブジェクト、トピック、ハイライトなどの下位のカテゴリに別けられ、オブジェクト、トピック、ハイライトなどの各カテゴリもそれぞれ、より具体的な下位のカテゴリに別けられている。さらに下位のカテゴリに別けられてもよい。ユーザは、各々の最下位カテゴリに自分が興味のある事物のデータをI/F部223を通じて入力することができる。ユーザからのデータ入力は、ユーザからの事物に関するテキストデータの直接入力による方式と、予め用意されていた候補データの中からの選択による方式がある。これによりユーザは、カテゴリ毎に自分の好みの事物のデータを容易に入力することができる。なお、トピックの嗜好データとは、ユーザが興味のある、例えば、時事問題、スポーツ競技の種類、天気予報といったものである。ハイライトの嗜好データは、例えば、野球・サッカーの得点シーン、相撲の取り組み中のシーン、陸上・体操競技の競技中シーンといったものである。コマーシャルを対象としたカテゴリも同様に階層化されている。コマーシャルの嗜好データは、具体的には、興味のある製品、人物などである。
[ユーザの嗜好データを用いたユーザ情報処理]
ユーザ情報処理部225は、特徴フレームの画音の特徴データと、ユーザ嗜好データ記録部229に保存されたユーザの嗜好データとのマッチングにより得られる相関度の高さに応じてその特徴フレームの第2の重要度を計算する。
図25は、ユーザ情報処理部225による特徴フレームの第2の重要度の計算例を示す図である。既にユーザ嗜好データ記録部229には、ユーザより、例えば、前述したカテゴリ別の嗜好データの入力ガイダンスに従って、人物のカテゴリの嗜好データとして"鈴木○○"と"山田××"が記録され、食べ物のカテゴリの嗜好データとして"メロン"が記録され、トピックのカテゴリの嗜好データとして"国会"と"天気予報"が記録され、コマーシャルのカテゴリの嗜好データとして"TV(テレビジョン)"が記録されているものとする。
このような嗜好データが設定されていた場合のユーザ情報処理の例を次に説明する。
なお、この動作の説明では、説明の簡単のため、第2の重要度を"低"、"中"、"高"の3段階に求める場合を示している。"低"、"中"、"高"は実際には数値データである。また、特徴フレームの画音の特徴データと嗜好データとで一致したカテゴリ数を相関度とし、一致したカテゴリ数が"2"以上の特徴フレームの第2の重要度を"高"、一致したカテゴリ数が"1"の特徴フレームの第2の重要度を"中"、一致したカテゴリ数が"0"の特徴フレームの第2の重要度を"低"と判定されるように処理のアルゴリズムが決められていることとする。
特徴フレームf1の特徴データにはユーザの嗜好データと一致するものが何も含まれてなく、つまり一致したカテゴリ数は"0"であることから、ユーザ情報処理部225は、特徴フレームf1の第2の重要度として"低"を判定する。
特徴フレームf2の特徴データには、ユーザの嗜好データ中の"天気"が含まれており、一致したカテゴリ数は"1"であることから、ユーザ情報処理部225は、特徴フレームf2の第2の重要度として"中"を判定する。
特徴フレームf3の特徴データには、ユーザの嗜好データ中の"国会"と"鈴木○○"が含まれており、一致したカテゴリ数は"2"であることから、ユーザ情報処理部225は、特徴フレームf3の第2の重要度として"高"を判定する。
特徴フレームf4の特徴データには、ユーザの嗜好データ中の"TV"と"山田××"が含まれており、一致したカテゴリ数は"2"であることから、ユーザ情報処理部225は、特徴フレームf4の第2の重要度として"高"を判定する。
特徴フレームf5の特徴データには、ユーザの嗜好データ中の"メロン"が含まれており、一致したカテゴリ数は"1"であることから、ユーザ情報処理部225は、特徴フレームf5の第2の重要度として"中"を判定する。
特徴フレームf6の特徴データにはユーザの嗜好データと一致するものが何も含まれてなく、つまり一致したカテゴリ数は"0"であることから、ユーザ情報処理部225は、特徴フレームf6の第2の重要度として"低"を判定する。
特徴フレームf7の特徴データにはユーザの嗜好データと一致するものが何も含まれてなく、つまり一致したカテゴリ数は"0"であることから、ユーザ情報処理部225は、特徴フレームf7の第2の重要度として"低"を判定する。
以上のように本実施形態によれば、特徴フレーム毎に、特徴の強さを反映した第1の重要度とユーザの嗜好との相関を反映した第2の重要度とからサムネイル化する特徴フレームが決定されるので、ユーザに良好なシーンサーチ環境を提供することができる。
<第3の実施形態>
次に、本発明の第3の実施形態を説明する。
本実施形態は、第1の実施形態と第2の実施形態とを組み合わせたもので、すなわち本実施形態の情報処理装置は、ユーザ操作ログ情報をもとにする第2の重要度と、特徴フレームの特徴データとユーザ嗜好データとの相関度をもとにする第2の重要度をそれぞれ暫定的な第2の重要度として計算し、それぞれの暫定的な第2の重要度を統合した結果を最終的な第2の重要度として求める。
図26は第3の実施形態に係る情報処理装置300の構成を示すブロック図である。同図において、図1および図2と対応するもしくは同一の部分には、300番台の対応する符号を付してある。同図に示すように、本実施形態に係る情報処理装置300は、第1の実施形態におけるユーザ操作ログ処理部126に相当するユーザ操作ログ処理部326、第1の実施形態におけるユーザ操作ログ記録部127に相当するユーザ操作ログ記録部327、第2の実施形態におけるユーザ嗜好データ処理部228に相当するユーザ嗜好データ処理部328、第2の実施形態におけるユーザ嗜好データ記録部229に相当するユーザ嗜好データ記録部329を有する。
ユーザ情報処理部325は、第1の実施形態におけるユーザ情報処理部125、第2の実施形態におけるユーザ情報処理部225に代わるものである。ユーザ情報処理部325は、ユーザ操作ログ記録部327に保存されたユーザ操作ログ情報をもとに特徴フレーム毎の第2の重要度を、ユーザ操作ログ情報をもとにする暫定的な第2の重要度として算出する。また、ユーザ情報処理部325は、特徴フレームの画音の特徴データと、ユーザ嗜好データ記録部329に保存されたユーザの嗜好データとのマッチングにより得られる相関度の高さに応じてその特徴フレームの第2の重要度を、特徴フレームの特徴データとユーザ嗜好データとの相関度をもとにする暫定的な第2の重要度として算出する。そして、ユーザ情報処理部325は、それぞれの暫定的な第2の重要度をもとに最終的な第2の重要度を求める。図26におけるその他のブロックの機能は第1の実施形態および第2の実施形態と同様である。
図27は、ユーザ情報処理部325による特徴フレームの最終的な第2の重要度の計算例を示す図である。説明の簡単のため、ここでは第2の重要度が"低"、"中"、"高"の3段階に得られる場合を示している。"低"、"中"、"高"は実際には数値データであり、例えば、低=1、中=4、高=8とする。
特徴フレームf1のユーザ操作ログに基づく暫定的な第2の重要度は"低=1"であり、特徴フレームの特徴データとユーザ嗜好データとの相関度に基づく暫定的な第2の重要度も"低=1"である。ユーザ情報処理部325は、例えば、それぞれの暫定的な第2の重要度の積を最終的な第2の重要度として求めることとした場合、当該特徴フレームf1の最終的な第2の重要度は"1"と求められる。
特徴フレームf2のユーザ操作ログに基づく暫定的な第2の重要度は"中=4"であり、特徴フレームの特徴データとユーザ嗜好データとの相関度に基づく暫定的な第2の重要度は"高=8"である。したがって、当該特徴フレームf2の最終的な第2の重要度は"32"と求められる。
特徴フレームf3のユーザ操作ログに基づく暫定的な第2の重要度は"高=8"であり、特徴フレームの特徴データとユーザ嗜好データとの相関度に基づく暫定的な第2の重要度は"高=4"である。したがって、当該特徴フレームf3の最終的な第2の重要度は"32"と求められる。以下同様に最終的な第2の重要度が求められる。
なお、上記の説明では、それぞれの暫定的な第2の重要度の積を最終的な第2の重要度として求めることとしたが、それぞれの暫定的な第2の重要度の和を最終的な第2の重要度として求めるようにしてもよい。
以上のように本実施形態によれば、特徴フレーム毎に、特徴の強さを反映した第1の重要度と、ユーザがサーチで見逃している可能性の高さならびにユーザの嗜好との相関を反映した第2の重要度とからサムネイル化する特徴フレームが決定されるので、ユーザに良好なシーンサーチ環境を提供することができる。
<変形例1>
[サムネイル間引き処理を伴う表示サムネイルページの選択]
表示サムネイル選択部119は、動画の早送り、早戻しなどの高速再生中も、再生中の動画の時刻に最も近い最近サムネイルフレームを含むページを表示サムネイルページとして選択し、選択した表示サムネイルページから、再生速度情報(サーチ速度情報)に応じて一部のサムネイルフレームを間引きしてサムネイル表示枚数を減らすようにしてもよい。より具体的には、表示サムネイル選択部119は、再生速度が高いほど間引き率を上げてサムネイル表示枚数を少なくする。
図28はサムネイル間引き処理の例を示す図である。
ここで、サムネイル表示枚数は8×8=64とする。通常再生時、表示サムネイル選択部119は、間引きは行わずに64個全てのサムネイルフレームの情報をサムネイル表示加工部122に出力する。その結果、画面に64個のサムネイル画像が8×8の行列状に配置して表示される。ユーザより再生速度情報(サーチ速度情報)を含む早送り再生または早戻し再生の指示がシステムコントローラ124に入力されると、システムコントローラ124から再生処理部112にその指示が与えられる。再生処理部112は、指示された速度で動画の早送りまたは早戻し再生を実行する。また、システムコントローラ124は、表示サムネイル選択部119にも再生速度情報(サーチ速度情報)を送出する。表示サムネイル選択部119は、入力された再生速度情報をもとに次のようにしてサムネイルフレームの間引き処理を行う。
表示サムネイル選択部119は、8×8の行列に割り当てられる各サムネイルフレームについて、画音特徴判定部116にて得られた特徴フレームの重要度の、行単位の和および列単位の和を計算する。ここで重要度は、第1の重要度であっても、第2の重要度であってもよい。もしくは第1の重要度と第2の重要度との積や和などの統合値であってもよい。表示サムネイル選択部119は、行単位の重要度の和が最も低い下位q個の行を判定するとともに、列単位の重要度の和が最も低い下位q個の列を判定する。ここで、qの値は、再生速度(サーチ速度)に応じて予め決められた値であり、再生速度(サーチ速度)に比例して大きくなる値である。図29の例では、q=2とした。表示サムネイル選択部119は、判定したq個の行とq個の列を8×8の行列から間引き、この結果残った6×6の行列分のサムネイルフレームの情報をサムネイル表示加工部122に供給する。
図29は、表示サムネイル選択部119による表示サムネイルページの選択からサムネイル間引き処理までのフローチャートである。
表示サムネイル選択部119は、サムネイル表示枚数決定部118にて決定されたサムネイル表示枚数M、行数R、列数Cの情報を取得する(ステップS401)。続いて、表示サムネイル選択部119は、各々のサムネイルフレームの情報(時刻情報)を取得し(ステップS402)、これらの情報とサムネイル表示枚数決定部118にて決定されたページ数Pの情報とから、各サムネイルフレームをページ別にページ分けする(ステップS403)。
次に、表示サムネイル選択部119は、システムコントローラ124より、再生中の動画の時刻の情報を取得し(ステップS404)、再生中の動画の時刻が表示サムネイルページの時刻範囲内にあるように表示サムネイルページを決定する(ステップS405)。
次に、表示サムネイル選択部119は、ユーザにより指定された動画の再生速度情報(サーチ速度情報)を取得し(ステップS406)、その速度が通常再生速度(1倍速)である場合(ステップS407のNO)、決定した表示サムネイルページに属するサムネイルフレームの情報、行数および列数の各情報をサムネイル表示加工部122に出力する(ステップS411)。この後も表示サムネイル選択部119は、再生中の動画の時刻を監視して、表示サムネイルページの決定と、決定した表示サムネイルページに属するサムネイルフレームの情報、行数および列数の各情報のサムネイル表示加工部122への出力を繰り返す。
また、ユーザにより指定された動画の再生速度が高速(早送り・早戻し)である場合(ステップS407のYES)、表示サムネイル選択部119においてサムネイルの間引き処理が次のように実行される。まず、表示サムネイル選択部119は、ユーザにより指定された動画の再生速度から、予め決められたルールに従ってサムネイルの間引き数(qの値)を決定する(ステップS408)。続いて、表示サムネイル選択部119は、表示サムネイルページに属するそれぞれサムネイルフレームについて、画音特徴判定部116にて得られた特徴フレームの重要度の、行単位の和および列単位の和を計算する(ステップS409)。
次に、表示サムネイル選択部119は、行単位の重要度の和が最も低い下位q個の行と列単位の重要度の和が最も低い下位q個の列を間引き対象の行および列として判定する(ステップS410)。そして、表示サムネイル選択部119は、ステップS405で決定された表示サムネイルページに属するサムネイルフレームから、間引き対象の行および列に対応するサムネイルフレームを除いた表示対象のサムネイルフレームの情報と、初期の行数からqの値を差し引いた行数の情報、さらには初期の列数からqの値を差し引いた列数の情報をサムネイル表示加工部122に出力する(ステップS411)。
以上のように、動画の再生速度に応じてサムネイルフレームの間引きを行うことで、シーンサーチにおいてユーザの意図する精細度を、動画の再生速度と1画面でのサムネイル画像の表示数の両方に反映させることができる。また、行および列の単位でサムネイルフレームの間引きを行うことで、再生速度の変更の前後で、行列内での各サムネイル画像の位置関係が大きく変動することを回避できる。これにより、動画の再生速度(サーチ速度)が異なる各状況下で、同一のサムネイル画像をユーザが容易に発見できるようになり、操作性の向上を期待できる。
以上の実施形態では、特徴フレームの特徴の強さを反映した第1の重要度とユーザがサーチで見逃している可能性の高さを反映した第2の重要度とからサムネイル化する特徴フレームが決定されることとした。しかしながら、本発明は、ユーザがサーチで見逃している可能性の高さを反映した第2の重要度のみからサムネイル化する特徴フレームを決定するものとして応用することが可能である。あるいは、ユーザの嗜好との相関度を反映した第2の重要度のみからサムネイル化する特徴フレームを決定するものとして応用し得る。
その他、本発明は、上述の実施形態および変形例に限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々更新を加え得ることは勿論である。
100…情報処理装置
111…映像・音声信号記録部
112…再生処理部
113…表示処理部
114…特徴フレーム抽出部
115…特徴フレーム情報記録部
116…画音特徴判定部
117…サムネイルフレーム決定部
118…サムネイル表示枚数決定部
119…表示サムネイル選択部
120…静止画作成部
121…静止画記録部
122…サムネイル表示加工部
123…I/F部
124…システムコントローラ
125…ユーザ情報処理部
126…ユーザ操作ログ処理部
127…ユーザ操作ログ記録部

Claims (7)

  1. 複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、
    前記特徴フレーム毎の重要度を算出する重要度算出部と、
    前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部と、
    前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択する選択部と、
    前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示するサムネイル画像表示部と、
    前記ユーザより入力された第1の操作情報を記録する操作情報記録部とを具備し、
    前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与える
    情報処理装置。
  2. 請求項1に記載の情報処理装置であって、
    前記動画を再生可能な再生処理部と、
    前記ユーザより入力された第2の操作情報をもとに前記再生処理部に前記動画の再生を開始させる制御部とをさらに具備し、
    前記操作情報記録部は、前記第2の操作情報をさらに記録し、
    前記重要度算出部は、前記記録された第2の操作情報をもとに、前記動画として再生されたことのない時間範囲の1以上の前記特徴フレームが、前記動画として再生されたことのある時間範囲の1以上の前記特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与える
    情報処理装置。
  3. 請求項2に記載の情報処理装置であって、
    前記抽出された特徴フレームの特徴に応じた特徴重要度を算出する特徴重要度算出部をさらに具備し、
    前記決定部は、前記算出された特徴重要度と、前記重要度算出部により算出された重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する
    情報処理装置。
  4. 請求項3に記載の情報処理装置であって、
    ユーザの嗜好データが記録される嗜好データ記録部をさらに具備し、
    前記重要度算出部は、前記特徴フレーム抽出部により抽出された前記特徴フレームの特徴データと前記嗜好データ記録部に記録された前記嗜好データとの相関度を加味して前記特徴フレームに重要度を与える
    情報処理装置。
  5. 特徴フレーム抽出部が、複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出し、
    決定部が、前記特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定し、
    選択部が、前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択し、
    サムネイル画像表示部が、前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示し、
    操作情報記録部が、前記ユーザより入力された第1の操作情報を記録し、
    前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与える
    情報処理方法。
  6. 複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、
    前記特徴フレーム毎の重要度を算出する重要度算出部と、
    前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部と、
    前記決定されたサムネイルフレームの中から、ユーザより入力された第1の操作情報をもとに1以上のサムネイルフレームを選択する選択部と、
    前記選択された1以上のサムネイルフレームに対応するサムネイル画像を表示するサムネイル画像表示部と、
    前記ユーザより入力された第1の操作情報を記録する操作情報記録部としてコンピュータを機能させ、
    かつ前記重要度算出部は、前記記録された第1の操作情報をもとに、前記サムネイル画像として表示されたことのない特徴フレームが表示されたことのある特徴フレームよりも優先的に前記決定部で前記サムネイルフレームとして決定されるようにそれぞれの前記特徴フレームに重要度を与えるようにコンピュータを機能させる
    プログラム。
  7. 複数のフレームを含む動画から特徴となる1以上のフレームを特徴フレームとして抽出する特徴フレーム抽出部と、
    ユーザの嗜好データが記録される嗜好データ記録部と、
    前記特徴フレーム毎の重要度を算出する重要度算出部と、
    前記重要度算出部により算出された特徴フレーム毎の重要度をもとに、前記抽出された1以上の前記特徴フレームの中の少なくとも一部の特徴フレームをサムネイルフレームとして決定する決定部とを具備し、
    前記重要度算出部は、前記特徴フレーム抽出部により抽出された前記特徴フレームの特徴データと前記嗜好データ記録部に記録された前記嗜好データとの相関度を求め、前記嗜好データとの前記相関度の高い特徴データを有する前記特徴フレームが、優先的に前記決定部で前記サムネイルフレームとして決定されるように当該特徴フレームに重要度を与える
    情報処理装置。
JP2010068264A 2010-03-24 2010-03-24 情報処理装置、情報処理方法、プログラム Pending JP2011203821A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010068264A JP2011203821A (ja) 2010-03-24 2010-03-24 情報処理装置、情報処理方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010068264A JP2011203821A (ja) 2010-03-24 2010-03-24 情報処理装置、情報処理方法、プログラム

Publications (1)

Publication Number Publication Date
JP2011203821A true JP2011203821A (ja) 2011-10-13

Family

ID=44880437

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010068264A Pending JP2011203821A (ja) 2010-03-24 2010-03-24 情報処理装置、情報処理方法、プログラム

Country Status (1)

Country Link
JP (1) JP2011203821A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014192755A (ja) * 2013-03-27 2014-10-06 Olympus Corp 画像記録装置、画像記録処理の制御方法及びそのプログラム
KR20150141059A (ko) * 2014-06-09 2015-12-17 삼성전자주식회사 동영상의 썸네일 영상을 제공하는 장치 및 방법
KR20200052253A (ko) * 2013-03-19 2020-05-14 삼성전자주식회사 디스플레이 장치 및 그의 액티비티에 대한 정보 디스플레이 방법
JP2020145762A (ja) * 2017-01-20 2020-09-10 株式会社ミクシィ 情報処理装置,情報処理装置の制御方法及び制御プログラム
JP2022176301A (ja) * 2020-06-12 2022-11-25 株式会社Mixi 情報処理装置,情報処理装置の制御方法及び制御プログラム

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20200052253A (ko) * 2013-03-19 2020-05-14 삼성전자주식회사 디스플레이 장치 및 그의 액티비티에 대한 정보 디스플레이 방법
KR102325040B1 (ko) * 2013-03-19 2021-11-11 삼성전자주식회사 디스플레이 장치 및 그의 액티비티에 대한 정보 디스플레이 방법
JP2014192755A (ja) * 2013-03-27 2014-10-06 Olympus Corp 画像記録装置、画像記録処理の制御方法及びそのプログラム
KR20150141059A (ko) * 2014-06-09 2015-12-17 삼성전자주식회사 동영상의 썸네일 영상을 제공하는 장치 및 방법
KR102209070B1 (ko) * 2014-06-09 2021-01-28 삼성전자주식회사 동영상의 썸네일 영상을 제공하는 장치 및 방법
JP2020145762A (ja) * 2017-01-20 2020-09-10 株式会社ミクシィ 情報処理装置,情報処理装置の制御方法及び制御プログラム
JP2022176301A (ja) * 2020-06-12 2022-11-25 株式会社Mixi 情報処理装置,情報処理装置の制御方法及び制御プログラム
JP7393691B2 (ja) 2020-06-12 2023-12-07 株式会社Mixi 情報処理装置,情報処理装置の制御方法及び制御プログラム

Similar Documents

Publication Publication Date Title
JP2011205217A (ja) 情報処理装置、情報処理方法、プログラム
US8793733B2 (en) Information processing apparatus, information processing method, and program for enabling computer to execute same method
US7990473B2 (en) Image processing apparatus, image processing method, and image processing program
JP2007013568A (ja) 電子機器、映像処理装置及び映像処理方法
KR20030017997A (ko) 이미지 시퀀스 내의 위치를 선택하기 위한 방법 및 시스템
EP1781027A2 (en) A display control device, and associated method of identifying content
JP4550725B2 (ja) 映像視聴支援システム
JP2011203821A (ja) 情報処理装置、情報処理方法、プログラム
JP2000350165A (ja) 動画像記録再生装置
JPH11220689A (ja) 映像ソフト処理装置及び同処理プログラム記録記憶媒体
JP6301616B2 (ja) 電子機器、電子機器の制御方法、及びシーン制御プログラム
JP4966917B2 (ja) 録画再生装置
JP4228316B2 (ja) 録画番組管理装置
EP2846272A2 (en) Electronic apparatus, method for controlling electronic apparatus, and information recording medium
JP4882687B2 (ja) 録画番組管理装置
JP5033653B2 (ja) 映像記録再生装置及び映像再生装置
JP4872401B2 (ja) 録画番組管理装置
JP2009118206A (ja) 録画再生装置
JPH1169281A (ja) 要約生成装置及び映像表示装置
JP2008020767A (ja) 記録再生装置および方法、プログラム、並びに記録媒体
KR101218921B1 (ko) 방송 수신기의 방송 프로그램 하이라이트 구간 처리 방법
JP5682167B2 (ja) 映像音声記録再生装置、および映像音声記録再生方法
JP2005328329A (ja) 映像再生装置と映像録画再生装置と映像再生方法
JP2000125243A (ja) 映像記録再生装置及び記録媒体
JP2009027430A (ja) 動画再生装置