WO2001003005A1

WO2001003005A1 - Appareil d'enregistrement d'informations de recherche d'images dynamiques et dispositif de recherche d'images dynamiques

Info

Publication number: WO2001003005A1
Application number: PCT/JP2000/004299
Authority: WO
Inventors: Shuichi Watanabe
Original assignee: Sharp Kabushiki Kaisha
Priority date: 1999-06-30
Filing date: 2000-06-29
Publication date: 2001-01-11
Also published as: EP1195692A1; US7884884B2; DE60036288T2; EP1195692B1; JP4027662B2; EP1835421A3; JP4462922B2; CN1371502B; CN1371502A; EP1195692A4; KR20020019482A; US7092040B1; EP1835421A2; ES2288859T3; KR100486047B1; JP2004104836A; US20060164560A1; DE60036288D1

Description

明細書動画像検索情報記録装置および動画像検索装置技術分野

本発明は、動画像を検索するための情報を記録する装置（動画像検索情報記録装置）および動画像を検索するための装置（動画像検索装置）に関し、より詳細には、動画像を構成する複数個のシーンの中から、所望のシ一ンを効率的に検索して取出すことを可能とする、動両像検索情報記録装置および動画像検索装置に関する。背景技術

コンピュータの性能の向上、記憶装置の大容量ィ匕、通信のためのインフラストラクチャ一の整備などにより、大量の画像をデータベース化しておき必要なときに必要な画像を配信するサービスなどが普及しつつある。画像をデジタル化する技術も普及しているため、個人で動画像のデータベースを構築することも可能である。

このように動画像をデータベース化すると、その中からいかにして所望の動画像を検索するかが問題となる。本発明は、そのような動画像の検索の技術の改良に関する。

本明細書において使用する「動画像」という用語は、 R G B (R e d , G r e e n , B l u e ) 信号からなる、加工されていない動画像データ、および M P E G (Moving Picture Experts Group) などのように、デジタルィ匕され、所定の動画圧縮方式によつて符号化された動画像デ一タの両者を含むものとする。

「シーン」という用語は、連統する複数の画像フレームからなる、動像の構成単位であって、例えば録画の開始から停止までの 1回の撮影で得られた動画像、または編集済みの動画像の中で、二つの編集点で両端を区切られた一連の動両像のことをいう。編集箇所がフェード、ディゾルブなどの特殊な効果を含んでいる場合も含む。一^ 3のシーンは複数個のシーンを含んでもよい。「シーンチェンジ点」とは、二つのシーンが切り替わる時間軸上の位置を指し、シーンが切替わった直後のシーンの先頭フレームを「シーンチェンジフレーム」とレ、う。

Γキ一フレーム」とは、検索などで利用される、各シーンまたは動画像全体を代表すなような特徴的なフレームをいう。

動画像データは、時間軸に沿つて変化する画像情報からなるコンテンツである。動画像データは、その全てが検索の対象となる。したがって、所望の動両像を検索するための最も単純な方法は、動画像の全体を見て所望の動画像を選ぶことである。しかし、動画像の全体を見るためにはある時間を要する。したがって、デ —タベースに登録されている動画像の数が増えると、所望の動画像を取出すために要する時間が極めて大きくなる。したがつてこの方法は現実的ではない。

効率的に動画像を検索するための一般的な方法では、予め各動画像の内容を代表する種々の検索のための情報（検索情報）を各動画像について用意し、これに基づレ、て所望の動画像を検索する。

検索情報として用いられる情報は、画像に付加された情報（付加情報）、画像の特性を表わす情報（特性情報）、および画像の概要を表わす情報（概要情報）を含む。付加情報は、動画像に附随して用意されるタイトルまたは説明文を含む。特性情報は、画像信号から導出される輝度値の頻度もしくはフレーム間での動き情報など. 画像の特性を表わす情報を含む。概要情報は、画像の特性情報または外部からの入力によって定められるシーンチェンジ点またはキ一フレームなどを含む。

上記した情報の中で、特性情報は特に便利でかつ重要である。たとえば動画像を代表するキーフレームは特性情報を利用して選択できる。特性情報は数値化することが容易で、所望の動画像の特性を特性情報の形で数値化すれば、要求された特性情報と一致する特性を有する動画像を抽出することも容易にできる。以下の説明では「検索情報」とはこの特性情報のことをいうものとする。

一般に動画像は複数個のシーンを含む。検索者が動画像を検索するのは、多くの場合、検索の対象となる 1または複数の動画像から、動画像中に含まれている所望のフレームまたは所望のシーンを発見するためである。検索情報を用いて動画像の中から所望のフレームまたはシーンを発見するための基本的な方法は、予め各フレームに関する検索情報または各シーンに関する検索情報を求めて記録しておき、これらに基づいてフレームまたはシーンの選択を行なうことである。この点に関し日本 M特開平 9— 2 8 4 7 0 2号公報には、シーンチェンジ点を検出するためのフレームの特徴量として、フレームごとの動きベクトルの総和、ならびに、フレームを構成する複数個の小領域の、フレーム内およびフレーム間の連続度を用いる装置および方法が開示されている。

また日本国特開平 7— 3 8 8 4 2号公報には、各シーン内の動きべクトルの大きさの平均値および画像の色ヒストグラムをシーンの特徴量として用いて、各シ —ンの代表画像を画像ィンデックスとして表示する際の制御方法が開示されている。

こうした従来技術を考慮して、動画像を検索するための情報を記録するための装置（動画像検索情報記録装置）および動画像を検索するための装置（動画像検索装置）を作成したとすれば、以下に示すようなものとなると考えられる。

図 1を参照して、想定された従来の動両像検索情報記録装置は、入力される動画像データを解析してシーンに分割し、シーンの分割位匱（シーンチェンジ）などの動画像の構造を表わす情報（動画像構造情報）を出力するための解析部 6 0 1と、解析部 6 0 1の出力と入力された動画像データとを受けるように接続され、解析部 6 0 1から出力された動画像構造情報および動画像データに基づいて、シーン内の各フレームに対応する動きべクトルの総和などの、画像の要約情報を検索情報として生成し、出力するフレーム単位の検索情報生成部 6 0 2と、フレーム単位の検索情報生成部 6 0 2の出力を受けるように接続され、フレーム単位の検索情報生成部 6 0 2から出力されるフレーム単位の要約情報に基づいて、あるシーンの全体に対する動きべクトルの大きさの平均値などの要約情報を検索情報として生成し出力するためのシーン単位の検索情報生成部 6 0 3と、解析部 6 0 1から出力される動画像構造情報、フレーム単位の検索情報生成部 6 0 2から出力される各フレーム単位の検索情報、およびシーン単位の検索情報生成部 6 0 3 から出力されるシ一ン全体に対する検索情報を、所定の形式に配置することにより、動画像に対応する検索情報を生成し出力するための動画像の検索情報生成部 6 0 4と、もとの動画像データと、動画像の検索情報生成部 6 0 4から出力される、動画像に対応する検索情報とを対応付けて記録媒体 6 0 6に記憶するための記録部 6 0 5とを含む。

なお、 1フレームは、動画像を時間的に分割した単位であると考えることができる。したがってフ I ^一ムは時間分割ブロックの一例と呼ぶことができる。

図 2を参照して、想定される従来の画像検索装置は、記録媒体 6 0 6から動画像検索情報および動画像データを読出すための読出部 7 0 1と、読出部 7 0 1から供給される各動画像検索情報を保持し、検索情報に対する要求を受けて、シーン単位の検索情報またはフレーム単位の検索情報を動画像の構造情報とともに出力するための検索情報管理部 7 0 2と、シーン単位の検索の要求を受けて、検索情報管理部 7 0 2にシーン単位の検索情報と動画像構造情報とを要求し、受取つたシーン単位の検索情報と動画像構造情報とに基づいて、検索要求に合致したシーンを検出して、検出されたシーンに関する情報を出力するためのシーン単位の検索実行部 7 0 3と、フレーム単位の検索の要求を受けて、検索情報管理部 7 0 2に対してシーン内のフレーム単位の検索情報おょぴ動画像構造情報を要求し、受取ったシーン内のフレーム単位の検索情報および動画像情報に基づいて、検索要求に合致したシーンまたはフレームを検出して、検出されたシーンまたはフレ —ムに関する情報を出力するためのフレーム単位の検索実行部 7 0 4と、シーン単位の検索実行部 7 0 3およびフレーム単位の検索実行部 7 0 4から出力される、検出されたシ一ンに「する情報または検出されたフレームに関する情報に基づレ、て、それら検出されたシーンまたはフレームに対応する画像データを読出部 7 0 1を介して取出し、出力するためのデータ管理部 7 0 5と、オペレータから与えられる検索指示に応答し、検索要求をシーン単位の検索実行部 7 0 3またはフレ —ム単位の検索実行部 7 0 4に与え、データ管理部 7 0 5から与えられる動画像データを検索結果として表示する処理を繰返し、検索終了時には検索結果を出力するための検索制御部 7 0 6とを含む。

図 1に示される装置は以下のように動作することが想定される。動画像データが入力されると、解析部 6 0 1がその動両像データをシーン単位に分割する。解析部 6 0 1はまた、動画像構造情報を出力する。フレーム単位の検索情報生成部 6 0 2は、解析部 6 0 1力出力された動画像構造情報および動画像データに基づいて、シーン内のフレームに対応する要約情報を生成する。フレーム単位の検索情報生成部 6 0 2はさらに、こうして生成された要約情報をシーン単位の検索情報生成部 6 0 3および動画像の検索情報生成部 6 0 4に検索情報として出力する。

シーン単位の検索情報生成部 6 0 3は、フレーム単位の検索情報生成部 6 0 2 から与えられたフレーム単位の要約情報に基づき、シーン全体に対する要約情報を生成する。シーン単位の検索情報生成部 6 0 3はさらに、こうして生成された要約情報をシーン単位の検索情報生成部 6 0 3に検索情報として与える。

動画像の検索情報生成部 6 0 4は、解析部 6 0 1から動画像構造情報を、フレーム単位の検索情報生成部 6 0 2からフレーム単位の検索情報を、シーン単位の検索情報生成部 6 0 3からシーン全体のための検索情報をそれぞれ受け、所定の形式で配置して動画像に対応する検索情報を生成する。動画像の検索情報生成部 6 0 4は、こうして生成された、動画像に対応する検索情報を記録部 6 0 5に与える。

記録部 6 0 5は、もとの動画像データと、動画像の検索情報生成部 6 0 4から与えられた検索情報とを記録媒体 6 0 6に記録する。このとき記録部 6 0 5は、記録される動画像データと検索情報とが対応していることを示す情報を動画像デ —タまたは検索情報のレ、ずれか一方または双方に付加する力、または動画像デ一タおよび検索情報とは別に記録する。

図 2を参照して、従来の検索装置は以下のように動作することが想定される。検索の開始時に、オペレータは検索制御部 7 0 6に対して検索指示を与える。検索制御部 7 0 6は、この検索指示に応答してシーン単位の検索、またはフレーム単位の検索のいずれかを選択する。

たとえばシーン単位の検索が選択されたものとする。すると、検索制御部 7 0 6はシーン単位の検索実行部 7 0 3に対して検索の要求を与える。シーン単位の検索実行部 7 0 3はこの要求に応答して、検索情報管理部 7 0 2に対してシーン単位の検索情報と動画像構造情報とを要求し、検索情報管理部 7 0 2から出力されたシ一ン単位の検索情報と動画像情報とを受取る。シーン単位の検索実行部 7 0 3は、このシーン単位の検索情報と動画像構造情報とに基づいて、検索制御部 7 0 6から与えられた検索要求に合致したシーンを検出する。そしてシーン単位の検索実行部 7 0 3は、検出されたシーンに関する情報をデータ管理部 7 0 5に対して出力する。

データ管理部 7 0 5は、シーン単位の検索実行部 7 0 3から与えられたシーンに関する情報に基づいて、対応する画像データを読出部 7 0 1を介して記録媒体 6 0 6から読出し、検索制御部 7 0 6に与える。

検索制御部 7 0 6は、この画像データを表示する。オペレータは、表示された画像データを見て、次の検索方針を決め、次の検索指示を検索制御部 7 0 6に与える。以下、同様の処理が繰返される。

こうして、オペレータが取出したいと考えていた画像が ¾出されると検索は終了する。検索結果は検索制御部 7 0 6から出力される。

従来の技術では、シーンに関する検索情報は、そのシーンに含まれるフレーム単位の検索情報に基づいて生成されている。これは、シーンを構成する最小の単位はフレームであると一般的に認識されていることによる。

このように個々のフ L ^一ム単位の検索情報に基づいてシーンの検索情報を生成すると、各フレームを小領域に分割して得られる、各フレーム内の空間的な特徴 (画面分割プロック単位の検索情報）を検索情報として利用することができる。しかし、これらの従来の装置では時間軸上である長さを有するシ一ン全体にわたる、画像の空間的な特徴を极うことができないという問題がある。この明細書では. このようにシーン全体にわたる、画像の空問的な特徴を Γ空間分割ブロック単位の検索情報 J と呼ぶ。

たとえば、画面の中央部に激しく動く物体が映っている、という特徴を有するシーンを取出そうとする場合を考える。従来の技術では、このようなシーンをシーン単位の検索情報から検索することができず、各シーンに含まれる各フレームに付加された検索情報まで降りて検索する必要がある。そのため従来の技術では、そのような検索は効率が極めて低くなる。

本発明は、従来技術の、上記したような問題点に鑑みてなされたものであり、シーンの特徴を的確に表わす新たな指標を用いて動画像検索を効率的に行なうこ 01 とを可能とする動画像の検索情報を記録する装置および動画像を検索するための装置を提供することを目的とする。

本発明の他の目的は、シーンを時間的なプロンクに分割してその特徴を抽出するだけでなく、シーンを、時間軸上では分割せず、空間的にのみ分割してシーンの別の特徴を抽出することにより、動画像の検索を効率的に行なうことを可能とする、動画像検索情報記録装置および動画像検索装置を提供することである。本発明のさらに他の目的は、シーンの特徴を的確に表わす新たな指標を用いて動画像の検索を効率的に行なうことが可能で、かつ検索のための情報の情報量が少なくて済む、動画像検索情報記録装置および動画像検索装置を提供することである。発明の開示

本発明にかかる動画像検索情報記録装置は、動画像データと、動画像データにより表わされる動画像を時間軸上で 1以上の時間軸上の部分動画像に分割する動画像構造情報とに基づいて、 1以上の部分動画像の各々に対応して検索情報を生成する検索情報生成部と、検索情報と動画像構造情報とを、対応する動画像デ一タとともに記録媒体に記録する記録部とを含む。検索情報生成部は、 1以上の時間軸上の部分動画像の各々を空間的に分割することにより得られる丄以上の空間的部分動画像の要約情報を生成するための第 1の要約情報生成部を含む。

B 間軸上の部分動画像の各々を空間的に分割することにより得られる空間的部分動画像から要約情報が生成される。この要約情報は、本発明で新たに導入されたものであり、時間軸上の部分動画像の中の、時間的な一部から得られるのではない。この要約情報は、空間的には画像の一部のみの、しかし時間軸上では部分動画像の全体にわたる空間的部分動画像から得られる。したがって、この要約情報は、ある部分動画像の時間的な全体を通じた、その部分動画像の空間的な特徴を表わす。この新たな指標を用いて、部分動画像の、時間よりも空間的な特徴に重点においた検索を効率的に行なうことが可能となる。

この発明の他の局面にかかる動画像検索装置は、動画像を構成する 1以上の部分動画像の各々に対応した検索情報を利用して、所望の画像を検索するための動画像検索装置である。この動画像を表わす動画像データには、検索情報が対応付けられており、検索情報は、 1以上の時間軸上の部分動画像の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報を含む。この発明にかかる動画像検索装匱は、検索情報を読出して管理するための情報抽出部と、この情報管理部に接続され、外部から与えられる、時間軸上の部分動画像を検索の単位とする第 1の検索要求に応答して、検索情報に含まれる空間的部分動画像の要約情報を用いて、第 1の検索要求に合致する時間軸上の部分動画像を検索するための第 1の部分動画像検索部を含む。

時間軸上の部分動画像の各々を空間的に分割することにより得られる空間的部分動画像から得られた要約情報は、本発明で新たに導入されたものであり、空間的には画像の一部のみの、しかし時間軸上では部分動画像の全体にわたる空間的部分動画像から得られる。したがって、この要約情報は、ある部分動画像の時間的な全体を通じた、その部分動画像の空間的な特徴を表わす。したがつてこの発明にかかる動画像検索装置によれば、この新たな指標を用いて、部分動画像の、時間よりも空間的な特徴に重点においた検索を効率的に行なうことができる。図面の簡単な説明

図 1は想定された従来の動画像の検索情報記録装置の概略ブロック図である。図 2は想定された従来の動画像の検索装置の概略プロック図である。

図 3は本発明の一実施の形態にかかる動画像検索情報記録装置のブロック [^である。

図 4は本発明の一実施の形態にかかる動画像検索情報記録装置において、動画像をシーンに分解する過程を示す図である。

図 5は本癸明の一実施の形態にかかる動画像検索情報記録装置において、時間分割プロック単位の検索情報が生成される過程を示す図である。

図 6は本発明の一実施の形態にかかる動画像検索情報記録装匱において、空間分割プロック単位の検索情報が生成される過程を示す図である。

図 7は本発明の一実施の形態にかかる動画像検索情報記録装置におけるシーン単位の検索情報の概念を説明するための図である。図 8は本発明の一実施の形態にかかる動画像検索情報記録装置における空間分割ブロック単位の検索情報の概念を説明するための図である。

図 9は本発明の一実施の形態にかかる動画像検索情報記録装置における、冗長性を排した空間分割ブロック単位の検索情報の概念を説明するための図である。図 1 0は本発明の一実施の形態にかかる動画像検索装置のブロック図である。 m 1 1はシーン単位検索情報による頹似度検索における、基準となるシーンを示す図である。

図 1 2はシーン単位検索情報による類似度検索における、一^ 3のシーンを示す図である。

図 1 3はシーン単位検索情報による類似度検索における、他のシーンを示す図である。

図 1 4は空間分割プロック単位検索情報による類似度検索における、基準となるシーンを示す図である。

図 1 5は空間分割ブロック単位検索情報による類似度検索における、一つのシーンを示す図である。

図 1 6は空間分割ブロック単位検索情報による類似度検索における、他のシ一ンを示す図である。

図 1 7は本発明の一実施の形態にかかる動画像検索情報記録装置において、シーン単位検索情報の記録と、空間分割プロンク単位の検索情報の選択的な記録という概念を示す図である。

図 1 8は分割指定数フラグの値の意味を表形式で示す図である。

図 1 9は本発明の一実施の形態にかかる動画像検索情報記録装置における、シ —ン単位の検索情報の記録と、空間分割プロック単位の検索情報の階層的な記録とレ、う概念を表わす図である。

図 2 0はフ I ^一ムを 2²個に分割するときの分割例を示す図である。

図 2 1はフレームを 2³個に分割するときの分割例を示す図である。

図 2 2はフレームを 2 個に分割するときの分割例を示す図である。

図 2 3はフレームを 2 ⁵個に分割するときの分割例を示す図である。

図 2 4はフレームを 2 ^β個に分割するときの分割例を示す図である。図 2 5は動画像データがシーン単位に分割して蓄積されている動画像データべースを示す図である。発明を実施するための最良の形態

図 3に、本実施の形態にかかる動画像検索情報記録装置 4 0のブロック図を示す。図 3を参照して、この動画像検索情報記録装置 4 0は、動画像データを受け、動画像の構造を解析してシーンに分割し、シーンチェンジ点などの動画像構造情報を出力するための解析部 1 0 1と、動画像データと、解析部 1 0 1から出力される動画像構造情報とを受け、各シーンに含まれる各フレームの画像データに対する要約情報（フレームという時間分割ブロンクを単位とする要約情報）を生成し出力するための第 1の検索情報生成部 1 0 2と、解析部 1 0 1から出力された動画像構造情報、および動画像データを受け、各シーンに関する検索情報として、シーン内の全てのフレームの同一分割ブロック位置の画像データから構成される空間分割プロックの要約情報を生成し出力するための第 2の検索情報生成部 1 0 3と、第 1の検索情報生成部 1 0 2から出力されたシーン内の各フレーム（時間分割ブロック）に対する要約情報、および Zまたは、第 2の検索情報生成部 1 0 3から出力されたシーン内の各空間分割プロックに対する要約情報を入力とし、第 1の検索情報生成部 1 0 2からの要約情報、およびまたは第 2の検索情報生成部 1 0 3からの要約情報の一方または双方に基づき、シーン全体に対する要約情報を生成し出力するための第 3の検索情報生成部 1 0 4と、第 1の検索情報生成部 1 0 2から出力された要約情報、第 2の検索情報生成部 1 0 3から出力された要約情報、第 3の検索情報生成部 1 0 4から出力される要約情報、および解析部 1 0 1から出力される動画像構造情報を所定の形式に配置することにより、動画像に対応する検索情報を生成し出力するための第 4の検索情報生成部 1 0 5と、第 4の検索情報生成部 1 0 5から出力される、動画像に対する検索情報と、もとの動画像データとを受け、それらの一方または双方に検索情報と動画像データとの対応情報などを付加するかまたは別データとし、検索情報および動画像データとの対応情報などを'記録媒体 1 0 7に記録するための記録部 1 0 6とを含む。本願発明の装置が扱う動画像データは、 R G B信号などの原画像信号、 MP E G (Moving Picture Experts Group) などの動画圧縮方式を用いて符号化された画像データのいずれでも良い。本実施の形態では、説明の簡便のため、動画像デ —タは符号化されたものであると仮定する。

図 3に示された各ブロックの機能についてさらに詳細に以下に説明する。解析部 1 0 1は、動画像を時間的な小単位（シーン）に分割する。そのために解析部 1 0 1は、画像データ中のシーンチェンジ点の検出を行なう。解析部 1 0 1はこの例では、符号化画像データに含まれる符号化ブロックの予測モードの、フレーム内での頻度情報を用いてシーンチェンジ点を検出する。

たとえば、図 4を参照して、解析部 1 0 1は、動両像 1 2 0の中の第 1のシ一ンチェンジフレーム 1 3 0、第 2のシーンチェンジフレーム 1 3 2、第 3のシ一ンチェンジフレーム 1 3 4、第 4のシーンチェンジフレーム 1 3 6を検出する。それによつて解析部 1 0 1は、第 1のシーンチェンジフレーム 1 3 0と第 2のシ —ンチェンジフレーム 1 3 2との間の画像データ第 1のシーンチェンジフレーム 1 3 0を含む）からなる第 1のシーン 1 4 0、第 2のシーンチェンジフレーム 1 3 2と第 3のシーンチェンジフレーム 1 3 4との間の画像データ第 2のシ一ンチェンジフ L ム 1 3 2を含む）からなる第 2のシーン 1 4 2、第 3のシーンチェンジフレーム 1 3 4と第 4のシーンチェンジフレーム 1 3 6との間の画像データ第 3のシーンチェンジフレーム 1 3 4を含む）からなる第 3のシーン 1 4 4、および第 4のシーンチェンジフレーム 1 3 6から動画像 1 2 0の最後までの画像デ —タ（第 4のシーンチェンジフレーム 1 3 6を含む）からなる第 4のシーン 1 4 6とに動画像 1 2 0を分割する。すなわち、解析部 1 0 1は、動画像 1 2 0をこの例では 4つのシーン丄 4 0、 1 4 2、 1 4 4、 1 4 6に分害 ijする。

解祈部 1 0 1は、第 1のシーンチェンジフレーム 1 3 0、第 2のシーンチェンジフレーム 1 3 2、第 3のシーンチェンジフレーム 1 3 4、第 4のシーンチェンジフ L ^一ム 1 3 6などのシーンチェンジフレームの、画像データ中の位置を表わす情報を、動画像構造情報として出力する機能を有する。

図 5を参照して、第 1の検索情報生成部 1 0 2は、解析部 1 0 1から出力された動画像構造情報に基づいて動画像データを分割することにより得られたあるシーン 1 6 0に対して以下のような処理を行なって、シーン 1 6 0に含まれる各フレームの要約情報を作成する。なおシーン 1 6 0はフレーム 1 6 2 Aから 1 6 2 Nを含むものとする。

第 1の検索情報生成部 1 0 2は、フレーム 1 6 2 A〜l 6 2 Nの各々について、動きべクトルのフレーム内の頻度情報 1 6 6 Aから 1 6 6 Nを求める。また第 1 の検索情報生成部 1 0 2は、フレーム 1 6 2 A〜 1 6 2 Nの各々における動きべクトルの平均値 1 6 8 Aから 1 6 8 Nを求める。

このようにして求められた頻度情報 1 6 6と平均値情報 1 6 8と力この例では各フレームの要約情報 1 7 0を構成する。要約情報は、フレーム番^の関数 (すなわち時間の関数）として与えられる。

この要約情報は、シーン 1 6 0に含まれる各フレームの空間内に分布する情報を圧縮して得られた検索情報である。各フレームは、画像を時間的に分割した単位であって、時間分割ブロックの一種である。したがって要約情報 1 7 0は、時間分割ブロック単位の検索情報ということができる。

第 2の検索情報生成部 1 0 3は、解析部 1 0 1から出力された動画像構造情報 (シーンチェンジ位匱の情報）と、動画像データとを受ける。第 2の検索情報生成部 1 0 3はこの動画像構造情報と動画像データとを用いて以下のようにして空間分割ブロックに対する要約情報を生成する。

なおここで空問分割ブロックとは以下のようなものをいう。一^ 3のシーン内の全てのフレームの各々を同じ方法で複数個の分割プロンクに空間的に分割する。それら全てのフレームの、対応する位置の分割ブロックの全体をそのシーンの空間分割ブロックと呼ぶ。したがって、一つのシーンが n個のフレームを含み、各フレームが m個の分割プロックに分割される場合には、そのシーンは m個の空間分割ブロックに分割され、各空間分割ブロックは n個の分割ブロックを含む。具体的には、図 6を参照して、第 2の検索情報生成部 ΐ 0 3ではシーン 1 6 0 に対して以下のような処理が行なわれる。前述のとおり、シーン 1 6 0が複数個のフレーム 1 6 2 A〜l 6 2 Νを含むものとする。これらフレーム 1 6 2 A〜l 6 2 Νが各々、 Μ個の分割ブロックに空間的に分割される。ここで、分割ブロックとは、画像面を複数に分割したときの、各小領域を指す。たとえば図 6に示されるフ L ム 1 6 2 Αは、複数個の分割ブロック 1 8 O A 1から 1 8 0 AMに分割される。他のフレーム 1 6 2 Bから 1 6 2 Nも同様である。

そして、複数個のフレーム 1 6 2 A〜 1 6 2 Nの各々の、同じ位置の分割ブロックによって、シーン 1 6 0の一つの空間分割ブロンクが形成される。たとえば N個のフレームの各々の M番目の分割ブロックの集合（その要素の数は Nと等しレ、。 ) によって空間分割ブロック 1 8 2— Mが形成される。他の空間分割ブロックも同様に形成される。

こうして得られた M個の空間分割プロックの各々に対して、時間軸方向に分布する情報を圧縮して要約情報 1 8 8を生成する。ここでいう要約情報 1 8 8は、各空間分割プロックに対する要約情報であり、各空間分割プロックに含まれる分割ブロックの、フレーム内の位置（座標）に対する関数 ^ (直である。

典型的には、要約情報 1 8 8は、頻度情報 1 8 4と平均値情報 1 8 6とを含む。頻度情報 1 8 4としては、各符号化プロソクの予測モードの空間分割プロック内の頻度情報、または動き補償予測符号化時の動きべクトルの空間分割ブロック内の頻度情報を用いることができる。たとえば図示されていないが空間分割プロック 1 8 2— 1からは頻度情報 1 8 4 Aが得られ、空間分割ブロック 1 8 2— 2からは頻度情報 1 8 4 Bが得られ、以下同様にして空間分割プロック 1 8 2— M力らは頻度情報 1 8 4 Mが得られる。

また平均値情報 1 8 6としては、空間分割プロック內の動きべクトルの総和もしくは平均値を用いることができる。たとえば図示されて、ないが空間分割ブ口ック 1 8 2 ? 1からは平均値情報 1 8 6 Aが得られ、空間分割プロック 1 8 2 ? 2 からは平均値情報 1 8 6 Bが得られ、以下同様にして空間分割ブロック 1 8 2 Mからは平均値情報 1 8 6 Mが得られる。

これ以外にも要約情報としては、空間分割ブロック内の動きべクトルの標準偏差などを用いることもできる。

第 3の検索情報生成部 1 0 4は、第 1の検索情報生成部 1 0 2から出力された要約情報、または、第 2の検索情報生成部 1 0 3から出力された要約情報を受け、これらの一方または双方に基づいて、シーン全体に対する要約情報を生成し出力する。

二こで、シーン全体に対する要約情報とは、シーンを検索する際に用いられる検索情報である。シーン全体に対する要約情報としては、動きべクトル、輝度値、または色差値などの、シーン全体における頻度情報、平均値、標準偏差などを用いることができる。

第 4の検索情報生成部 1 0 5は、第 1の検索情報生成部 1 0 2から出力された要約情報と、笫 2の検索情報生成部 1 0 3から出力された要約情報と、第 3の検索情報生成部 1 0 4から出力された要約情報と、解析部 1 0 1力ら出力された動画像構造情報とを所定の形式に配置することにより、動画像に対応する検索情報を生成し出力して記録部 1 0 6に与える ₃

記録部 1 0 6は、第 4の検索情報生成部 1 0 5から出力された、動画像に対応すろ検索情報と、もとの動画像データとを受けて、検索情報のみ、または検索情報と動画像データとを記録媒体 1 0 7に記録する。このとき記録部 1 0 6は、動画像デ一タと検索情報とが対応していることを示す情報を動画像データもしくは検索情報のいずれか一方もしくは双方に付加するか、または動画像データおよび検索情報とは別データとして記録する。

上に構造と一般的動作とを説明した本実施の形態にかかる動画像検索情報記録装置 4 0において用いられる検索情報としては、動き補償予測符号化された動画像データに含まれる動きべクトルに基づいて得られる動きの大きさの情報を用いるものとする。

より具体的には、時間分割ブロック（フレーム）単位の検索情報は、シーン内の各フレームに対して、各符号化ブロックに付加された動きベクトルから求められた、フレーム全体における動きベクトルの絶対値の総和として求められる。なお、動きべクトルの絶対値の総和にかえて動きべクトルの絶対値の平均としても同じことである。実際、一フレームに含まれる符号化ブロックの数が定まっていれば、動きべクトルの絶対値の総和とその平均値との一方から容易に他方が求められる。

空間分割ブロック単位の検索情報としては、各空間分割ブロックにおける動きべクトルの絶対値の総和が使用される。ここでも、動きべクトルの総和に替えてその平均を検索情報として用いることができる。空間分割プロ 'ンクを構成する各分割プロックが符号化プロックと一致する場合には、各分割プロックに対応する動きべクトルの数は 1となる。各分割ブロックが複数個の符号化プロックを含む場合には、各分割ブロックに対応する動きべクトルの数はその分割ブロックに含まれる符号化プロックの数と等しい。

または空間分割ブロック単位の検索情報は、各空間分割プロ 'ンク内での動きべクトルの絶対値の総和を、空間分割ブロックを構成する分割ブロソクの数で除した値でもよい。この場合の分割ブロックの数は、シーンを構成するフ L ムの数と等しい。さらにまた、空間分割ブロック単位の検索情報は、各空間分割ブロック内での動きべクトルの絶対値の総和を、空間分割ブロックを構成する分割プロックに含まれる符号化ブロックの数の総和で除した値でもよレ、。

時間分割プロックまたは空間分割プロックの検索情報として、動きべクトルの絶対値の総和を用いたとすると、シーンに含まれる全ての動きべクトルの絶対値の総和を計算することができる。本実施の形態では、こうして得られた総和をシ —ン単位の検索情報とすろ。

次に、空間分割プロック単位での検索情報の生成に用いられる分割ブロックの具体例について説明する。図 7に示されるように、シーン 1 6 0がフレーム 1 6 2 A〜 1 6 2 Nからなつているものとする。こォしらフレーム 1 6 2 A〜 1 6 2 N の動きべクトルの絶対値の総和から、シーン 1 6 0のシーン単位検索情報 Iが求められる。

図 8に示されるように、フレーム 1 6 2 A〜 1 6 2 Nはそれぞれ、 2 X 2個の分割ブロックに分割されているものとする。すなわちフレーム 1 6 2 A〜 1 6 2 Nはそれぞれ 4つの分割ブロックに分割されている。たとえばフレーム 1 6 2 A は 4つの分割ブロック 1 9 O A 1から 1 9 0 A 4に分割される。以下のフレームについても図示しないが同様である。たとえばフレーム 1 6 2 Bはフレーム 1 9 0 B 1力ら 1 9 0 B 4に分割される、などである。したがって先の空間分割ブロックの説明からわかるように、シーン 1 6 0は 4つの空間分割ブロックに分割され、これら 4つの空間分割ブロックに対して、各空間分割ブロック内の動きべクトルの絶対値の総和からそれぞれ空間分割プロック単位の検索情報 I，からがいずれも実数値として求められる。

したがって、シーン 1 6 0のためのシーン検索情報として、たとえばこれら検索情報 I , Iい I ₂, I 3 , I ₄を順番に配列して得られる { I , Iい I ₂ , I a . I ₄ } を用いることができる。この検索情報をもとの両像データとともに記録すればよい。

ただし、上記した検索情報は冗長性を含む。これは、この例ではシーン単位検索情報 Iが空間分割ブロック単位の検索情報の和と等しいことによる。たとえばシーン単位検索情報 Iは、空間分割プロック単位の検索情報 I から I ₄から求めることができる。または、空間分割ブロック単位の検索情報 I ,から 1 ₄のうちの任意の 3つとシーン単位検索情報 I とから、空間分割プロック単位の検索情報の残りの一つを計算することができる。

そこで、本実施の形態の装置では、 1 ₄については検索情報には含ませないようにする。さらに本実施の形態の装置では、各空間分割ブロック単位検索情報のそのままの値ではなく、シーン単位の検索情報に対する各空間分割プロック単位検索情報の値の百分率で示す。第 1から第 3の空間分割ブ口ックの検索情報の、シーン単位の検索情報 Iに対する比率を Pい P ₂および P ₃とすれば、このときの空間分割ブロック単位の検索情報は図 9に示されるようにして求められる。すなわち、第 1の空間分割プロックとシーン単位検索情報とから第 1の空間分割ブ口ックの検索情報 P iが計算される。第 2の空間分割プロックとシーン単位検索情報とから第 2の空間分割プロ 'ンクの検索情報 P ₂が計算される。第 3の空間分割ブロックとシーン単位検索情報とから第 3の空間分割ブロックの検索情報 P 3 が計算される。第 4の空間分割ブロックについて検索情報を求めると冗長となるので、求めることはしなレ、。つまり、シーン 1 6 0は 4つの空間分割ブロックに分割される力そのうち 3つの検索情報を求めればよい。一般的に P _kは、 P _k = 1 0 0 X I _k/ Iによって求められる。

このように空間分割プロックの検索情報として、シーン単位検索情報に対する百分率として記録すると、以下のような利点が得られる。第 1に検索情報を記録するための信号のダイナミックレンジが制限されるため、より効率的に検索情報を言己録できる。すなわち記録される情報量がそうでない場合より減少する。第 2 に、検索情報の値が正規化されるため、別々のシーンに付された検索情報を互いに比較することが可能となる。第 3に、既に述べたとおり、記録すべき変数を一つ省略することができる。

このようにして動画像検索情報が第 4の検索情報生成部 1 0 5によって生成され、記録部 1 0 6を介して記録媒体 1 0 7に記録される。

さて、図 3に示された動画像検索情報記録装置 4 0によって記録媒体 1 0 7に記録された動画像データおよび検索情報を用いて動画像検索をする装置につレ、て以下説明する。図 1 0を参照して、この実施の形態にかかる動画像検索装置 5 0 は、記録媒体 1 0 7に記録された動画像データとその検索情報とを読出すための読出部 5 0 1と、読出部 5 0 1により読出された動画像の検索情報を保持し、検索要求に応じてシーン単位検索情報、空間分割ブロック単位検索情報、または時間分割プロック単位検索情報を、動画像構造情報とともに出力するための検索情報管理部 5 0 2と、シーン単位の検索要求に応答して、検索情報管理部 5 0 2に対して要求を出し、検索情報管理部 5 0 2からシーン全体に対する検索情報と、動画像構造情報とを受け、シーン単位の検索要求に合致したシーンを検出して、検出されたシーンに関する情報を出力するための第 1の検索実行部 5 ϋ 3と、空間分割ブロック単位の検索要求に応答して、検索情報管理部 5 0 2に対して要求を出し、検索情報管理部 5 0 2から受取った、シーン内の各空間分割ブロックに対する要約情報と、動画像構造情報とに基づいて、検索要求に合致したシーンを検出して検出されたシーンに関する情報を出力するための第 2の検索実行部 5 0 4と、時間分割プロック単位の検索要求に応答して検索情報管理部 5 0 2に対して要求を出し、検索情報管理部 5 0 2から受取ったシーン内の各フ L ムに対する要約情報と、動画像構造情報とに基づし、て検索要求に合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報を出力するための第 3の検索実行部 5 0 5と、読出部 5 0 1によって読出された動画像情報を保持し、第 1の検索実行部 5 0 3、第 2の検索実行部 5 0 4または第 3の検索実行部 5 0 5から出力される検索結果に基づいて、検索結果に基づき検出されるシ一ンまたはフレームの画像データを出力するためのデータ管理部 5 0 6と、ォペレ —タからの検索指示入力に応答して、シーン単位の検索要求を第 1の検索実行部 5 0 3に、空間分割プロック単位の検索要求を第 2の検索実行部 5 0 4に、または時間分割プロック単位の検索要求を第 3の検索実行部 5 0 5に、それぞれ出力し，その結果データ管理部 5 0 6から出力されるシーンまたはフレームの画像データを表示し、検索終了時には検索結果を出力するための検索制御部 5 0 7とを含む。

この動画像検索装置 5 0は以のように動作する。検索開始時、オペレータは検索制御部 5 0 7に対して検索指示を与える。検索制御部 5 0 7は、この検索指示に応じて、シーン単位の検索、空間分割ブロック単位での検索、または時間分割ブロック単位での検索のいずれかを選択し、第 1の検索実行部 5 0 3、第 2の検索実行部 5 0 4、または第 3の検索実行部 5 0 5のいずれかに対して検索要求を出す。

第 1の検索実行部 5 0 3、第 2の検索実行部 5 0 4、第 3の検索実行部 5 0 5 のうち、検索制御部 5 0 7から検索要求を受取ったものは、検索情報管珅.部 5 0 2から与えられる動画像構造情報と、シーン単位、空間分割ブロンク単位、または時間分割ブロック（フレーム）単位の要約情報に基づいて、検索要求に合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報をデータ管理部 5 0 6に与える。

データ管理部 5 0 6は、第 1の検索実行部 5 0 3、第 2の検索実行部 5 0 4または第 3の検索実行部 5 0 5から受取った、シーンまたはフレームに関する情報に対応するシーンまたはフレームの画像を動画像データから抽出し検索制御部 5 0 7に与える。

検索制御部 5 0 7は、データ管理部 5 0 6から与えられた画像を表示する。表示された画像により、オペレータはその画像が所望のシーンであるかどうかを判断し、所望のシーンであれば検索結果を出力するように指示を検索制御部 5 0 7 に与える。検索制御部 5 0 7はこの指示に応答して、検索結果を出力する。検索制御部 5 0 7により表示された画像が所望のシーンを表わすものではなかつた場合，オペレータはさらに次の検索指示を検索制御部 5 0 7に与える。以下検索制御部 5 0 7は上述したのと同様の動作を行なって、検索結果のシーンの表示を行なう。以下、検索が終了するまでこの動作を繰返す。

具体的な動画像検索の例について説明する。この実施の形態では、検索情報として、動き補償予測符号化された動画像データに含まれる動きべクトルに基づいて得られる動きの大きさに関する情報を用いる。

所望のシーンまたはシーン内のフレームは、次のようにして検索される。

シーン単位の検索情報を利用すると、たとえば全体的に動きの大きなシーンと、全体的に動きの小さなシーンとを選別することができる。

空間分割プロック単位の検索情報を利用すると、たとえば一シーンにわたって動きが空間的に遍在するようなシーンと、動きが空間的に比較的均等に分布するシーンとを選別できる。また、動きの遍在する部分が画像のどの部分かを指定することができる。たとえば、画像の中央部分に激しく動く部分（被写体）があるシーン、または画像の下半分に激しく動く部分があるシーン（空を含む画像）などを選び出すことができる。

本実施の形態では、空間分割ブロックという、従来は考慮されていなかったものを単位とする検索情報をシーンの検索に用いる。そのため、次のような効果が得られる。

図 1 1から図 1 3を参照して、図 1 2 (A) に示すシーン Aと、図 1 3 ( A) に示すシーン Bとについて、図 1 1 (A) に示す基準となるシーンとの類似度を計算する場合を考える。こうした「類似度」計算により、基準となるシーンと類似した動き特徴を有するシーンを検出することができる。図 1 2から図 1 3は、シーン単位の検索情報のみを用いた場合を示す。

図 1 1から図 1 3の（B ) に、それぞれの（A) に示す画像に対するシーン単位検索情報を示す。図 1 1から図 1 3の（A) に示されるように、シーン Aおよびシーン Bは、基準となるシーンに対して、シーン全体として同じような動きの強さを持っている。そのため、図 1 1から図 1 3の（B ) に示されるように、対応のシーン単位検索情報も同様の値となるすなわち、シーン A、 Bのいずれも、基準となるシーンと類似していると判断される。

続いて、図 1 4から図 1 6を参照して、空間分割ブロック単位の検索情報を用いた場合の類似度検索の特徴について説明する。図 1 4から図 1 6の（A) にはそれぞれ基準となるシーン、シーン A、 Bを示す。図示されるように、各シーンの各フレームは 4つの分割ブロックを含む。そのうちそれぞれ第 1から第 3の分割ブロックからなる空間分割ブロックに対して、空間分割ブロック単位の検索情報 P ,、 P ₂および P ₃が計算されている。また図 1 4から図 1 6の（B ) に示すように、基準となるシーン、シーン Aおよび Bに対するシーン単位の検索情報はほぼ同じ値である。

しかし、図 1 4から図 1 6の（C ) に示されるように、空間分割ブロック単位の検索情報で各ン一ンを比較すると、次の事実が分る。すなわち、シーン Aの方が、基準となるシ一ンの空間分割ブロック単位検索情報の分布と類似した分布を有する。これは、シーン Bでは人物が右の方によっているため、空間的に動きの偏りができるためである。基準となるシーンおよびシーン Aはいずれも、人物がほぼ中央にいる。したがって、基準となるシーンと類似したシーンとしてシーン Aは検出されるが、シーン Bは検出されない。つまり、シーン全体としての動きはシーン A、 Bとも基準となるシーンと類似している場合であっても、動きが遍在しているか否かによってシーンを選別することができる。

さらに、フレーム（時間分割ブロック）単位の検索情報を利用すれば、たとえばシーン内の特に動きの激しいフレーム、逆に動きの止まっているようなフレームを選別することができる。

上記したシーン単位の検索情報、空間分割ブロック単位での検索情報、および時間分割ブロック単位での検索情報を組合わせることによって、さらに細かく所望のシーンの検索をすることができる。

たとえば、全体的に動きの大きなシーンを選び、特に画像の中央部分に激しく動く部分を持つシーンに絞り込み、さらに絞り込まれた各シーン内の、特に動きの激しいフレームをキーフレームとして取出す、という形で動画像検索を実行することができる。

このように、本実施の形態の装置によれば、多面的な条件指定により、画像の動きなどの画像特徴に基づいて、所望のシーンの画像を効率的に検索することができる。検索に要する時間も短縮される。

上記した実施の形態は、本発明を実施するための一つの例に過ぎない。この他にも種々の変形をこれらの装置に対して行なうことができる。

たとえば、この実施の形態の装置では解析部 1 0 1が自動的に動画像データに対する信号解析によりシーンチェンジ点を見出している。しかし本発明はこれには限定されず、たとえばオペレータが動画像を見て、オペ L ^一タの主観によって動画像の構造を解析しシーンの分割位置にタグを付すようにしてもよい。この場合解析部 1 0 1は、動画像データを同様に解析するが、その際、動画像データに付されたタグを見て動画像をシーンに分割する

上記した実施の形態では、フレームの要約情報の頻度情報丄 6 6として動き補償予測符号化時の動きべクトルのフレーム内頻度情報を用いた。しかしこの発明はこれには限定されず、頻度情報として各符号化ブロックの予測モードのフレ一ム内頻度情報を用いることもできる。

また、要約情報としては、上記したほかに、フレーム内の動きベクトルの総和もしくは標準偏差、または原画像信号もしくは復号画像信号を用いて計算されるフレーム内の平均輝度値、もしくは平均色差値などを用いてもよい。

検索方法および手順は、ここに示した組合せには限定されない。選択される候補を絞り込む順序を変えることも可能である。また、生成される検索情報によつても、検索のための方法およびその手順は変化する

またたとえば、上記した実施の形態の装置では、空間分割ブロックとして、 1 フレームを 2 X 2 = 4分割した分割ブロックの 1シーンにわたる集合を用いた。分割の個数は 4個には限定されない。たとえば図 1 7に示されるように 4 X 4、 8 X 8、またはそれ以上の数による分割を行なうことも可能である。 4 X 4分割の場合には、百分率で表わした空間分割ブロック単位検索情報は P から Γ _{1 5}である。 P ₁₆は 1 0 0 %から他の空間分割ブロックの検索情報の禾!]を減ずることにより得られる。 8 X 8分割の場合には、百分率で表わした空間分割ブロック単位検索情報はから P _{fi 3}である。 P ₆₄も 1 0 0 %から他の空間分割ブロックの検索情報の和を減ずることにより得られる。

さらに、このように複数通りの分割方法のいずれを用いるかを選択できるようにしてもよい。この場合、選択された個数（「解像度」と呼ぶことができる。）にしたがって分割された分割プロックによって空間分割プロックを構成し、その各々に対して検索情報を求める。さらに、検索情報を記録するときには、シーン単位検索情報と、選択された解像度による空間分割プロシク単位の検索情報に加えて、図 1 8にその値と分割数との対応関係が示される分割数指定フラグを検索情報に付加する。分割数指定フラグが「0」であれば {Pい P₂, P₃} 、

「1」であれば {P】， P₂₎ ·■·, P ₁₅} 、「2j であれば {P^ P₂, ■··, P ₆ ₃) 、「3」であれば {Ρ ,, P ₂, ··'， P_{2 S6}} の空間分割ブロック単位の検索情報が記録される。

このように空間分割ブロックの解像度を複数通り指定できることにより、以下のような効果が生じる。

まず、画像のうち上下左右のおおまかな画像の動きの分布を知りたいという、比較的簡易な検索のみが要求されるデータベースでは、 2 X 2など、小さな分割数を用いる。検索情報の記録量を抑えることができる。

画像の特定の一部または離れた 2つの部分で動きが大きいシーンを抽出したい、というような要求が頻繁にあるデータベースでは、 8 X 8など、比較的大きな分割数を用いる。高機能な検索を実現することができる。高解像度の検索情報は、低解像度の検索情報を含むので、低解像度の検索が必要なときにも、低解像度の検索情報を重複して持つ必要はない。

以上説明した実施の形態では、 2 X 2、 4 X 4、および 8 X 8のように、縦方向の分割数と横方向の分割数とが等しく、かついずれも 2のべき乗である。こうした分割数を選択的に用いると、分割の解像度が異なる空間分割プロック単位検索情報を記録したデータベース間においても検索情報の間の対応付けが可能となる _u また、異なる分割解像度どうしでの検索情報を比較することも可能となる。さらに、図 1 9に示されるように、複数種類の解像度の空間分割ブロック単位の検索情報を階層的に記録してもよい。たとえば、シーンの検索情報は、シーン単位の検索情報 200と、 2 X 2分割による空間分割ブロック単位の検索情報 2 02と、 4 X4分割による空間分割ブロック単位の検索情報 204と、 8 X 8分割による空間分割ブロック単位の検索情報 206とを含む。

この階層構造では、ある層の空間分割ブロック単位の検索情報は、一段高解像度の 4つの空間ブロック単位の検索情報で表わされる。したがって、各層において、 4つの空間分割ブロック単位の検索情報のうちの一つを記録しなくとも、検索に必要な全ての情報を得ることができる ₃

図 1 9に示した例による検索情報は、図丄 7に示した 8 X 8にフレームを分割して形成される空間分割ブロックを単位とする検索情報を記録するのと同じ解像度の検索情報を含む。一方で図 1 9に示した検索情報によれば、他の解像度の検索情報を容易に得ることができるという利点を有する。

上に説明した実施の形態では、シーン内の全フレームを、 2 X 2、 4 X 4、 8 X 8などのように n X nの配置に分割して、空間分割ブロックを形成している。しかし本発明によれば、フレームの分割方法はこれには限られない。たとえば図 2 0から図 2 4に示されるような形でフレームを分割して、得られた空間分割ブ口ックを甲.位として検索情報を生成するようにしてもよい。図 2 0から図 2 4に示した例では、シーン内の全フレームを 2のべき乗（2 ⁿ) 個（図 2 0では n = 2、図 2 1では n = 3、図 2 2では n = 4、図 2 3では n = 5、図 2 4では n = 6 ) に分割している。このような分割方法を用いても、上に述べた実施の形態の装置で得られたものと同様の検索機能を実現するための検索情報を生成することができる。

図 2 0〜図 2 4に示したようなフレームの分割方法によっても、上に記載した実 ί£の形態と同様に、異なる解像度の検索情報同士の対応付けが容易である。また、異なる解像度の検索情報を互いに容易に比較することができる。

なお、図 5に示される例の場合は、たとえばフレーム 1 6 2 Νを一つの時間分割プロンク 1 6 4 Νとして要約情報を求めている。しかし本発明はこうした実現例に限定されない。たとえば一つの時間分割ブロックが 2以上のフレームを含むようにしてもよい。また、各フレームをサブサンプリングしてサブフレームを生成し、一時間分割ブロックが一または複数個のサブフレームを含むようにしてもよい。またシーン内のフレームを適宜間引いて、間引いた各フレームに対する要約情報を用いるとしてもよい。

なお、図 6に示される例または図 8に示される例の場合は、空間分割ブロックに含まれる全ての分割ブロックを用いて空間分割プロックの要約情報を求めている。しかし本発明はこうした実現例に限定されない。必ずしも空間分割ブロック内の全ての分割ブロックに対応する画像データを用いる必要はなく、分割ブロックを適当に間引いて、または分割ブロック内の画像データを適当に間引いて、空間分割プロックの要約情報を生成してもよい。なお、図 5および図 6を参照して説明した、時間分割ブロック単位もしくは空間分割プロック単位の検索情報、またはシーン単位の検索情報を生成する際に、動画像を撮影したカメラの動きによるバックグラウンドの動きへの影饗を除くために、カメラの動きに相当する動きべクトル分を補正して検索情報を生成するようにしてもよレ、。

さらに、上記した実施の形態では、動画像検索情報記録装置 4 0と動画像検索装置 5 0とは分離された別の装置である。そして検索情報は記録媒体 1 0 7を介して動画像検索情報記録装置 4 0から動画像検索装置 5 0に渡されている。これに替えて、例えば、図 3に示す第 1の検索情報生成部 1 0 2、第 2の検索情報生成部 1 0 3、第 3の検索情報生成部 1 0 4で生成された各種の検索情報を、解析部 1 0 1から出力される動画像構造情報とあわせて、直接図 1 0の検索情報管理部 5 0 2に渡すようにしてもよい。この場合の検索処理は、いわゆるリアルタイム検索と呼ばれる。

上記した実施の形態でフレームを分割した分割ブロックは、符号化ブロックと —致してもよい。符号化ブロックとは別の、適当な大きさのブロックを新たに定義してもよい。上の実施の形態では、分割ブロックは対称形であり、かつ分割ブロックの配置も対称である。しかし分割ブロックを新しく定義する場合には、ブ口ックが対称形である必要はない。またプロックの配置に関しても対称である必要はない。また、画像面内を適当に間引くことも可能である。すなわち、画像內に分割ブロックが含まれなレ、領域があってもよい。また、分割ブロックが部分的に重複してもよい。すなわち、画像内に複数の分割ブロックに含まれる領域があつてもよレゝ。

上記した実施の形態では、図 3に示される第 3の検索情報生成部 1 0 4は、第 1の検索情報生成部 1 ϋ 2から出力される要約情報および第 2の検索情報生成部 1 0 3から出力される要約情報を受けて、シーン全体に関する要約情報を生成している。しかし本発明はこのような実現例には限定されない。たとえば第 3の検索情報生成部 1 0 4は、入力された画像データから直接にシーン全体に関する要約情報を生成するようにしてもよい。

また、上記した実施の形態では、各種の要約情報（検索情報）を、物理的に定義された一シーンを単位として求めている。しかし検索情報を、シーンを単位として求める必要は必ずしもない。たとえば 1つのシーンを複数に分割したサブシ

—ンを単位として検索情報を求めてもよい。すなわち「シーン」という語は「サブシーン」をも意味する。逆に、複数のシーンからなる複合シ一ンを単位として検索情報を求めることもできる。すなわち「シーン」という語は、「複数のシーンの集まり」をも意味する。

また、上記した実施の形態では、 1つの動画像データに対して検索情報を生成し、記録し、検索を実行しているが、本発明はこうした実現例に限定されない。すなわち、複数の動画像データを検索の対象とし、検索情報を生成し、記録し、複数の動画像データ中から所望のシーンまたはフレームを検索することも想定するものである。

その一例として、図 2 5に示す、複数のシーンの各々が独立した動画像データとして蓄積されている画像データベースからの動画像検索を考える。昨今の、動画像を撮影することが可能なデジタルカメラなどで動画像の撮影を行なった場合には、各撮影された動画像、すなわち 1回の録画開始から録画停止までの 1シ一ンを表わす動画像データが、それぞれ独立したデータファイルとして生成される。したがって、図 2 5に示すような画像データベースも容易に想起できる。

このような画像データベースに対して、図 3に示される動画像検索情報記録装置 4 0によって検索情報を生成する。このとき、入力される動画像データは、データベースに存在する複数の動画像データである。格動画像データは既にシーンに分解されていろ（ 1つの動画像データは各々一つのシーンのみを含んでいる）ため、動画像構造情報は不要である。したがって解析部 1 0 1では動画像の構造解析を行なう必要はない。第 1、第 2、第 3の検索情報生成部 1 0 2、 1 0 3、 1 0 4は、動画像データからそれぞれフレーム（時間分割ブロック）、空間分割ブロック、シーン全体に対する要約情報を生成する。第 4の検索情報生成部 1 0 5は、これらの要約情報を所定の形式に配置して動画像に対する検索情報を生成する。記録部 1 0 6は、各動画像データと各動画像に対応する検索情報とを受け、各動画像データと検索情報との対応情報をいずれか一方もしくは双方に付加する力または別データとし、検索情報と対応情報とを記録媒体 1 ϋ 7に記録する。記録媒体 1 0 7を元の画像データベース内としてもよい。また、各検索情報は各々独立して記録しても、または画像データベースに対応する検索情報としてまとめて記録してもよレ、。

また、このような画像データベースならびに生成および記録された検索情報から、図 1 0に示される動画像検索装置によって検索を実行する。このとき、読出部 5 0 1で読出され検索情報管理装置 5 0 2で管理されるのは、データベースに存在する複数の動画像データに対応した検索情報であり、各動画像データに対応した動画像構造情報は不要である。第 1、第 2、第 3の検索実行部 5 0 3、 5 0 4、 5 0 5ではそれぞれ、対応する検索情報を用いて検索要求と合致したシーンまたはフレームを検出し、検出されたシーンまたはフレームに関する情報を出力する。データ管理部 5 0 6および検索制御部 5 0 7は前記した実施の形態と同様に動作し、検索結果が得られる。

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。技術分野

以上のように木発明にかかる動画像検索情報記録装置および動画像検索装置は、シーンを時間的にではなく空間的に分割した空間分割ブロックを単位としてシーンの検索情報を生成し、その検索情報に基づいてシーンを検索するので、動画像のうちの所望のシーンを、そのシーンをつうじて観測される空間的な特徴にしたがって効率良く検索するシステムに適している。

Claims

請求の範囲

1. 動画像データにより表わされ. 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 1 60 ) からなる、動画像を検索するための検索情報を、記録媒体に記録する動画像検索情報記録装置（40) であって、

前記動画像データに基づいて、前記 1以上の部分動画像の各々に対応して検索情報を生成する検索情報生成部（102、丄 03、 104、 105) と、

前記検索情報を、該検索情報と前記動画像デ一タとの対応情報とともに記録媒体に記録する記録部（106) とを備え、

前記検索情報生成部（102、 1 03、 104、 105) は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（1 8 8) を生成するための第 1の要約情報牛.成手段い 03) を含む、動画像検索情報記録装置（40) 。

2. 前記 1以上の時間軸上の部分動画像（140、 142、 144, 146、 160) は、前記動画像データにより表わされる動画像が時間軸上で分割されたものであり、

前記 1以上の時間軸上の部分動画像の前記動画像データ中の位置を表わす動画像構造情報を出力する動画像構造情報出力部（101) を備え、

前記検索情報生成部（102、 103、 104、 105) は、前記動画像構造情報と前記動画像データとに基づいて、前記 1以上の時間軸上の部分動画像（1 40、 142、 144、丄 46、 160) の各々に対応した検索情報を生成し、前記記録部（106) は、前記検索情報と前記動画像構造情報とを、該検索情報と前記動画像データとの対応情報とともに記録媒体に記録する、請求項 1に記載の動画像情報記録装置。

3. 前記 1以上の時間軸上の部分動両像の各々は、 1または複数個の時間的な単位画像（162A〜162N) を含み、

前記第 1の要約情報生成手段（1 03) は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々の、前記 1または複数個の時間的な単位画像（1 6 2A〜 1 6 2N) の全てを同一の態様で複数個の空間的分割ブロックに分割し、前記 1または複数個の時間的な単位画像（1 6 2A~ 1 6 2N) のそれぞれ同一の位置の前記空間的分割ブロックに対応する画像デ一タから前記空間的部分動画像の要約情報を生成するための空間的分割手段（1 0 3) を含む、請求項 1に記載の動画像検索情報記録装置（40) 。

4. 前記空間的分割手段（1 03) は、前記 1以上の時間軸上の部分動画像 (1 40、 1 42、 1 44、 1 46、 1 60) の各々の、前記 1または複数個の時間的な単位画像（1 62A〜1 6 2N) の各々を、前記単位画像上に定義される 2つの方向において同一の予め定める数に分割することにより前記時間的な単位画像（ 1 6 2 A〜 1 6 2 N) の全てを複数個の空間的分割ブロックに分割し、前記 1または複数個の時間的な単位画像（1 6 2A〜1 6 2N) のそれぞれ同一の位置の前記空間的分割ブロックに対応する画像データから前記空間的部分動画像の要約情報を生成するための手段（ 1 03) を含む、請求項 3に記載の動画像検索情報記録装置。

5. 前記空間的分割手段（1 03) は、前記 1以上の時間軸上の部分動画像 (1 40、 142、 144、 1 46、 1 60) の各々の、前記 1または複数個の時間的な単位画像（1 6 2A〜1 62N) の各々を、予め定める 2のべき乗数に分割することにより前記時間的な単位画像（ 1 62 A〜 1 62 N) の全てを複数個の空間的分割ブロックに分割し、前記 1または複数個の時間的な単位画像（ 1 62 A〜 1 62 N) のそれぞれ同一の位置の前記空間的分割ブロンクに対応する画像データから前記空間的部分動画像の要約情報を生成するための手段（1 0 3) を含む、請求項 3に記載の動画像検索情報記録装置。

6. 前記検索情報生成部（ 1 02、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 144、 1 46、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（ 1 6 2A〜1 6 2 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段 (1 02) を含む、請求項 5に記載の動画像検索情報記録装置 _D

7. 前記 1または複数個の時間的な単位画像（ 1 62 A〜 1 6 2 N) の各々は、 1フレームの画像を含む、請求項 6に記載の動画像検索情報記録装匱。 8. 前記検索情報生成部（ 1 02、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々に含まれる全ての前記フレームから、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 7に記載の動画像検索情報

9. 前記検索情報生成部（1 02、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（ 1 40、 1 42、 1 44、 1 46、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 6 2A〜 1 6 2 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（1 02) を含む、請求項 4に記載の動画像検索情報記録装匱。 10. 前 ¾ 1または複数個の時間的な単位画像（1 6 2A〜1 6 2N) の各々は、 1フ L ムの画像を含む、請求項 9に記載の動画像検索情報記録装置。

1 1. 前記検索情報生成部（ 1 02、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々に含まれる全ての前記フレームから、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 1 0に記載の動画像検索情報記録装置。

1 2. 前記検索情報生成部（1 0 2、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（ 1 40、 1 42、 1 44、 1 46、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 6 2A〜 1 6 2 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（1 02) を含む、請求項 3に記載の動画像検索情報記録装置（4 0) 。

1 3. 前記 1または複数個の時間的な単位画像（ 1 62 A〜 1 62 N) の各々は、 1フレームの画像を含む、請求項 1 2に記載の動画像検索情報記録装置（4 0) 。

14. 前記検索情報生成部（ 102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 160) の各々に含まれる全ての前記フレームから、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 1 3に記載の動画像検索情報記録装置（40) 。

1 5. 前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、

160) の各々は、 1または複数個の時間的な単位画像（162A〜162N) を含み、

前記検索情報生成部（102、 103、 104, 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 160) の各々に含まれる前記 1または複数個の時間的な単位画像（162A〜162N) の 1 または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（102) を含む、請求項 1に記載の動画像検索情報記録装置（40) 。

16. 前記 1または複数個の時間的な単位画像（162A〜162N) の各々は、 1フレームの画像を含む、請求項 15に記載の動画像検索情報記録装置（40) 。

1 7. 前記検索情報生成部（102、 103、 1 04、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる全ての前記フレームから、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 16に記載の動画像検索情報記録装置（40) 。

18. 前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々に含まれる全ての前記時間的な単位幽像（162A〜162N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 15に記載の動画像検索情報記録装置（40) 。

19. 前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 160) の各々に含まれる全ての前記時間的な単位画像（162A~162N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 5に記載の動画像検索情報記録装置（40) 。

20. 前記検索情報生成部（102、 1 04、 1 04、 1 05) はさらに、前記 Ί以上の時間軸上の部分動画像（1 40、 142、 1 44、 1 46、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜1 6 2N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 4に記載の動画像検索情報記録装置（40) 。

2 1 · 前記検索情報生成部 (1 0 2, 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜 1 6 2N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む，請求項 1に記載の動画像検索情報記録装置（40) 。

22. 前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々は、 1または複数個の時間的な単位画像（1 62A〜1 6 2N) を含み、前記検索情報生成部（1 02、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（140、 1 42、 1 44、 1 46、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 6 2A〜1 6 2N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 1に記載の動画像検索情報記録装置（40) 。

23. 動画像を構成する 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々に対応した検索情報を利用して、所望の画像を検索するための動画像検索装置（50) であって、前記動画像を表わす動画像デ一タには、前記検索情報が対応付けられており、前記検索情報は、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（ 1 8 8) を含み、

前記検索情報を読出して管理するための情報管理手段（50 1、 502) と、前記情報管理手段に接続され、外部から与えられる、時間軸上の部分動画像 (1 40、 142, 144、 146、 1 60) を検索の単位とする第 1の検索要求に応答して、前記検索情報に含まれる前記空間的部分動画像の要約情報を用いて、前記第 1の検索要求に合致する時間軸上の部分動画像（1 40、 1 42、 1 44、 146、 1 60) を検索するための第 1の部分動画像検索手段（504) を含む、動画像検索装置（50) 。

24. 前記 1以上の時間軸上の部分動画像（ 1 40、 1 42、 1 44、 1 46、 1 60) の各々は、 1以上の時間軸上の単位画像（1 6 2A〜1 6 2N) を含み、前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) に含まれる前記 1以上の時間軸上の単位画像（1 6 2 A〜 1 6 2 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時問的部分動画像の要約情報を含み、

前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) を検索の単位とする第 2の検索要求に応答して、前記検索情報に含まれる前記時間軸上の単位画像（ 1 62 A〜 1 62 N) の 1または複数個からなる前記 1以上の時間的部分動画像の要約情報を用いて、前記第 2の検索要求に合致する時間軸上の部分動画像（1 40、 14 2、 1 44、 1 46、 1 60) を検索するための第 2の部分動画像検索手段（50 5) を含む、請求項 2 3に記載の動画像検索装置（50) 。

25. 前 IE検索情報はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 144、 1 46、 1 60) の各々を単位とする要約情報を含み、

前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（1 40、 1 42、 1 44、 146、 1 60) を検索の単位とする第 3の検索要求に応答して、前記検索情報に含まれる前記時間軸上の部分動画像（1 40、 142、 1 44、 1 46、 1 60) を単位とする要約情報を用いて、前記笫 3の検索要求に合致する時間軸上の部分動画像（140、 142、 1 44、 1 46、 1 60) を検索するための第 3の部分動画像検索手段（503) を含む、請求項 24に記載の動画像検索装置（50) 。

26. 前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（1 40、 1 42、 144、 146、 1 60) の各々を単位とする要約情報を含み、前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、 1 60) を検索の単位とする第 2の検索要求に応答して、前記検 I 索情報に含まれる前記時間軸上の部分動画像（1 40、 1 42、 1 44、 1 46、

1 60) を単位とする要約情報を用いて、前記第 2の検索要求に合致する時間軸上の部分動画像（140、 142、 1 44、 1 46、 1 60) を検索するための第 2の部分動画像検索手段（503) を含む、請求項 23に記載の動画像検索装置（50) 。

補正書の請求の範囲

[2000年 10月 10日（10. 10. 00) 国際事務局受理：出願当初の請求の範囲 1 7は取り下げられた；出願当初の請求の範囲 1一 16及び 18— 22は補正された；新しい請求の範囲 27-33 が加えられた；他の請求の範囲は変更なし。（9頁） ]

請求の範囲

1. (補正後）動画像データにより表わされ、 1以上の時間軸上の部分動画像 (140、 142、 144、 146、 1 60) からなる、動画像を検索するための検索情報を生成する動画像検索情報生成装置（40) であって、

前記動画像データに基づいて、前記 1以上の部分動画像の各々に対応して検索情報を生成する検索情報生成部（102、 103、 104、 105) を備え、前記検索情報生成部（ 1 02、 103、 104、 1 05) は、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 1 60) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（1 8 8) を生成するための第 1の要約情報生成手段（103) を含む、動画像検索情報生成装置（40) 。

2. (補正後）前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 1 60) は、前記動画像データにより表わされる動画像が時間軸上で分割されたものであり、

前記 1以上の時間軸上の部分動画像の前記動画像データ中の位置を表わす動画像構造情報を出力する動画像構造情報出力部（10 1) をさらに備え、

前記検索情報生成部（ 1 02、 103、 1 04、 105) は、前記動画像構造情報と前記動画像データとに基づいて、前記 1以上の時間軸上の部分動画像（ 1 40、 142、 144、 146、 1 60 ) の各々に対応した検索情報を生成する、請求項 1に記載の動画像情報生成装置。

3. (補正後）前記 1以上の時間軸上の部分動画像の各々は、 1または複数個の時問的な単位画像（ 162 A〜 1 62 N) を含み、

前記第 1の要約情報生成手段（103) は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々の、前記 1または複数個の時間的な単位画像（162A~1 62N) の全てを同一の態様で複数個の空間的分割プロックに分割し、前記 1または複数個の時間的な単位画像（ 1 62 A〜 162N) のそれぞれ同一の位置の前記空間的分割ブロックに対応する画像データから前記空間的部分動画像の要約情報を生成するための空間的分割手段（10

34

捕正された用紙（条約第 19条） 3) を含む、請求項 1に記載の動画像検索情報生成装置（40) 。

4. (補正後）前記空間的分割手段（103) は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々の、前記 1または複数個の時間的な単位画像（162A〜1 62N) の各々を、前記単位画像上に定義される 2つの方向において同一の予め定める数に分割することにより前記時間的な単位画像（ 1 62 A〜 1 62 N) の全てを複数個の空間的分割プロックに分割し、前記 1または複数個の時間的な単位画像（ 1 62 A〜 1 62 N) のそれぞれ同一の位置の前記空間的分割プロックに対応する画像データから前記空間的部分動画像の要約情報を生成するための手段（103) を含む、請求項 3に記載の動画像検索情報生成装置。

5. (補正後）前記空間的分割手段（103) は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々の、前記 1または複数個の時間的な単位画像（162A〜1 62N) の各々を、予め定める 2のべき乗数に分割することにより前記時間的な単位画像（1 62A〜162N) の全てを複数個の空間的分割プロックに分割し、前記 1または複数個の時間的な単位画像（ 1 62 A〜 1 62 N) のそれぞれ同一の位置の前記空間的分割プロックに対応する画像データから前記空間的部分動画像の要約情報を生成するための手段 (1 03) を含む、請求項 3に記載の動画像検索情報生成装置。

6. (補正後）前記検索情報生成部（102、 103、 104、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1

60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 62A〜1 62N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（102) を含む、請求項 5に記載の動画像検索情報生成装置。 7. (補正後）前記 1または複数個の時間的な単位画像（ 162 A〜 162 N) の各々は、 1フレームの画像を含む、請求項 6に記載の動画像検索情報生成装置。 8. (補正後）前記検索情報生成部（ 102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる全ての前記時間的な単位画像（162A〜162N) か

35

補正された用紙（条約第 19条）ら、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 6に記載の動画像検索情報生成装置。

9. (補正後）前記検索情報生成部（102、 1 03、 1 04、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 62A〜1 62N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（1 02) を含む、請求項 4に記載の動画像検索情報生成装置。

1 0. (補正後）前記 1または複数個の時間的な単位画像（1 6 2A〜 1 6 2 N) の各々は、 1フレームの画像を含む、請求項 9に記載の動画像検索情報生成

1 1. (補正後）前記検索情報生成部（102、 103、 104、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜162N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 9に記載の動画像検索情報生成装置。

1 2. (補正後）前記検索情報生成部（102、 103、 104、 1 05) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 62A〜 1 62N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（1 02) を含む、請求項 3に記載の動画像検索情報生成装置

(40) 。

1 3. (補正後）前記 1または複数個の時間的な単位画像（1 6 2A〜1 62 N) の各々は、 1フレームの画像を含む、請求項 1 2に記載の動画像検索情報生成装置（40) 。

14. (補正後）前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる全ての前記時間的な単位画像（162A〜162N)

36

補正された用紙（条約第 19条）から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 1 2に記載の動画像検索情報生成装置（40) 。

1 5. (補正後）前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々は、 1または複数個の時間的な単位画像（162A〜1 62 N) を含み、

前記検索情報生成部（1 02、 103、 1 04、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（1 62A〜1 62N) の 1 または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を生成するための第 2の要約情報生成手段（102) を含む、請求項 1に記載の動画像検索情報生成装置（40) 。

1 6. (補正後）前記 1または複数個の時間的な単位画像（1 6 2A〜 1 6 2 N) の各々は、 1フレームの画像を含む、請求項 1 5に記載の動画像検索情報生成装置（40) 。

1 7. (削除）

1 8. (補正後）前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、

1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜1 62N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 1 5に記載の動画像検索情報生成装置（40) 。

1 9. (補正後）前記検索情報生成部（ 102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜162N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 5に記載の動画像検索情報生成装置（40) 。

20. (補正後）前記検索情報生成部（ 102、 104、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々に含まれる全ての前記時間的な単位画像（1 62A〜1 62N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104)

37

補正された用紙（条約第 19条）を含む、請求項 4に記載の動画像検索情報生成装置（40) 。

2 1. (補正後）前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 160) の各々に含まれる全ての前記時間的な単位画像（1 62A〜1 62N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（104) を含む、請求項 3に記載の動画像検索情報生成装置（40) 。

22. (補正後）前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々は、 1または複数個の時間的な単位画像（1 62A〜1 62 N) を含み、前記検索情報生成部（102、 103、 104、 105) はさらに、前記 1以上の時間軸上の部分動画像（ 140、 142、 144、 146、 1 60) の各々に含まれる全ての前記時間的な単位画像（1 62A〜1 62N) から、前記部分動画像の要約情報を生成する第 3の要約情報生成手段（1 04) を含む、請求項 1に記載の動画像検索情報生成装置（40) _D

23. 動画像を構成する 1以上の時間軸上の部分動画像（140、 142、 14 4、 146、 1 60) の各々に対応した検索情報を利用して、所望の画像を検索するための動画像検索装置（50) であって、前記動画像を表わす動画像データには、前記検索情報が対応付けられており、前記検索情報は、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（1 88) を含み、

前記検索情報を読出して管理するための情報管理手段（50 1、 502) と、前記情報管理手段に接続され、外部から与えられる、時間軸上の部分動画像 (140、 142、 144、 146、 160) を検索の単位とする第 1の検索要求に応答して、前記検索情報に含まれる前記空間的部分動画像の要約情報を用いて、前記第 1の検索要求に合致する時間軸上の部分動画像（140、 142、 1 44、 146、 160) を検索するための第 1の部分動画像検索手段（504) を含む、動画像検索装置（50) 。

24. 前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、

1 60) の各々は、 1以上の時間軸上の単位画像（1 62A〜162N) を含み、

38

補正された用紙（条約第 19条）前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) に含まれる前記 1以上の時間軸上の単位画像（ 162 A〜 162 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を含み、

前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（140、 142、 1 44、 146、 160) を検索の単位とする第 2の検索要求に応答して、前記検索情報に含まれる前記時間軸上の単位画像（ 1 62 A〜 1 62 N) の 1または複数個からなる前記 1以上の時間的部分動画像の要約情報を用いて、前記第 2の検索要求に合致する時間軸上の部分動画像（ 140、 142、 144、 146、 1 60) を検索するための第 2の部分動画像検索手段（505) を含む、請求項 2 3に記載の動画像検索装置（50) 。

25. 前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 1 42、 144、 146、 1 60) の各々を単位とする要約情報を含み、

前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（140、 142、 1 44、 146、 1 60) を検索の単位とする第 3の検索要求に応答して、前記検索情報に含まれる前記時間軸上の部分動画像（140、 142、 144、 146、 1 60) を単位とする要約情報を用いて、前記第 3の検索要求に合致する時間軸上の部分動画像（140、 142、 144、 146、 1 60) を検索するための第 3の部分動画像検索手段（503) を含む、請求項 24に記載の動画像検索装置（50) 。

26. 前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 1

42、 144、 146、 160) の各々を単位とする要約情報を含み、

前記動画像検索装置（50) はさらに、前記情報管理手段（50 1、 502) に接続され、外部から与えられる、時間軸上の部分動画像（140、 142、 1

44、 146、 160) を検索の単位とする第 2の検索要求に応答して、前記検索情報に含まれる前記時間軸上の部分動画像（140、 142、 144、 146、

1 60) を単位とする要約情報を用いて、前記第 2の検索要求に合致する時間軸

39

補正された用紙（条約第 19条）上の部分動画像（140、 142、 144、 146、 1 60) を検索するための第 2の部分動画像検索手段（503) を含む、請求項 23に記載の動画像検索装置（50) 。

27. (追加）動画像データにより表わされ、 1以上の時間軸上の部分動画像 ( 140、 142、 144、 146、 160 ) からなる、動画像を検索するための検索情報が、前記検索情報と前記動画像データとの対応情報とともに記録された記録媒体（107) であって、

前記検索情報は、前記 1以上の時間軸上の部分動画像（140、 142、 14 4、 146、 1 60) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（1 88) を含む、記録媒体（107) 。

28. (追加）前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々は、 1または複数個の時間的な単位画像（ 1 62 A〜 1 62N) を含み、

前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々に含まれる前記 1または複数個の時間的な単位画像（ 1 6 2 A〜 162 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を含む、請求項 27に記載の記録媒体（1 07) 。

29. (追加）前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) の各々は、 1または複数個の時間的な単位画像（ 162 A〜 1

62 N) を含み、

前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 160) の各々に含まれるすべての前記時間的な単位画像（1 62A〜1 62N) から生成される前記部分動画像の要約情報を含む、請求項 2 7に記載の記録媒体（107) 。

30. (追加）動画像を構成する 1以上の時間軸上の部分動画像（140、 14

2、 144、 146、 160) の各々に対応した検索情報を管理するための動画像検索情報管理装置であって、

前記動画像を表わす動画像データには、前記検索情報が対応付けられており、

40

補正された用紙（条約第 19条）前記検索情報は、前記 1以上の時間軸上の部分動画像（140、 142、 14 4、 146、 160) の各々を空間的に分割することにより得られる 1以上の空間的部分動画像の要約情報（1 88) を含み、

前記検索情報を読出すための読出部（501) と、

前記読出部（50 1) により読出された検索情報を保持し、外部から与えられる、時間軸上の部分動画像（ 140、 142、 144、 146、 1 60 ) を検索の単位とする第 1の検索要求に応じて、前記検索情報に含まれる前記空間的部分動画像の要約情報を出力するための検索情報管理部（502) とを含む、動画像 3 1. (追加）前記 1以上の時間軸上の部分動画像（140、 142、 144、 1 46、 1 60) の各々は、 1以上の時間軸上の単位画像（ 1 6 2 A〜 1 6 2 N) を含み、

前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（140、 142、 144、 146、 1 60) に含まれる前記 1以上の時間軸上の単位画像（ 162 A〜 1 62 N) の 1または複数個を単位として前記部分動画像を時間的に分割することにより得られる 1以上の時間的部分動画像の要約情報を含み、

前記検索情報管理部（502) はさらに、外部から与えられる、時間軸上の部分動画像（140、 1 42、 144、 146、 1 60 ) を検索の単位とする第 2 の検索要求に応じて、前記検索情報に含まれる前記時間軸上の単位画像（162 A〜 1 62 N) の 1または複数個からなる前記 1以上の時間的部分動画像の要約情報を出力する、請求項 30に記載の動画像情報管理装置。

32. (追加）前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（1 40、 142、 144、 146、 160) の各々を単位とする要約情報を含み、前記検索情報管理部（502) はさらに、外部から与えられる、時間軸上の部分動画像（140、 142、 144、 146、 160 ) を検索の単位とする第 3 の検索要求に応じて、前記検索情報に含まれる前記時間軸上の部分動画像（14 0、 142、 144、 146、 1 60) を単位とする要約情報を出力する、請求項 3 1に記載の動画像検索情報管理装置。

33. (追加）前記検索情報はさらに、前記 1以上の時間軸上の部分動画像（1

41

補正された用紙（条約第 19条） 40、 142、 144、 146、 1 60) の各々を単位とする要約情報を含み、前記検索情報管理部（502) はさらに、外部から与えられる、時間軸上の部分動画像（140、 142、 144、 146、 160) を検索の単位とする第 2 の検索要求に応じて、前記検索情報に含まれる前記時間軸上の部分動画像（14 0、 142、 144、 146、 1 60) を単位とする要約情報を出力する、請求項 30に記載の動画像検索情報管理装置。

42

補正された用紙（条約第 19条）