JP4513667B2 - VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM - Google Patents
VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM Download PDFInfo
- Publication number
- JP4513667B2 JP4513667B2 JP2005179472A JP2005179472A JP4513667B2 JP 4513667 B2 JP4513667 B2 JP 4513667B2 JP 2005179472 A JP2005179472 A JP 2005179472A JP 2005179472 A JP2005179472 A JP 2005179472A JP 4513667 B2 JP4513667 B2 JP 4513667B2
- Authority
- JP
- Japan
- Prior art keywords
- information
- video
- comment
- structured
- structured information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Television Signal Processing For Recording (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本発明は、映像情報入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体に係り、特に、映像を介したコミュニケーション方法において、ユーザがリアルタイムに視聴している映像に対して、情報を入力したい場所に容易に入力できると共に、当該映像を非リアルタイムで視聴する場合においても容易に情報が入力できる、映像情報入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体に関する。 The present invention relates to a video information input / display method and apparatus, a program, and a storage medium storing the program, and in particular, in a communication method via video, information is input to a video that a user is watching in real time. The present invention relates to a video information input / display method and apparatus, a program, and a storage medium storing the program, which can be easily input to a desired place and can easily input information even when the video is viewed in non-real time.
近年、ネットワーク上で行われるユーザ間のコミュニケーションにおいて、映像を介したコミュニケーション方法が注目を集めている。 In recent years, a communication method using video has attracted attention in communication between users performed on a network.
例えば、複数のユーザが特定のテレビ番組(例えば、サッカー番組)を同時視聴しつつ、ネットワーク上の掲示板ではリアルタイムにコメントを書き合うことでコミュニケーションを図る技術がある(以下、従来の第1の技術)。このように、テレビ放送受像機とリアルタイムコミュニケーションシステムを併用することで、まるで家族と共にテレビ番組を見るかのごとく、遠く離れたユーザとのその時の感動を共有しながら、コミュニケーションを図ることができるため、特に人気の高い生放送番組において利用価値が高い(例えば、非特許文献1参照)。 For example, there is a technique in which a plurality of users watch a specific TV program (for example, a soccer program) at the same time, and communicate by writing comments in real time on a bulletin board on a network (hereinafter referred to as the first conventional technique). ). In this way, by using a TV broadcast receiver and a real-time communication system in combination, it is possible to communicate while sharing the excitement of a distant user at the same time as if watching a TV program with a family. The utility value is particularly high in a popular live broadcast program (for example, see Non-Patent Document 1).
このようなテレビ放送受像機と掲示板・チャットシステムなどを併用した方法は、テレビ放送受像機とパーソナルコンピュータ等の入力端末という2種類の装置を使用しなければならないため、例えば、テレビ放送受像機とパーソナルコンピュータを近い場所に設置しなければならないなど、利用者に不便を強いる。 Such a method using both a television broadcast receiver and a bulletin board / chat system requires the use of two types of devices: a television broadcast receiver and an input terminal such as a personal computer. Inconvenience users, such as having to install a personal computer nearby.
これに対し、利用者の端末にテレビ放送受信システムを包含することで、テレビ放送を視聴しながらのリアルタイムコミュニケーションを容易にする技術がある(以下、従来の第2の技術と記す)。当該技術では、テレビ放送映像を視聴しながら入力した情報を、サーバを介して他のユーザ端末へリアルタイムに送出することによってコミュニケーションを行う。また、入力された情報及び映像と同期した時刻情報を蓄積することで、過去に遡った情報も出力可能としている(例えば、特許文献1参照)。 On the other hand, there is a technique for facilitating real-time communication while viewing a television broadcast by including a television broadcast receiving system in the user's terminal (hereinafter referred to as a conventional second technique). In this technique, communication is performed by transmitting information input while viewing a television broadcast video to other user terminals via a server in real time. In addition, by accumulating time information synchronized with input information and video, it is possible to output information that goes back in the past (see, for example, Patent Document 1).
また、テレビ放送に限らず、リアルタイムに放送・配信される映像メディアを用いたコミュニケーションシステムがある(以下、従来の第3の技術と記す)(例えば、非特許文献2参照)。 In addition, there is a communication system using video media that is broadcast / distributed in real time, not limited to television broadcasting (hereinafter referred to as a conventional third technique) (for example, see Non-Patent Document 2).
リアルタイムに映像を視聴しながらコミュニケーションを行う上記のようなシステムでは、今まさに複数の人との映像を楽しんでいるという臨場感や一体感を作り出せるため、コミュニケーションや映像視聴をより楽しむことができる。しかし、同一時刻に同一映像を見なければならない制約があるため、映像を視聴できない人にとっては利用価値が低い。 In the system as described above that communicates while watching video in real time, it can create a sense of presence and unity that you are enjoying video with multiple people, so you can enjoy communication and video viewing more. However, since there is a restriction that the same video must be viewed at the same time, the utility value is low for those who cannot view the video.
これに対し、上記の従来の第2の技術では、テレビ放送を受信すると共に録画も可能とし、入力される情報と時間情報を蓄積しておくことで、リアルタイムに視聴しているユーザばかりでなく、録画した映像を視聴する視聴者に対しても情報共有を可能としている。
上記のようなリアルタイム映像を用いたシステムは、従来から行われてきた、テレビ放送受像機とリアルタイムコミュニケーションシステムを併用した方法を、インターネットにおける映像視聴環境の整備やパーソナルコンピュータなどの汎用端末の機能向上に合わせて組み合わせ、拡張しただけに過ぎない。ユーザの情報閲覧・入力環境については従来と変わらず、例えば、入力された情報を入力された時刻に沿って列挙するのみに留まっている。 The system using real-time video as described above is a conventional method that uses a TV broadcast receiver and a real-time communication system together, improving the video viewing environment on the Internet and improving the functions of general-purpose terminals such as personal computers. It was only combined and expanded to match. For example, the user's information browsing / input environment is not different from conventional ones. For example, input information is only listed along the input time.
このような従来的なリアルタイム映像情報閲覧・入力環境では、刻々と映像時間が経過してしまうため、例えば長い文章を入力しようとした場合、入力が終了した段階では全く異なる映像が放送・配信されている状況が容易に起こり得る。そのため、ユーザとしては今まさに視聴したその瞬間・その場面についての感想・情報などを書き込みたいにも関らず、時間のずれによって意思や情報を伝えるタイミングを逸してしまうという問題が発生してしまう。 In such a conventional real-time video information browsing / input environment, video time elapses every moment. For example, when a long sentence is input, a completely different video is broadcast / distributed when the input is completed. The situation can happen easily. Therefore, although the user wants to write the moment that he / she just watched, the impression / information about the scene, the problem of losing the timing to convey the intention and information due to the time lag occurs. .
また、入力においてタイムラグが発生するにも関らず、入力された時刻に沿って情報を管理しているため、内容の異なる情報が混在したまま列挙されてしまい、通読性や一覧性に乏しくなる。最も良く見られる状況としては、数分前の話題が突然提示される場合や、大量のユーザから情報入力が一度に行われ、どこにどのような情報が書き込まれているのか一見して分からなくなってしまう場合などがあげられる。 In addition, despite the occurrence of a time lag in input, information is managed according to the input time, so information with different contents is enumerated while being mixed, resulting in poor readability and listing. . The most common situation is when a topic from a few minutes ago is suddenly presented, or a large number of users input information at a time, and it is difficult to understand at a glance what kind of information is written. The case where it ends.
以上のように、映像を視聴しながらリアルタイムコミュニケーションを行う場合おいては、入力においてタイムラグが発生することや入力された時刻によって情報が管理されていることによって、映像の適切な場所に適切な情報を入力できない。映像の適切な場所で適切な情報を整理して閲覧できないという問題が発生する。上述した従来の第2の技術では、リアルタイムばかりでなく録画した映像を用いたコミュニケーションも行える構成となっているが、同システムにおいてリアルタイムに入力された情報は、同様の問題を持つため、録画した映像を視聴する場合においても、適切な情報の閲覧・入力は難しい。 As described above, when real-time communication is performed while viewing a video, information that is appropriate for the appropriate location of the video can be obtained because a time lag occurs in the input and the information is managed according to the input time. Cannot be entered. There arises a problem that appropriate information cannot be organized and viewed at an appropriate place in the video. In the conventional second technology described above, communication is possible not only in real time but also using recorded video. However, information input in real time in the same system has the same problem, so it has been recorded. Even when viewing video, it is difficult to browse and input appropriate information.
本発明は、上記の点に鑑みなされたもので、ネットワーク上で映像を介したコミュニケーションを行う際に、入力されるコメント情報が映像上のどの場所に入力されたものであるかが容易に把握することが可能な映像情報入力・表示方法及び装置及びプログラム及びプログラムを格納した記憶媒体を提供することを目的とする。 The present invention has been made in view of the above points, and when communicating via video on a network, it is easy to know where the comment information input is input on the video. An object of the present invention is to provide a video information input / display method and apparatus, a program, and a storage medium storing the program.
図1は、本発明の映像情報入力・表示方法の原理説明図である。 FIG. 1 is a diagram for explaining the principle of a video information input / display method according to the present invention.
本発明(請求項1)は、ネットワーク上での映像に関するコミュニケーションにおける映像情報入力・表示方法であって、
映像を特定する映像情報を取得する映像情報取得手順(ステップ1)と、
映像に関わる映像構造化情報であり、表示開始から終了までの区間を算出する必要のある、または、計算時間を要する場合に、未定の項目を設定した一次映像構造化情報を算出し、映像構造化情報DBに格納する映像構造化算出手順(ステップ2)と、
映像構造化情報DBから一次映像構造化情報を取得する映像構造化情報取得手順(ステップ3)と、
映像構造化情報取得手順(ステップ3)で取得した一次映像構造化情報を表示装置に提示し、ユーザに一次映像構造化情報を選択させる映像構造化情報指定手順(ステップ4)と、
選択された一次映像構造化情報に対応する映像に関するコメント情報をユーザに入力させるコメント情報入力手順(ステップ5)と、
ユーザからコメント情報が入力されると、該コメント情報及び該コメント情報の入力時に選択された一次映像構造化情報とを関連付けて、コメント情報・映像構造化情報DBに格納するコメント情報・映像構造化情報蓄積手順(ステップ6)と、
映像情報取得手順で取得済みの映像情報及び映像構造化情報取得手順で取得済みの一次映像構造化情報を用いて、コメント情報・映像構造化情報DBから関連付けられたコメント情報を取得するコメント情報取得手順(ステップ7)と、
コメント情報取得手順で取得したコメント情報及び一次映像構造化情報を関連付けて表示手段に表示する情報表示手順(ステップ8)と、
一次映像構造化情報の未定の項目が確定した場合に、該一次映像構造化情報を映像構造化情報に変更してコメント情報・映像構造化情報DBに蓄積する映像構造化情報修正手順と、を行う。
The present invention (Claim 1) is a video information input / display method in communication related to video on a network,
A video information acquisition procedure (step 1) for acquiring video information for identifying video;
This is video structured information related to the video. When it is necessary to calculate the section from the start to the end of the display or when it takes calculation time, the primary video structured information with undecided items is calculated and the video structure is calculated. Video structuring calculation procedure (step 2) to be stored in the conversion information DB;
A video structured information acquisition procedure (step 3) for acquiring primary video structured information from the video structured information DB;
A video structured information specifying procedure (step 4) for presenting the primary video structured information acquired in the video structured information acquiring procedure (step 3) on the display device and allowing the user to select the primary video structured information ;
Comment information input procedure (step 5) for allowing the user to input comment information related to the video corresponding to the selected primary video structured information ;
When comment information is input from the user, the comment information and the video structuring information stored in the comment information / video structuring information DB in association with the comment information and the primary video structuring information selected when the comment information is input. Information accumulation procedure (step 6);
Comment information acquisition that acquires comment information associated with the comment information / video structured information DB using the video information acquired in the video information acquisition procedure and the primary video structured information acquired in the video structured information acquisition procedure Procedure (step 7);
An information display procedure (step 8) for associating and displaying the comment information acquired in the comment information acquisition procedure and the primary video structured information on the display means;
Video structuring information correction procedure for changing the primary video structuring information to video structuring information and storing it in the comment information / video structuring information DB when an undecided item of primary video structuring information is confirmed; Do.
上記の手順により、まず、映像を特定する映像情報が取得されると共に、テレビ放送映像やネットワーク配信映像などのリアルタイム映像から該映像に関わる映像構造化情報が次々と算出される。映像構造化情報とは、例えば、場面の区切りや文字(テロップ文字)が表示されている区間・場所、映像内の人物名や場所・出現区間、発話された音声区間・それを文字に書き下したものなど、映像に関わる事物・事象などを記述した映像を様々な単位を用いて構造化する情報である。単純な例としては、カメラの切り替わり点(カット点)によって映像は幾つかの区間に分割され、構造化される。 According to the above procedure, first, video information for identifying a video is acquired, and video structured information related to the video is calculated one after another from real-time video such as television broadcast video and network distribution video. The video structured information is, for example, a section / place where a scene break or character (telop character) is displayed, a person's name or place / appearance section in the video, a spoken audio section / written in characters It is information that structures video using various units that describe things and events related to the video. As a simple example, an image is divided into several sections and structured by switching points (cut points) of cameras.
次に、算出された映像構造化情報を取得すると共に、ユーザがコメント情報を入力する場合、コメント情報を入力する映像構造化情報を指定する。上記のように、映像構造化情報を用いることで映像は構造化される。例えば、カット点を用いて映像を複数の連続体と見做す場合、ユーザは、今まさに見ている場所にコメント情報を入力したい場合は現在の区間を、思い出した情報を入力したい場合は過去の該当する区間を指定する。 Next, the calculated video structuring information is acquired, and when the user inputs comment information, the video structuring information for inputting the comment information is designated. As described above, the video is structured by using the video structuring information. For example, when using a cut point to consider a video as multiple continuums, the user wants to enter comment information at the location he is currently looking at, the current section, or past information Specify the corresponding section of.
次に、入力されたコメント情報と指定された映像構造化情報を関連付けて蓄積する。コメント情報は映像構造化情報と関連付けて蓄積されるため、例えば、新たなカット点が検出され、コメント情報を入力し始めた映像区間が過去の映像区間となった場合でも、入力された映像区間と適切に関連付けて保持される。よって、ユーザは、入力にタイムラグが生じた場合でも適切な箇所に情報を入力できる。 Next, the input comment information and the designated video structuring information are stored in association with each other. Since the comment information is stored in association with the video structuring information, for example, even if a new cut point is detected and the video section where the comment information has started to be input becomes a past video section, the input video section Are held in association with each other. Therefore, the user can input information at an appropriate location even when a time lag occurs in the input.
次に、蓄積されているコメント情報及び映像構造化情報を取得し、それらを関連付けて提示する。上記のように、コメント情報と映像構造化情報を関連付けているため、映像のどの場所にどのような情報が入力されているのか一見して判別できるようになると共に、例えば、映像構造化情報として上述した様々な情報を用いた場合、映像の特定の人物について入力された情報や映像内の文字情報について追記された情報などを、映像構造化情報を用いて整理して提示できる。 Next, the accumulated comment information and video structuring information are acquired and presented in association with each other. As described above, since the comment information and the video structured information are associated with each other, it is possible to determine at a glance what information is input in which place of the video. For example, as the video structured information, When the various information described above is used, information input about a specific person in the video, information added about character information in the video, and the like can be organized and presented using the video structured information.
よって、これらの手順を踏まえてコメントを入力・表示すれば、リアルタイムに映像を視聴する場合においても、適切にコメントを入力・表示でき、ユーザ間のコミュニケーションはスムーズに行われる。 Therefore, if a comment is input / displayed based on these procedures, the comment can be appropriately input / displayed even when viewing a video in real time, and communication between users is smoothly performed.
当該請求項の方法は、映像化構造化情報を算出する際に、映像構造化情報が算出できない、あるいは確定していない状況などにおいて、一次映像構造化情報を算出する。この方法により、例えば、映像構造化情報算出手順において、映像構造化情報の算出に時間がかかる場合においても、一次映像構造化情報を用いて直ちに映像構造化情報の提示やコメント情報の提示・入力が可能となる。 The method of the claim calculates primary video structured information when calculating the video structured information in a situation where the video structured information cannot be calculated or has not been determined. By this method, for example, even if it takes time to calculate the video structured information in the video structured information calculation procedure, the presentation of the video structured information and the presentation / input of the comment information immediately using the primary video structured information. Is possible.
当該請求項の方法は、映像構造化情報を指定する際に、映像構造化情報が算出されていない、あるいは、確定していない状況などにおいて、一次映像構造化情報を指定できると共に、一次映像構造化情報を蓄積する。この方法により、例えば、映像構造化情報算出手順において、映像構造化情報の算出に時間がかかる場合においても、ユーザは仮の映像構造化情報を用いて直ちに情報を入力できると共に、一次映像構造化情報を用いたコメント情報の閲覧・入力が可能になる。 The method of the claim can specify the primary video structured information in the situation where the video structured information is not calculated or determined when the video structured information is designated, and the primary video structure is specified. Accumulation information is accumulated. By this method, for example, in the video structured information calculation procedure, even when it takes time to calculate the video structured information, the user can input information immediately using the temporary video structured information, and the primary video structured It is possible to browse and input comment information using information.
当該請求項の方法は、算出された映像構造化情報を任意に変更できると共に、蓄積されているコメント情報・映像構造化情報を、変更された映像構造化情報に従って変換する。この方法により、例えば、仮の映像構造化情報を用いた場合や自動的に算出された映像構造化情報に誤検出結果が含まれる場合、適度な粒度で映像を構造化できなかった場合でも、適宜映像構造化情報を修正し、また、修正された結果に合わせた適切な状態で情報の閲覧・入力が可能となる。 The method of the claim can arbitrarily change the calculated video structuring information, and converts the stored comment information / video structuring information according to the changed video structuring information. By this method, for example, when using temporary video structuring information or when the erroneously detected result is included in the automatically calculated video structuring information, even if the video could not be structured with an appropriate granularity, The video structured information is appropriately corrected, and information can be browsed and input in an appropriate state according to the corrected result.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項2)は、ネットワーク上での映像に関するコミュニケーションにおける映像情報入力・表示装置であって、
映像構造化情報を格納する映像構造化DB3と、
コメント情報及び該コメント情報が指定された該映像構造化情報とを関連付けて格納するコメント情報・映像構造化情報DB8と、
映像を特定する映像情報を取得する映像情報取得手段1と、
映像に関わる映像構造化情報であり、表示開始から終了までの区間を算出する必要のある、または、計算時間を要する場合に、未定の項目を設定した一次映像構造化情報を算出し、映像構造化情報DB3に格納する映像構造化情報算出手段2と、
映像構造化情報DB3から一次映像構造化情報を取得する映像構造化情報取得手段4と、
映像構造化情報取得手段4で取得した一次映像構造化情報を表示装置に提示し、ユーザに一次映像構造化情報を選択させる映像構造化情報指定手段5と、
選択された一次映像構造化情報に対応する映像に関するコメント情報をユーザに入力させるコメント情報入力手段6と、
ユーザからコメント情報が入力されると、該コメント情報及び該コメント情報の入力時に選択された一次映像構造化情報とを関連付けて、コメント情報・映像構造化情報DB8に格納するコメント情報・映像構造化情報蓄積手段7と、
映像情報取得手段1で取得済みの映像情報及び映像構造化情報取得手段4で取得済みの一次映像構造化情報を用いて、コメント情報・映像構造化情報DB8から関連付けられたコメント情報を取得するコメント情報取得手段9と、
コメント情報取得手段9で取得したコメント情報及び一次映像構造化情報を関連付けて表示手段に表示する情報表示手段10と、
一次映像構造化情報の未定の項目が確定した場合に、該一次映像構造化情報を映像構造化情報に変更して前記コメント情報・映像構造化情報DBに蓄積する映像構造化情報修正手段と、を有する。
The present invention (Claim 2 ) is a video information input / display apparatus in communication related to video on a network,
A video structuring DB 3 for storing video structuring information;
Comment information / video structured
Video information acquisition means 1 for acquiring video information for specifying video;
This is video structured information related to the video. When it is necessary to calculate the section from the start to the end of the display or when it takes calculation time, the primary video structured information with undecided items is calculated and the video structure is calculated. Video structured
Video structured information acquisition means 4 for acquiring primary video structured information from the video structured information DB 3;
Video structured
Comment information input means 6 for allowing the user to input comment information related to the video corresponding to the selected primary video structured information ;
When comment information is input from the user, the comment information and the structured video information stored in the comment information / video structured
A comment for acquiring comment information associated with the comment information / video structured
Information display means 10 for associating and displaying the comment information acquired by the comment information acquisition means 9 and the primary video structured information on the display means;
Video structuring information correction means for changing the primary video structuring information to video structuring information and storing it in the comment information / video structuring information DB when undecided items of primary video structuring information are confirmed; Have
本発明(請求項3)は、請求項1に記載の映像情報入力・表示方法の手順をコンピュータに実行させる映像情報入力・表示プログラムである。
The present invention (Claim 3 ) is a video information input / display program for causing a computer to execute the procedure of the video information input / display method according to
本発明(請求項4)は、請求項3に記載の映像情報入力・表示プログラムを格納した記憶媒体である。
The present invention (Claim 4 ) is a storage medium storing the video information input / display program according to Claim 3 .
上記の目的を達成するために、本発明では、テレビ放送映像やネットワーク配信映像などのリアルタイム映像から映像構造化情報を算出することを特徴とする。また、映像構造化情報を用いて、ユーザが入力する映像に対する感想などのコメント情報を、映像構造化情報と関連付けて入力・提示することを特徴とする。 In order to achieve the above object, the present invention is characterized in that video structured information is calculated from real-time video such as television broadcast video and network distribution video. In addition, the video structured information is used to input and present comment information such as impressions about the video input by the user in association with the video structured information.
上記の特徴を有することで、映像構造化情報を用いてコメント情報を入力する位置を指定できるため、タイムラグ等が発生した場合でも、情報を入力したい場所に適切に情報を入力できる。また、映像構造化情報と関連付けてコメント情報を提示することで、従来の手法に見られるような時間情報のみを用いた方法と異なり、情報を整理して閲覧できるようになる。 With the above characteristics, the position where comment information is input can be specified using the video structured information. Therefore, even when a time lag occurs, information can be appropriately input at a place where information is desired to be input. Also, by presenting the comment information in association with the video structured information, it becomes possible to organize and browse the information, unlike the method using only the time information as found in the conventional method.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
本発明の実施の形態の説明において、映像(映像コンテンツ)は、映像情報と音情報を含むコンテンツに限定されることはなく、少なくとも画像情報を含むあらゆるコンテンツを映像と呼ぶ。 In the description of the embodiment of the present invention, video (video content) is not limited to content including video information and sound information, and any content including at least image information is referred to as video.
また、コメント情報は、文字情報に限定されることなく、Web上のコンテンツを指し示すURLや感情を表現する画像、関連する文書、音声、楽曲など、コミュニケーションを図る上で利用可能な情報を含む。 The comment information is not limited to character information, but includes information that can be used for communication, such as URLs pointing to contents on the Web, images expressing emotions, related documents, sounds, and music.
[第1の実施の形態]
本実施の形態による映像情報入力・表示システムは、テレビ放送受像機などを用いてリアルタイムにテレビ放送映像を視聴する場合や、本システムとは独立した映像再生ソフトウェアなどを用いてネットワーク上でリアルタイムに配信される映像を視聴する場合を想定したものであり、それらの映像を視聴しながら各ユーザが入力したコメント情報をサーバを介して共有することで、ユーザ間で映像に関するコミュニケーションを行うものである。
[First Embodiment]
The video information input / display system according to the present embodiment is used in real time on a network when viewing a television broadcast video in real time using a television broadcast receiver or the like, or using video playback software independent of this system. It is intended for viewing distributed video, and by sharing the comment information input by each user via the server while viewing the video, communication regarding the video is performed between the users. .
以下の例では、説明の簡略化のために、テレビ放送受像機を用いて、テレビ放送を視聴しながらパーソナルコンピュータなどの端末を用いてコミュニケーションを行う、最も一般的なコミュニケーション方法を基本に説明する。 In the following example, for the sake of simplification of explanation, a description will be given based on the most common communication method in which a television broadcast receiver is used to communicate using a terminal such as a personal computer while watching a television broadcast. .
なお、本実施の形態は、請求項1及び請求項5を実施した場合の具体例を示している。
In addition, this Embodiment has shown the specific example at the time of implementing
図3は、本発明の第1の実施の形態におけるシステム構成図である。 FIG. 3 is a system configuration diagram according to the first embodiment of the present invention.
同図に示す映像コメント入力・表示システムは、複数台のクライアント装置100とサーバ装置200を含み、クライアント装置100とサーバ装置200は、例えば、インターネットのようなネットワークを介して接続される。ここで言う接続とは、各端末が論理的に接続される状態を指し、電話回線、FTTH、無線LANなどの接続方法は問わない。
The video comment input / display system shown in FIG. 1 includes a plurality of
クライアント装置100は、複数台存在するが、説明の簡略化のため以下では1台のクライアント装置100を用いて説明する。また、各クライアント装置100を保有するユーザは、上記で述べたようにテレビ放送受像機を用いて映像を視聴しているとする。
Although there are a plurality of
サーバ装置200は、コミュニケーションの対象となる映像を特定する映像情報を取得する。本実施の形態の場合は、テレビ放送映像が対象となるため、映像情報としてテレビ放送局(チャンネル)、放送時間を用いる。なお、他の例としては、EPG情報、iEPG情報、Gコードなどを用いてもよく、受信するテレビ放送映像が特定できればよい。なお、本実施の形態とは異なり、ネットワークにおけるライブ配信映像などを想定する場合、映像情報としては、当該映像の位置を指し示すURLなどが利用される。
The
サーバ装置200は、映像情報取得部201によって得られる映像情報によって特定される映像から映像構造化情報を算出する映像構造化情報算出部202を有する。具体的に、映像構造化情報算出部202は、テレビ放送映像をコンピュータで処理可能な信号に変換するテレビチューナーボードなどの装置と、当該信号を蓄積するメモリなどの装置、変換された信号から映像構造化情報を算出する装置あるいはプログラムなどからなる。本実施の形態とは異なり、ネットワーク上のライブ配信映像などを対象とする場合は、映像を一時蓄積するメモリなどの装置と、蓄積された映像から映像構造化情報を算出する装置、あるいは、プログラムなどからなる。一般的に、映像構造化情報算出部202は、対象となる映像を処理可能な形態に変換・蓄積する装置、あるいはプログラムと、映像構造化情報を算出する装置・プログラムなどからなり、映像から映像構造化情報を算出できればその形態は問わない。
The
また、本実施の形態では、単純化のために、テレビ放送映像やネットワーク配信映像の1チャンネル分だけを対象にして説明を行うが、複数のチャンネルを同時受信して処理を行ってもよい。その場合、映像情報取得部201及び映像構造化情報算出部202はチャンネル分だけ並列に存在し、映像情報の取得、映像構造化情報の算出を行うことになる。
Further, in this embodiment, for simplification, description will be made only for one channel of a television broadcast video or a network distribution video, but processing may be performed by simultaneously receiving a plurality of channels. In that case, the video
映像構造化情報算出部202により算出される映像構造化情報とは、画面上の色情報や場面の切り替わり点、カメラワーク、撮影されている物体、文字、発話内容、発話者や音楽の認識結果、一定間隔で取り出される時刻情報など、映像上の物理的、あるいは、意味的な特徴を示す情報であり、様々な単位を用いて映像を構造化する情報である。映像構造化情報は、映像管理や映像検索などの分野で広く扱われる情報であり、情報のいくつかは既知の映像解析技術を用いて取得できる。例えば、場面の切り替わり点やテロップ表示区間などに関しては、特許第2839132号公報、特開平9−238298号公報、及び、特開平11−178007号公報などに記載されており、それ以外の特徴量についても様々な研究が為されている。
The image structured information calculated by the image structured
一般に、映像構造化情報の算出・取得には映像を解析する処理時間を要する。しかし、コンピュータの高性能化や様々な解析アルゴリズムの提案・改良により、例えば、カメラの切り替え点であるカット点などの物理的な特徴量を用いた軽度な情報の算出は、現在のコンピュータで遅延無く行えるようになっている。本実施の形態では、現状におけるこのような軽度な処理や将来的な計算時間の短縮を考慮し、処理に要する時間については遅延がないことを仮定して話を進める。遅延が発生するような状況については、第2の実施の形態で後述する。 In general, calculation / acquisition of video structuring information requires processing time for analyzing video. However, with the improvement of computer performance and the proposal and improvement of various analysis algorithms, for example, calculation of light information using physical features such as cut points that are camera switching points is delayed by current computers. It can be done without it. In the present embodiment, in consideration of such a light process in the present situation and a reduction in future calculation time, it is assumed that there is no delay in the time required for the process. A situation where a delay occurs will be described later in the second embodiment.
映像構造化情報算出部202により、リアルタイムに放送・配信される映像から、次々と映像構造化情報が取得され、映像構造化情報DB203に次々と蓄積される。映像構造化情報としてカメラの切り替え点を用いた場合の、映像構造化情報DB203における映像構造化情報の蓄積例を図4に示す。なお、ソフトウェアや装置として実装されたDBを利用せず、メモリなどに一時的に蓄積した状態を映像構造化情報DB203としてもよい。
The video structuring
本実施の形態における例では、算出されたカメラの切り替え点の映像上の時刻をtnとした場合、各tnによって区切られる区間を代表する画像を代表画像nとして算出するものとする。代表画像も、構造化された映像を分かりやすく提示する場合に有効な情報の一つである。代表画像nの最も単純な算出方法としては、各区間の先頭時刻であるtnにおいて静止画像を取得する方法も挙げられるが、区間内におけるカメラの動きからパノラマ状の代表画像を作成する方法や、顔認識技術を用いて画面内に顔が映っている時刻から代表画像を取得する方法などもある。これらの方法については特に制限を設けず、既知の技術を用いて代表画像を取得するものとする。 In the example in the present embodiment, when the calculated time on the video of the switching point of the camera is tn, an image representing a section divided by each tn is calculated as the representative image n. The representative image is also one piece of information that is effective when a structured video is presented in an easy-to-understand manner. As the simplest calculation method of the representative image n, there is a method of acquiring a still image at tn which is the start time of each section, but a method of creating a panoramic representative image from the movement of the camera in the section, There is also a method of acquiring a representative image from the time when the face is shown on the screen using the face recognition technology. These methods are not particularly limited, and a representative image is acquired using a known technique.
図4に示すように、映像Aから取得される各映像構造化情報は、一意に識別する識別ID,映像情報取得部201によって取得された映像情報からなる映像識別子、映像構造化情報が算出された映像時刻、各区間の代表画像を識別する代表画像IDによって定義され、これらの情報により映像構造化情報は一意に特定されるようになる。
As shown in FIG. 4, each video structured information acquired from the video A has an identification ID for uniquely identifying, a video identifier consisting of the video information acquired by the video
以上の手段を用いることで、サーバ装置200上では、リアルタイムに放送・配信される映像から次々と映像構造化情報を算出し、蓄積していくこととなる。
By using the above means, on the
クライアント装置100は、コミュニケーションの対象となる映像を特定する映像情報を取得する映像情報取得部101を有する。本実施の形態の場合、ユーザはテレビ放送受像機などを用いて映像を視聴しているため、映像情報取得部101は、例えば、視聴しているテレビ放送映像のテレビ放送局(チャンネル)と放送時間などを手入力、あるいは、別途用意されたテレビ番組表などから選択し、取得するものとする。映像情報取得部101において、取得される映像情報は、サーバ装置200上の映像情報取得部201において取得される映像情報と整合させる必要があるが、同一の映像を扱っている場合において、両者の情報が同一の映像を特定できればよいため、両者で異なる情報を扱う場合(例えば、クライアント装置100ではiEPG情報、サーバ装置200ではGコード)においては、両者を同一の映像情報に変換するなどの暗黙の処理を含んでよい。
The
クライアント装置100は、映像構造化情報算出部202によって算出された映像構造化情報を取得する映像構造化情報取得部102を有する。具体的に、映像構造化情報取得部102は、映像情報取得部101によって取得された映像情報を用いて、映像構造化情報DB203に問い合わせを行い、当該映像情報によって特定される映像に関する映像構造化情報を取得する。図4を例にした場合、各映像構造化情報における映像識別子を用いることで、映像構造化情報の取得は容易に行うことができる。
The
クライアント装置100は、ユーザが映像に対する感想などのコメント情報を入力したい場合に、コメント情報の入力先である映像構造化情報を指定する映像構造化情報指定部103を有する。映像構造化情報指定部103における映像構造化情報の指定方法の例を図5に示す。
The
図5は、図4で示した映像構造化情報を用いた場合の例である。また、映像構造化情報指定部103における表示の時間経過に伴う変化を示す。映像Aの視聴に伴い、映像構造化情報は次々と映像構造化情報算出部202によって算出される。そのため、映像上の時刻taを視聴している際には、それまでに算出された映像構造化情報が、時刻tbを視聴している際には新たに算出された映像構造化情報が次々と提示されていく。このように算出される映像構造化情報を次々と提示することで、ユーザは、現在視聴中の映像区間についてコメント情報を入力できるばかりでなく、一つ前の区間、あるいは、それ以前の区間に対してもコメント情報を入力できるようになる。ユーザは提示された映像構造化情報のうちのいずれかを選択(図5では「コメント入力」ボタンを押下)することで、コメント情報を入力する映像情報構造化情報を指定する。
FIG. 5 is an example in the case of using the video structuring information shown in FIG. In addition, a change with time of display in the video structured
クライアント装置100は、映像構造化情報指定部103によって指定された映像構造化情報に対してユーザにコメント情報を入力させるコメント情報入力部104を有する。コメント情報入力部104の画面例を図6に示す。コメント情報入力部104は、映像構造化情報指定部103においてユーザから映像構造化情報が指定された場合に、図6に示すようなウィンドウなどを提示してユーザにコメント情報の入力を促す。このようなインタフェースを用いることで、ユーザは指定された映像構造化情報に対して映像に対する感想などのコメントが入力できるため、図7に示すように、時間の経過に伴い映像の内容が切り替わってしまった場合でも、映像構造化情報によって指定される適切な映像区間に対してコメント情報を継続して入力できるようになる。
The
クライアント装置100は、映像構造化情報指定部103により指定された映像構造化情報と、コメント情報入力部104から入力されたコメント情報を関連付けて蓄積するコメント情報・映像構造化情報蓄積部105を有する。本実施の形態の場合、コメント情報及び映像構造化情報は、図6におけるコメント情報入力部104において入力を確定した段階で直ちにサーバ装置200上のコメント情報・映像構造化情報DB204に蓄積される。本実施の形態におけるコメント情報・映像構造化情報蓄積DB204の具体例を図8に示す。
The
本実施の形態の場合、コメント情報・映像構造化情報蓄積DB204に蓄積される映像構造化情報としては、映像構造化情報DB203において各映像構造化情報を特定する一意な識別子となる識別IDを用いる。また、コメント情報としては、コメント情報を入力したユーザのユーザ名、入力日時、入力されたコメントを用いる。コメント情報・映像構造化情報DB204は、それらの情報を図8に示すように関連付けて蓄積することで、どの映像構造化情報にどのようなコメント情報が付与されたのかを容易に取得できるようになる。
In the case of the present embodiment, as the video structured information stored in the comment information / video structured
クライアント装置100は、映像情報取得部101によって取得された映像情報と映像構造化情報取得部102によって取得された映像構造化情報を用い、コメント情報・映像構造化情報DB204から関連するコメント情報を取得するコメント情報取得部106を有する。本実施の形態の場合、図8で示したように、取得済みの映像構造化情報の識別IDを参照することで、該当する映像に対して入力されたコメント情報を全て取得する。
The
クライアント装置100は、コメント情報取得部106により取得されたコメント情報を取得済みの映像構造化情報と関連付けて提示する情報表示部107を有する。本実施の形態の場合、映像構造化情報指定部103と表示部を併用して図9のように提示する。
The
図9の左側では、情報表示部107によって、ある時刻taにおいて取得済みの映像構造化情報と共に、その時点で入力されたコメント情報が各映像構造化情報に関連付けて表示される。また、図9の右側では、ある時刻tbにおいて新たに取得された映像構造化情報と共に、時刻taからtbの間に入力された新たなコメント情報が追加表示される。
On the left side of FIG. 9, the
このようにして、情報表示部107では、各映像構造化情報に関連付けてコメント情報を表示していくことで、入力にタイムラグがあった場合でも情報入力先に対して適切にコメント情報を提示できると共に、映像構造化情報と共に表示することで、どのコメント情報がどの映像部分に対して付けられたものであるのかを容易に理解できるようにする。
In this way, the
本実施の形態によれば、以上のような手段を用いることで、視聴中のリアルタイム映像から次々と算出される映像構造化情報を用いて適切な場所にコメント情報を入力できるようになると共に、映像構造化情報と関連付けて提示することで、各コメント情報が映像上のどの場所に入力されたものであるか容易に把握できるようになる。よって、入力された時刻に沿って次々とコメント情報を提示する従来の情報入力・表示方法とは異なり、リアルタイムに映像を視聴する場合においても適切に情報を入力・表示でき、ユーザ間のコミュニケーションはスムーズに行われる。 According to the present embodiment, by using the above-described means, it becomes possible to input comment information to an appropriate place using video structured information calculated one after another from the real-time video being viewed. By presenting it in association with the video structured information, it is possible to easily grasp where each comment information is input on the video. Therefore, unlike conventional information input / display methods that present comment information one after another along the input time, information can be input / displayed appropriately even when viewing video in real time, and communication between users is Performed smoothly.
[第2の実施の形態]
本実施の形態では、リアルタイムに放送されたテレビ放送映像やネットワーク上でのライブ配信映像などを対象とするもので、第1の実施の形態とは異なり、本システム内に用意された映像視聴用装置、あるいはプログラムなどを用いて映像を視聴しながらコミュニケーションを行うものである。
[Second Embodiment]
This embodiment is intended for TV broadcast video broadcast in real time, live distribution video on a network, and the like. Unlike the first embodiment, it is for video viewing prepared in this system. Communication is performed while viewing video using a device or a program.
以下の例では、説明の簡略化のために、ネットワーク上でのライブ配信映像を対象にコミュニケーションを行う場合を想定して説明する。本実施の形態では、請求項1〜4、5〜8を実施した場合の具体例を示している。 In the following example, for simplification of description, a description will be given assuming that communication is performed on a live distribution video on a network. In this Embodiment, the specific example at the time of implementing Claims 1-4 and 5-8 is shown.
図10は、本発明の第2の実施の形態におけるシステム構成図である。 FIG. 10 is a system configuration diagram according to the second embodiment of the present invention.
同図に示すシステムは、複数台のクライアント装置100と、サーバ装置200、リアルタイムライブ映像を配信するライブ映像配信サーバ300とを含み、クライアント装置100と各サーバ装置200は、例えば、インターネットのようなネットワークを介して接続される。クライアント装置100は複数台存在するが、説明の簡略化のため以下では1台のクライアント装置100を用いて説明する。
The system shown in FIG. 1 includes a plurality of
なお、以下では、図3の構成と同一構成部分には同一符号を付す。 In the following, the same components as those in FIG.
ライブ映像配信サーバ300は、カメラからの生映像あるいは録画済の映像などを、ネットワークを通じてリアルタイムに配信する映像配信部301を有する。映像配信部301から配信される映像はURLなどで接続先を指定でき、映像再生プログラムなどに当該情報を入力して接続することで、ユーザはリアルタイムに映像を視聴できるようになる。本実施の形態では、ネットワーク上でのライブ配信を想定しているが、テレビ放送映像を対象とした場合ではライブ映像配信サーバ装置300を放送局と置換して考えることができる。
The live video distribution server 300 includes a
クライアント装置100は、コミュニケーションの対象となる映像を特定する映像情報を取得する映像情報取得部101を有する。本実施の形態におけるライブ配信映像を特定する映像情報としては、例えば、映像配信元によって一意に定めるURLや識別ID、映像ファイル名、あるいいはそれらを複合した情報を用いる。
The
クライアント装置100は、上記の映像情報取得部101によって得られる映像情報によって特定される映像から映像構造化情報を算出する映像構造化情報算出部108を有する。具体的な映像構造化情報算出部108については既に、第1の実施の形態の映像構造化情報算出部202と同様であるため、詳細な説明を省略する。但し、本実施の形態の場合は、クライアント装置100内で映像構造化情報を算出するため、使用する映像構造化情報やクライアント装置の性能によって算出に時間がかかる場合が想定される。そこで以下では、映像構造化情報算出部108において映像構造化情報の算出にタイムラグが生じることを前提にして説明する。また、クライアント装置100によって算出する映像構造化情報も異なるものとする。すなわち、カメラの切り替え点を算出するクライアント装置、オブジェクトを認識するクライアント装置など、ユーザによって算出する映像構造化情報を分散して処理する状況を想定する。前述の第1の実施の形態では、サーバ装置200側で全ての映像構造化情報を算出した例を示したが、本実施の形態のようにクライアント装置100側で映像構造化情報を算出することによって、サーバ装置200側で算出される映像構造化情報以外の様々な映像構造化情報を用いたコミュニケーションが可能になる。
The
なお、クライアント装置100によっては映像構造化情報を算出しない場合もあり得る。その場合、映像構造化情報算出部108は映像構造化情報DB203に何も蓄積しない。
Depending on the
サーバ装置200は、上記の映像構造化情報算出部108によって算出された映像構造化情報を蓄積する映像構造化情報DB203を有する。蓄積された映像構造化情報の例を図11に示す。
The
本実施の形態では、第1の実施の形態とは異なり、カメラの切り替え点ばかりでなく、映像内の様々な情報を認識することで、例えば、映像内に映っているオブジェクトや人物の顔、テロップ文字と呼ばれる画像内文字情報なども抽出するものとする。図11に示すように、これらの映像構造化情報は、算出対象となる映像を識別する映像識別子(図4と同様に映像情報からなる)、算出された開始時間・終了時間、代表画像などと共に、例えば、顔認識の場合には、認識された顔領域の画面上の位置や認識された人物名などの補助的な情報と共に蓄積される(図11では“補助情報”として簡略化して図示されている)。なお、これらの情報は、サーバ装置200が有する映像構造化情報修正部206によって適宜修正され得る。映像構造化情報修正部206については後述する。
In the present embodiment, unlike the first embodiment, by recognizing not only the camera switching point but also various information in the video, for example, an object or a human face reflected in the video, In-image character information called telop characters is also extracted. As shown in FIG. 11, the video structuring information includes a video identifier for identifying a video to be calculated (consisting of video information as in FIG. 4), a calculated start time / end time, a representative image, and the like. For example, in the case of face recognition, it is stored together with auxiliary information such as the position of the recognized face area on the screen and the recognized person name (in FIG. 11, it is shown in a simplified manner as “auxiliary information”). ing). Note that these pieces of information can be appropriately corrected by the video structured
ここで、請求項2、6に関わる特徴として、映像構造化情報算出部108は、一次映像構造化情報を算出できる。ここで、一次映像構造化情報とは、画面上に表示されている文字のように、表示開始から終了までの区間を算出する必要のあるものや、顔画像認識のように計算時間を要する映像構造化情報が存在するため、このような映像構造化情報に対して一次的に算出し、利用する映像構造化情報をいう。
Here, as a feature relating to
区間確定後や計算終了後に対応する映像構造化情報が確定した場合、一次映像構造化情報は確定した映像構造化情報に置き換えられる。例えば、図14に示すように、ユーザが入力した画面上の位置情報を一次映像構造化情報とし、図15に示すように位置情報に対応する領域情報が確定した場合、位置情報は領域情報に置換される。 When the corresponding video structuring information is determined after the section is determined or after the calculation is completed, the primary video structuring information is replaced with the determined video structuring information. For example, as shown in FIG. 14, when the position information on the screen input by the user is the primary video structured information and the area information corresponding to the position information is confirmed as shown in FIG. 15, the position information is converted into the area information. Replaced.
上述した情報には、カメラの切り替わり点のようにある時刻に即座に算出できるものと、画面上に表示されている文字のように、表示開始から終了までの区間を算出する必要があるものや、顔画像認識のように計算時間を要するものなどが存在する。映像構造化情報算出部108は、後者のような算出・確定までに時間がかかるような映像構造化情報に対して、一次映像構造化情報を算出することで直ちにコメント情報の閲覧や入力を可能とする。一次映像構造化情報の例を図12に示す。図12では、時刻taの時点で確定していないオブジェクト、テロップ文字に対して、未定の項目を“*”として一次映像構造化情報を算出し、映像構造化情報DB203に蓄積する。一次映像構造化情報を用いる効果の具体例については、映像構造化指定部103や情報表示部107の説明において示す。
The information described above includes information that can be calculated immediately at a certain time, such as a camera switching point, and information that needs to be calculated from the display start to the end, such as characters displayed on the screen. There are those that require calculation time, such as face image recognition. The video structured
なお、映像構造化情報が算出・確定した場合、映像構造化算出部108は、即座に映像構造化情報DB203の該当情報を更新することとする。
When the video structuring information is calculated / confirmed, the video
クライアント装置100は、映像構造化情報算出部108によって算出された映像構造化情報を取得する映像構造化情報取得部102を有する。具体的には映像構造化情報取得部102は、映像情報取得部101によって取得された映像情報を用いてサーバ装置200の映像構造化情報DB203に問い合わせを行い、当該映像情報によって特定される映像に関わる映像構造化情報を取得する。具体的に図11を例にした場合、各映像構造化情報における映像識別子を用い、映像識別子が映像情報と同一と判定される映像構造化情報を取得する。但し、請求項2,3、6,7に関わる特徴を有する場合、取得される映像構造化情報には一次映像構造化情報も含まれる。
The
クライアント装置100は、映像に対する感想などのコメント情報を入力したい場合に、コメント情報の入力先である映像構造化情報をユーザに指定させる映像構造化情報指定部103を有する。映像構造化情報指定部103における映像構造化情報の指定方法の例を図13に示す。図5に述べた方法と同様に、映像の視聴に合わせて算出される映像構造化情報を次々と提示すると共に(図12では時刻taにおける状態を示す)、それぞれの映像構造化情報を指定できるボタンなどを用意する。上述したように、本実施の形態では、映像構造化情報算出部108において、一次映像構造化情報を取得できる。図13では、オブジェクト、テロップ文字において、時刻taの段階で未定の項目があるにも関らず、一次映像構造化情報を用いることで映像構造化情報を指定できるようになる。
The
ここで、請求項3、7に関わる特徴として、映像構造化情報指定部103は、一次映像構造化情報を指定できる。映像構造化情報には、顔画像認識のように認識までに計算時間を要するものなどが存在するため、リアルタイムに映像を視聴している場合、映像構造化情報算出部108による一次映像構造化情報の算出がユーザの入力に間に合わない状況が考えられる。映像構造化情報指定部103においても、映像構造化情報算出部108のように一次映像構造化情報を利用できるようにすることでそのような問題を回避する。映像構造化情報指定部103による一次映像構造化情報の指定方法を図14に示す。
Here, as a feature related to claims 3 and 7, the video structured
再生されている映像に対してマウスカーソルなどを用いて映像内の情報を指定すると共に、その種別を選択する手段を設けることで、図14のような一次映像構造化情報が指定できる。より具体的には、開始時刻はマウスカーソルによって映像内のある場所を指定した時刻、種別は選択手段において選択された種別、補助情報としてはマウスカーソルの画面上の位置、代表画像としては開始時刻として指定された時刻における静止画などが指定できる。 By specifying the information in the video using a mouse cursor or the like for the video being played back and providing means for selecting the type, it is possible to specify the primary video structured information as shown in FIG. More specifically, the start time is the time when a certain place in the video is specified by the mouse cursor, the type is the type selected by the selection means, the auxiliary information is the position on the screen of the mouse cursor, and the representative image is the start time A still image at the time specified as can be specified.
このような一次映像構造化情報を指定できる手段を設けることで、映像構造化情報指定部108は、算出にかかる映像構造化情報などに対しても、一次映像構造化情報を用いることで即座にコメント情報を入力できるようにする。
By providing a means for specifying such primary video structured information, the video structured
クライアント装置100は、映像構造化情報指定部103によって指定された映像構造化情報に対してコメント情報を入力するコメント情報入力部104を有する。コメント情報入力部104については、第1の実施の形態の図6で説明したため、説明は省略する。
The
クライアント装置100は、映像構造化情報指定部103でユーザにより指定された映像構造化情報と、コメント情報入力部104でユーザによって入力されたコメント情報を、コメント情報・映像構造化情報DB204に関連付けて蓄積するコメント情報・映像構造化情報蓄積部105を有する。コメント情報・映像構造化情報蓄積部105により蓄積される情報については、第1の実施の形態の図8において既に説明したため詳細な説明は省略する。
The
なお、請求項3,7に関わる特徴を有する場合、映像構造化情報指定部103によって指定された一次映像構造化情報が映像構造化情報DB203に蓄積される。
In addition, when it has the characteristics regarding Claims 3 and 7, the primary video structured information specified by the video structured
クライアント装置100は、映像情報取得部101によって取得された映像情報と映像構造情報取得部108によって取得された映像構造化情報を用い、コメント情報・映像構造化情報DB204から関連するコメント情報を取得するコメント情報取得部106を有する。本実施の形態の場合、図8で示したように、取得済みの映像構造化情報の識別IDを参照することで、該当する映像に対して入力されたコメント情報を取得する。また、映像構造化情報の識別IDを用いて、特定の映像構造化情報と関連付けられたコメント情報のみを取得することもできる。
The
クライアント装置100は、コメント情報取得部106により取得されたコメント情報を、取得済みの映像構造化情報と関連付けて提示する情報表示部107を有する。情報表示部107については、図9において既に説明したので詳細な説明は省略する。但し、請求項2,3,6,7に関わる特徴を有する場合、算出・確定していない映像構造化情報に対しても一次映像構造化情報を用いてコメント情報の閲覧ができる。
The
クライアント装置100は、映像配信部301から放送・配信される映像を視聴する映像再生部109を有する。請求項3,7に関わる特徴を有する場合、映像再生部109は、図14に示したように、映像構造化情報指定部103における一次映像構造化情報の指定に利用することができる。
The
本発明において、請求項4,8に関わる特徴を有する場合、映像構造化情報が変更された際に、コメント情報・映像構造化情報蓄積部105において、コメント情報・映像構造化情報を変更して、サーバ装置200のコメント情報・映像構造化情報DB204に蓄積する。そこで、本実施の形態では、サーバ装置200において、そのような処理を行う映像構造化情報修正部206を有する。
In the present invention, when the video structured information is changed, the comment information / video structured
映像構造化情報修正部206は、映像構造化情報DB203の内容が変更された場合に即座にコメント情報・映像構造化情報DB204の関連情報を修正する。例えば、請求項2,6に関わる特徴を有する場合、映像構造化情報DB203には映像構造化情報算出部108によって算出された一次映像構造化情報が蓄積されており、映像構造化情報算出部108によって映像構造化情報が確定した場合に映像構造化情報は更新されるため、それに合わせて情報の修正を行う。本実施の形態の場合、図8で示したように、コメント情報・映像構造化情報DB204は映像構造化情報を識別IDとして保持しているため修正する必要は生じないが、実施の形態によっては識別ID以外の情報を保持する可能性があるため、該当する情報が更新された場合に修正を行う。
The video structured
請求項3,7に関わる特徴を有する場合、映像構造化情報修正部206は、映像構造化情報指定部103によってユーザから指定された一次映像構造化情報に対し、映像構造化情報算出部108によって算出された映像構造化情報と比較を行い、同一の映像構造化情報と判定される場合にはそれらを統合すると共に、該当するコメント情報・映像構造化情報を修正する。一次映像構造化情報と算出された映像構造化情報の比較方法の例を図15に示す。
When the video structured
図15は、図14において映像構造化情報指定部103によってユーザから指定された一次映像構造化情報xと、映像構造化情報算出部108によって算出された映像構造化情報yを比較したものである。両者が同一の映像構造化情報を指し示しているかどうかを判定するには、まず、種別が同一(顔)であることを比較した後、xにおける開始時刻(一次映像構造化情報を指定した時刻)が、yにおける開始終了時刻内に含まれるかどうかを比較する。含まれる場合、yの補助情報にある顔領域(領域tf0)内に、xの情報指定位置(位置i0)が含まれるかどうかを比較し、含まれる場合に両者は同一の映像構造化情報を指し示していると判定する。同一であると判定された場合、xは一次映像構造化情報であるため、映像構造化情報DB203から破棄すると共に、コメント情報・映像構造化情報DB204において識別IDxを参照するコメント情報・映像構造化情報の全てに対し、識別IDをyに書き換える。このような手順を踏まえることで、一次映像構造化情報と算出された映像構造化情報の重複を無くし、コメント情報を正しく閲覧・入力できるようにする。
FIG. 15 compares the primary video structured information x designated by the user by the video structured
また、映像構造化情報修正部206は、人手などを用いて映像構造化情報DB203を修正する場合などにも用いることができる。誤検出などによって開始・終了時刻が実際と異なる場合や、カメラ切り替え点があまりにも細かく認識されてしまったためにコメントの閲覧・入力が煩わしくなった場合などに、適宜映像構造化情報DB203の項目の修正やいつくかの映像構造化情報の統合・追加・削除などを行うと共に、コメント情報・映像構造化情報DB204内の情報も修正することで、適切な状態で情報が閲覧・入力できるようになる。また、このような修正を可能とすることで、映像構造化情報及びコメント情報の閲覧性を高めることができるため、リアルタイムにコミュニケーションを図った後でもそれらの情報を有効に活用できるようになる。例えば、ライブ配信映像を録画・蓄積し、後日同様のシステムを用いてコミュニケーションする場合などに利用できる。
The video structured
以上のような手段を用いることで、本実施の形態によれば、請求項1〜4に記載の方法及び、5〜8に記載の装置を用いることで、視聴中のリアルタイム映像から次々と算出される映像構造化情報を用いて、適切な場所にコメント情報を入力できるようになると共に、映像構造化情報の算出に時間がかかる場合などにおいても即座に情報が閲覧・入力できるようになる。また、映像構造化情報に修正を施した場合にも適切に情報が閲覧・入力できるようになるため、リアルタイムに映像を視聴する場合においても適切に情報を入力・表示でき、ユーザ間のコミュニケーションはスムーズに行われる。
By using the means as described above, according to the present embodiment, the method according to
また、上記の第1の実施の形態及び第2の実施の形態における動作をそれぞれプログラムとして構築し、コンピュータにインストールする、または、ネットワークを介して流通させることが可能である。 In addition, the operations in the first embodiment and the second embodiment described above can be constructed as a program and installed in a computer or distributed via a network.
なお、第1の実施の形態におけるクライアント装置100の映像情報取得部101、映像構造化情報取得部102、映像構造化情報指定部103、コメント情報入力部104、コメント情報・映像構造化情報蓄積部105、コメント情報取得部106、情報表示部107の各動作をクライアント装置用のプログラムとして構築し、クライアント装置として利用されるコンピュータにインストールして実行させることが可能である。
Note that the video
また、サーバ装置200の映像情報取得部201、映像構造化情報算出部202の動作をサーバ装置用のプログラムとして構築し、サーバ装置として利用されるコンピュータにインストールして実行させることが可能である。
In addition, the operations of the video
また、第2の実施の形態におけるクライアント装置100の映像情報取得部101、映像構造化情報算出部108、映像構造化情報取得部102、映像構造化情報指定部103、コメント情報入力部104、コメント情報・映像構造化情報蓄積部105、コメント情報取得部106、情報表示部107及び映像再生部109の各動作をクライアント装置用のプログラムとして構築し、クライアント装置として利用されるコンピュータにインストールして実行させることが可能である。
Also, the video
また、サーバ装置200の映像構造化情報修正部206の動作をサーバ装置用のプログラムとして構築し、サーバ装置として利用されるコンピュータにインストールして実行させることが可能である。
Further, the operation of the video structured
また、構築されたプログラムをハードディスク装置や、フレキシブルディスク、CD−ROM等の可搬記憶媒体に格納しておき、コンピュータにインストールして実行させる、または、配布することが可能である。 Further, the constructed program can be stored in a portable storage medium such as a hard disk device, a flexible disk, or a CD-ROM, and installed in a computer to be executed or distributed.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、テレビ放送受像機とリアルタイムコミュニケーションシステムを併用するシステムや、サーバを介して他のユーザ端末へリアルタイムにコメント等の情報を送出するシステムに適用可能である。 The present invention is applicable to a system that uses a television broadcast receiver and a real-time communication system in combination, or a system that sends information such as comments in real time to other user terminals via a server.
1 映像情報取得手段
2 映像構造化情報算出手段
3 映像構造化情報DB
4 映像構造化情報取得手段
5 映像構造化情報指定手段
6 コメント情報入力手段
7 コメント情報・映像構造化情報蓄積手段
8 コメント情報・映像構造化情報DB
9 コメント情報取得手段
10 情報表示手段
100 クライアント装置
101 映像情報取得部
102 映像構造化情報取得部
103 映像構造化情報指定部
104 コメント情報入力部
105 コメント情報・映像構造化情報蓄積部
106 コメント情報取得部
107 情報表示部
108 映像構造化情報算出部
109 映像再生部
200 サーバ装置
201 映像情報取得部
202 映像構造化情報算出部
203 映像構造化情報DB
204 コメント情報・映像構造化情報DB
206 映像構造化情報修正部
300 ライブ映像配信サーバ装置
301 映像配信部
1 Video information acquisition means 2 Video structured information calculation means 3 Video structured information DB
4 video structured information acquisition means 5 video structured information designation means 6 comment information input means 7 comment information / video structured information storage means 8 comment information / video structured information DB
9 Comment
204 Comment Information / Video Structured Information DB
206 Video Structured Information Correction Unit 300 Live Video
Claims (4)
映像を特定する映像情報を取得する映像情報取得手順と、
前記映像に関わる映像構造化情報であり、表示開始から終了までの区間を算出する必要のある、または、計算時間を要する場合に、未定の項目を設定した一次映像構造化情報を算出し、映像構造化情報DBに格納する映像構造化算出手順と、
前記映像構造化情報DBから一次映像構造化情報を取得する映像構造化情報取得手順と、
前記映像構造化情報取得手順で取得した前記一次映像構造化情報を表示装置に提示し、ユーザに一次映像構造化情報を選択させる映像構造化情報指定手順と、
選択された一次映像構造化情報に対応する映像に関するコメント情報を前記ユーザに入力させるコメント情報入力手順と、
前記ユーザからコメント情報が入力されると、該コメント情報及び該コメント情報の入力時に選択された一次映像構造化情報とを関連付けて、コメント情報・映像構造化情報DBに格納するコメント情報・映像構造化情報蓄積手順と、
前記映像情報取得手順で取得済みの前記映像情報及び前記映像構造化情報取得手順で取得済みの前記一次映像構造化情報を用いて、前記コメント情報・映像構造化情報DBから関連付けられたコメント情報を取得するコメント情報取得手順と、
前記コメント情報取得手順で取得したコメント情報及び一次映像構造化情報を関連付けて表示手段に表示する情報表示手順と、
前記一次映像構造化情報の未定の項目が確定した場合に、該一次映像構造化情報を映像構造化情報に変更して前記コメント情報・映像構造化情報DBに蓄積する映像構造化情報修正手順と、
を行うことを特徴とする映像情報入力・表示方法。 A video information input / display method in communication related to video on a network,
Video information acquisition procedure for acquiring video information for identifying video;
The video structuring information related to the video , and when it is necessary to calculate the section from the start to the end of the display or when calculation time is required, the primary video structuring information in which the undetermined items are set is calculated, and the video A video structuring calculation procedure stored in the structured information DB;
A video structured information acquisition procedure for acquiring primary video structured information from the video structured information DB;
A video structured information designation procedure for presenting the primary video structured information acquired in the video structured information acquisition procedure on a display device and allowing a user to select primary video structured information ;
Comment information input procedure for allowing the user to input comment information related to the video corresponding to the selected primary video structured information ;
When comment information is input from the user, the comment information and video structure stored in the comment information / video structured information DB in association with the comment information and the primary video structured information selected when the comment information is input Information storage procedure,
Using the video information acquired in the video information acquisition procedure and the primary video structured information acquired in the video structured information acquisition procedure, comment information associated from the comment information / video structured information DB is obtained. The comment information acquisition procedure to be acquired,
An information display procedure for displaying the comment information acquired in the comment information acquisition procedure and the primary video structured information in association with each other on the display means;
Video structuring information correction procedure for changing the primary video structuring information to video structuring information and storing it in the comment information / video structuring information DB when undecided items of the primary video structuring information are confirmed; ,
A video information input / display method characterized by:
映像構造化情報を格納する映像構造化DBと、
コメント情報及び該コメント情報が指定された映像構造化情報を関連付けて格納するコメント情報・映像構造化情報DBと、
映像を特定する映像情報を取得する映像情報取得手段と、
前記映像に関わる映像構造化情報であり、表示開始から終了までの区間を算出する必要のある、または、計算時間を要する場合に、未定の項目を設定した一次映像構造化情報を算出し、前記映像構造化情報DBに格納する映像構造化情報算出手段と、
前記映像構造化情報DBから一次映像構造化情報を取得する映像構造化情報取得手段と、
前記映像構造化情報取得手段で取得した前記一次映像構造化情報を表示装置に提示し、ユーザに一次映像構造化情報を選択させる映像構造化情報指定手段と、
選択された一次映像構造化情報に対応する映像に関するコメント情報を前記ユーザに入力させるコメント情報入力手段と、
前記ユーザからコメント情報が入力されると、該コメント情報及び該コメント情報の入力時に選択された一次映像構造化情報とを関連付けて、前記コメント情報・映像構造化情報DBに格納するコメント情報・映像構造化情報蓄積手段と、
前記映像情報取得手段で取得済みの前記映像情報及び前記映像構造化情報取得手段で取得済みの前記一次映像構造化情報を用いて、前記コメント情報・映像構造化情報DBから関連付けられたコメント情報を取得するコメント情報取得手段と、
前記コメント情報取得手段で取得したコメント情報及び一次映像構造化情報を関連付けて表示手段に表示する情報表示手段と、
前記一次映像構造化情報の未定の項目が確定した場合に、該一次映像構造化情報を映像構造化情報に変更して前記コメント情報・映像構造化情報DBに蓄積する映像構造化情報修正手段と、
を有することを特徴とする映像情報入力・表示装置。 A video information input / display device in communication related to video on a network,
A video structuring DB for storing video structuring information;
A comment information / video structured information DB for associating and storing comment information and video structured information in which the comment information is designated;
Video information acquisition means for acquiring video information for identifying video;
The video structuring information related to the video , and when it is necessary to calculate the section from the display start to the end, or when calculation time is required, calculate the primary video structuring information in which undetermined items are set , Video structured information calculating means for storing in the video structured information DB;
Video structured information acquisition means for acquiring primary video structured information from the video structured information DB;
Video structured information specifying means for presenting the primary video structured information acquired by the video structured information acquiring means on a display device, and allowing a user to select primary video structured information ;
Comment information input means for allowing the user to input comment information related to the video corresponding to the selected primary video structured information ;
When comment information is input from the user, the comment information and video stored in the comment information / video structured information DB in association with the comment information and the primary video structured information selected when the comment information is input. Structured information storage means;
Using the video information acquired by the video information acquisition means and the primary video structured information acquired by the video structured information acquisition means, comment information associated with the comment information / video structured information DB is obtained. Comment information acquisition means to acquire;
Information display means for associating and displaying the comment information acquired by the comment information acquisition means and the primary video structured information on the display means;
Video structured information correcting means for changing the primary video structured information to video structured information and storing it in the comment information / video structured information DB when an undecided item of the primary video structured information is confirmed; ,
A video information input / display device characterized by comprising:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005179472A JP4513667B2 (en) | 2005-06-20 | 2005-06-20 | VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005179472A JP4513667B2 (en) | 2005-06-20 | 2005-06-20 | VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006352779A JP2006352779A (en) | 2006-12-28 |
JP4513667B2 true JP4513667B2 (en) | 2010-07-28 |
Family
ID=37648085
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005179472A Expired - Fee Related JP4513667B2 (en) | 2005-06-20 | 2005-06-20 | VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4513667B2 (en) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5300296B2 (en) * | 2008-03-27 | 2013-09-25 | 株式会社東芝 | Display device, server device, system, and display method |
KR101777242B1 (en) * | 2015-09-08 | 2017-09-11 | 네이버 주식회사 | Method, system and recording medium for extracting and providing highlight image of video content |
KR101818544B1 (en) * | 2016-12-30 | 2018-02-21 | 스튜디오씨드코리아 주식회사 | Method for commenting on the interactive contents and reenacting the commenting scenario |
US10127216B2 (en) | 2016-12-30 | 2018-11-13 | Studio Xid Korea, Inc. | Method for adding a comment to interactive content by reproducing the interactive content in accordance with a breached comment scenario |
CN113014988B (en) * | 2021-02-23 | 2024-04-05 | 北京百度网讯科技有限公司 | Video processing method, device, equipment and storage medium |
CN114697756A (en) * | 2022-04-07 | 2022-07-01 | 脸萌有限公司 | Display method, display device, terminal equipment and medium |
CN116887009B (en) * | 2023-09-06 | 2023-12-12 | 湖南智警公共安全技术研究院有限公司 | End cloud integrated video structuring method and system based on 5G network |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003283981A (en) * | 2002-03-20 | 2003-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for inputting/displaying comment about video, client apparatus, program for inputting/ displaying comment about video, and storage medium thereof |
JP2005159903A (en) * | 2003-11-27 | 2005-06-16 | Nippon Telegr & Teleph Corp <Ntt> | Content link type comment display method and system, server, client unit,comment display program, storing medium readable by computer for storing display program |
-
2005
- 2005-06-20 JP JP2005179472A patent/JP4513667B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003283981A (en) * | 2002-03-20 | 2003-10-03 | Nippon Telegr & Teleph Corp <Ntt> | Method and system for inputting/displaying comment about video, client apparatus, program for inputting/ displaying comment about video, and storage medium thereof |
JP2005159903A (en) * | 2003-11-27 | 2005-06-16 | Nippon Telegr & Teleph Corp <Ntt> | Content link type comment display method and system, server, client unit,comment display program, storing medium readable by computer for storing display program |
Also Published As
Publication number | Publication date |
---|---|
JP2006352779A (en) | 2006-12-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2924065C (en) | Content based video content segmentation | |
JP6335145B2 (en) | Method and apparatus for correlating media metadata | |
JP5395813B2 (en) | Content and metadata consumption techniques | |
US20190253474A1 (en) | Media production system with location-based feature | |
JP4062908B2 (en) | Server device and image display device | |
US9860593B2 (en) | Devices, systems, methods, and media for detecting, indexing, and comparing video signals from a video display in a background scene using a camera-enabled device | |
US20190259423A1 (en) | Dynamic media recording | |
JP6084537B2 (en) | Method for in-video bookmarking and non-transitory computer readable recording medium | |
CN108293140B (en) | Detection of common media segments | |
JP2006155384A (en) | Video comment input/display method and device, program, and storage medium with program stored | |
JP2013529325A (en) | Media fingerprint for determining and searching content | |
US20030219708A1 (en) | Presentation synthesizer | |
US11990158B2 (en) | Computing system with DVE template selection and video content item generation feature | |
JP4737213B2 (en) | Information processing device | |
JP4513667B2 (en) | VIDEO INFORMATION INPUT / DISPLAY METHOD AND DEVICE, PROGRAM, AND STORAGE MEDIUM CONTAINING PROGRAM | |
US20120150990A1 (en) | System and method for synchronizing with multimedia broadcast program and computer program product thereof | |
KR101328270B1 (en) | Annotation method and augmenting video process in video stream for smart tv contents and system thereof | |
KR101805618B1 (en) | Method and Apparatus for sharing comments of content | |
JP2007317217A (en) | Method for relating information, terminal device, server device, and program | |
US20090307725A1 (en) | Method for providing contents information in vod service and vod system implemented with the same | |
JP2000308017A (en) | Video audience device | |
EP3044728A1 (en) | Content based video content segmentation | |
JP2006165658A (en) | Program metadata creating/management method, program metadata creating/management system, program meta-data creating apparatus, program metadata evaluation apparatus, computer program and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070815 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100202 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100402 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100420 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100503 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130521 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140521 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |