Nothing Special   »   [go: up one dir, main page]

JP2023162711A - 撮像装置 - Google Patents

撮像装置 Download PDF

Info

Publication number
JP2023162711A
JP2023162711A JP2022073273A JP2022073273A JP2023162711A JP 2023162711 A JP2023162711 A JP 2023162711A JP 2022073273 A JP2022073273 A JP 2022073273A JP 2022073273 A JP2022073273 A JP 2022073273A JP 2023162711 A JP2023162711 A JP 2023162711A
Authority
JP
Japan
Prior art keywords
bgm
image
video
recommended
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022073273A
Other languages
English (en)
Inventor
幹雄 加藤
Mikio Kato
潔 関口
Kiyoshi Sekiguchi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2022073273A priority Critical patent/JP2023162711A/ja
Publication of JP2023162711A publication Critical patent/JP2023162711A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Studio Devices (AREA)

Abstract

【課題】 画像の撮影時の周囲の音声、音量および撮影画像に基づいて、画像の投影時のBGMを自動選択する。【解決手段】 撮像手段と、音声取得手段と、前記撮像された静止画と前記音声取得手段により取得された音声とを対応付けて記録媒体に記録する記録手段と、前記記録手段により記録された静止画から複数の推奨画像を選択し、映像を生成する映像生成手段と、前記推奨画像に対応した前記音声または前記推奨画像に基づき、前記推奨画像のBGMを選択するBGM選択手段と、前記BGM選択手段により選択されたBGMから、前記映像生成手段により生成された前記映像のBGMを決定するBGM決定手段と、前記映像生成手段により生成された前記映像を投影する投影手段と、前記BGM決定手段により決定されたBGMを、前記投影手段により投影された前記映像のBGMとして出力するBGM出力手段とを有する。【選択図】 図1

Description

本発明は、撮像装置に関する。
近年、投影装置付きカメラなど、撮影して画像をすぐに投影、表示する事が可能な機器が登場している。また、おすすめ画像を自動で選択するような機能のある機器もあり、撮影画像からBGM(Background music)といった音楽付きムービー等を作成する機器もある。
特許文献1では、動画像のダイジェストムービーの再生時、動画像に記録される音声は再生せず、ユーザーがBGMを選択して再生する方法が開示されている。
特許第5411874号広報
しかしながら、前記の特許文献に開示された従来技術では、ユーザーがBGMを選択して再生するため、BGM選択に手間がかかる。また、撮影した画像を表示、投影する際、流れるBGMが必ずしも画像に適したBGMではなく、ユーザーにとって好適ではない場合がある。
そこで、本発明は、撮影した複数の画像に適したBGMを選択して流す事により、ユーザーに好適な鑑賞機会を提供することを目的とする。
撮像手段と、音声取得手段と、前記撮像された静止画と前記音声取得手段により取得された音声とを対応付けて記録媒体に記録する記録手段と、前記記録手段により記録された静止画から複数の推奨画像を選択し、映像を生成する映像生成手段と、前記推奨画像に対応した前記音声、または前記推奨画像の情報に基づいて、前記推奨画像に適したBGMを選択するBGM選択手段と、前記BGM選択手段により選択されたBGMの中から、前記映像生成手段により生成された前記映像に適したBGMを決定するBGM決定手段と、前記映像生成手段により生成された前記映像を投影する投影手段と、前記BGM決定手段により決定されたBGMを、前記投影手段により投影された前記映像のBGMとして出力するBGM出力手段とを有する。
本発明によれば、撮影した複数の画像に適したBGMを選択して流す事により、ユーザーに好適な鑑賞機会を提供することができる。
撮像装置の構成を説明するブロック図である。 撮像装置の動作を示すフローチャートである。 撮像装置の構成を説明するブロック図である。 撮像装置の動作を示すフローチャートである。
以下に、本発明の好ましい実施の形態を、添付の図面に基づいて詳細に説明する。
図1は、第1の実施形態における撮像装置の構成を説明するブロック図である。
撮像装置100は、撮像部101、音声取得部102、記録部103、映像生成部104、BGM選択部105、投影部106、BGM決定部107、BGM出力部108を有する。撮像部101は、画像を撮影するもので、CMOSセンサーやCCDセンサーなどの撮像素子を用いて行うことができる。音声取得部102はマイクを有し、画像の撮影時に周囲の音声を取得する。記録部103は、取得された画像および音声を記録媒体に記録する。記録媒体は、メモリーカードやハードディスクなどが挙げられる。また、無線や有線といった通信部を用いて外部の記録媒体を用いても良いが、ここでは特に限定しない。
映像生成部104は、撮影した画像から複数の推奨画像を選択し、映像を自動生成する。BGM選択部105は、推奨画像に対応する音声、または推奨画像の情報に基づいて、推奨画像のBGMを選択する。BGM決定部107は、選択したBGMの中から映像のBGMを決定する。BGM出力部108は、BGMを出力する。投影部106は、生成した映像を投影する。
本実施形態では、撮像部101により静止画を撮影して記録する。撮像部101で撮影した静止画と音声取得部102で取得した音声は、記録部103に送られ記録される。音声取得部102は、静止画の撮影時のレリーズ期間中、またはレリーズ後の所定時間、またはレリーズ前後の所定時間のいずれかの期間にて音声を取得する。
音声を取得する期間が長ければ音声を多く取得できるが情報量が増えることとなり多くの記録容量を要する。例えば、音声が1~2秒ほどあれば、単語レベルでの音声を聞き取ることが十分可能である。また、音声は、撮像装置100の周囲の人の声や音楽などである。
記録部103により、このようにして撮影した複数の静止画像と、それに対応する音声が記録される。映像生成部104には、記録部103により記録された静止画像から複数の静止画像、及び、これらの静止画像に対応づけて記録された音声が、記録媒体から読み出されて送られる。記録部103から送られる静止画像は、映像生成部104が選択する。
例えば、家族(以降では、父、母、子の3人家族を例とする)の画像が複数あったとき、家族皆が笑顔の画像を推奨画像として一定数選択する。画像の選択方法については、様々な手法で特徴量を抽出して判断される。画像選択にあたっては、あらかじめ数千~数万枚の画像データを機械学習用データベースに蓄積し、さらにこれらの画像データを用いて、機械学習により対象物候補を選択可能とする選択器を生成しておく。
特徴量の計算、選択器生成にはHOG特徴量、SVM識別器などさまざまな手法が提案されているが、ここでは特に限定しない。選択する推奨画像の枚数は、ユーザーが任意に設定することができる。例えば10枚である。また、自動生成する映像の長さによって設定しても良い。自動生成する映像は、複数の推奨画像を連続して表示するスライドショーとして生成する。例えば、自動生成する映像を1分とし、画像1枚当たりの表示時間を5秒とすると、合計12枚の画像を推奨画像として選択することとなる。これらはユーザーが任意に設定しても良い。
ここでは、映像生成部104が記録部103から送られる画像を選択するとして説明したが、特にこれに限定されない。記録部103が選択しても良いし、ユーザーが任意に選択しても良い。
BGM選択部105には、映像生成部104から推奨画像と、それに対応づけて記録された音声が送られる。BGM選択部105では、音声に含まれる音楽、または声から、曲を推定し、推定の結果からBGMを選択する。例えば、音声にテーマパークのテーマ音楽が記録されているとき、テーマパークのテーマ音楽がBGMとして選定される。音声として子の声で、テーマパークのキャラクターの名前が記録されているとき、そのキャラクターのテーマ音楽がBGMとして選定される。キャラクター個別のテーマ音楽が無い場合、テーマパークのテーマ音楽をBGMとしても良い。
音楽からのBGM選択にあたっては、画像選択と同様の手法を用いることで可能となるが、ここでは特に限定しない。声からのBGM選定についても同様である。また、画像に対応づけられた音声からではなく、画像に含まれる被写体、または文字列から、適した曲を推定し、推定の結果からBGMを選択しても良い。例えば、画像にテーマパークのキャラクターが画像に含まれているとき、そのキャラクター情報からBGMを選定しても良い。テーマパークの名称が画像に文字列として含まれているとき、そのテーマパークの名称からBGMを選定しても良い。
また、推奨画像のシーンを識別し、シーン識別結果に適したBGMを選択しても良い。例えば、子の運動会の画像の場合、運動会に適した音楽をBGMとして選択しても良い。また、推奨画像に撮影されている特定の個人、年齢、シーンに適した曲を予め対応付け、BGMを選択しても良い。
この時、特定の個人が子であれば、子の好みの曲、特定の個人が父であれば、若い時の流行曲等を予め対応付けておく。年齢であれば、年齢に応じた流行曲等を予め対応付けておく。シーンであれば、例えば運動会やお祭りといったシーンに応じた曲を予め対応付けておく。これにより、BGMの選択を容易にすることができる。
また、BGM選択部105は、ネットワーク上のサーバ、または内蔵記憶装置からBGMを引用するようにしている。BGM決定部107は、BGM選択部105で選択されたBGMの数に基づいて、映像のBGMを決定する。または、BGM決定部107は、最も選択数が多いBGMが複数だった場合、最も選択数が多いBGMの中からランダムでBGMを決定する。
例えば、推奨画像10枚に対して、BGM選択部105で選択されたBGMが、BGM1が4曲、BGM2が3曲、BGM3が3曲であった場合、BGM1がBGMとして選択される。また、例えばBGM1が4曲、BGM2が4曲、BGM3が2曲であった場合、BGM1とBGM2が同数であるため、ランダムでBGM1またはBGM2がBGMとして選択される。
投影部106は、プロジェクターなどの光学的な機能を用いて投影を行う。これにより映像生成部104で生成した映像を即座に投影して鑑賞することができる。BGM出力部108は、スピーカーによりBGM決定部107で決定したBGMを出力する。投影部106で投影する映像と共に、BGMが出力される。このように、撮影した静止画像を映像として投影する際に、撮影した画像に適したBGMを選択する。そして、選択したBGMを、投影される映像のBGMとして出力することにより、ユーザーに好適な鑑賞機会を提供することができる。
図2は、撮像装置100の動作を示すフローチャートである。ステップS101で、撮像部101により静止画の撮影を行う。ステップS102で、音声取得部102により周囲の声や音楽などの音声を取得する。ステップS103で、撮影した静止画像と取得した音声を対応付けて記録する。ステップS104で、映像の自動生成を行うか否かをユーザーが選択する。ユーザーが映像の自動生成を行わないことを選択した場合、画像撮影S101に戻る。ユーザーが映像の自動生成を行うことを選択した場合、ステップS105に進む。
ステップS105で、推奨画像を所定の枚数(ここではn枚を例とし、初期値を1とする)選定し、映像生成を実行する。ステップS106で、推奨画像のn枚目に対応した音声の判定を行う。ステップS107で、推奨画像のn枚目に対応した音声から特定のBGMを推定する。ステップS108で、特定のBGMが推定できるかを判定する。BGMが推定できる場合、ステップS109に進み、特定したBGMをn番目の推奨画像に適したBGMとする。
BGMが推定できない場合、ステップS113に進む。ステップS113では、推奨画像に写る被写体または文字列から特定のBGMの推定を行う。ステップS114で、推奨画像に写る被写体または文字列から特定のBGMを推定できるかを判定する。BGMが推定できる場合、ステップS115に進み、特定したBGMをn番目の推奨画像のBGMとする。BGMが推定できない場合、ステップS116に進む。
ステップS116では、推奨画像のシーン識別を行う。ステップS116で、識別したシーンに適したBGMをn番目の推奨画像のBGMとする。ステップS110で、推奨画像を所定の枚数すべてに適したBGMが選択されたかを判定する。n枚の推奨画像すべてに適したBGMが選択された場合、ステップS111に進む。
推奨画像すべてに適したBGMが選択されていない場合、ステップS118に進む、次の推奨画像に適したBGMの選定に進む。具体的には、nに1を加算し、ステップS106に戻り、再度ステップS106以降の実行に進む。ステップS111で、選択したBGMの数をカウントし、最も多く選択されたBGMを映像に適したBGMとして決定する。最も多く選択されたBGMが複数あった場合は、ランダムでBGMを決定する。ステップS112で、映像に適したBGMを映像と共に投影する。
以上が本実施形態の説明であるが、本発明は、本発明の技術思想の範囲内において、実施形態に限定されるものではない。
次に、第2の実施形態について図面を参照して説明する。なお、第1の実施形態と同一の構成、動作及び処理については図中に同一の符号を付し、その説明は省略する。
図3は、第2の実施形態における撮像装置100の構成を説明するブロック図である。BGM選択部201では、選択したBGMに重み付け情報を付与する。BGM選択部201において、音声からBGM選択をする場合、音量に応じて選択したBGMの重み付け情報を付与する。例えば、通常時、重み付け無しの時を1として、重み付け情報として1.5などである。
また、BGM選択部201において、静止画からBGM選択する場合、被写体もしくは文字列が写る領域に応じて選択したBGMの重み付け情報を付与する。例えば、0.8である。BGM選択部201では、推奨画像に適したBGMと共に、そのBGMに対して重み付け情報を付与してBGM決定部202に情報を送付する。
BGM決定部202では、BGMの重み付け情報を基に映像に適したBGMを決定する。例えば、BGM選択部201からの推奨画像が5枚と選択したBGMが3曲あったとする。推奨画像1にはBGM1が選択され、重み付け情報が0.8であった。推奨画像2にはBGM2が選択され、重み付け情報が1.5であった。推奨画像3にはBGM1が選択され、重み付け情報が0.7であった。推奨画像4にはBGM2が選択され、重み付け情報が1.2であった。推奨画像5にはBGM3が選択され、重み付け情報が1.5であった。
この時、推奨画像に選択されたBGMが、BGM1とBGM2とが2曲ずつで同数である。しかし、重み付け情報により、BGM1は重み付け情報の加算値が1.5である。一方、BGM2は重み付け情報の加算値が2.7である。このような場合には、BGMの重み付け情報の大きいBGM2を選択することになる。重み付け情報の数値については、大きいほど推奨画像に適したBGMであるとすることもでき、また、逆でも良い。また、推定するBGMの機械学習用データベースとの適合量に応じて重み付け情報を付与することもできる。
このように、撮影した画像を映像として投影する際に、撮影した画像に適したBGMを選択して流す事により、ユーザーに好適な鑑賞機会を提供することができる。図4は、実施例2における撮像システムの動作を示すフローチャートである。
ステップS201で、推奨画像に対応した音声から推定したBGMに重み付け情報を付与する。ステップS202で、推奨画像に写る被写体または文字列から推定したBGMに重み付け情報を付与する。ステップS203で、推奨画像のシーンに適したBGMに重み付け情報を付与する。
ステップS204で、選択したBGMの数をカウントし、最も多く選択されたBGMを映像に適したBGMとして決定する。最も多く選択されたBGMが複数あった場合は、重み付け情報を元にBGMを決定する。
100 撮像装置

Claims (10)

  1. 撮像手段と、
    音声取得手段と、
    前記撮像された静止画と前記音声取得手段により取得された音声とを対応付けて記録媒体に記録する記録手段と、
    前記記録手段により記録された静止画から複数の推奨画像を選択し、映像を生成する映像生成手段と、
    前記推奨画像に対応した前記音声または前記推奨画像に基づき、前記推奨画像のBGMを選択するBGM選択手段と、
    前記BGM選択手段により選択されたBGMから、前記映像生成手段により生成された前記映像のBGMを決定するBGM決定手段と、
    前記映像生成手段により生成された前記映像を投影する投影手段と、
    前記BGM決定手段により決定されたBGMを、前記投影手段により投影された前記映像のBGMとして出力するBGM出力手段とを有する撮像装置。
  2. 前記音声取得手段は、前記撮像手段による前記静止画像のレリーズ期間中、またはレリーズ後の所定時間、またはレリーズ前後の所定時間のいずれかの期間にて音声を取得することを特徴とする請求項1記載の撮像装置。
  3. 前記BGM選択手段は、前記記録手段により記録された前記音声に含まれる音楽、または声から、適した曲を推定し、推定の結果から前記BGMを選択することを特徴とする請求項1または2に記載の撮像装置。
  4. 前記BGM選択手段は、前記推奨画像に含まれる被写体、または文字列から、曲を推定し、推定の結果から前記BGMを選択することを特徴とする請求項1または2に記載の撮像装置。
  5. 前記BGM選択手段は、推奨画像のシーンを識別し、前記シーンの識別の結果からBGMを選択することを特徴とする請求項1または2に記載の撮像装置。
  6. 前記BGM選択手段は、ネットワーク上のサーバ、または内蔵記憶装置からBGMを選択することを特徴とする請求項1から5のいずれか1項に記載の撮像装置。
  7. 前記BGM選択手段は、特定の個人、年齢、シーンに適した曲を予め対応付け、BGMを選択することを特徴とする請求項1から6のいずれか1項に記載の撮像装置。
  8. 前記映像生成手段は、ユーザーが任意に、または自動で生成する前記映像の長さによって、選択する前記推奨画像の枚数を決めることを特徴とする請求項1から7のいずれか1項に記載の撮像装置。
  9. 前記BGM決定手段は、前記BGM選択手段で選択された前記BGMの数に基づいて、前記BGMを決定することを特徴とする請求項1から8のいずれか1項に記載の撮像装置。
  10. 前記BGM選択手段は、前記選択したBGMに重み付け情報を付与し、
    前記BGM決定手段は、前記BGMの重み付け情報に基づいて、前記BGMを決定することを特徴とする請求項1から9のいずれか1項に記載の撮像装置。
JP2022073273A 2022-04-27 2022-04-27 撮像装置 Pending JP2023162711A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2022073273A JP2023162711A (ja) 2022-04-27 2022-04-27 撮像装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2022073273A JP2023162711A (ja) 2022-04-27 2022-04-27 撮像装置

Publications (1)

Publication Number Publication Date
JP2023162711A true JP2023162711A (ja) 2023-11-09

Family

ID=88650864

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022073273A Pending JP2023162711A (ja) 2022-04-27 2022-04-27 撮像装置

Country Status (1)

Country Link
JP (1) JP2023162711A (ja)

Similar Documents

Publication Publication Date Title
US7945439B2 (en) Information processing apparatus, information processing method, and computer program
JP5474062B2 (ja) コンテンツ再生装置、コンテンツ再生方法、プログラム、及び集積回路
JP5765940B2 (ja) 画像を再生するための方法及び装置
US20160099023A1 (en) Automatic generation of compilation videos
JP2005101906A (ja) 動画記録装置、動画記録方法、及びプログラム
JP5407708B2 (ja) 撮影映像処理装置、制御方法及びプログラム
JP2010252008A (ja) 撮影装置、表示装置、再生装置、撮影方法、および表示方法
JP5112901B2 (ja) 画像再生装置、画像再生方法、画像再生用サーバー、および画像再生システム
TWM257575U (en) Encoder and decoder for audio and video information
JP2009017598A (ja) 撮像装置、および情報処理方法、並びにコンピュータ・プログラム
US8724958B2 (en) Reproducing apparatus, reproducing system and server
JP2023162711A (ja) 撮像装置
JP5839065B2 (ja) 撮像装置、撮像方法及びプログラム
CN102611863A (zh) 动画记录重放装置
CN107147842B (zh) 一种儿童照相的方法及装置
JP2007235432A (ja) 画像音声記録装置および画像音声記録制御プログラム
JP6038256B2 (ja) 画像検索システムおよび画像検索方法
JP2009130644A (ja) 通信装置、通信方法、プログラム、および記憶媒体
KR102472892B1 (ko) 자전거 라이더를 위한 음성인식 기반 라이딩 영상 편집 방법 및 시스템
JP5895921B2 (ja) 撮影映像処理装置、制御方法及びプログラム
WO2024047816A1 (ja) 映像関連音再生方法、映像関連音再生装置及び映像関連音再生プログラム
CN108495163A (zh) 视频弹幕朗读装置、系统、方法及计算机可读存储介质
JP2010045518A (ja) 画像処理装置
JP5851375B2 (ja) 画像検索システムおよび画像検索方法
KR100718083B1 (ko) 파일을 링크시켜 기록/재생하는 영상기기 및 그기록/재생방법

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20231213