Nothing Special   »   [go: up one dir, main page]

JP2018045390A - 物品読取装置およびプログラム - Google Patents

物品読取装置およびプログラム Download PDF

Info

Publication number
JP2018045390A
JP2018045390A JP2016178873A JP2016178873A JP2018045390A JP 2018045390 A JP2018045390 A JP 2018045390A JP 2016178873 A JP2016178873 A JP 2016178873A JP 2016178873 A JP2016178873 A JP 2016178873A JP 2018045390 A JP2018045390 A JP 2018045390A
Authority
JP
Japan
Prior art keywords
article
feature
registered
feature amount
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2016178873A
Other languages
English (en)
Other versions
JP6838903B2 (ja
Inventor
雄一郎 畠中
Yuichiro Hatanaka
雄一郎 畠中
飯坂 仁志
Hitoshi Iizaka
仁志 飯坂
秀彦 宮越
Hidehiko Miyakoshi
秀彦 宮越
英浩 内藤
Hidehiro Naito
英浩 内藤
勇太 佐々木
Yuta Sasaki
勇太 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba TEC Corp
Original Assignee
Toshiba TEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba TEC Corp filed Critical Toshiba TEC Corp
Priority to JP2016178873A priority Critical patent/JP6838903B2/ja
Priority to CN201710780975.4A priority patent/CN107818295B/zh
Priority to US15/702,215 priority patent/US10573022B2/en
Priority to EP17190872.6A priority patent/EP3293674B1/en
Publication of JP2018045390A publication Critical patent/JP2018045390A/ja
Application granted granted Critical
Publication of JP6838903B2 publication Critical patent/JP6838903B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/10Terrestrial scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/761Proximity, similarity or dissimilarity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/58Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/583Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/5854Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using shape and object relationship
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/28Determining representative reference patterns, e.g. by averaging or distorting; Generating dictionaries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/70Determining position or orientation of objects or cameras
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/772Determining representative reference patterns, e.g. averaging or distorting patterns; Generating dictionaries
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07GREGISTERING THE RECEIPT OF CASH, VALUABLES, OR TOKENS
    • G07G1/00Cash registers
    • G07G1/0036Checkout procedures
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N7/00Television systems
    • H04N7/18Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast
    • H04N7/183Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source
    • H04N7/185Closed-circuit television [CCTV] systems, i.e. systems in which the video signal is not broadcast for receiving images from a single remote source from a mobile camera, e.g. for remote control
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/68Food, e.g. fruit or vegetables

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Library & Information Science (AREA)
  • Evolutionary Computation (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)
  • Cash Registers Or Receiving Machines (AREA)

Abstract

【課題】認識性能を下げる可能性のある画像を検知して、登録前に報知することができる物品読取装置およびプログラムを提供する。【解決手段】指定手段が、学習対象の物品を学習対象物品として指定する。そして、抽出手段が、学習対象物品である物品を撮像した画像から当該学習対象物品の特徴を示す第1の特徴量を抽出する。算出手段は、抽出手段が抽出した第1の特徴量と、記憶手段である辞書に登録された各登録物品の特徴を示す第2の特徴量とを比較して類似度を算出する。報知手段は、第1の特徴量と学習対象の物品を除く登録物品の第2の特徴量との類似度が第1の閾値以上、または第1の特徴量と登録物品に含まれた学習対象物品の第2の特徴量との類似度が第1の閾値よりも低い第2の閾値以下であることを条件にして、学習手段が、第1の特徴量を、学習対象物品の特徴量として記憶手段に登録する学習処理を行うのに先行して報知を行う。【選択図】図4

Description

本発明の実施形態は、物品読取装置およびプログラムに関する。
従来、商品の外観を撮像した画像から当該商品の特徴量を抽出して、抽出した特徴量を予め用意された照合用のデータと比較することによって、商品の種別等を認識する一般物体認識(オブジェクト認識)を用いて商品の登録を行う技術が提案されている(例えば、特許文献1)。
このようなオブジェクト認識を用いた物品読取装置において、新たな商品を追加登録する場合には、照合用辞書の更新を行っていた。しかしながら、新たな商品の特徴量が、既に照合用辞書に登録されている他の商品の特徴量と類似する場合には、新たに登録した商品と、既に照合用辞書に登録されている商品とを誤認識する可能性があるという課題があった。
本発明が解決しようとする課題は、認識性能を下げる可能性のある画像を検知して、登録前に報知することができる物品読取装置およびプログラムを提供することである。
実施形態の物品読取装置は、指定手段と、抽出手段と、記憶手段と、算出手段と、学習手段と、報知手段と、を備える。指定手段は、学習対象の物品を学習対象物品として指定する。抽出手段は、学習対象物品を撮像した画像から当該学習対象物品の特徴を示す第1の特徴量を抽出する。記憶手段は、辞書に登録された登録物品の特徴を示す第2の特徴量を記憶する。算出手段は、抽出手段が抽出した第1の特徴量と登録物品の第2特徴量とを比較して、その類似度を算出する。学習手段は、抽出手段が抽出した第1の特徴量を学習対象物品の特徴量として記憶手段に登録する学習処理を行う。報知手段は、第1の特徴量と学習対象物品を除く登録物品の第2の特徴量との類似度が第1の閾値以上、または第1の特徴量と登録物品に含まれた学習対象物品の第2の特徴量との類似度が、第1の閾値よりも低い第2の閾値以下であることを条件に、学習処理に先行して報知を行う。
図1は、実施形態に係る物品読取装置の一例を示す外観斜視図である。 図2は、物品読取装置のハードウェア構成の一例を示すハードウェアブロック図である。 図3は、PLUファイルのデータ構成の一例を示す概念図である。 図4は、物品読取装置の機能構成の一例を示す機能ブロック図である。 図5は、物品読取装置に新規カテゴリーの画像を追加登録する処理の流れを示すフローチャートである。 図6は、図5のフローチャートの中で行う類似画像の枚数の計数方法について説明する図である。 図7は、物品読取装置の既存カテゴリーに新たな画像を追加登録する処理の流れを示すフローチャートである。 図8は、図7のフローチャートの中で行う乖離画像の枚数の計数方法について説明する図である。
(物品読取装置の全体構成の説明)
以下、添付図面を参照して、物品読取装置およびプログラムの実施形態を詳細に説明する。本実施形態では、係る物品読取装置およびプログラムの一実施形態として、スーパーマーケット等の店舗に設けられた、物品読取装置1への適用例を示す。
図1は、物品読取装置1の一例を示す外観斜視図である。図1に示すように、物品読取装置1は、POS(Point-of-Sale)端末10と、読取ユニット100と、表示・操作ユニット110とを備える。
POS端末10は、登録対象となる物品G(商品)の登録を行う。また、POS端末10は、読取ユニット100が読み取った商品を、読取ユニット100が出力する物品Gの特徴量Fa(第1の特徴量)に基づいて特定して、売上登録および精算処理を行う。
読取ユニット100は、売上登録を行う場合に登録対象となる物品G(商品)の画像を撮像するとともに、撮像された物品の画像が有する特徴量Faを読み取る。
表示・操作ユニット110は、読取ユニット100が撮像した画像を表示するとともに、POS端末10が出力する各種情報を表示する。また、表示・操作ユニット110は、キャッシャが行う各種操作情報をPOS端末10に転送する。
図1において、POS端末10は、レジ台41の上に、ドロワ21に載置した状態で設けられる。POS端末10は、上面に、操作用の押下キーが配列されたキーボード22を有する。また、POS端末10は、キーボード22の上方に、キャッシャが登録情報の確認、および決済に必要な情報の入力に使用する第1の表示デバイス23と、客が登録情報の確認に使用する第2の表示デバイス24とを有する。第1の表示デバイス23は、液晶パネル等の表示パネル23aを有し、表示パネル23aにタッチパネル26が積層されたタッチ入力式のものである。第2の表示デバイス24は液晶パネル等の表示パネル24aを有する。第2の表示デバイス24は、POS端末10の上部に、客から見やすい方向に回転可能に立設されている。ドロワ21は、内部に紙幣や硬貨などを収納し、POS端末10からの指示により開放する。
レジ台41の隣には、レジ台41と共にL状に配置されたサッカー台151を設けている。サッカー台151の上面には、買物カゴ153などを載置するための荷受面152が形成されている。図1は、買物カゴ153として、第1の買物カゴ153aと第2の買物カゴ153bとが載置された例を示している。第1の買物カゴ153aは、客が持ち込んだ買物カゴ、つまり読み取り前の物品(例えば物品G)の入った買い物カゴである。第2の買物カゴ153bは、読み取りを終えた物品Gを収納するための買物カゴである。キャッシャは、第1の買物カゴ153aから読み取り前の例えば物品Gを手に取り、物品読取装置1に物品Gを読み取らせた後、物品Gを第2の買物カゴ153bに移し替える。なお、買物カゴ153は、カゴ状のものに限らず、トレー状、箱状、袋状等であってもよい。
読取ユニット100は、サッカー台151の荷受面152の中央部に立設され、POS端末10と有線または無線によりデータ送受信可能に接続される。読取ユニット100は、ハウジング102の表面に、キャッシャ側を向けて設けられた読取窓103の奥側に備えられている。読取窓103は透光性を有する、例えば透明なガラス板等により形成されている。読取ユニット100は、読取窓103の奥に、物品Gを撮像するための撮像部160を有する。物品Gが撮像部160により撮像されると、読取ユニット100は、撮像された物品Gの画像、および、画像から抽出した物品Gの特徴量Faを、POS端末10に対して出力する。
表示・操作ユニット110は、ハウジング102の上部に備えられる。表示・操作ユニット110は、液晶パネル等の第3の表示デバイス106を有する。表示・操作ユニット110は、キャッシャが、読取ユニット100が撮像した画像の確認、および物品読取装置1の操作に必要な情報の入力を行う場合に使用する。表示・操作ユニット110は、POS端末10から出力された各種情報、例えば、物品Gの読み取り結果や、物品Gを登録対象の商品として登録した場合に、物品Gの読み取り性能が低下する、もしくは読み取り性能が改善しない等の警告表示等を第3の表示デバイス106に表示する。また、第3の表示デバイス106の画面には、タッチパネル105が積層されて、タッチ入力によって、物品読取装置1を動作させるために必要な情報の入力が可能となっている。さらに、第3の表示デバイス106の右隣にはキーボード107が設けられて、キャッシャによるキーボード入力が可能となっている。そして、表示・操作ユニット110は、客が、物品Gの読み取り結果等を確認するための第4の表示デバイス109を、読取窓103の背面側(客側)に備える。
(物品読取装置のハードウェア構成の説明)
次に、物品読取装置1のハードウェア構成について説明する。図2は、物品読取装置1のハードウェア構成を示すハードウェアブロック図である。物品読取装置1のPOS端末10は、CPU(Central Processing Unit)61、ROM(Read Only Memory)62、RAM(Random Access Memory)63、HDD(Hard Disk Drive)64、接続インタフェース65、ドロワ21、キーボード22、第1の表示デバイス23、第2の表示デバイス24、通信インタフェース25、タッチパネル26等を備える。CPU61と、ROM62と、RAM63とHDD64は、内部バス27により接続される。また、ドロワ21、キーボード22、第1の表示デバイス23、第2の表示デバイス24、通信インタフェース25、タッチパネル26、HDD64、接続インタフェース65は、いずれも各種の入出力回路(いずれも不図示)を介して上記内部バス27に接続される。
CPU61は、POS端末10の全体の制御を司る中央演算処理装置である。ROM62は固定プログラムなどを格納する不揮発性メモリである。RAM63は、CPU61が作業エリアなどとして使用する揮発性メモリである。
HDD64は、各種プログラムや各種ファイルを記憶する記憶部である。各種プログラムには、POS端末10の全体の動作を制御するとともに、商品候補を決定してその商品候補を示す情報を選択画面に表示するなどの処理を含む、商品販売データ処理のためのプログラムPRなどが含まれる。各種ファイルは、ストアコンピュータSCから配信されて格納されたPLUファイルF1などである。また、HDD64には、商品を登録するための登録テーブルや売上テーブルなどが記憶されている。すなわち、POS端末10は、CPU61が制御主体となってプログラムPR等を読み出して実行する、一般的なコンピュータシステムの構成を有する。
通信インタフェース25は、ストアコンピュータSCとデータ通信を行うためのネットワークカード等で構成される。ストアコンピュータSCは、店舗のバックヤード等に設置されたものである。ストアコンピュータSCは、HDD(不図示)に、POS端末10に配信するためのPLUファイルF1などを格納している。
接続インタフェース65は、読取ユニット100の接続インタフェース175、および表示・操作ユニット110の接続インタフェース176と通信を行うためのインタフェースである。通信は、有線または無線により行う。
物品読取装置1の読取ユニット100は、CPU161と、ROM162と、RAM163と、撮像部160と、音声出力部165と、接続インタフェース175とを有する。また、物品読取装置1の表示・操作ユニット110は、接続インタフェース176と、タッチパネル105と、第3の表示デバイス106と、キーボード107と、第4の表示デバイス109とを有する。
CPU161と、ROM162と、RAM163は、内部バス166により接続される。また、撮像部160と、音声出力部165と、接続インタフェース175とは、いずれも各種の入出力回路(いずれも図示せず)を介して上記内部バス166に接続される。そして、タッチパネル105と、第3の表示デバイス106と、キーボード107と、第4の表示デバイス109とは、いずれも各種の入出力回路(いずれも不図示)を介して接続インタフェース176に接続される。
CPU161は、読取ユニット100の全体の制御を司る中央演算処理装置である。ROM162は、読取ユニット100の制御プログラムなどを格納する不揮発性メモリである。制御プログラムには、撮像された物品Gの画像Iから特徴量Fを抽出して、抽出した特徴量FをPOS端末10に出力する処理等のプログラムなどが含まれる。RAM163は、CPU161が作業エリアなどとして使用する揮発性メモリである。すなわち、読取ユニット100は、CPU161が制御主体となって制御プログラム等を読み出して実行する、一般的なコンピュータシステムの構成を有する。
撮像部160は、CCD(Charge Coupled Device)やCMOS(Complementary Metal Oxide Semiconductor)などの撮像素子を有するカラーイメージセンサである。撮像部160は、CPU161からの撮像開始信号を受けて撮像を開始し、読取窓103に翳された物品Gを所定のフレームレート(例えば30fpsなど)で電気信号に変換し、撮像された画像Iを順次出力する。
音声出力部165は、予め設定された読取音(“ピッ”)や警告音や音声等を再生するための再生回路やスピーカ等を有する。音声出力部165は、CPU161からの制御信号により読取音や警告音や音声等を再生して、物品Gの読取状態等を音で報知する。
さらに、CPU161には接続インタフェース175が接続される。接続インタフェース175は、POS端末10の接続インタフェース65と通信接続して、読取ユニット100とPOS端末10との間のデータ送受信を行う。
接続インタフェース176は、POS端末10の接続インタフェース65と通信接続して、表示・操作ユニット110とPOS端末10との間のデータ送受信を行う。また、接続インタフェース176は、接続インタフェース175と通信接続して、表示・操作ユニット110と読取ユニット100との間のデータ送受信を行う。
ここで、POS端末10が備えるPLUファイルF1について、図3を用いて説明する。PLUファイルF1は、辞書の一例であり、後述する記憶手段71を構成している。図3は、PLUファイルF1のデータ構成の一例を示す図である。PLUファイルF1は、物品G毎に、商品情報と、その物品Gの外観を撮像した画像Iと、画像Iから抽出した特徴量Fとを対応付けたデータファイルである。PLUファイルF1には、N種類の商品(物品G)の情報が登録されている。具体的には、商品毎に、商品情報と、画像Iと、画像Iから抽出した、物品Gの特徴を示す値である特徴量Fとが対応付けられて格納されている。図3の例では、商品情報として、商品ID欄f1、商品分類欄f2、商品名欄f3、単価欄f4、イラスト画像欄f5に示すデータを格納する。そして、これらの商品情報に、商品の外観を撮像した画像Iが格納された画像欄f6、当該画像Iから抽出した特徴量Fb(第2の特徴量)が格納された特徴量欄f7、および後述する平均特徴量欄f8のデータが対応付けられている。なお、後述するように、画像欄f6には、1つの商品IDの商品に対して、複数枚の画像Iが格納される。そして、特徴量欄f7には、各画像Iから抽出した複数の特徴量Fbが格納される。
1つの物品Gを認識対象物品としてPLUファイルF1に登録する場合には、各商品をより正確に判別するために、同じ商品を様々な方向から撮像した複数の画像I、または同じカテゴリーに属する複数の商品の画像Iを撮像する。すなわち、PLUファイルF1の画像欄f6には、複数枚の画像Iが記憶される。以後、画像欄f6に格納された画像を総称して画像Iと表記し、複数枚の画像を区別して表現する必要がある場合は、画像Inm(n=1〜N)と表記する。すなわち、画像Inmは、商品IDが「n」の商品の外観を撮像した「m番目」の画像であることを示す。
PLUファイルF1の特徴量欄f7に格納される特徴量Fb(第2の特徴量)は、例えば、画像Iから抽出した、物品Gの色合いや表面の凹凸等の表面状態(テクスチャ)等を用いる。ある商品IDに属する複数の画像Inmから抽出した各特徴量Fbは、対応する画像Inmと関連付けて格納される。すなわち、特徴量欄f7には、画像Inmから抽出した特徴量Fbnm(n=1〜N)が関連付けられて格納される。なお、特徴量Fbnmは、商品IDが「n」の商品の外観を撮像した「m番目」の画像から抽出した特徴量であることを示す。以後、特徴量欄f7に格納された第2の特徴量を総称して特徴量Fbと表記し、複数の特徴量を区別して表現する必要がある場合は、特徴量Fbnm(n=1〜N)と表記する。
PLUファイルF1の平均特徴量欄f8には、特徴量Fbnmを平均化した平均特徴量Fcが格納される。具体的には、平均特徴量欄f8の、商品IDが「n」の商品に対応する欄には、平均特徴量Fcn(n=1〜N)が格納される。この平均特徴量Fcn(n=1〜N)は、物品読取装置1が商品を特定して通常の売上登録処理を行う際に、客が購入する商品の外観を撮像した画像から後述する抽出手段53が抽出する特徴量Faと、平均特徴量Fcnとの類似度Cを算出する際に利用する。
なお、PLUファイルF1に、未登録の新たな物品G(新規カテゴリーの物品G)の画像Ioを追加登録することによって、物品読取装置1の認識対象となる物品Gの種類を拡充させることができる。また、PLUファイルF1に、既に登録されている物品Gの新たな画像(新規画像Ic)を追加登録することによって、物品読取装置1の物品Gの読取性能(認識性能)を改善させることができる。詳しくは後述する。
(物品読取装置の機能構成の説明)
次に、物品読取装置1の機能構成について説明する。図4は、物品読取装置1の機能ブロックの構成の一例を示す機能ブロック図である。なお、図4の機能ブロック図は、物品読取装置1が有する全ての機能の中で、本発明が有する特徴的な機能のみを示す。物品読取装置1では、図2に示すCPU161が、ROM162に格納されたプログラムを適宜実行する。これにより、読取ユニット100を構成するCPU161の内部に、指定手段50と、撮像手段51と、検知手段52と、抽出手段53と、報知手段54とが機能部として実現される。
さらに、物品読取装置1では、図2に示すCPU61が、ROM62に格納されたプログラム、およびHDD64に格納されたプログラムPRを適宜実行する。これにより、POS端末10を構成するCPU61の内部に、記憶手段71と、算出手段72と、認識手段73と、判定手段74と、学習手段75とが機能部として実現される。
次に、読取ユニット100の機能構成について説明する。指定手段50は、物品Gを学習対象物品として指定する。なお、学習対象物品を指定する場合には、前述したように、2通りの場合がある。1つめは、PLUファイルF1が記憶していないカテゴリーの物品Gを、新規カテゴリーの学習対象物品として指定する場合である。このように、新たな物品Gを新規カテゴリーに登録することによって、物品読取装置1は、新たな物品Gを認識できるようになる。2つめは、既にPLUファイルF1が記憶している既存カテゴリーに、当該既存カテゴリーに属する物品Gを学習対象物品として指定する場合である。このように、既にPLUファイルF1に登録されている物品Gを追加登録することによって、物品Gに関する特徴量の数が増加するため、物品読取装置1は、物品Gの認識性能を改善することができる。
なお、指定手段50は、具体的には、表示・操作ユニット110(図1)が備えるタッチパネル105またはキーボード107の操作情報に基づいて、学習対象物品を指定する。
撮像手段51は、撮像部160(図2)に対して撮像開始信号を出力して、撮像部160に撮像動作を開始させる。その後、撮像手段51は、撮像部160が撮像して出力した画像Iを、RAM163(図2)に順次保存する。
検知手段52は、撮像部160が撮像して出力した連続する複数の画像Iに基づいて、物品Gが読取窓103(図1)に翳されたことを検知する。具体的に、検知手段52は、撮像部160が出力した画像IをRAM163から読み出し、直近に読み出した画像Iと、輝度を比較する。検知手段52は、輝度の比較によって輝度階調に変化があったことを条件として、手や物品G等の何等かの写り込みがある画像Iであることを判断する。さらに、検知手段52は、写り込みのある画像Iと連続する画像Iを2値化して物品Gの輪郭線を抽出する。そして、検知手段52は、連続する画像Iの輪郭線の位置に変化があったときに、その輪郭線内の領域が、読取窓103に翳された物品Gを示す領域であると特定する。このようにして、検知手段52は、物品Gが読取窓103に翳されたことを検知する。
なお、物品Gが読取窓103に翳されたことを特定する方法は上記に限らず、他の方法を用いてもよい。例えば、画像Iの中の物品Gの輪郭線ではなく、肌色領域の有無によって特定するようにしてもよい。すなわち、画像Iの中に肌色領域がある場合には、キャッシャの手の写り込みがあることが予想される。したがって、例えば、画像Iの中から輪郭線を抽出して、手の形状を示す輪郭線のうち、物品Gを把持する位置の輪郭線の内側の領域を、物品Gを示す領域として特定してもよい。
抽出手段53は、画像Iに写っている物品Gの領域から、オブジェクト認識による認識対象物品が有する特徴量Fa(第1の特徴量)を抽出する。そして、抽出手段53は、抽出した特徴量FaをPOS端末10に出力する。具体的に、抽出手段53は、RAM163から画像Iを読み出す。そして、抽出手段53は、画像Iの中から物品Gの領域を特定する。次に、抽出手段53は、特定した物品Gの領域の内部に対して、特徴量Faを抽出する。抽出手段53は、抽出した特徴量Faを接続インタフェース175(図2)に出力する。接続インタフェース175は、受信した特徴量Faを接続インタフェース65(図2)に出力して、接続インタフェース65からPLUファイルF1に特徴量Faを通知する。
報知手段54は、後述する学習手段75の学習処理により、後述する認識手段73の認識性能が低下する可能性があること、または認識性能が改善しない可能性があることを、学習処理の実行に先立って報知する。詳しくは後述する。
次に、POS端末10の機能構成について説明する。記憶手段71は、前述したPLUファイルF1を備える。このPLUファイルF1は、前述したように、辞書の一例であり、辞書に登録された各登録物品の画像Iと各登録物品の特徴を示す特徴量Fb(第2の特徴量)を記憶する。記憶手段71は、後述する認識手段73がオブジェクト認識を行う場合に参照して、撮像手段51が撮像した画像Iの中に写っている物品Gを特定する。
算出手段72は、撮像手段51が撮像した画像Iから抽出した特徴量Fa(第1の特徴量)と、記憶手段71に格納された各商品の特徴量Fb(第2の特徴量)との類似度Cを算出する。
認識手段73は、画像Iの中の物品Gを認識するためのオブジェクト認識処理を行う。具体的には、認識手段73は、抽出手段53が、撮像部160が撮像した物品Gを含む画像Iの中から抽出した特徴量Fa(第1の特徴量)と、PLUファイルF1に格納された各商品の平均特徴量Fcnとの類似度Cに基づいて、PLUファイルF1の中から、類似度Cが所定の閾値C1(第1の閾値)以上である商品を選出する。そして、認識手段73は、未知の物品Gが、PLUファイルF1に登録されたいずれ物品Gであるかを認識する。
なお、画像の中に含まれる物品Gを認識するオブジェクト認識は、一般物体認識(generic object recognition)とも呼ばれる。一般物体認識で用いられる各種認識技術については、下記の文献に詳しく解説されているため、説明は省略する。
柳井 啓司、“一般物体認識の現状と今後”、情報処理学会論文誌、Vol.48、No.SIG16 [平成28年8月5日検索]、インターネット<URL: http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf>
Jamie Shottonら、“Semantic Texton Forests for Image Categorization and Segmentation”、[平成28年8月5日検索]、インターネット<URL: http://mi.eng.cam.ac.uk/~cipolla/publications/inproceedings/2008-CVPR-semantic-texton-forests.pdf>
ここで、認識手段73がオブジェクト認識を行って物品Gを特定する場合に利用する類似度Cは、PLUファイルF1内の各物品Gの特徴量欄f7に格納された特徴量Fbnm、または平均特徴量欄f8に格納された平均特徴量Fcnと、画像Iの中に写っている物品Gの特徴量Faと、がどの程度類似しているかを示す尺度である。なお、類似度Cは、100%=「類似度:1.0」とする絶対評価値で算出してもよいし、相対評価値で算出してもよい。
例えば、類似度Cを絶対評価値で算出するとする。その場合、画像Iの中に写っている物品Gの特徴量Faと、PLUファイルF1に登録された各物品Gの特徴量Fbnmまたは平均特徴量Fcn(n=1〜N)と、を1対1で比較し、この比較の結果算出される類似度Cを採用する。ここで、類似度95%を第1の閾値C1にしたとする。その場合、認識手段73は、類似度Cが95%以上の商品を類似度Cの順に順番付けを行って、物品Gの候補とする。
また、類似度Cを相対評価で算出するとする。その場合、PLUファイルF1の各商品との類似度Cの総和が1.0(100%)となるよう算出する。例えばPLUファイルF1に5つの商品(第1の商品、第2の商品、第3の商品、第4の商品、第5の商品)が登録されているものとする。その場合の類似度Cは、例えば第1の商品に対する類似度「0.6」、第2の商品に対する類似度「0.1」、第3の商品に対する類似度「0.1」、第4の商品に対する類似度「0.1」、第5の商品に対する類似度「0.1」等とし、類似度Cの総和が常に1.0になるようにする。ここで、例えば類似度0.5を第1の閾値C1にしたとする。その場合、認識手段73は、類似度Cが0.5以上の商品を類似度Cの順に順番付けを行って、物品Gの候補とする。前述した例では、第1の商品が物品Gの候補となる。
判定手段74は、記憶手段71に未登録の新たな物品Gの画像Ioを、新規カテゴリーとして追加登録する場合、または既存カテゴリーに物品Gの新規画像Icを追加登録する場合に、認識手段73の認識性能が低下する可能性があるか、または認識性能が改善しない可能性があるかを判定する。
なお、PLUファイルF1に新規カテゴリーの画像Ioを登録するとは、PLUファイルF1(図3)の商品ID欄f1、商品分類欄f2、商品名欄f3、単価欄f4、イラスト画像欄f5に新しい商品情報を登録して、さらに、画像欄f6に新たな画像Ioを登録することである。なお、一般には、新たな画像Ioは複数枚が追加登録される。新たな画像Ioを登録する場合には、併せて、新たな画像Ioから、特徴量Fa(第1の特徴量)を抽出して、抽出した特徴量Faを特徴量欄f7に格納して、第2の特徴量Fbとする。さらに、平均特徴量Fcを算出して平均特徴量欄f8に格納する。具体的には、PLUファイルF1の中に、商品として「AA1個」、「AA1/2個」が登録されているときに、例えば「AA1/4個」を新たな商品(カテゴリー)として登録するケースが、新規カテゴリーの追加登録の例である。
また、既存カテゴリーに新規画像Icを追加登録するとは、PLUファイルF1(図3)の既登録の商品の画像欄f6に、新規画像Icを追加登録(学習)することである。このような既存カテゴリーへの新規画像Icの追加登録は、当該商品の認識性能を改善したい場合に行う。
一般に、辞書に未登録の物品G(学習対象物品)を新規カテゴリーとして当該辞書に追加登録する際に、追加登録した物品Gを高い認識率で認識するためには、新規登録する物品Gの画像から抽出した特徴量(第1の特徴量)と、辞書に登録済みの登録物品の特徴量(第2の特徴量)と、が容易に識別できることが望ましい。すなわち、第1の特徴量と第2の特徴量との類似度Cを算出した際に、類似度Cができるだけ低いことが望ましい。逆に、第1の特徴量と第2の特徴量との類似度Cが高い場合には、未登録の物品Gを登録済の物品Gと誤認識する可能性が高くなる。そこで、判定手段74は、第1の特徴量と第2の特徴量との類似度Cに基づいて、未登録の物品Gを新規カテゴリーとして記憶手段71(PLUファイルF1)に登録した際に、認識性能が低下する可能性があるかを判定する。詳しい判定方法については後述する。
また、辞書に登録済の物品Gの既存カテゴリーに、当該既存カテゴリーに属する物品Gの新規画像を追加登録した際に、新規画像が追加登録された辞書を用いて、物品Gを確実に認識するためには、追加登録する物品Gの新規画像から抽出した特徴量(第1の特徴量)と、辞書に登録済の物品Gの特徴量(第2の特徴量)と、ができるだけ類似していることが望ましい。逆に、第1の特徴量と第2の特徴量との類似度Cが低い場合(登録済の画像と追加登録する新規画像とが乖離している場合)には、認識手段73がオブジェクト認識を行った際に、登録済の物品Gの認識性能が低下する可能性がある。そこで、判定手段74は、第1の特徴量と第2の特徴量との類似度Cに基づいて、辞書に登録済の物品Gの既存カテゴリーに、当該既存カテゴリーに属する物品Gの新規画像を追加登録した際に、認識性能が低下する可能性があるかを判定する。詳しい判定方法については後述する。
学習手段75は、抽出手段53が抽出した、物品Gの特徴量Fa(第1の特徴量)を、学習対象物品の特徴量Fb(第2の特徴量)として記憶手段71(PLUファイルF1)に登録する学習処理を行う。また、学習手段75は、記憶手段71に新規カテゴリーの画像Ioを追加登録する場合、または既存カテゴリーに新規画像Icを追加登録する場合に、新たな画像の登録を実行するかを制御する。
(物品読取装置に新規カテゴリーの画像を登録する処理の流れの説明)
以下、実施形態である物品読取装置1が行う動作について、記憶手段71であるPLUファイルF1に新規カテゴリーの物品Gの画像Ioを追加登録する動作と、記憶手段71であるPLUファイルF1の既存カテゴリーに、当該既存カテゴリーに属する物品Gの新規画像Icを追加登録する動作と、に分けて説明する。
まず、物品読取装置1が、記憶手段71であるPLUファイルF1に新規カテゴリーの画像Ioを追加登録する動作の流れについて、図5を用いて説明する。図5は、物品読取装置1に新規カテゴリーの画像Ioを追加登録する処理の流れを示すフローチャートである。まず、ステップS10において、指定手段50は、表示・操作ユニット110(図1)が備えるタッチパネル105またはキーボード107の操作情報に基づいて、新規カテゴリーへの追加登録を行うことを指定する。具体的には、新規カテゴリー、および追加登録の対象となる学習対象物品を指定する。
次に、ステップS12において、撮像手段51は、新規カテゴリーに追加登録する物品Gの画像Ioを撮像する。なお、一般に、画像Ioは複数枚撮像する。
続いて、ステップS14において、抽出手段53は、撮像した画像Ioから特徴量Fa(第1の特徴量)を抽出する。
ステップS16において、まず、算出手段72は、PLUファイルF1の各既存カテゴリーに登録された特徴量Fb(第2の特徴量)と、新規カテゴリーに追加登録する画像Ioの特徴量Fa(第1の特徴量)との類似度Cを算出する。そして、判定手段74は、既存カテゴリーの中に、特徴量Faと第1の閾値C1以上の類似度Cを有する画像Inm(n=1〜N)があるかを判定する。なお第1の閾値C1は、任意の値に設定してよいが、比較的高い値(例えば、類似度Cを相対評価で算出した場合に80%)とするのが望ましい。第1の閾値C1以上の類似度Cを有する画像Inmがあると判定された場合(ステップS16:Yes)はステップS18に進み、それ以外の場合(ステップS16:No)はステップS28に進む。
続いて、ステップS18において、算出手段72は、各既存カテゴリーに登録されている画像Inmの中から、画像Ioと類似する画像(第1の閾値C1以上の類似度Cを有する画像Inm、以後、第1の類似画像と呼ぶ)の枚数を計数する。
ステップS20において、判定手段74は、ステップS18における計数結果に基づいて、画像Ioの第1の類似画像が所定の枚数K1以上登録された既存カテゴリーがあるかを判定する。画像Ioの第1の類似画像を枚数K1以上有する既存カテゴリーがあると判定された場合(ステップS20:Yes)はステップS22に進み、それ以外の場合(ステップS20:No)はステップS28に進む。なお、カテゴリーによって登録されている画像Inmの枚数は異なるため、ステップS20で判定に用いる枚数K1は、例えば、各カテゴリーに登録された総画像枚数のうち所定の割合以上(例えば30%以上)であることとする。
続いて、ステップS22において、算出手段72は、ステップS12で撮像した複数の画像Io間の類似度Cを算出する。
ステップS24において、判定手段74は、新規カテゴリーに登録する複数の画像Io間の類似度Cに基づいて、当該画像Ioの中に、所定の枚数K2以上の類似画像があるかを判定する。登録する複数の画像Ioの中に、枚数K2以上の類似画像があると判定された場合(ステップS24:Yes)はステップS26に進み、それ以外の場合(ステップS24:No)はステップS28に進む。なお、判定手段74は、複数の画像Io間の類似度C(より具体的には、複数の画像Ioから抽出した特徴量Fa間の類似度C)が第3の閾値C3以上であるときに、画像Io同士は類似画像であると判定されるものとする。なお、第3の閾値C3は、前記した第1の閾値C1とは無関係に任意の値に設定してよいが、比較的高い値(例えば、類似度Cを相対評価で算出した場合に70%以上)とするのが望ましい。また、ステップS16で算出した類似度Cに基づいて類似していると判断した第1の類似画像と区別するため、ステップS24において類似していると判断した類似画像を、以後、第2の類似画像と呼ぶ。また、新規カテゴリーに登録する画像Ioの枚数は、場合によって異なるため、ステップS24で判定に用いる枚数K2は、例えば、新規カテゴリーに登録する総画像枚数のうち所定の割合以上(例えば20%以上)であることとする。
ステップS24において、画像Io間に枚数K2以上の第2の類似画像があると判定された場合、判定手段74は、ステップS26において、報知手段54に対して、警告表示による報知を行う指示を出す。そして、報知手段54は、画像Ioを新規カテゴリーとして登録すると、認識手段73の認識性能が低下する可能性があることを報知する。その後、物品読取装置1は、ステップS28の処理を行う。
ステップS28において、撮像手段51は、画像Ioの撮像を終了するかを判断する。具体的には、撮像手段51は、表示・操作ユニット110を介して、画像Ioの撮像の終了を指示する入力がなされたかの判断を行う。画像Ioの撮像を終了する場合(ステップS28:Yes)、すなわち、表示・操作ユニット110を介して、画像Ioの撮像の終了を指示する入力がなされた場合はステップS30に進み、それ以外の場合(ステップS28:No)はステップS12に戻る。
続いて、ステップS30において、学習手段75は、画像Ioおよび画像Ioの特徴量Fa(第1の特徴量)を、記憶手段71であるPLUファイルF1の新規カテゴリーに追加登録する。なお、特徴量Faは、PLUファイルF1に、第2の特徴量Fbとして登録される。ここで、ステップS26において警告表示による報知がなされた場合であっても、学習手段75による追加登録は無条件で実行されるものとする。ただし、追加登録した情報を活用するかは、後述するステップS32で設定される。
次に、ステップS32において、学習手段75は、ステップS30で追加登録した新規カテゴリーの有効無効設定を行う。なお、新規カテゴリーを有効にする場合には、認識手段73がPLUファイルF1に登録した新規カテゴリーに対してアクセスできるようにする。すなわち、新規カテゴリーを、物品読取装置1の認識対象とする。また、新規カテゴリーを無効にする場合には、認識手段73がPLUファイルF1に登録した新規カテゴリーに対してアクセスできないようにする。すなわち、新規カテゴリーを、物品読取装置1の認識対象としない。ステップS32の処理は、具体的には、キャッシャが表示・操作ユニット110(図1)が備えるタッチパネル105またはキーボード107を操作することによって行われる。そして、物品読取装置1は、ステップS32を実行した後、図5の処理を終了する。
ここで、ステップS18で行う第1の類似画像の枚数の計数方法、およびステップS22で行う第2の類似画像の枚数の計数方法について、図6を用いて、より具体的に説明する。図6は、類似画像(第1の類似画像および第2の類似画像)の枚数の計数方法について説明する図である。
図6に示すように、ステップS18(図5)において、算出手段72は、追加登録する画像Io(Io1、Io2、…、Ion)と、既存カテゴリーnに登録された画像Inm(n=1〜N)との類似度Cを算出する。そして、算出手段72は、第1の閾値C1以上の類似度Cを有する第1の類似画像の枚数を、カテゴリー(カテゴリー1、カテゴリー2、…、カテゴリーN)毎に計数する。
すなわち、算出手段72は、新規カテゴリーにn枚の画像Ioを追加登録する場合には、ステップS18において、例えば、b枚の画像が記憶された既存カテゴリー2に対しては、b*n回の類似度算出を行う。
また、ステップS22(図5)において、算出手段72は、追加登録する画像Io(Io1、Io2、…、Ion)間の類似度Cを算出する。そして、算出手段72は、第1の閾値C1以上の類似度Cを有する第2の類似画像の枚数を算出する。
すなわち、算出手段72は、ステップS22において、例えば、新規カテゴリーにn枚の画像Ioを追加登録する場合には、nC回の類似度算出を行う。
なお、図5のフローチャートでは、ステップS20において、画像Ioと類似する第1の類似画像が枚数K1以上登録された既存カテゴリーがあるかを判定した。そして、ステップS24において、新規登録する複数の画像Ioの中に、枚数K2以上の第2の類似画像があるかを判定した。その結果、画像Ioと類似する第1の類似画像が枚数K1以上登録された既存カテゴリーがあって、なおかつ、複数の画像Ioの中に、枚数K2以上の第2の類似画像があることを条件として、判定手段74は、報知手段54に対して、認識性能が低下する可能性があることを報知させるものとした。これは、新規登録する画像Ioの中に、既存カテゴリーに登録された画像Inmと類似する画像が存在すると、画像Ioから抽出した特徴量Faと、画像Inmから抽出した特徴量Fbとが近い値になるため、認識手段73がオブジェクト認識を実行した際に、新規物品Gを既存カテゴリーに登録済の物品と誤認識する可能性が高まるためである。また、新規登録する物品Gを撮像した複数の画像Io間に、類似する画像が多く存在する場合には、新規カテゴリーの物品Gの複数の画像Ioを追加登録したにも関わらず、高い認識性能が得られない可能性がある。すなわち、新規登録する画像Io間に類似する画像が多く存在する場合には、物品Gの画像Ioが偏っている可能性がある。すなわち、認識手段73がオブジェクト認識を行った際に、新規登録したカテゴリーに属する物品Gを物品読取装置1に読み取らせた場合に、他のカテゴリーの物品と誤認識する可能性がある。
なお、ステップS20およびステップS24が行う判定処理は、より簡略化して行ってもよい。すなわち、ステップS16において、新規登録する画像Ioと既存カテゴリーに登録された画像Inmとの類似度Cを算出した際に、登録されたいずれかのカテゴリーの中に、第1の閾値C1以上の画像Inmが見つかったこと(ステップS16:Yes)を条件として、判定手段74は、報知手段54に対して、認識手段73の認識性能が低下する可能性があることを報知させてもよい。この場合、図5のフローチャートにおいて、ステップS18、S20、S22、S24の各処理は不要となる。
さらに、ステップS20において、画像Ioの第1の類似画像が枚数K1以上登録された既存カテゴリーがあること(ステップS20:Yes)を条件として、判定手段74は、報知手段54に対して、認識手段73の認識性能が低下する可能性があることを報知させてもよい。この場合、図5のフローチャートにおいて、ステップS22、S24の各処理は不要となる。
(物品読取装置の既存カテゴリーに新規画像を登録する処理の流れの説明)
次に、実施形態である物品読取装置1が、記憶手段71であるPLUファイルF1の既存カテゴリーiに新規画像Icを追加登録する動作の流れについて、図7を用いて説明する。図7は、物品読取装置1の既存カテゴリーiに新規画像Icを追加登録する処理の流れを示すフローチャートである。まず、ステップS40において、指定手段50は、表示・操作ユニット110(図1)が備えるタッチパネル105またはキーボード107の操作情報に基づいて、既存カテゴリーiに新規画像Icの追加登録を行うことを指定する。具体的には、既存カテゴリーi、および追加登録の対象となる学習対象物品を指定する。
次に、ステップS42において、撮像手段51は、既存カテゴリーiに追加登録する新規画像Icを撮像する。
続いて、ステップS44において、抽出手段53は、撮像した新規画像Icから特徴量Fa(第1の特徴量)を抽出する。
ステップS46において、まず、算出手段72は、PLUファイルF1の既存カテゴリーiに登録された特徴量Fb(第2の特徴量)と、既存カテゴリーiに追加登録する新規画像Icの特徴量Fa(第1の特徴量)との類似度Cを算出する。そして、判定手段74は、既存カテゴリーiの中に、特徴量Faと第2の閾値C2以下の類似度Cを有する画像Iimがあるかを判定する。なお第2の閾値C2は、第1の閾値C1よりも低い任意の値に設定してよいが、比較的低い値(例えば、類似度Cを相対評価で算出した場合に20%)とするのが望ましい。第2の閾値C2以下の類似度Cを有する画像Iimがあると判定された場合(ステップS46:Yes)はステップS48に進み、それ以外の場合(ステップS46:No)はステップS56に進む。
続いて、ステップS48において、算出手段72は、既存カテゴリーiに登録されている画像Iimの中から、新規画像Icと第2の閾値C2以下の類似度Cを有する画像(以下、乖離画像と呼ぶ)の枚数を計数する。
ステップS50において、判定手段74は、ステップS48における計数結果に基づいて、既存カテゴリーiの中に、新規画像Icの乖離画像が所定の枚数K3以上あるかを判定する。乖離画像が枚数K3以上あると判定された場合(ステップS50:Yes)はステップS52に進み、それ以外の場合(ステップS50:No)はステップS56に進む。なお、既存カテゴリーiに登録されている画像Iimの枚数は場合によって異なるため、ステップS50で判定に用いる枚数K3は、例えば、既存カテゴリーiに登録された総画像枚数のうち所定の割合以上(例えば15%以上)であることとする。
ステップS50において、既存カテゴリーiの中に枚数K3以上の乖離画像があると判定された場合、判定手段74は、ステップS52において、報知手段54に対して、警告表示による報知を行う指示を出す。そして、報知手段54は、既存カテゴリーiの中に新規画像Icを追加登録すると、認識手段73の認識性能が低下する可能性があることを報知する。その後、物品読取装置1は、ステップS54の処理を行う。
続いて、ステップS54において、学習手段75は、新規画像Icを既存カテゴリーiに登録する追加学習を行うかを判定する。追加学習を行う場合(ステップS54:Yes)はステップS56に進み、それ以外の場合(ステップS54:No)は、物品読取装置1は図7の処理を終了する。なお、学習手段75は、判定手段74が、認識手段73の認識性能が低下する可能性がないと判定したことを条件として追加学習を行えばよい。そして、学習手段75は、判定手段74が、認識手段73の認識性能が低下する可能性があると判定したことを条件として追加学習を行わないようにすればよい。
ステップS56において、学習手段75は、新規画像Icおよび新規画像Icの特徴量Fa(第1の特徴量)を、記憶手段71であるPLUファイルF1の既存カテゴリーiに追加登録する。なお、特徴量Faは、PLUファイルF1に、第2の特徴量Fbとして登録される。その後、物品読取装置1は、図7の処理を終了する。
なお、図7のフローチャートでは、ステップS46において、新規画像Icと、追加登録する既存カテゴリーiに登録された画像Iimとの類似度Cを算出した。そして、ステップS50において、既存カテゴリーiに登録された画像Iimの中に、新規画像Icの乖離画像が枚数K3以上あることを条件として、判定手段74は、報知手段54に対して、認識性能が低下する可能性があること、または認識性能が改善しない可能性があることを報知させるものとした。これは、カテゴリーiに追加登録する新規画像Icの中に、既に既存カテゴリーiに登録されている画像Iimの乖離画像が存在すると、新規画像Icから抽出した特徴量Faと、画像Iimから抽出した特徴量Fbとが離れた値になるため、認識手段73がオブジェクト認識を実行した際に、既存カテゴリーiに属する物品Gを別のカテゴリーに登録された物品と誤認識する可能性が高まるためである。
なお、ステップS46およびステップS50が行う判定処理は、より簡略化して行ってもよい。すなわち、ステップS46において、追加登録する新規画像Icと既存カテゴリーiに登録された画像Iimとの類似度Cを算出した際に、第2の閾値C2以下の画像Iimが見つかったこと(ステップS46:Yes)を条件として、判定手段74は、報知手段54に対して、認識手段73の認識性能が低下する可能性があることを報知させてもよい。この場合、図7のフローチャートにおいて、ステップS48、S50の各処理は不要となる。
また、図7に示すフローチャートは、新規画像Icを1枚のみ追加登録する例について示したが、追加登録する新規画像Icは1枚に限定されるものではない。すなわち、ステップS56の処理を行った後で、別の新規画像Icを追加登録するかを判定して、追加登録が必要である場合には、ステップS42に戻って、図7の処理を繰り返して実行してもよい。なお、複数の新規画像Icを追加登録する際には、判定手段74が、追加登録する複数の新規画像Ic間に、第3の閾値C3以上である類似度Cを有する新規画像Icが所定の枚数K2以上存在するかを判定して、類似画像が所定の枚数K2以上存在する場合に、報知手段54に対して、認識性能が低下する可能性があること、または認識性能が改善しない可能性があることを報知させてもよい。この処理は、図5のステップS22、S24で説明した処理に対応する。
さらに、判定手段74は、新規画像Icと、当該新規画像Icを追加登録しない既存カテゴリー(既存カテゴリーi以外のカテゴリー)に登録された画像との類似度Cに基づいて、新規画像Icを追加登録した場合に、既存カテゴリーiの認識性能が低下する可能性があるか、または認識性能が改善しない可能性があるかを判定してもよい。すなわち、新規画像Icの追加対象ではない既存カテゴリー(既存カテゴリーi以外のカテゴリー)に、新規画像Icに類似する画像が多く存在する場合には、新規画像Icを既存カテゴリーiに追加登録した場合に、既存カテゴリーiの認識性能が低下する可能性があると判定することができる。そしてさらに、新規画像Icと類似する画像が存在する既存カテゴリーiの認識性能も同様に低下する可能性があると判定することができる。この処理は、例えば、図5のステップS16、S18を用いて行うことができる。
ここで、ステップS48で行う乖離画像の枚数の計数方法について、図8を用いて、より具体的に説明する。図8は、乖離画像の枚数の計数方法について説明する図である。
図8に示すように、ステップS48(図7)において、算出手段72は、新規画像Icと、当該新規画像Icを登録する既存カテゴリーiに登録された画像Iimとの類似度Cを算出する。そして、算出手段72は、第2の閾値C2以下の類似度Cを有する画像Iim(乖離画像)の枚数を計数する。
すなわち、算出手段72は、既存カテゴリーiにp枚の画像が登録されている場合には、ステップS48において、p回の類似度算出を行う。
以上説明したように、実施形態に係る物品読取装置1によれば、指定手段50が、学習対象の物品Gを学習対象物品として指定する。そして、抽出手段53が、学習対象物品である物品Gを撮像した画像から当該学習対象物品の特徴を示す特徴量Fa(第1の特徴量)を抽出する。続いて、算出手段72が、抽出手段53が抽出した特徴量Faと、PLUファイルF1(記憶手段71)が構成する辞書に登録された各登録物品の特徴を示す特徴量Fb(第2の特徴量)とを比較して、その類似度Cを算出する。判定手段74は、特徴量Faと物品Gを除く登録物品の特徴量Fbとの類似度Cが第1の閾値C1以上、または特徴量Faと物品Gを含む登録物品の特徴量Fbとの類似度Cが第1の閾値C1よりも低い第2の閾値C2以下であるかを判定する。そして、報知手段54は、判定手段74が前記判定を行ったことを条件として、学習手段75が、抽出手段53が抽出した特徴量Faを、学習対象物品の特徴量Fbとして記憶手段71に登録する学習処理を行うのに先行して報知を行う。したがって、記憶手段71への、認識性能が低下する可能性のある物品Gの追加登録を避けることができる。
また、実施形態に係る物品読取装置1によれば、記憶手段71は、登録物品毎に複数の特徴量Fb(第2の特徴量)を記憶する。そして、報知手段54は、登録物品毎の特徴量Fbの中に、特徴量Fa(第1の特徴量)との類似度Cが、第1の閾値C1以上、または第2の閾値C2以下となる特徴量Fbが存在することを条件として報知を行う。したがって、指定手段50が学習対象物品を指定した際に、認識性能が低下する可能性があることを、簡単な演算で確実に判定することができる。
さらに、実施形態に係る物品読取装置1によれば、記憶手段71は、登録物品毎に複数の特徴量Fb(第2の特徴量)を記憶する。そして、報知手段54は、登録物品毎の特徴量Fbの中に、特徴量Fa(第1の特徴量)との類似度Cが、第1の閾値C1以上となる特徴量Fbを有する画像Ioが枚数K1(所定数)以上あることを条件として報知を行う。また、報知手段54は、登録物品毎の特徴量Fbの中に、特徴量Fa(第1の特徴量)との類似度Cが、第2の閾値C2以下となる特徴量Fbを有する新規画像Ic(画像)が枚数K3(所定数)以上存在することを条件として報知を行う。したがって、指定手段50が学習対象物品を指定した際に、認識性能が低下する可能性があることを、簡単な演算で、より一層確実に判定することができる。
そして、実施形態に係る物品読取装置1によれば、抽出手段53は、学習対象物品を撮像した複数の画像Ioの各々から特徴量Fa(第1の特徴量)を抽出する。そして、算出手段72は、抽出手段53が抽出した特徴量Fa間の類似度Cを算出する。報知手段54は、特徴量Faと物品Gを除く登録物品の特徴量Fbとの類似度Cが第1の閾値C1以上、または特徴量Faと物品Gを含む登録物品の特徴量Fbとの類似度Cが第1の閾値C1よりも低い第2の閾値C2以下であって、なおかつ特徴量Fa間の類似度Cが第3の閾値C3以上となる特徴量Faを有する画像Ioが枚数K2(所定数)以上存在することを条件として報知を行う。したがって、認識性能が低下する可能性があること、または認識性能が改善しない可能性があることを確実に判定することができる。
また、実施形態に係る物品読取装置1によれば、指定手段50は、PLUファイルF1(記憶手段71)が記憶していないカテゴリーの物品Gを、新たなカテゴリーの学習対象物品として指定する。また、指定手段50は、記憶手段71が記憶している既存カテゴリーに、当該既存カテゴリーに属する物品Gを学習対象物品として指定する。したがって、読み取りを行う物品Gの追加や変更に容易に対応することができる。
以上、本発明の実施形態を説明したが、この実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。この新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これらの実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
例えば、実施形態では、物品読取装置1は、PLUファイルF1(記憶手段71)に画像Inmと特徴量Fbをともに登録したが、登録するのは、画像Inmと特徴量Fbのいずれか一方であってもよい。すなわち、PLUファイルF1に、特徴量Fbのみを登録しておいてのよいし、PLUファイルF1に、画像Inmのみを登録しておき、必要に応じて特徴量Fbを算出してもよい。ただし、物品読取装置1に対して、新規カテゴリーの追加登録が見込まれる場合には、登録された各カテゴリーの認識性能を改善するために、今までにない新たな特徴量Fbを使用する必要性が生じる場合がある。新たな特徴量Fbを使用する場合には、既に登録された物品Gの画像から、当該新たな特徴量Fbを算出する必要がある。したがって、記憶手段71には、少なくとも物品Gの画像Inmを登録しておくのが望ましい。
また、実施形態では、物品読取装置1は、第1の特徴量Faおよび第2の特徴量Fbとして、それぞれ1種類の特徴量を用いたが、使用する特徴量の種類は1種類に限定されるものではない。すなわち、複数種類の特徴量を用いて、それらの特徴量の値を組み合わせて、物品Gを認識するようにしてもよい。
また、実施形態では、図5と図7のフローチャートを独立して説明したが、これら2つのフローチャートは、1つに組み合わせて使用してもよい。例えば、指定手段50の指定に応じて、新規カテゴリーへの追加登録と既存カテゴリーへの追加登録とを切り替える構成としてもよい。
1 物品読取装置
10 POS端末
50 指定手段
51 撮像手段
52 検知手段
53 抽出手段
54 報知手段
61 CPU
71 記憶手段
72 算出手段
73 認識手段
74 判定手段
75 学習手段
100 読取ユニット
110 表示・操作ユニット
161 CPU
F1 PLUファイル
Fa 特徴量(第1特徴量)
Fb、Fbnm 特徴量(第2特徴量)
Fcn 平均特徴量
C 類似度
C1 第1の閾値
C2 第2の閾値
C3 第3の閾値
特開2014−32539号公報

Claims (6)

  1. 学習対象の物品を学習対象物品として指定する指定手段と、
    前記学習対象物品を撮像した画像から当該学習対象物品の特徴を示す第1の特徴量を抽出する抽出手段と、
    辞書に登録された登録物品の特徴を示す第2の特徴量を記憶する記憶手段と、
    前記抽出手段が抽出した前記第1の特徴量と前記登録物品の前記第2特徴量とを比較して、その類似度を算出する算出手段と、
    前記抽出手段が抽出した前記第1の特徴量を、前記学習対象物品の前記第2の特徴量として前記記憶手段に登録する学習処理を行う学習手段と、
    前記第1の特徴量と前記学習対象物品を除く前記登録物品の前記第2の特徴量との前記類似度が第1の閾値以上、または前記第1の特徴量と前記登録物品に含まれた前記学習対象物品の前記第2の特徴量との前記類似度が前記第1の閾値よりも低い第2の閾値以下であることを条件に、前記学習処理に先行して報知を行う報知手段と、
    を備えることを特徴とする物品読取装置。
  2. 前記記憶手段は、前記登録物品毎に複数の前記第2の特徴量を記憶し、
    前記報知手段は、前記条件に該当する前記第2の特徴量が存在する場合に前記報知を行う
    ことを特徴とする請求項1に記載の物品読取装置。
  3. 前記記憶手段は、前記登録物品毎に複数の前記第2の特徴量を記憶し、
    前記報知手段は、前記条件に該当する前記第2の特徴量が所定数以上存在する場合に前記報知を行う
    ことを特徴とする請求項1または請求項2に記載の物品読取装置。
  4. 前記抽出手段は、前記学習対象物品を撮像した複数の画像の各々から前記第1の特徴量を抽出し、
    前記算出手段は、前記抽出手段が抽出した前記第1の特徴量間の前記類似度を算出し、
    前記報知手段は、前記条件に該当して、かつ前記第1の特徴量間の前記類似度が第3の閾値以上となる前記第1の特徴量が所定数以上存在する場合に前記報知を行う
    ことを特徴とする請求項1から請求項3のいずれか1項に記載の物品読取装置。
  5. 前記指定手段は、前記記憶手段が記憶していないカテゴリーの物品を、新たなカテゴリーの学習対象物品として指定するか、または前記指定手段は、前記記憶手段が記憶している既存カテゴリーに、当該既存カテゴリーに属する物品を学習対象物品として指定する
    ことを特徴とする請求項1から請求項4のいずれか1項に記載の物品読取装置。
  6. コンピュータを、
    学習対象の物品を学習対象物品として指定する指定手段と、
    前記学習対象物品を撮像した画像から当該学習対象物品の特徴を示す第1の特徴量を抽出する抽出手段と、
    辞書に登録された登録物品の特徴を示す第2の特徴量を記憶する記憶手段と、
    前記抽出手段が抽出した前記第1の特徴量と前記登録物品の前記第2特徴量とを比較して、その類似度を算出する算出手段と、
    前記抽出手段が抽出した前記第1の特徴量を前記学習対象物品の特徴量として前記記憶手段に登録する学習処理を行う学習手段と、
    前記第1の特徴量と前記学習対象物品を除く前記登録物品の前記第2の特徴量との前記類似度が第1の閾値以上、または前記第1の特徴量と前記登録物品に含まれた前記学習対象物品の前記第2の特徴量との前記類似度が前記第1の閾値よりも低い第2の閾値以下であることを条件に、前記学習処理に先行して報知を行う報知手段と
    して機能させるためのプログラム。
JP2016178873A 2016-09-13 2016-09-13 物品読取装置およびプログラム Active JP6838903B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2016178873A JP6838903B2 (ja) 2016-09-13 2016-09-13 物品読取装置およびプログラム
CN201710780975.4A CN107818295B (zh) 2016-09-13 2017-09-01 物品读取装置及控制方法、终端设备
US15/702,215 US10573022B2 (en) 2016-09-13 2017-09-12 Object recognition system and method of registering a new object
EP17190872.6A EP3293674B1 (en) 2016-09-13 2017-09-13 Object recognation system and method of registering a new object

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2016178873A JP6838903B2 (ja) 2016-09-13 2016-09-13 物品読取装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2018045390A true JP2018045390A (ja) 2018-03-22
JP6838903B2 JP6838903B2 (ja) 2021-03-03

Family

ID=59887048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2016178873A Active JP6838903B2 (ja) 2016-09-13 2016-09-13 物品読取装置およびプログラム

Country Status (4)

Country Link
US (1) US10573022B2 (ja)
EP (1) EP3293674B1 (ja)
JP (1) JP6838903B2 (ja)
CN (1) CN107818295B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020008710A1 (ja) * 2018-07-02 2020-01-09 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
WO2022003973A1 (ja) * 2020-07-03 2022-01-06 株式会社ソニー・インタラクティブエンタテインメント 訓練データ選別装置、訓練データ選別方法及びプログラム

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10853643B2 (en) * 2017-10-27 2020-12-01 Rakuten, Inc. Image extraction device, image extraction method, and image extraction program
JP6575628B1 (ja) * 2018-03-30 2019-09-18 日本電気株式会社 情報処理装置、情報処理システム、制御方法、及びプログラム
US11967174B2 (en) * 2018-09-11 2024-04-23 Hitachi Kokusai Electric Inc. Verification system and verification server
CN109360358A (zh) * 2018-12-25 2019-02-19 北京旷视科技有限公司 支付设备、支付系统及自助结账方法
CN110246281B (zh) * 2019-06-04 2021-01-22 北京星选科技有限公司 数据处理方法、装置、电子设备及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016001450A (ja) * 2014-06-12 2016-01-07 オムロン株式会社 画像認識装置及び画像認識装置への特徴量データ登録方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5194149B2 (ja) 2010-08-23 2013-05-08 東芝テック株式会社 店舗システムおよびプログラム
JP5551143B2 (ja) * 2011-12-02 2014-07-16 東芝テック株式会社 店舗システムおよびプログラム
JP5579202B2 (ja) * 2012-01-16 2014-08-27 東芝テック株式会社 情報処理装置、店舗システム及びプログラム
JP5553866B2 (ja) 2012-07-23 2014-07-16 東芝テック株式会社 商品認識装置及び認識辞書追加プログラム
JP2014032539A (ja) * 2012-08-03 2014-02-20 Toshiba Tec Corp オブジェクト認識スキャナシステム、辞書サーバ、オブジェクト認識スキャナ、辞書サーバプログラムおよび制御プログラム
JP5826800B2 (ja) * 2013-07-17 2015-12-02 東芝テック株式会社 認識辞書評価装置及び認識辞書評価プログラム
JP6147676B2 (ja) * 2014-01-07 2017-06-14 東芝テック株式会社 情報処理装置、店舗システム及びプログラム
JP6220679B2 (ja) * 2014-01-08 2017-10-25 東芝テック株式会社 情報処理装置、店舗システム及びプログラム
JP6348827B2 (ja) 2014-11-17 2018-06-27 東芝テック株式会社 情報処理装置、店舗システムおよびプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016001450A (ja) * 2014-06-12 2016-01-07 オムロン株式会社 画像認識装置及び画像認識装置への特徴量データ登録方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020008710A1 (ja) * 2018-07-02 2020-01-09 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
JP2020008904A (ja) * 2018-07-02 2020-01-16 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
JP7122625B2 (ja) 2018-07-02 2022-08-22 パナソニックIpマネジメント株式会社 学習データ収集装置、学習データ収集システム、及び学習データ収集方法
US11579904B2 (en) 2018-07-02 2023-02-14 Panasonic Intellectual Property Management Co., Ltd. Learning data collection device, learning data collection system, and learning data collection method
WO2022003973A1 (ja) * 2020-07-03 2022-01-06 株式会社ソニー・インタラクティブエンタテインメント 訓練データ選別装置、訓練データ選別方法及びプログラム
JP7449385B2 (ja) 2020-07-03 2024-03-13 株式会社ソニー・インタラクティブエンタテインメント 訓練データ選別装置、訓練データ選別方法及びプログラム

Also Published As

Publication number Publication date
US10573022B2 (en) 2020-02-25
CN107818295A (zh) 2018-03-20
EP3293674B1 (en) 2023-10-04
CN107818295B (zh) 2022-03-15
EP3293674A1 (en) 2018-03-14
JP6838903B2 (ja) 2021-03-03
US20180130225A1 (en) 2018-05-10

Similar Documents

Publication Publication Date Title
JP6838903B2 (ja) 物品読取装置およびプログラム
CN103116949B (zh) 信息处理装置及信息处理方法
US9036870B2 (en) Commodity recognition apparatus and commodity recognition method
US11392917B2 (en) Article reading device
JP5551143B2 (ja) 店舗システムおよびプログラム
JP5450560B2 (ja) 商品データ処理装置、商品データ処理方法及び制御プログラム
US20130223682A1 (en) Article recognition system and article recognition method
JP2014153894A (ja) 情報処理装置及びプログラム
JP6745646B2 (ja) 認識システム、情報処理装置、及びプログラム
JP6747873B2 (ja) 情報処理装置及びプログラム
JP2015038719A (ja) 情報処理装置及びプログラム
EP3144854B1 (en) Image recognition system that displays a user-friendly graphical user interface
JP5437404B2 (ja) 情報処理装置、店舗システム及びプログラム
JP5770899B2 (ja) 情報処理装置及びプログラム
JP2017211880A (ja) 情報処理装置及びプログラム
JP2016062548A (ja) 商品登録装置、商品登録方法、および商品登録プログラム
US20170083891A1 (en) Information processing apparatus and information processing method
JP5529982B2 (ja) 情報処理装置
JP6964166B2 (ja) 認識システム、情報処理装置、及びプログラム
JP7281569B2 (ja) 物品読取装置およびプログラム
JP7030946B2 (ja) 物品読取装置およびプログラム
JP5820011B2 (ja) 情報処理装置、情報処理システムおよび情報処理方法
JP2018101292A (ja) 情報処理装置及びプログラム
JP5698856B2 (ja) 情報処理装置、情報処理システムおよび情報処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190821

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20201008

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20201020

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201218

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210212

R150 Certificate of patent or registration of utility model

Ref document number: 6838903

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150