JP5385349B2 - Receipt definition data creation device and program thereof - Google Patents
Receipt definition data creation device and program thereof Download PDFInfo
- Publication number
- JP5385349B2 JP5385349B2 JP2011177408A JP2011177408A JP5385349B2 JP 5385349 B2 JP5385349 B2 JP 5385349B2 JP 2011177408 A JP2011177408 A JP 2011177408A JP 2011177408 A JP2011177408 A JP 2011177408A JP 5385349 B2 JP5385349 B2 JP 5385349B2
- Authority
- JP
- Japan
- Prior art keywords
- receipt
- item
- definition
- data
- items
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007726 management method Methods 0.000 claims description 126
- 238000013500 data storage Methods 0.000 claims description 46
- 230000014509 gene expression Effects 0.000 claims description 19
- 238000000034 method Methods 0.000 description 57
- 230000008569 process Effects 0.000 description 49
- 239000003550 marker Substances 0.000 description 35
- 238000004364 calculation method Methods 0.000 description 32
- 238000012015 optical character recognition Methods 0.000 description 26
- 238000010586 diagram Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 230000002354 daily effect Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000006467 substitution reaction Methods 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は,レシート定義データ作成装置およびそのプログラムに関し,特に,例えばショッピングモールなどの複数の店舗の売上を管理するために,文字認識により読み取ったレシートデータから必要なデータを正確に抽出するときに必要となる定義データの作成を支援する技術に関するものである。 The present invention relates to a receipt definition data creation device and a program thereof, and more particularly, when managing necessary data from receipt data read by character recognition in order to manage sales of a plurality of stores such as a shopping mall. The present invention relates to a technology that supports creation of necessary definition data.
ショッピングセンター,ショッピングモール等に出店するテナント(店舗を運営する会社など)の店舗を管理するテナント管理部門では,各店舗の一日の売上を収集し,現金売上,クーポン売上,…といった売上内訳(売上管理項目)を作成している。この売上内訳作成の際には,各店舗から提供される精算レシートが集められて,売上管理項目の数値を算出することが行われる。しかし,各店舗から提供される精算レシートの形式は,店舗ごとに導入されているPOSシステムに依存するため,さまざまな形式で作成されているのが現状である。そのため,テナント管理部門が処理する精算レシートは,項目の種類,項目名,印字サイズ,印字字体などにおいて多種多様である。 The tenant management department that manages stores of tenants (such as companies that operate stores) that open stores in shopping centers, shopping malls, etc. collects daily sales for each store, and breakdowns of sales such as cash sales, coupon sales, etc. ( Sales management item). When creating the sales breakdown, payment receipts provided from each store are collected and the numerical value of the sales management item is calculated. However, since the format of the payment receipt provided from each store depends on the POS system installed in each store, it is currently created in various formats. Therefore, the payment receipt processed by the tenant management department has a wide variety of items, item names, print sizes, print fonts, and the like.
例えば,精算レシートの項目の名称について,売上合計,売上計,合計売上,総売上,…等は,同等の内容を示すものであっても,POSシステムによって異なる名称が印字されている。また,出店するテナントの店舗の入れ替えなどが頻繁に行われるため,新たな精算レシートの形式にも対応しなければならない。そのため,テナント管理部門では,精算レシートを統一された売上管理データとして集計する売上集計作業に莫大な労力を要し,そのための人的および時間的負担に多大なコストを要しているのが現状である。 For example, regarding the names of the items on the payment receipt, even though the total sales, total sales, total sales, total sales, etc. indicate the same contents, different names are printed depending on the POS system. In addition, since the tenant's store that opens a store is frequently replaced, a new payment receipt format must also be supported. For this reason, the tenant management department requires a great deal of labor for the sales totaling work for totaling the payment receipts as unified sales management data, and the human and time burden for that is very expensive. It is.
なお,特許文献1には,レシート処理装置が開示されている。このレシート処理装置では,レシートの画像から文字を認識してテキストデータを生成し,テキストデータから所定の文字列を選択し,選択された所定の文字列が含まれる行位置を検出する。そして,検出された行位置に基づいて定まるテキストデータ上の所定の行範囲から行を単位とするラインデータを順に選択し,ラインデータから品目に関わるデータを抽出する。
Note that
また,特許文献2には,罫線がない不定型帳票を含む任意の帳票に対して,人手を介入することなく,自動的に帳票定義を作成する技術が開示されている。この技術では,レシートを画像として読み込み,印紙されている項目を表領域として切り出し,表領域ごとにx座標,y座標を算出し,x座標の度数分布表を作成する。それから位置揃えを判定して,商品欄,個数欄,価格欄を決定することにより,帳票定義を作成する。
前述したような,ショッピングセンター等の各店舗から提供される精算レシート(以下,レシートという)を集計するために,ショッピングセンター等を運営する会社(組織)のテナント管理部門では,従来,事務員が目視でレシートを読み取り,読み取ったデータを手作業でデータ処理装置に入力していた。この売上集計作業の作業量は,店舗数が100店舗以上に及ぶこともあり,しかも毎日行わなければならない作業であるため,非常に負担が大きいものであった。 In the tenant management department of a company (organization) that operates a shopping center or the like, the clerk has traditionally used to collect the payment receipts (hereinafter referred to as receipts) provided by each store such as a shopping center. The receipt was read visually, and the read data was manually input to the data processing device. The work amount of the sales totaling work is very heavy because the number of stores may reach 100 stores or more and must be performed every day.
この負担を軽減するための一案としては,各店舗の売上データ(レシートデータ)を,各店舗の端末からネットワークを介して自動収集することが考えられる。しかし,一般に各店舗は企業体が異なるため,個々にネットワーク開設の許諾を得る必要があり,さらに導入されているシステムによって接続するネットワークの種類やアプリケーションの追加・修正の難易度が異なるなど,解決が困難な問題が存在する。 As a proposal for reducing this burden, it is conceivable to automatically collect sales data (receipt data) of each store from a terminal of each store via a network. However, in general, each store has a different business entity, so it is necessary to obtain permission to open the network individually, and the type of network to be connected and the difficulty of adding / modifying applications differ depending on the installed system. There are difficult problems.
既存のシステムの変更,特に各店舗における端末などの情報機器の変更をできるだけ行わないで,前述した作業負担を軽減する他の案としては,レシートデータを人間が読み取るのではなく,文字画像の認識によって読み取る方法が考えられる。すなわち,各店舗のレシートを,例えばOCR(Optical Character Recognition )機能を有する読取装置,スキャナー等で読み取り,読み取ったレシート項目とその数値データについて売上管理項目に必要なものを抽出し,売上管理データに入力し直す方法である。 Another way to reduce the above-mentioned work load by changing the existing system, especially information devices such as terminals in each store as much as possible, is to recognize character images instead of reading receipt data by humans. The reading method can be considered. That is, the receipt of each store is read by, for example, a reader or scanner having an OCR (Optical Character Recognition) function, and the necessary receipt items and their numerical data are extracted as sales management items, and the sales management data is extracted. This is a method to re-enter.
このように,レシートの文字画像を認識して,売上管理データを自動で作成する場合,売上管理データとして必要な売上管理項目とレシートの読取項目とがどのように対応しているかの対応情報,また,レシートの読取項目の文字列(項目名称)およびその読取項目に対応する金額欄の画像上の位置情報を,レシート定義データとして事前に用意する必要がある。 In this way, when recognizing a character image of a receipt and automatically creating sales management data, correspondence information on how sales management items required as sales management data correspond to read items of receipts, In addition, it is necessary to prepare in advance the receipt definition data as the character string (item name) of the read item of the receipt and the position information on the image of the amount column corresponding to the read item.
このレシート定義データを一度作成して,レシート認識装置に登録すれば,OCR機能を有する読取装置等によりレシート画像を読み取り,その読み取ったレシート画像から売上管理データの作成に必要なレシート項目を抽出し,毎日の売上管理データをある程度自動で収集することができると考えられる。 Once this receipt definition data is created and registered in the receipt recognition device, the receipt image is read by a reading device or the like having an OCR function, and the receipt items necessary for creating sales management data are extracted from the read receipt image. , It is thought that daily sales management data can be collected to some extent automatically.
問題は,このレシート定義データをどのような方法により作成するかである。まず,人手により,レシート定義データを一つずつ入力することが考えられるが,大規模ショッピングモール等では,店舗数が100店舗以上にもなることがざらであり,レシート定義データを人手により入力するのは大変な作業量となる。さらに,ショッピングモール等では,出店する店舗の入れ替えが頻繁にあり,新しい店舗が加入する都度,新しいレシート定義データを人手により入力するのは,煩雑な作業となる。 The problem is how to create this receipt definition data. First, it is conceivable to manually input the receipt definition data one by one. However, in a large-scale shopping mall or the like, the number of stores may be more than 100, and the receipt definition data is manually input. This is a huge amount of work. Furthermore, in a shopping mall or the like, stores that are opened frequently are frequently replaced, and it is troublesome to manually input new receipt definition data every time a new store joins.
そこで,レシート定義データをできるだけ簡単に作成することができるコンピュータによる支援技術が望まれるが,特許文献2のレシート画像から自動的に帳票定義を作成する技術は,本発明が対象とするようなケースでは不十分であり,次の理由により用いることができない。
Therefore, a computer-aided technology capable of creating receipt definition data as easily as possible is desired. However, the technology for automatically creating a form definition from the receipt image of
(1)特許文献2では,テナント部門が必要とする各店舗の売上の管理に共通する特定の売上管理項目群からなる売上管理データがまったく考慮されていない。
(1) In
(2)また,特許文献2の技術では,個々のレシートごとの項目定義情報の作成は可能であるが,レシートに印字されている全ての項目を対象としており,必要な項目だけを選択することはできない。
(2) Also, with the technology of
(3)また,特にテナント管理部門が必要とする売上管理項目は,各店舗のレシートに印字されたレシート項目の項目名称と一致するとは限らず,また,必ずしも売上管理項目とレシート項目とが,一対一に対応しているとは限らない。 (3) In addition, the sales management items particularly required by the tenant management department do not always match the item names of the receipt items printed on the receipts of each store, and the sales management items and the receipt items are not necessarily It does not necessarily correspond one-on-one.
図27は,売上管理項目とレシート項目との対応関係の例を示す図である。 FIG. 27 is a diagram illustrating an example of a correspondence relationship between sales management items and receipt items.
テナント管理部門が必要とする売上管理項目は,例えば図27(A)に示すように,「現金売上」,「掛売上」,「クレジット売上」,……,「純売上」というような,各店舗に共通の統一された項目である。図27(B)に示すレシートでは,第14行目の「現金売上金額」が,第1番目の売上管理項目「現金売上」に対応しており,第2番目の売上管理項目「掛売上」に対応するレシート項目はなく,第18行目の「その他金券金額」が,第3番目の売上管理項目「クレジット売上」に対応している。 For example, as shown in FIG. 27A, the sales management items required by the tenant management department are “cash sales”, “payment sales”, “credit sales”,. It is a unified item common to stores. In the receipt shown in FIG. 27B, the “cash sales amount” on the 14th line corresponds to the first sales management item “cash sales”, and the second sales management item “overtime sales”. There is no receipt item corresponding to, and the “other voucher amount” on the 18th line corresponds to the third sales management item “credit sales”.
一方,図示省略するが,他の店舗のレシートでは,例えばレシート項目「日報上現金有高」とレシート項目「感謝カード」の金額を加算したものが,第1番目の売上管理項目「現金売上」に対応しており,レシート項目「日報上掛売上」が,第2番目の売上管理項目「掛売上」に対応しており,…というように,各売上管理項目とレシート項目との対応関係が店舗ごとに全く異なる。 On the other hand, although not shown in the drawings, in the receipt of another store, for example, the sum of the receipt item “cash amount on daily report” and the receipt item “thank you card” is the first sales management item “cash sales”. The receipt item “Daily Overtime Sales” corresponds to the second sales management item “Overhead Sales”, and so on, the correspondence between each sales management item and the receipt item is Every store is completely different.
本発明は,このような背景において,売上管理データをレシートの認識により収集するためのレシート定義データを簡易に作成するための手段を提供することを目的とする。すなわち,本発明は,ショッピングモール等の複数の店舗から出力される形式の異なるレシートを読み込み,必要な売上管理項目だけを正確かつ効率的に取得するためのレシート定義データを簡易に効率よく作成する手段を提供することを目的としている。 In view of such a background, an object of the present invention is to provide means for easily creating receipt definition data for collecting sales management data by recognition of a receipt. That is, the present invention reads receipts of different formats output from a plurality of stores such as shopping malls, and easily and efficiently creates receipt definition data for acquiring only necessary sales management items accurately and efficiently. It aims to provide a means.
上記課題を解決するための本発明の概要は,以下のとおりである。なお,以下ではレシートから収集する各店舗に共通な特定の基本管理項目として,売上管理項目を用いる場合を例に説明する。
(1)売上管理データを収集するためのレシート定義データの作成対象となる店舗が発行したレシートを画像として読み込み,画面上に表示し,画面操作によりレシート定義データを作成する。
(2)このとき,あらかじめ定められた必要な売上管理項目(精算項目ともいう)を画面に表示し,その項目ごとにレシートのイメージデータ上で対応する読取項目(レシート項目ともいう)を,マウス等の入力装置によるポイント操作またはドラッグ操作等により選択させ,位置情報を取得してレシート定義データを作成する。なお,マウス等でドラッグする場合には,厳密である必要はなく,該当する項目上のどこかにあればよい。例えば,ドラッグされた位置をシステム側で判断して,選択された項目を囲む枠線を自動的に表示し,操作員が正しく指定されたことが確認できるようにする。
(3)選択した項目を読取項目として表示するので,操作員は確認しながら作業ができる。
(4)選択した読取項目は,例えば四則演算の指定により,他の読取項目との演算を可能にする。演算式が指定された場合のその演算式をレシート定義データ内に設定することにより,一つの売上管理項目に複数の読取項目を対応づけることができる。
(5)また,レシート内において,選択した項目と同一名称の項目の存在をチェックする。同一名称の複数の項目が存在する場合,読取項目として特定するための複数のキーワードやマーカー項目(必要な項目位置の基準を定める項目)の設定を促す。
(6)また,読取項目がOCR認識困難(文字の潰れ,文字接触,罫線接触など)と想定される場合に,読取項目に代替するレシート項目を代替項目として定義し,代替項目からの相対位置の金額を認識できるようにする。
(7)また,例えば店舗情報を参照することにより,類似する業務のレシート定義データが既に存在する場合,その既存のレシート定義データを利用して,新しいレシート定義データを作成することを可能とする。
The outline of the present invention for solving the above problems is as follows. In the following, a case where a sales management item is used as a specific basic management item common to each store collected from a receipt will be described as an example.
(1) A receipt issued by a store that is a creation target of receipt definition data for collecting sales management data is read as an image, displayed on a screen, and receipt definition data is created by screen operation.
(2) At this time, the necessary necessary sales management items (also referred to as checkout items) are displayed on the screen, and the corresponding read items (also referred to as receipt items) on the receipt image data are displayed for each item. The selection is made by a point operation or a drag operation using an input device such as the above, and the position information is acquired to generate receipt definition data. When dragging with a mouse or the like, it is not necessary to be exact, and it may be anywhere on the corresponding item. For example, the system determines the dragged position and automatically displays a frame line surrounding the selected item so that the operator can confirm that it has been correctly specified.
(3) Since the selected item is displayed as a read item, the operator can work while confirming.
(4) The selected reading item can be operated with other reading items by specifying four arithmetic operations, for example. When an arithmetic expression is specified, the arithmetic expression is set in the receipt definition data, whereby a plurality of read items can be associated with one sales management item.
(5) Also, the presence of an item having the same name as the selected item is checked in the receipt. When there are a plurality of items having the same name, the user is prompted to set a plurality of keywords and marker items (items that determine the criteria for the necessary item positions) to be specified as read items.
(6) Also, when the read item is assumed to be difficult to recognize OCR (character collapse, character contact, ruled line contact, etc.), a receipt item that replaces the read item is defined as a substitute item, and the relative position from the substitute item To recognize the amount of money.
(7) Also, for example, by referring to store information, when there is already receipt definition data for a similar job, it is possible to create new receipt definition data using the existing receipt definition data. .
詳しくは,本発明は,複数の店舗がそれぞれ発行したレシートの画像を認識することにより,レシートに印字された前記店舗ごとに異なることがあるレシート項目と該レシート項目に対応する金額の情報を取得し,取得した情報をもとに各店舗に共通な特定の基本管理項目と該基本管理項目に対応する金額の情報を含む基本管理データを収集するレシート認識システムが各店舗ごとのレシートの認識に用いるレシート定義データを作成するレシート定義データ作成装置であって,レシート定義データの作成対象となる店舗が発行したレシートのイメージデータを含む画像データを記憶する画像データ記憶手段と,あらかじめ定められた前記基本管理項目の情報を記憶する基本データ記憶手段と,前記基本データ記憶手段に記憶された基本管理項目の情報の表示と前記画像データ記憶手段に記憶されたレシートのイメージデータの表示とを含む定義入力画面を表示する定義入力画面表示手段と,前記定義入力画面に表示されたイメージデータにおいて操作員に選択されたレシート項目と,該レシート項目に対応する金額の位置の入力を受け付けるとともに,前記レシート項目と前記定義入力画面に表示された前記基本管理項目との対応情報の入力を受け付ける入力データ処理手段と,前記入力データ処理手段が受け付けた情報をもとに,前記レシート項目,および前記イメージデータにおける前記レシート項目に対応する金額の位置,および前記レシート項目と前記基本管理項目との対応情報を含むレシート定義データを作成する定義データ作成手段と,作成されたレシート定義データを記憶する定義データ記憶手段とを備えることを特徴とする。 Specifically, the present invention obtains information on receipt items that may be different for each store printed on a receipt and information on the amount corresponding to the receipt item by recognizing images of receipts issued by a plurality of stores. Based on the acquired information, a receipt recognition system that collects basic management data including specific basic management items common to each store and information on the amount corresponding to the basic management items is used to recognize receipts for each store. A receipt definition data creation device for creating receipt definition data to be used, the image data storage means for storing image data including image data of a receipt issued by a store for which receipt definition data is to be created, and the predetermined data Basic data storage means for storing information on basic management items, and basic management stored in the basic data storage means The definition input screen displaying means for displaying the definition input screen including the display of the eye information and display the image data of the image data storage means stored in the receipt, the operator in the image data displayed on the definition input screen Input data processing that accepts input of the receipt item selected in the item and the position of the amount of money corresponding to the receipt item, and accepts input of correspondence information between the receipt item and the basic management item displayed on the definition input screen And the information received by the input data processing means, the receipt item, the position of the amount corresponding to the receipt item in the image data, and the correspondence information between the receipt item and the basic management item Definition data creation means for creating receipt definition data including the receipt definition data created Characterized in that it comprises a definition data storing means for storing.
また,本発明の一態様においては,さらに,前記定義入力画面は,前記レシート項目に対する演算式を操作員に入力させるための演算式入力用領域を有し,前記入力データ処理手段は,前記定義入力画面の演算式入力用領域に入力された前記レシート項目の演算式に従って一つまたは複数の前記レシート項目を一つの前記基本管理項目に対応づける対応情報を作成する手段を有することを特徴とする。 In the aspect of the invention, the definition input screen further includes an arithmetic expression input area for allowing an operator to input an arithmetic expression for the receipt item, and the input data processing means includes the definition According to another aspect of the present invention, there is provided means for creating correspondence information for associating one or a plurality of the receipt items with the one basic management item according to the arithmetic expression of the receipt item input in the arithmetic expression input area of the input screen. .
また,本発明の他の一態様においては,前記入力データ処理手段は,前記定義入力画面に表示されるイメージデータのレシート内に前記レシート項目と同一名称の他のレシート項目が存在するかどうかを調べ,存在する場合に,前記基本管理項目に対応づけるべき前記レシート項目の位置を特定するための,他の名称のレシート項目を含む複数のレシート項目またはレシート内においてユニークな名称の他のレシート項目を前記定義入力画面を介して入力させる手段を有し,前記定義データ作成手段は,前記基本管理項目に対応づけるべき前記レシート項目の位置を特定するための,他の名称のレシート項目を含む複数のレシート項目またはレシート内においてユニークな名称の他のレシート項目の情報を含むレシート定義データを作成する手段を有することを特徴とする。 Further, in another aspect of the present invention, the input data processing means, whether other receipt items of the receipt item having the same name in the receipt of the image data to be displayed on the definition input screen is present If there is a plurality of receipt items including receipt items with other names, or other receipt items with unique names in the receipt, to identify the position of the receipt item to be associated with the basic management item , if present the has a means for input through the definition input screen, the definition data generating means, a plurality including a receipt item of the basic management for specifying the position of the receipt items to associate the item, other names to create a receipt definition data including information other receipt items unique name in the receipt item or the receipt of It characterized by having a stage.
また,本発明の他の一態様においては,前記入力データ処理手段は,前記定義入力画面に表示されたレシートのイメージデータにおいて操作員がレシート項目または該レシート項目に対応する金額の位置を指定する操作の入力を受け付け,前記イメージデータにおける該当するレシート項目の文字列が印字された領域または金額の文字列が印字された領域を定め,その領域を囲む枠線を表示またはその領域内の文字列を強調表示する手段を有することを特徴とする。 In another aspect of the present invention, the input data processing means designates a receipt item or a position of an amount corresponding to the receipt item in the receipt image data displayed on the definition input screen. Accepts the operation input, determines the area where the character string of the corresponding receipt item in the image data is printed or the area where the character string of the amount is printed, and displays the frame surrounding the area or the character string in the area It is characterized by having means for highlighting .
また,本発明の他の一態様においては,前記画像データ記憶手段は,前記レシート定義データの作成対象となる店舗が発行したレシートに印字された文字を認識した結果の文字認識精度の情報をさらに記憶しており,前記入力データ処理手段は,入力された前記レシート項目の文字に対する文字認識精度が所定値以下であった場合に,前記レシート項目に代替する代替項目の指定を操作員に促すメッセージを出力し,操作員が指定した代替項目の入力を受け付ける手段を有し,前記定義データ作成手段は,前記レシート項目に加えて前記代替項目の情報と,前記レシート項目に対応する金額の位置を前記イメージデータ内における前記代替項目からの相対距離で示す情報を含むレシート定義データを作成する手段を有することを特徴とする。 In another aspect of the present invention, the image data storage means further includes information on character recognition accuracy as a result of recognizing a character printed on a receipt issued by a store to which the receipt definition data is to be created. And the input data processing means prompts an operator to specify an alternative item to substitute for the receipt item when the character recognition accuracy for the character of the input receipt item is less than a predetermined value. outputs, and means for accepting an input of alternate items that operator specified, the definition data creation means, and the said substitute item information in addition to the receipt item, the position of the amount corresponding to the receipt item The image forming apparatus includes means for creating receipt definition data including information indicated by a relative distance from the substitute item in the image data .
また,本発明の他の一態様においては,前記入力データ処理手段は,前記作成されたレシート定義データまたはその履歴データから抽出したデータを,前記定義入力画面に表示し,他のレシート定義データの作成時に操作員に参照させる手段を有することを特徴とする。
In another aspect of the present invention, the input data processing means displays the created receipt definition data or data extracted from the history data on the definition input screen, and stores other receipt definition data. It has a means to make an operator refer at the time of creation.
以上により作成されるレシート定義データは,以下のデータを含む。
(1)基本管理項目とレシート内の読取項目との対応情報。すなわち,基本管理項目として計上する金額は,レシート内のどの読取項目に対する金額であるかを示す情報。
(2)レシート内の読取項目の文字列と,それに対応する金額欄の相対的な位置情報。
(3)基本管理項目の金額が,複数の読取項目の金額の四則演算によって算出される場合には,その演算式を示す情報。
(4)その他,レシート内に必要な読取項目と同一名称(同じ文字列)の項目が複数あった場合に,必要な読取項目を特定するための複数キーワードやマーカー項目などの文字情報および読取文字との位置関係を示す情報。
The receipt definition data created as described above includes the following data.
(1) Correspondence information between basic management items and read items in receipts. That is, information indicating which reading item in the receipt the amount to be recorded as a basic management item.
(2) The relative position information of the character string of the reading item in the receipt and the corresponding money amount column.
(3) Information indicating an arithmetic expression when the amount of the basic management item is calculated by four arithmetic operations of the amounts of the plurality of reading items.
(4) In addition, when there are multiple items with the same name (same character string) as the required reading items in the receipt, character information and reading characters such as multiple keywords and marker items for specifying the required reading items Information indicating the positional relationship with
本発明の効果は以下のとおりである。
(1)レシートから基本管理項目に必要な読取項目を抽出する場合,どの基本管理項目にどの読取項目が対応するかを示すレシート定義データを,実際のレシートを用いて簡易に作成することができる。特に,操作員は,選択した読取項目を画面上で確認しながら,入力ミスを防いで容易に入力作業をすることができる。
(2)レシート定義データ中に読取項目の演算式を設定することができるので,一つの基本管理項目の金額を,複数の読取項目に対応する金額から算出することができ,レシート項目の内容が個々の店舗によって種々異なる場合でも,統一した基本管理項目のデータを収集することができる。
(3)レシートから基本管理項目に必要な読取項目について項目名称に同一の名称が複数存在する場合に,選択する読取項目を特定するための複数のキーワードとなる項目名称や読取項目に対する位置関係を特定する他のユニークな項目名称を持つマーカー項目の情報をレシート定義データに設定することができる。これにより,基本管理データの収集時におけるレシートデータの抽出の誤認識を回避することができる。
(4)画面上で基本管理項目に対応する読取項目を簡単な操作で選択することができ,また,指定された領域の自動調整機能を有することにより,その入力および確認が容易であり,効率よくレシート定義データを作成することができる。
(5)また,レシートの印字における文字の潰れ,文字接触,罫線接触などにより,読取項目についてOCR認識困難な場合があっても,レシート内の他の項目を読取項目の代替項目として定義できるので,読取精度のよいレシート定義データの作成が可能になる。
(6)また,同様な業務内容の店舗の新しいレシート定義データを作成する場合に,既存のレシート定義データを流用して,異なる読取項目の部分だけの入力でレシート定義データを作成することができるため,迅速にレシート定義データを作成することができる。
The effects of the present invention are as follows.
(1) When reading items necessary for basic management items are extracted from receipts, receipt definition data indicating which basic management items correspond to which reading items can be easily created using actual receipts. . In particular, the operator can easily perform an input operation while preventing an input error while checking the selected reading item on the screen.
(2) Since the calculation formula of the reading item can be set in the receipt definition data, the amount of one basic management item can be calculated from the amounts corresponding to a plurality of reading items. Even if it differs from store to store, data on unified basic management items can be collected.
(3) When there are a plurality of reading items necessary for the basic management item from the receipt, the item names that become a plurality of keywords for specifying the reading item to be selected and the positional relationship with the reading item are indicated. Information of marker items having other unique item names to be identified can be set in the receipt definition data. As a result, it is possible to avoid erroneous recognition of receipt data extraction when collecting basic management data.
(4) Reading items corresponding to basic management items can be selected on the screen with a simple operation, and it has an automatic adjustment function for the specified area, making it easy to input and confirm. You can often create receipt definition data.
(5) In addition, even if there is a case where OCR recognition is difficult for the read item due to character crushing, character contact, ruled line contact, etc. in printing the receipt, other items in the receipt can be defined as substitute items for the read item. , Receipt definition data with high reading accuracy can be created.
(6) In addition, when creating new receipt definition data for a store with the same business content, the receipt definition data can be created by inputting only the portions of different reading items by diverting the existing receipt definition data. Therefore, receipt definition data can be created quickly.
本発明によって作成されたレシート定義データを用いることにより,レシートの読取項目が異なる各種店舗のレシートデータから,テナントの管理部門が必要とする基本的なデータを統一的に収集し,売上管理データベースなどの基本データ管理データベースに保存することができるようになる。 By using the receipt definition data created by the present invention, basic data required by the tenant's management department is uniformly collected from receipt data of various stores with different receipt reading items, and a sales management database, etc. Can be saved in the basic data management database.
以下,図面を用いながら,本発明の実施の形態について詳細に説明する。なお,以下では,主に店舗売上を集計する装置の例について説明するが,本発明は売上集計に限られるわけではなく,仕入集計データやその他の伝票などに印字された実績データを集計するための装置などにも同様に適用することができる。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In the following, an example of an apparatus for totalizing store sales will be described. However, the present invention is not limited to sales totalization, and totals actual data printed on purchase total data or other slips. The present invention can be applied to a device for the same.
図1は,本発明の概要を説明するための装置構成例を示す。図1において,1はCPUおよびハードディスクやメモリ等の記憶装置等から構成され,レシートから読み取った画像データをもとに,レシート定義データを作成する処理を実行するレシート定義データ作成装置,2はレシート定義データの作成対象となるレシート,3は表示装置,4はキーボードやマウス等の入力装置である。
FIG. 1 shows an apparatus configuration example for explaining the outline of the present invention. In FIG. 1,
レシート2は,透明なキャリアシート等に挟まれた状態で読取機10に読み取られる。読取機10は,光学方式などによる画像のスキャンニングにより,レシート2の画像を読み取る装置である。画像データ読込部11は,周知のOCR処理機能を持ち,読取機10により読み取った画像を所定の画像データに変換する。なお,読取機10がOCR処理機能を有する場合には,画像データ読込部11は,OCR処理機能を持たなくてもよい。画像データは,例えばイメージデータが格納された画像ファイル,OCRによる認識文字データを含む。画像データ読込部11は,OCR処理結果の画像データを画像データ記憶部101に保存する。
The
定義入力画面表示部12は,店舗マスタ103を参照し,指定された店舗のレシート定義データを作成するために,基本データ記憶部102に格納されている基本的な売上管理項目の情報と,画像データ記憶部101に格納されているレシートのイメージデータを含む画像データの表示領域を有する定義入力画面を,表示装置3に表示する。
The definition input
入力データ処理部13は,表示された定義入力画面から,レシートの読取項目と,イメージデータにおける読取項目に対応する金額欄の位置情報と,読取項目と売上管理項目との対応情報とを入力する。このため,入力データ処理部13は,イメージデータにおける読取項目の位置の座標およびそれに対応する金額欄の位置の座標を入力装置4から取得する座標取得部131,複数の読取項目を一つの売上管理項目に対応づける演算式を定義する演算定義部132を備える。
The input
また,入力データ処理部13は,レシート内に読取項目と同一名称の他の項目が存在する場合に,読取項目を特定する基準となる複数キーワードを定義入力画面から入力して設定する複数キーワード設定部133および読取項目を特定する基準となる他のユニークな読取項目を定めるマーカー項目設定部134を備える。さらに,入力データ処理部13は,入力した読取項目について認識エラーがあった場合や文字認識精度が悪い場合に,読取項目に代替する他のレシート項目を代替項目として操作員に指定させて代替項目を入力する代替項目処理部135を備える。
The input
定義データ作成部14は,入力データ処理部13によって入力した情報をもとに,店舗ごとのレシート定義データを作成し,定義データ記憶部104に格納する。作成されるレシート定義データの具体例については後述する。レシート定義データは,レシートの読取項目における項目名称とそれに対応する金額項目の相対位置(相対的な金額欄の位置)などの情報を含むとともに,売上管理項目との対応関係情報を含んでいる。
The definition
履歴データ作成部15は,定義データ作成部14によって作成されたレシート定義データの履歴データを作成し,履歴データ記憶部105に格納する。この履歴データは,類似する他のレシートのレシート定義データを作成するときに参照して利用することができる。
The history
図2は,図1に示すレシート定義データ作成装置1の処理の概要を示すフローチャートである。
FIG. 2 is a flowchart showing an outline of processing of the receipt definition
ステップS11では,画像データ読込部11が,読取機10により精算レシートを読み取る。精算レシートは,各店舗における1日分の売上情報の集計データであり,レシート項目は各店舗が使用しているPOSシステムによって異なっている。画像データ読込部11は,文字認識などによって得られた項目明細やレシートの全体イメージのデータを画像データ記憶部101に格納する。
In step S <b> 11, the image
ステップS12では,定義入力画面表示部12が,画像データ記憶部101,基本データ記憶部102,店舗マスタ103のデータから定義入力画面を作成し,表示装置3に表示する。定義入力画面には,レシートの全体イメージの表示も行われる。
In step S <b> 12, the definition input
ステップS13では,入力データ処理部13が,定義入力画面からの入力により,精算レシートの項目について,読取項目および演算式などを設定し,読取項目と売上管理項目との対応関係,読取項目とその読取項目に対応する金額欄の位置関係を定める。
In step S13, the input
ステップS14では,定義データ作成部14が,入力データ処理部13により入力した情報をもとに,レシート定義データを作成し,定義データ記憶部104に格納する。
In
ステップS15では,履歴データ作成部15が,作成したレシート定義データについての履歴データを作成し,履歴データ記憶部105に保存する。
In step S <b> 15, the history
以上,レシート定義データ作成装置1が実行する大まかな処理を説明したが,以下では,具体的な処理内容やデータ構造について詳しく説明する。
The rough processing executed by the receipt definition
図3は,読取機10によって読み取られるレシート2の例を示す図である。読取機10が図3に示すようなレシート2を読み取ると,読取機10または画像データ読込部11のOCR処理により,画像の解析による文字認識が行われる。この文字認識では,図3に示すレシート2における文字列#1,#2,…,#14,…のように,一連の文字列ごとに,文字列を構成する各認識文字の候補とその位置情報とが画像データとして抽出され,画像データ記憶部101に格納される。
FIG. 3 is a diagram illustrating an example of the
図4は,画像データ記憶部101に格納される画像データの例を示す図である。画像データ記憶部101には,図4(A)に示すように,レシート画像のイメージデータに関するデータと,図4(B)に示すように,レシートの文字認識結果のデータ(以下,認識文字データという)とが格納される。
FIG. 4 is a diagram illustrating an example of image data stored in the image
レシート画像のイメージデータは,例えばレシート全体またはレシートにおける文字が印字された部分全体の矩形領域の画像イメージがビットマップ形式の画像ファイルとして格納され,また,このレシート2を発行した店舗を識別する店舗コードが付与される。この店舗コードは,入力装置4から事前に入力してもよいし,また,レシート2を読取機10に読み取らせるときのレシート挟持用シート(キャリアシート)に付与された各店舗識別用の2次元コード等を解析して入力するようにしてもよい。
As the image data of the receipt image, for example, the image image of the rectangular area of the entire receipt or the entire portion of the receipt printed with characters is stored as a bitmap image file, and the store that identifies the store that issued this receipt 2 A code is given. This store code may be input in advance from the
図4(B)に示す認識文字データは,一連の文字列#n(n=1,2,…)についての文字認識の結果が格納されるが,その内容を図3に示す文字列#14の例を用いて説明する。まず,文字列#14がレシート2における14番目の文字列であり,識別番号がそれを示している。文字列#14の文字数は3(第1候補の並びは「総売上」)であり,文字列#14の座標は,(x,y)−(x’,y’)である。この座標は,あらかじめ定められたレシート2の画像の基準位置(例えばレシート画像の左上角または文字列群を囲む矩形領域の左上角など)を原点とした座標である。
In the recognized character data shown in FIG. 4B, the result of character recognition for a series of character strings #n (n = 1, 2,...) Is stored, the contents of which are
さらに,認識文字データは,文字列#14を構成する各文字#141,#142,#143の3文字について,各々の座標情報を持つ。また,認識結果の文字と認識用の辞書との相違度の小さい順に,認識結果のいくつかの文字が相違度とともに格納される。例えば,文字#141の認識結果の第1番目の候補は「総」(相違度=1311)であり,第2番目の候補は「脆」(相違度=1581),第3番目の候補は「聡」(相違度=1640)である。
Further, the recognized character data has coordinate information for each of the three characters # 141, # 142, and # 143 constituting the
ここで,画像データ読込部11は,これらの認識結果の候補をすべて画像データ記憶部101に格納するのではなく,各文字列#nを構成する認識候補の各文字の組み合わせと,すべての店舗に共通にあらかじめ用意された認識結果単語辞書であって,レシートに印字される可能性のある文字列があらかじめ格納されている辞書中の単語との照合により,認識結果の文字列を絞り込んで,その絞り込んだ結果だけを画像データ記憶部101に格納するようにしてもよい。
Here, the image
図5は,基本データ記憶部102に格納される基本テーブルの例を示す図である。この基本テーブルは,テナント管理部門が集計する売上管理項目の情報を格納している。具体的には,ショッピングセンターにおける売上管理データの管理を対象とした場合,ショッピングセンターを識別するショッピングセンターコード,ショッピングセンターの名称および所在地,ショッンピングセンター内の店舗数の情報を格納している。また,テナント管理に必要な各売上管理項目の項目名称が格納される。
FIG. 5 is a diagram illustrating an example of a basic table stored in the basic
この例では,売上管理項目として8個の項目があり,これらの各項目の名称が「現金売上」,「掛売上」,「クレジット売上」,「商品券」,「総売上」,「消費税」,「その他控除」,「純売上」である。本システムは,各店舗ごとに異なる各種のレシートの項目の中から,これらの売上管理項目の情報を自動で抽出するためのレシート定義データを,単純な操作で作成することができるようにすることを目的としている。 In this example, there are eight items as sales management items, and the names of these items are “cash sales”, “payment sales”, “credit sales”, “gift certificate”, “total sales”, “consumption tax” ”,“ Other deductions ”and“ Net sales ”. This system enables receipt definition data for automatically extracting information on these sales management items from various receipt items that differ for each store to be created with a simple operation. It is an object.
また,この基本テーブルには,各演算管理項目ごとにその演算管理項目が取り得る値の下限値と上限値とが定められ,格納されている。この下限値と上限値とは,レシート画像を文字認識することによってレシートから売上管理項目の金額を自動で抽出した場合に,,誤認識・誤入力を少なくするためのチェックに用いられる。 In this basic table, a lower limit value and an upper limit value that can be taken by the calculation management item are determined and stored for each calculation management item. The lower limit value and the upper limit value are used for checking to reduce erroneous recognition and erroneous input when the amount of the sales management item is automatically extracted from the receipt by character recognition of the receipt image.
図6は,店舗マスタ103の例を示す図である。店舗マスタ103は,レシートを発行する個別の店舗の情報を格納するテーブルであり,あらかじめ用意される。1番目の設定項目である店舗コードは,店舗を識別する番号である。2番目の店舗名称は,店舗の名称である。3番目の業種コードは,店舗の業種を表すコードである。4番目の業種名は,業種の名称である。続いてPOSシステム情報1,2,3として,順に,導入されているPOSシステムの識別コード(例:F001),POSシステムのメーカー(例:AAAAA),POSシステムの導入年月日(例:2000年1月1日)などの情報が格納される。また,精算レシート情報1,2,3,4として,順に,精算レシートの長さ,読込形式,精算レシート中の印字項目数,その他の必要な情報が格納される。読込形式の欄には,読取機10がレシート2をそのまま形で読み込む場合には“0”,レシート2が長過ぎるため,レシート2を複数片にカットして読み込む場合には“1”の値が設定される。
FIG. 6 is a diagram illustrating an example of the
本システムは,以上の画像データ記憶部101,基本データ記憶部102,店舗マスタ103に格納されているデータをもとに,レシート定義データを作成する。なお,店舗マスタ103は,店舗情報が既知であるか入力装置4から事前に入力される場合には必須ではない。
This system creates receipt definition data based on the data stored in the image
図7は,レシート定義データであって,もっとも基本的なデータの例を示している。店舗コードは,どの店舗のレシート定義データであるかを示す店舗の識別コードである。続いて,レシートから読み取るレシート項目の情報が,各項目ごとに格納される。読取項目1識別コードは,1番目の読取項目1の識別コードであり,レシート定義データ内で読取項目を一意に識別するコードである。
FIG. 7 shows an example of the most basic data as receipt definition data. The store code is a store identification code indicating which store has the receipt definition data. Subsequently, receipt item information read from the receipt is stored for each item. The
項目属性には,読取項目の属性が設定される。レシート内に同一名称(読取文字が同じ)の読取項目が存在しない場合,属性値=1である。レシート内に同一名称の読取項目が存在したときに,マーカー項目を基準にして読取項目を特定する場合には,属性値=2である。レシート内に同一名称の読取項目が存在したときに,複数キーワードをもとに読取項目を特定する場合には,属性値=3である。読取文字の認識が困難で代替項目を設定した場合には,属性値=4である。 In the item attribute, the attribute of the read item is set. If there is no reading item with the same name (the same reading character) in the receipt, the attribute value = 1. When there is a reading item with the same name in the receipt, the attribute value = 2 when the reading item is specified based on the marker item. When there is a reading item with the same name in the receipt, when specifying the reading item based on a plurality of keywords, attribute value = 3. When it is difficult to recognize the read character and an alternative item is set, attribute value = 4.
図7(A)のレシート定義データは,同一名称の読取項目が複数存在しない場合の例であり,項目属性の属性値は1となっている。1番目の読取項目の読取文字1は,この例では「総売上」となっている。金額欄の相対読取位置1は,「総売上」に対応する金額の文字列がどの部分に印字されているかを「総売上」の文字列の位置からの相対位置で示す。ここで相対位置とは,例えば「総売上」の文字列領域の左上角を原点としたときの金額欄の位置の座標である。金額欄の位置を読取文字1の位置からの相対位置で示すのは,同じレシートであっても,日によって実際にレシートに印字される行数が異なり,読取文字1の位置が可変であるからである。
The receipt definition data in FIG. 7A is an example when there are not a plurality of read items with the same name, and the attribute value of the item attribute is 1. The read
2番目の読取項目の読取文字2「その他金券金額」,3番目の読取項目の読取文字3「現金売上」についても,同様に識別コード,項目属性,読取文字,金額欄の相対読取位置のデータがレシート定義データとして格納される。
Similarly, for the
図7(B)のレシート定義データは,読取項目の文字認識が困難な場合の例であり,項目属性の属性値は4となっている。この場合,読取項目(例えば消費税)の認識の代わりとなる項目を代替項目(例えば小計)として定義し,金額欄の相対読取位置として代替項目からの相対距離を設定する。 The receipt definition data in FIG. 7B is an example when it is difficult to recognize the characters of the read item, and the attribute value of the item attribute is 4. In this case, an item that replaces recognition of a reading item (for example, consumption tax) is defined as an alternative item (for example, a subtotal), and a relative distance from the alternative item is set as a relative reading position in the amount column.
図8は,読取項目としてレシート内に同一名称が複数存在する場合のレシート定義データの例を示している。図8(A)は,項目属性の属性値が2の場合の例,図8(B)は,項目属性の属性値が3の場合の例である。 FIG. 8 shows an example of receipt definition data when there are a plurality of identical names in the receipt as read items. 8A shows an example when the attribute value of the item attribute is 2, and FIG. 8B shows an example when the attribute value of the item attribute is 3.
レシート内に読取項目の名称が同じ項目が複数存在する場合(例えば,読取項目の項目名称が「消費税」であり,その「消費税」という用語が複数行に印字されている場合),どちらの金額を売上管理項目として抽出するかを特定する情報が必要となる。 When there are multiple items with the same read item name in the receipt (for example, the item name of the read item is "consumption tax" and the term "consumption tax" is printed on multiple lines) Is required to specify whether to extract the amount of money as a sales management item.
項目属性の属性値が2の場合,読取項目の位置を特定する基準となる他のユニークな項目名称をマーカー項目として定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図8(A)の例では,「総売上」が読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,他のユニークなレシート上の印字名称である「貸在高」の項目をマーカー項目として定義している。また,読取文字1の読取位置およびその項目に対応する金額欄の相対読取位置1の他に,マーカー項目からの距離(方向を含む)の情報が定義される。このマーカー項目からの距離の情報は,マーカー項目「貸在高」の文字位置から読取文字1「総売上」の文字位置までの距離(x座標,y座標)の上限値を示しており,x座標については,読取文字1が右方向に存在する場合には正の値,左方向に存在する場合には負の値をとる。また,y座標については,読取文字1が上方向に存在する場合には正の値,読取文字1が下方向に存在する場合には負の値をとる。図8(A)の例では,この値が「(−50,+100)」であり,マーカー項目「貸在高」の文字位置からx座標で−50(左方向),かつ,y座標で+100(上方向)の範囲内に,収集対象となる読取文字1「総売上」が存在することを示している。
If the attribute value of the item attribute is 2, define one of the items with the same name as the actual reading item by defining another unique item name that serves as a reference for specifying the position of the reading item as a marker item To do. In the example of FIG. 8A, “total sales” is the read
項目属性の属性値が3の場合,複数行に連続して並ぶ複数の項目名称をキーワードとして,それらの複数のキーワードがレシート内でユニークになるように定義することにより,同一の名称の項目の一つを実際の読取項目として特定する。図8(B)の例では,「総売上」が売上管理項目として必要な読取文字1であるが,レシート内に「総売上」の項目名称が複数存在するため,レシート内でユニークになる「総売上」,「純売上」,「現金有高」,「貸在高」の複数行にわたる一連の項目を,複数キーワードとして設定し,これらの一塊の文字列により,「総売上」の読取項目の位置を特定するようにしている。読取文字1の読取位置1は,「総売上」,「純売上」,「現金有高」,「貸在高」の複数キーワードが印字された最小矩形領域の左上と右下の座標である。また,金額欄の相対読取位置1は,読取文字1の読取位置1の左上の座標を原点として定義した座標である。
When the attribute value of an item attribute is 3, by defining multiple item names that are consecutively arranged in multiple lines as keywords and defining the multiple keywords to be unique in the receipt, the items with the same name One is specified as an actual reading item. In the example of FIG. 8B, “total sales” is the read
さらに,レシート定義データとして,図7および図8に示すレシート定義データによって定義された読取項目と,図5に示した基本テーブル中の売上管理項目との対応関係を示す演算式の定義情報が設定される。図9は,その演算式を定義するレシート定義データの例を示している。 Further, as the receipt definition data, the definition information of the arithmetic expression indicating the correspondence between the read item defined by the receipt definition data shown in FIGS. 7 and 8 and the sales management item in the basic table shown in FIG. 5 is set. Is done. FIG. 9 shows an example of receipt definition data that defines the arithmetic expression.
演算式の定義情報は,図9に示すように,店舗を識別する店舗コードの他に,各売上管理項目と1または複数の読取項目識別コードとの対応情報を持つ。複数の読取項目が,1つの売上管理項目に対応づけられる場合には,複数の読取項目識別コードについての四則演算の演算式が用いられる。図9の例で説明すると,売上管理項目1「現金売上」に対応する読取項目識別コードは,「A+B」となっている。これは,読取項目識別コード=Aの読取項目に対応する金額欄に印字された数値と,読取項目識別コード=Bの読取項目に対応する金額欄に印字された数値とを加算した値を,売上管理項目1「現金売上」の金額として計上することを示している。2番目の売上管理項目2「掛売上」については,読取項目識別コード「C」の読取項目を,そのまま「掛売上」の金額とすることを示している。他の売上管理項目についても同様に,読取項目識別コードの演算式(1対1対応の場合を含む)によって,各売上管理項目とレシートからの読取項目との対応情報が定義される。
As shown in FIG. 9, the definition information of the arithmetic expression has correspondence information between each sales management item and one or a plurality of read item identification codes in addition to the store code for identifying the store. When a plurality of reading items are associated with one sales management item, arithmetic expressions of four arithmetic operations for a plurality of reading item identification codes are used. In the example of FIG. 9, the read item identification code corresponding to the
次に,履歴データ作成部15によって作成され,履歴データ記憶部105に格納される履歴データの例を,図10に従って説明する。
Next, an example of history data created by the history
履歴データは,定義データ作成部14によって作成されたレシート定義データの内容を,他の同業種の店舗でのレシート定義データの作成に流用できるようにするために,まとめたものである。業種情報として,業種コード,業種名,POSシステム情報1〜3,精算レシート情報1〜4などが格納される。また,項目情報として,各読取項目の識別コード,項目属性,読取文字等が格納される。また,演算情報として,各売上管理項目と,該当する読取項目識別コードを用いた演算式が格納される。これらの具体的な内容は,図7ないし図10を用いて説明したレシート定義データの内容と同様である。
The history data is collected so that the contents of the receipt definition data created by the definition
また,履歴データ作成部15は,履歴データとして辞書情報を作成し,履歴データ記憶部105に格納する。図11は,その履歴データの辞書部の例を示す。
The history
履歴データの辞書部には,図11に示すように,業種コード,POSシステム情報,売上管理項目,読取文字,…などの実際にレシート定義データに利用された文字列情報(単語など)が格納される。この辞書部に格納された文字列情報は,作成済みのレシート定義データを用いて,新しい店舗のレシート定義データを作成する場合に,売上管理項目に該当する読取項目を類推するために用いられる。また,例えば図4で説明した文字認識結果の画像データにおいて,正しい認識結果の文字列を抽出するのに用いることができる。また,実際の売上管理データの収集作業において,自動で誤認識,誤入力を防止するのに用いることができる。 In the history data dictionary section, as shown in FIG. 11, character string information (words, etc.) actually used for receipt definition data, such as industry code, POS system information, sales management items, read characters,... Is done. The character string information stored in the dictionary part is used to infer the reading items corresponding to the sales management items when the receipt definition data of a new store is created by using the created receipt definition data. For example, it can be used to extract a character string of a correct recognition result in the image data of the character recognition result described with reference to FIG. It can also be used to prevent erroneous recognition and erroneous input automatically in the actual sales management data collection operation.
次に,レシート定義データ作成装置1が実行する処理について,さらに詳しく説明する。図12〜図14は,本実施形態に係るレシート定義データ作成処理の全体のフローチャートである。
Next, the process executed by the receipt definition
まず,ステップS201では,入力装置4からの操作員の入力を待ち合わせる。操作員が,メニュー等により,レシート定義データを新規に作成するのか,または作成済みのレシート定義データを参照して作成するのかを指定すると,ステップS202へ進む。
First, in step S201, an operator input from the
ステップS202では,レシート定義データの新規作成か参照作成かを判定し,参照作成の場合,図13のステップ220へ進み,新規作成の場合には,ステップS203へ進む。 In step S202, it is determined whether the receipt definition data is newly created or reference created. If reference creation is made, the process proceeds to step 220 in FIG. 13, and if newly created, the process proceeds to step S203.
ステップS203では,レシート定義データを作成するための定義入力画面の初期画面を表示装置3に表示する。
In step S203, an initial screen of a definition input screen for creating receipt definition data is displayed on the
図15に,定義入力画面の構成例を示す。定義入力画面30には,レシート定義データを作成する施設とテナント(店舗)情報の表示領域の下に,売上管理項目一覧表示領域31,OCR読取定義一覧表示領域32,レシート画像表示領域33,マーカー定義一覧表示領域34,計算式入力用領域35が設けられる。
FIG. 15 shows a configuration example of the definition input screen. The
売上管理項目一覧表示領域31には,図16(A)に示すように,売上管理項目一覧が表示される。売上管理項目一覧は,図5で説明した基本テーブルに格納されている売上管理項目の項目名称と,売上管理項目と読取項目とを対応づける計算式(演算式)が確定したときに,その計算式が表示される欄を持つ。
In the sales management item
また,OCR読取定義一覧表示領域32には,図16(B)に示すように,操作員の入力操作によって入力されるOCRの読取項目や,レシート画像内においてその項目の領域情報が設定されたどうかを示す情報(項目領域),その項目に対応する金額欄の領域情報が設定されたかどうかを示す情報(金額情報)が表示される。
In the OCR reading definition
レシート画像表示領域33には,読取機10で読み取ったレシートの画像(イメージデータ)が表示される。この領域の表示においては,スクロール,拡大/縮小などの機能が設けられている。
In the receipt
マーカー定義一覧表示領域34は,レシート内に同一名称の読取項目が複数存在する場合に,読取項目を特定するためのユニークなマーカー項目を定義するための情報が表示される。また,計算式入力用領域35には,入力された売上管理項目と読取項目とを対応づける計算式が表示される。
The marker definition list display area 34 displays information for defining a unique marker item for specifying a reading item when there are a plurality of reading items with the same name in the receipt. In the calculation
ステップS203で,以上のような定義入力画面30の初期画面を表示した後,ステップS204で,操作員の入力を待ち合わせる。ステップS205では,すべての項目の入力が終わると,操作員が「定義確定」のキーを押すので,その入力があったかどうかを判定し,「定義確定」の指示が入力されたならば,ステップS208へ進む。
In step S203, the initial screen of the
「定義確定」の指示がない場合には,ステップS206へ進み,読取項目の入力と,項目領域の選択と,金額領域の選択処理を行う。この処理の例について,図16および図17を用いて説明する。 If there is no “define definition” instruction, the process advances to step S206 to input a reading item, select an item area, and select a money area. An example of this processing will be described with reference to FIGS.
定義入力画面30の初期画面では,OCR読取定義一覧表示領域32は,図16(B1)に示すように自動で付与される読取項目ID(例えば,a)の表示と,空欄の読取項目,項目領域,金額領域の表示が行われている。ここで,読取項目として,例えば「純売上」が入力により設定されると,その「純売上」の項目に対するレシート内の項目領域および金額領域の領域が未設定であることを示す「未設定」の文字が,目立ちやすい表示色で,図16(B2)に示すように表示される。そこで,操作員は,項目領域の設定操作と金額領域の設定操作を行う。
On the initial screen of the
図17は,項目領域の設定を説明する図である。OCR読取定義一覧表示領域32の表示が図17(A)に示すとおりであり,レシート画像表示領域33には,図17(B)に示すようなレシート画像が表示されているとする。操作員は,レシート画像表示領域33における画像上で,マウス等の入力装置4により,「純売上」の文字列部分をポイントして,ドラッグまたはクリックする。入力データ処理部13の座標取得部131は,この入力を検知し,レシート画像における「純売上」の文字列を枠線で囲んで表示する。このとき,例えば図17(C)の左側の図に示す矢印のように,「純売上」の文字列部分を大きくドラッグしても,枠線の自動調整により,図17(C)の右側の図に示す点線枠のように必要最小限の大きさで枠線が表示される。このようにして選択された項目領域の左上角座標と,右下角座標とが,内部メモリに記憶される。OCR読取定義一覧では,図17(D)に示すように,項目領域の欄が「未設定」から「○」に書き換えられ,項目領域の選択処理が済んだことが示される。枠線で囲む領域の大きさの自動調整は,図5で説明したOCRによる認識結果の画像データを参照することにより行うことができる。
FIG. 17 is a diagram for explaining the setting of the item area. Assume that the display in the OCR reading definition
金額領域の選択処理についても,同様に,レシート画像における該当する金額欄に対するマウス等によるドラッグまたはクリックによって,枠線が表示され,その領域の座標情報が取り込まれることにより行われる。金額領域の設定により,OCR読取定義一覧における金額領域の欄は,「未設定」から「○」に書き換えられ,「純売上」の読取項目に対する定義が終了する。入力欄は,次の行に移る。入力欄がなければ,新しい入力欄が自動的に追加される。なお,枠線の表示で領域を示す代わりに,背景や文字の表示色を変えて領域を示してもよい。 Similarly, the amount area selection process is performed by displaying a frame line by dragging or clicking the corresponding amount field in the receipt image with a mouse or the like, and taking in the coordinate information of the area. By setting the amount area, the amount area column in the OCR reading definition list is rewritten from “not set” to “◯”, and the definition for the reading item “net sales” is completed. The input field moves to the next line. If there is no entry field, a new entry field is automatically added. Instead of showing the area by displaying the frame line, the background or character display color may be changed to show the area.
以上の読取項目の定義処理に続いて,ステップS207では,演算定義処理が行われる。演算定義処理は,売上管理項目とステップS206で定義された1または複数の読取項目との対応関係を示す計算式を定義する処理である。詳しくは後述する。その後,ステップS204へ戻り,同様に処理を繰り返す。 Subsequent to the reading item definition processing described above, in step S207, calculation definition processing is performed. The calculation definition process is a process for defining a calculation formula indicating the correspondence between the sales management item and one or more reading items defined in step S206. Details will be described later. Then, it returns to step S204 and repeats a process similarly.
「定義確定」の指示があった場合,ステップS208へ進み,ステップS208では,読取項目の再チェックを行う。ここでは,読取項目の項目領域について再度,文字認識を行う。または,図4(B)で説明した画像データ記憶部101に格納されている認識文字データの中の読取項目の各認識文字に対する相違度の情報から,認識の精度を判定し,誤認識が生じていないかどうか,または認識の精度が所定の閾値より悪いかどうかをチェックする。
If there is an instruction for “definition of definition”, the process proceeds to step S208. In step S208, the reading item is rechecked. Here, character recognition is performed again for the item area of the read item. Alternatively, the recognition accuracy is determined based on the difference information for each recognized character of the read item in the recognized character data stored in the image
ステップS209の判定により,認識エラーがないと判定された場合,または認識の精度が悪くないと判定された場合には,図14のステップS230へ進む。そうでない場合には,ステップS210へ進み,操作員に対して代替項目の入力を促す。代替項目は,本来の読取項目について,認識が困難であるか誤認識の可能性が大きいために,他のレシート項目を代替項目として認識対象とし,その代替項目からの相対位置情報によって,本来の読取項目に対する金額を取得することを目的とした項目である。操作員からの代替項目の入力操作があれば,ステップS211により,代替項目の定義処理を行う。その後に,ステップS204へ戻る。代替項目の具体例については,後に,図24を用いて説明する。 If it is determined in step S209 that there is no recognition error, or if it is determined that the recognition accuracy is not bad, the process proceeds to step S230 in FIG. If not, the process proceeds to step S210 to prompt the operator to input a substitute item. Because the substitution item is difficult to recognize or has a high possibility of misrecognition of the original reading item, other receipt items are to be recognized as substitution items, and the original item is determined based on the relative position information from the substitution item. This is an item for the purpose of acquiring the amount of money for the read item. If there is an input operation of the substitute item from the operator, the substitute item definition process is performed in step S211. Thereafter, the process returns to step S204. Specific examples of alternative items will be described later with reference to FIG.
ステップS202でレシート定義データの参照作成が指定された場合,ステップS220へ進み,参照するレシート定義データを手動で選択するか自動で選択するかの指示を入力する。手動で選択する場合,ステップS221へ進む。ステップS221では,既にレシート定義データを作成済みの店舗の店舗コードを指定する情報を入力し,その店舗コードに該当するレシート定義データを定義データ記憶部104から取得し,ステップS226へ進む。
When the receipt creation data reference creation is designated in step S202, the process proceeds to step S220, and an instruction is input to select the receipt definition data to be referred to manually or automatically. When selecting manually, it progresses to step S221. In step S221, information specifying a store code of a store for which receipt definition data has already been created is input, receipt definition data corresponding to the store code is acquired from the definition
参照するレシート定義データを自動で選択する場合,ステップS222へ進み,履歴データ記憶部105に格納されている履歴データを参照する。次に,ステップS223では,類似データの有無を判断する。この類似データの有無を判断する処理については,図25を用いて後述する。
When the receipt definition data to be referred to is automatically selected, the process proceeds to step S222, and the history data stored in the history
ステップS224の判定により,履歴データ中に,これから作成しようとする店舗のレシート定義データと類似するデータがない場合には,参照作成は不可であるので,ステップS203へ戻り,新規作成と同様な処理を実行する。 If it is determined in step S224 that there is no data similar to the receipt definition data of the store to be created in the history data, reference creation is not possible, so the process returns to step S203, and processing similar to that for new creation is performed. Execute.
履歴データ中に,類似するデータがあると判定された場合には,ステップS225へ進み,その類似した店舗のレシート定義データを取得する。 If it is determined that there is similar data in the history data, the process proceeds to step S225, and receipt definition data of the similar store is acquired.
ステップS226では,ステップS221またはステップS225で取得したレシート定義データから,取得した店舗の読取項目を類推し,定義入力画面30の編集を行う。すなわち,定義入力画面30の初期画面として,OCR読取定義一覧が空欄の画面を表示するのではなく,参照するレシート定義データ中で定義されている読取項目のデータや,売上管理項目一覧における売上管理項目の計算式を埋め込んだ形の画面を作成し,表示する。その後,ステップS204に進む。ステップS204以降の処理は,前述した処理と同様である。これにより,参照作成の場合には,操作員は,参照する店舗のレシート定義データと異なる部分を必要に応じて修正するだけで,新しい店舗のレシート定義データを簡単に作成することができる。
In step S226, the read item of the acquired store is inferred from the receipt definition data acquired in step S221 or step S225, and the
上述したステップS209で,読取項目の認識エラーがない,または認識精度が悪くないと判断された場合,図14のステップS230へ進む。ステップS230では,ステップS206で定義された読取項目について,レシート内に同一文字列の項目がないかをチェックする。続く,ステップ231の判定において,同一文字列があると判定された場合には,ステップS233へ進み,同一文字列がないと判定された場合には,ステップS232へ進む。 If it is determined in step S209 described above that there is no reading item recognition error or the recognition accuracy is not bad, the process proceeds to step S230 in FIG. In step S230, the receipt item defined in step S206 is checked for an item of the same character string in the receipt. If it is determined in step 231 that there is an identical character string, the process proceeds to step S233. If it is determined that there is no identical character string, the process proceeds to step S232.
ステップS232では,履歴データを作成した後,処理を終了する。履歴データ作成処理についての詳細は後述する。 In step S232, after the history data is created, the process ends. Details of the history data creation processing will be described later.
同一文字列があった場合,ステップS233により,必要な読取項目を特定するための同一文字列処理を行う。ここでは,マーカー項目の設定や複数キーワードの設定が行われるが,詳しくは後述する。同一文字列処理の後,ステップS204へ戻り,同様に処理を続ける。 If there is the same character string, in step S233, the same character string processing for specifying a necessary reading item is performed. Here, marker items and multiple keywords are set, which will be described in detail later. After the same character string processing, the process returns to step S204 and continues in the same manner.
図18は,演算定義処理(図12のステップS207)の詳細を示すフローチャートである。以下の処理は,入力データ処理部13における演算定義部132が実行する。
FIG. 18 is a flowchart showing details of the calculation definition process (step S207 in FIG. 12). The following processing is executed by the
ステップS301では,演算の定義に対する入力を待ち合わせる。入力があれば,ステップS302へ進み,その入力をもとに,演算を定義する売上管理項目と,その演算に使用する読取項目を選択する。読取項目は,読取項目IDの指定によって選択することができる。読取項目の選択は1個でも複数個でもよい。 In step S301, an input for the calculation definition is awaited. If there is an input, the process proceeds to step S302, and based on the input, a sales management item that defines the calculation and a reading item that is used for the calculation are selected. A reading item can be selected by specifying a reading item ID. One or a plurality of reading items may be selected.
ステップS303では,四則演算の演算子を入力し,演算子の選択を行う。なお,%などの算術記号や演算の順序を指定する括弧記号等を用いることもできる。入力する演算子の数は,選択した読取項目の数による。1個の読取項目の場合には,演算子を入力する必要はない。 In step S303, an arithmetic operation operator is input and the operator is selected. Arithmetic symbols such as% and parenthesis symbols that specify the order of operations can also be used. The number of operators to enter depends on the number of selected reading items. In the case of one reading item, it is not necessary to input an operator.
ステップS304の判定処理により,必要なすべての読取項目および演算子の選択が終了するまで,ステップS301へ戻って同様に処理を繰り返す。 Until the selection of all necessary reading items and operators is completed by the determination process in step S304, the process returns to step S301 and the same process is repeated.
読取項目および演算子の選択が終了したならば,ステップS305では,入力した演算子のチェックを行う。これは,以下のチェックである。
1)定義されていない読取項目IDを使用していないか。
2)使用できない演算子が指定されていないか。
3)設定された計算式を用いて金額を計算した場合に,結果が許容範囲内か。
If the selection of the reading item and the operator is completed, the input operator is checked in step S305. This is the following check.
1) Is an undefined reading item ID used?
2) Is an operator that cannot be used specified?
3) Whether the result is within the allowable range when the amount is calculated using the set formula.
なお,結果が許容範囲内であるかどうかは,実際にレシートの画像データから得られた金額の数値を用いて計算した場合に,基本テーブルに格納されいてる該当する売上管理項目の下限値から上限値までの範囲に入っているかどうかにより判断される。 Whether or not the result is within the allowable range is calculated based on the lower limit value of the corresponding sales management item stored in the basic table when it is calculated using the numerical value of the amount actually obtained from the receipt image data. Judgment is made based on whether the value is within the range.
ステップS306によるチェック結果の判定により,エラーが検出されれば,ステップS301に戻って,読取項目の再選択または演算子の再入力を行う。エラーがなければ,売上管理項目一覧における該当する売上管理項目の計算式の欄に,入力された計算式を表示し,一つの売上管理項目に対する演算定義を終了する。演算定義は,基本的にはすべての売上管理項目に対して行うが,該当する読取項目が存在しない売上管理項目に対しては,未定義であってもよい。 If an error is detected by the determination of the check result in step S306, the process returns to step S301 to reselect the reading item or re-enter the operator. If there is no error, the input calculation formula is displayed in the calculation formula column of the corresponding sales management item in the sales management item list, and the calculation definition for one sales management item is terminated. Calculation definition is basically performed for all sales management items, but may be undefined for sales management items for which no corresponding read item exists.
図19は,演算定義の例を示している。図19(A)に示すように,OCR読取定義一覧表示領域32には,読取項目の純売上(ID=a)と消費税(ID=b)と金券(ID=c)とが定義されていたとする。ここで,売上管理項目である「総売上」,「商品券」について,それぞれ図19(B)に示すような読取項目との対応関係があった場合,図19(C)に示すように,「総売上」に対して「a+b」の計算式の定義,「商品券」に対して「c」の計算式の定義を行う。この計算式を演算定義として,レシート定義データに設定することにより,店舗が発行する実際のレシートから,売上管理項目の金額を算出することが可能になる。
FIG. 19 shows an example of calculation definition. As shown in FIG. 19A, in the OCR reading definition
図20は,ある店舗のレシートと売上管理項目との対応関係が,計算式によって定義されている例を示している。レシートの読取項目は,一般に店舗によって異なるので,テナント管理部門が必要とする売上管理項目と,各店舗のレシートの読取項目との対応関係は,店舗ごとに異なる。しかし,図20に示すように,店舗ごとに計算式を定義することができるので,売上管理項目とレシートの項目との対応づけを柔軟に行うことができる。 FIG. 20 shows an example in which the correspondence between the receipt of a certain store and the sales management item is defined by a calculation formula. Receipt reading items generally differ from store to store, so the correspondence between sales management items required by the tenant management department and receipt reading items at each store differs from store to store. However, as shown in FIG. 20, since a calculation formula can be defined for each store, it is possible to flexibly associate sales management items with receipt items.
図21は,同一文字列処理(図14のステップS233)の詳細を示すフローチャートである。以下の処理は,入力データ処理部13における複数キーワード設定部133およびマーカー項目設定部134が実行する。
FIG. 21 is a flowchart showing details of the same character string processing (step S233 in FIG. 14). The following processing is executed by the multiple
ステップS401では,OCR読取定義一覧表示領域32中で定義された読取項目に同一名称のものが複数あることを示すアラームを表示して,操作員からの入力を待ち合わせる。
In step S401, an alarm indicating that there are a plurality of reading items defined in the OCR reading definition
ステップS402では,操作員の入力に対して,複数の同一名称の中の読取項目をマーカー項目によって特定するか,複数キーワードによって特定するかを判定する。マーカー項目が選択された場合,ステップS403へ進み,複数キーワードが選択された場合,ステップS406へ進む。 In step S <b> 402, it is determined whether a reading item in the same name is specified by a marker item or a plurality of keywords in response to an input from the operator. If a marker item is selected, the process proceeds to step S403, and if a plurality of keywords are selected, the process proceeds to step S406.
ステップS403では,マーカー項目の入力を待ち合わせる。マーカー項目の入力方法は,図17で説明した項目領域の設定における入力方法と同様である。ステップS404では,指定されたマーカー項目の文字項目の座標を取得する。続いて,ステップS405では,同一文字列の読取項目の中で,実際に定義で用いる読取項目がマーカー項目の上方向にあるのか下方向にあるのかを示す方向と,マーカー項目からの距離を算出し,読取項目がマーカー項目の上方向にあれば距離を正の値,下方向にあれば距離を負の値で定義する。この距離の値には,実際に日々発行されるレシートにおける読取項目の行位置の変動を考慮して,所定の行数分の距離を余裕分として加算してもよい。 In step S403, input of marker items is waited. The marker item input method is the same as the input method in the item area setting described with reference to FIG. In step S404, the coordinates of the character item of the designated marker item are acquired. In step S405, the direction indicating whether the reading item actually used in the definition is in the upward direction or the downward direction and the distance from the marker item are calculated. If the reading item is in the upward direction of the marker item, the distance is defined as a positive value, and if it is in the downward direction, the distance is defined as a negative value. A distance corresponding to a predetermined number of lines may be added to the distance value as a margin in consideration of fluctuations in the line position of the reading item in a receipt that is actually issued every day.
図22は,マーカー項目の定義例を示している。図22(A)に示すレシート画像表示領域33に表示されたレシート画像において,実際に売上管理項目として必要になる読取項目が「消費税」であったとする。ここでは,「消費税」という同一名称の項目が複数存在するが,このうち,上方にある「消費税」が読取項目として定義したい項目であったとする。そこで,レシート内でユニークな他の項目(この例では「返品明細」)をマーカー項目として定義する。
FIG. 22 shows a definition example of marker items. In the receipt image displayed in the receipt
すなわち,図22(B)に示すように,マーカー項目が「返品明細」であり,「消費税」への距離が右方向へ「110」,上方向へ「100」であったとする。このとき,マーカー項目「返品明細」からの読取項目「消費税」への距離として,(110,100)を定義する。 That is, as shown in FIG. 22B, it is assumed that the marker item is “returned goods details” and the distance to “consumption tax” is “110” in the right direction and “100” in the upward direction. At this time, (110, 100) is defined as the distance from the marker item “details of return” to the read item “consumption tax”.
マーカー項目は,1個に限らず複数個定義してもよい。図22(C)の例では,「返品明細」をマーカー項目として定義する他に,「売上明細」についてもマーカー項目の定義を行っている。この場合,すべてのマーカー項目の定義による条件を満たした読取項目だけが,該当する読取項目として抽出され,読取項目がマーカー項目定義の条件を一つでも満たさない場合には,「該当読取項目なし」と認定されることになる。 The number of marker items is not limited to one, and a plurality of marker items may be defined. In the example of FIG. 22C, in addition to defining “returned goods details” as a marker item, a marker item is also defined for “sales details”. In this case, only the read items that satisfy the conditions defined by the definition of all marker items are extracted as the corresponding read items. If the read item does not satisfy any of the marker item definition conditions, Will be certified.
図21のステップS402で,複数キーワードによって読取項目を特定すると判定された場合,ステップS406へ進み,複数キーワードの入力を待ち合わせる。複数キーワードの入力があれば,ステップS407では,複数キーワードの文字項目と金額領域の座標を取得し,複数キーワードの定義とする。 If it is determined in step S402 in FIG. 21 that the reading item is specified by a plurality of keywords, the process proceeds to step S406, and the input of the plurality of keywords is awaited. If there is an input of a plurality of keywords, in step S407, the character items of the plurality of keywords and the coordinates of the amount area are acquired, and the plurality of keywords are defined.
図23に,複数キーワードの設定例を示す。図23の例では,読取項目「総売上」と同一名称の文字項目が,Str#12,Str#22,Str#32の3個存在する。また,その各々に対応する金額の文字列もDat#12「¥168,735」,Dat#22「¥48,195」およびDat#32「¥32,025」の3個存在する。
FIG. 23 shows an example of setting a plurality of keywords. In the example of FIG. 23, there are three character items having the same name as the read item “total sales”,
ここで必要とする読取項目がStr#12の「総売上」であったとすると,「総売上」の文字列だけではStr#12の読取項目を特定できないので,Str#12を含む複数の文字項目を複数キーワードKey#1として定義する。この例では,「総売上」,「純売上」,「現金在高」および「貸在高」を,複数のキーワードKey#1として定義している。このレシート定義データでは,項目属性#1として複数キーワードを示す「3」を定義し,読取文字#1として「総売上」,「純売上」,「現金在高」,「貸在高」を定義する。また,売上管理項目の収集に必要な,金額の文字列Dat#12の金額欄の相対読取位置#1についてもレシート定義データ中に定義する。これによって,レシート中に「総売上」の文字列が複数個存在しても,複数キーワードがユニークであれば,複数キーワードに一致する文字列に含まれる「総売上」の読取項目が特定されることになる。
If the read item required here is “total sales” of
図24は,代替項目の設定例を示す図である。前述した図12のステップS210,S211において,代替項目処理部135が行う処理について説明する。
FIG. 24 is a diagram illustrating an example of setting alternative items. Processing performed by the alternative
今,図24(A)に示すように,OCR読取定義一覧表示領域32において,消費税の定義が行われ,また,その項目領域についても座標情報が取得されていたとする。ここで,図24(A)に示すレシート画像表示領域33の表示元となったレシートの原画像について,再度この部分をOCR処理によって文字認識する。実際に操作員が入力した「消費税」と認識された場合には,正しいので代替項目の処理は行わない。違う文字に認識されて認識エラーがあった場合には,図24(B)に示すように,「読取困難な文字列です。代替項目を指定してください。」という代替項目の入力を促す警告メッセージを出力する。なお,実際にOCR処理を行うのではなく,図4(B)に示した認識文字データから,認識精度を推定してもよい。
Now, as shown in FIG. 24A, it is assumed that the consumption tax is defined in the OCR reading definition
操作員は,図24(B)に示すような警告メッセージが出力された場合,図24(C)のレシート画像表示領域33における「小計」のような読取が容易なレシート項目を代替項目として指定する。代替項目は,本来の読取項目(消費税)の上側であっても下側であってもどちらでもよいが,行が近いほうが望ましい。この例のように,「小計」が代替項目として指定されると,消費税に対応する金額「¥7,234」の相対読取位置の情報は,レシート定義データ内において,「消費税」からの相対位置ではなく,読取が容易な「小計」からの相対位置が定義される。
When the warning message as shown in FIG. 24B is output, the operator designates an easy-to-read receipt item such as “subtotal” in the receipt
また,代替項目によって定義されたことを示すために,OCR読取定義一覧表示領域32内では,図24(D)に示すように,代替項目「小計」と本来の読取項目「消費税」とが所定の区切記号「!」で連結されて表示される。レシート定義データ内においても,図7(B)に示すように,読取文字が「小計!消費税」と定義され,代替項目によって定義されたことが示される。
In addition, in order to show that the item is defined by the substitute item, the substitute item “subtotal” and the original read item “consumption tax” are displayed in the OCR reading definition
図25は,類似データの有無を判断する処理(図13のステップS223)の詳細を示すフローチャートである。 FIG. 25 is a flowchart showing details of the process for determining the presence or absence of similar data (step S223 in FIG. 13).
新しい店舗のレシート定義データの作成において,既に作成済みのレシート定義データを参照して作成に利用する場合に,履歴データから類似するレシート定義データを自動抽出する処理を行うために,類似データの有無を判断する。まず,ステップS501では,店舗マスタ103を参照する。また,ステップS502では,履歴データ記憶部105に格納された履歴データを参照する。
When creating receipt definition data for a new store, whether or not there is similar data in order to automatically extract similar receipt definition data from history data when referring to already created receipt definition data Judging. First, in step S501, the
ステップS501,S502で参照した結果,新たにレシート定義データを作成する新規店舗の業種コードと履歴データ中の業種コードとが等しく,かつ,新規店舗のPOSシステム情報と履歴データ中のPOSシステム情報とが等しいものがあるかどうかを,ステップS503およびステップS504で判定する。判定した結果,どちらも等しいものが存在した場合,ステップS506へ進む。どちらも等しいものが存在しない場合には,ステップS505へ進み,判断結果を「類似性無し」とする。 As a result of referring to steps S501 and S502, the business type code of the new store that newly creates receipt definition data is the same as the business type code in the history data, and the POS system information in the new store and the POS system information in the history data Are determined in steps S503 and S504. As a result of the determination, if both are equal, the process proceeds to step S506. If neither is equal, the process proceeds to step S505, and the determination result is “no similarity”.
一方,ステップS506では,「類似性有り」と判断し,ステップS507では,履歴データ(辞書部)を参照する。ステップS508では,履歴データ(辞書部)を参照した結果から,売上管理項目に該当する読取項目を類推する。 On the other hand, in step S506, it is determined that “similarity exists”, and in step S507, history data (dictionary part) is referred to. In step S508, the reading item corresponding to the sales management item is inferred from the result of referring to the history data (dictionary part).
図26は,履歴データ作成処理(図14のステップS232)の詳細を示すフローチャートである。 FIG. 26 is a flowchart showing details of the history data creation process (step S232 in FIG. 14).
ステップS601では,新しくレシート定義データを作成した店舗の店舗コードから店舗マスタ103を参照する。ステップS602では,店舗マスタ103から該当する業種コード,POSシステム情報,精算レシート情報を取得する。ステップS603では,作成したレシート定義データから項目情報,演算情報を取得する。ステップS604では,図10および図11に示すような履歴データと履歴データの辞書部とを作成し,履歴データ記憶部105に格納する。
In step S601, the
以上のレシート定義データを作成する処理は,コンピュータとソフトウェアプログラムとによって実現することができ,そのプログラムをコンピュータ読み取り可能な記録媒体に記録することも,ネットワークを通して提供することも可能である。 The processing for creating the receipt definition data described above can be realized by a computer and a software program, and the program can be recorded on a computer-readable recording medium or provided through a network.
1 レシート定義データ作成装置
10 読取機
11 画像データ読込部
12 定義入力画面表示部
13 入力データ処理部
131 座標取得部
132 演算定義部
133 複数キーワード設定部
134 マーカー項目設定部
135 代替項目処理部
14 定義データ作成部
15 履歴データ作成部
101 画像データ記憶部
102 基本データ記憶部
103 店舗マスタ
104 定義データ記憶部
105 履歴データ記憶部
2 レシート
3 表示装置
4 入力装置
DESCRIPTION OF
Claims (7)
レシート定義データの作成対象となる店舗が発行したレシートのイメージデータを含む画像データを記憶する画像データ記憶手段と,
あらかじめ定められた前記基本管理項目の情報を記憶する基本データ記憶手段と,
前記基本データ記憶手段に記憶された基本管理項目の情報の表示と前記画像データ記憶手段に記憶されたレシートのイメージデータの表示とを含む定義入力画面を表示する定義入力画面表示手段と,
前記定義入力画面に表示されたイメージデータにおいて操作員に選択されたレシート項目と,該レシート項目に対応する金額の位置の入力を受け付けるとともに,前記レシート項目と前記定義入力画面に表示された前記基本管理項目との対応情報の入力を受け付ける入力データ処理手段と,
前記入力データ処理手段が受け付けた情報をもとに,前記レシート項目,および前記イメージデータにおける前記レシート項目に対応する金額の位置,および前記レシート項目と前記基本管理項目との対応情報を含むレシート定義データを作成する定義データ作成手段と,
作成されたレシート定義データを記憶する定義データ記憶手段とを備える
ことを特徴とするレシート定義データ作成装置。 By recognizing images of receipts issued by a plurality of stores , information on receipt items that may be different for each store printed on receipts and information on the amounts corresponding to the receipt items are obtained, and In addition, a receipt recognition system that collects basic management data including specific basic management items common to each store and information on the amount corresponding to the basic management items creates receipt definition data used for receipt recognition for each store. A receipt definition data creation device,
Image data storage means for storing image data including receipt image data issued by a store for which receipt definition data is to be created ;
Basic data storage means for storing information on the predetermined basic management items;
Definition input screen display means for displaying a definition input screen including display of information on basic management items stored in the basic data storage means and display of receipt image data stored in the image data storage means;
The receipt item selected by the operator in the image data displayed on the definition input screen and the position of the amount corresponding to the receipt item are received, and the receipt item and the basic information displayed on the definition input screen are received. Input data processing means for accepting input of correspondence information with management items ;
Based on the information the input data processing unit receives receipt definition includes the corresponding information on the position of the amount corresponding to the receipt item in the receipt item, and the image data, and said receipt item and the basic management items Definition data creation means for creating data;
A receipt definition data creation device comprising: definition data storage means for storing the created receipt definition data.
前記定義入力画面は,前記レシート項目に対する演算式を操作員に入力させるための演算式入力用領域を有し,
前記入力データ処理手段は,前記定義入力画面の演算式入力用領域に入力された前記レシート項目の演算式に従って一つまたは複数の前記レシート項目を一つの前記基本管理項目に対応づける対応情報を作成する手段を有する
ことを特徴とするレシート定義データ作成装置。 In the receipt definition data creation device according to claim 1,
The definition input screen has an arithmetic expression input area for allowing an operator to input an arithmetic expression for the receipt item.
The input data processing means creates correspondence information for associating one or a plurality of receipt items with one basic management item according to the arithmetic expression of the receipt item input in the arithmetic expression input area of the definition input screen. A receipt definition data creation device.
前記入力データ処理手段は,前記定義入力画面に表示されるイメージデータのレシート内に前記レシート項目と同一名称の他のレシート項目が存在するかどうかを調べ,存在する場合に,前記基本管理項目に対応づけるべき前記レシート項目の位置を特定するための,他の名称のレシート項目を含む複数のレシート項目またはレシート内においてユニークな名称の他のレシート項目を前記定義入力画面を介して入力させる手段を有し,
前記定義データ作成手段は,前記基本管理項目に対応づけるべき前記レシート項目の位置を特定するための,他の名称のレシート項目を含む複数のレシート項目またはレシート内においてユニークな名称の他のレシート項目の情報を含むレシート定義データを作成する手段を有する
ことを特徴とするレシート定義データ作成装置。 In the receipt definition data creation device according to claim 1 or 2,
It said input data processing means checks whether other receipt items of the receipt item having the same name in the receipt of the image data to be displayed on the definition input screen is present, if present, to the basic management items Means for inputting a plurality of receipt items including receipt items with other names or other receipt items with unique names in the receipt via the definition input screen for specifying the position of the receipt item to be associated. Have
The definition data creating means includes a plurality of receipt items including receipt items with other names for identifying the position of the receipt item to be associated with the basic management item, or other receipt items with unique names in the receipt. A receipt definition data creation device comprising means for creating receipt definition data including the information on the receipt .
前記入力データ処理手段は,前記定義入力画面に表示されたレシートのイメージデータにおいて操作員がレシート項目または該レシート項目に対応する金額の位置を指定する操作の入力を受け付け,前記イメージデータにおける該当するレシート項目の文字列が印字された領域または金額の文字列が印字された領域を定め,その領域を囲む枠線を表示またはその領域内の文字列を強調表示する手段を有する
ことを特徴とするレシート定義データ作成装置。 In the receipt definition data creation device according to any one of claims 1 to 3,
The input data processing means receives an input of an operation in which an operator designates a receipt item or a position of an amount corresponding to the receipt item in the image data of a receipt displayed on the definition input screen , and the corresponding in the image data An area in which a character string of a receipt item is printed or an area in which an amount of money is printed is defined, and a frame surrounding the area is displayed or a character string in the area is highlighted. Receipt definition data creation device.
前記画像データ記憶手段は,前記レシート定義データの作成対象となる店舗が発行したレシートに印字された文字を認識した結果の文字認識精度の情報をさらに記憶しており,
前記入力データ処理手段は,入力された前記レシート項目の文字に対する文字認識精度が所定値以下であった場合に,前記レシート項目に代替する代替項目の指定を操作員に促すメッセージを出力し,操作員が指定した代替項目の入力を受け付ける手段を有し,
前記定義データ作成手段は,前記レシート項目に加えて前記代替項目の情報と,前記レシート項目に対応する金額の位置を前記イメージデータ内における前記代替項目からの相対距離で示す情報を含むレシート定義データを作成する手段を有する
ことを特徴とするレシート定義データ作成装置。 In the receipt definition data creation device according to any one of claims 1 to 4,
The image data storage means further stores information on character recognition accuracy as a result of recognizing characters printed on a receipt issued by a store to which the receipt definition data is to be created,
The input data processing means outputs a message prompting an operator to specify an alternative item to be substituted for the receipt item when the character recognition accuracy for the character of the input receipt item is equal to or less than a predetermined value. Has a means to accept input of alternative items specified by the employee ,
The definition data creation means includes receipt definition data including information on the substitute item in addition to the receipt item, and information indicating a position of an amount corresponding to the receipt item as a relative distance from the substitute item in the image data. A receipt definition data creation device comprising means for creating a receipt definition data.
前記入力データ処理手段は,前記作成されたレシート定義データまたはその履歴データから抽出したデータを,前記定義入力画面に表示し,他のレシート定義データの作成時に操作員に参照させる手段を有する
ことを特徴とするレシート定義データ作成装置。 In the receipt definition data creation device according to any one of claims 1 to 5,
The input data processing means has means for displaying the created receipt definition data or data extracted from the history data on the definition input screen and allowing an operator to refer to it when creating other receipt definition data. A receipt definition data creation device.
請求項1から請求項6までのいずれか1項に記載のレシート定義データ作成装置が備える,前記画像データ記憶手段と,前記基本データ記憶手段と,前記定義入力画面表示手段と,前記入力データ処理手段と,前記定義データ作成手段と,前記定義データ記憶手段,
として機能させるためのレシート定義データ作成プログラム。 Computer
The receipt definition data creation device according to any one of claims 1 to 6, comprising the image data storage means, the basic data storage means, the definition input screen display means, and the input data processing It means, and the definition data creating means, the definition data storage means,
Receipt definition data creation program to function as
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011177408A JP5385349B2 (en) | 2011-08-15 | 2011-08-15 | Receipt definition data creation device and program thereof |
CN201210289710.1A CN103150652B (en) | 2011-08-15 | 2012-08-15 | Receipt definition data organization device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011177408A JP5385349B2 (en) | 2011-08-15 | 2011-08-15 | Receipt definition data creation device and program thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013041388A JP2013041388A (en) | 2013-02-28 |
JP5385349B2 true JP5385349B2 (en) | 2014-01-08 |
Family
ID=47889737
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011177408A Active JP5385349B2 (en) | 2011-08-15 | 2011-08-15 | Receipt definition data creation device and program thereof |
Country Status (2)
Country | Link |
---|---|
JP (1) | JP5385349B2 (en) |
CN (1) | CN103150652B (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10242410B2 (en) | 2014-12-26 | 2019-03-26 | Brother Kogyo Kabushiki Kaisha | Storage medium, image processing method and image processing apparatus |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5702342B2 (en) * | 2012-08-22 | 2015-04-15 | 株式会社富士通マーケティング | Receipt definition data creation device and program |
JP6136584B2 (en) * | 2013-05-30 | 2017-05-31 | 沖電気工業株式会社 | Display control apparatus, display control method, and program |
JP5967164B2 (en) * | 2014-04-30 | 2016-08-10 | キヤノンマーケティングジャパン株式会社 | Form system, processing method thereof, and program |
JP2016133917A (en) * | 2015-01-16 | 2016-07-25 | 東芝テック株式会社 | Server and program |
JP2018124705A (en) * | 2017-01-31 | 2018-08-09 | 日本Ics株式会社 | Voucher management program |
JP7017027B2 (en) | 2017-03-17 | 2022-02-08 | 富士フイルムビジネスイノベーション株式会社 | Search device, search program, and search system |
JP7081179B2 (en) * | 2018-01-31 | 2022-06-07 | セイコーエプソン株式会社 | Image processing equipment and image processing program |
JP7358838B2 (en) * | 2019-08-21 | 2023-10-11 | 富士フイルムビジネスイノベーション株式会社 | Information processing device and information processing program |
CN113435993A (en) * | 2021-08-27 | 2021-09-24 | 聆笙(北京)科技有限公司 | Receipt data recognition system and method thereof |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3223086B2 (en) * | 1995-11-17 | 2001-10-29 | 東芝テック株式会社 | Sales management system |
JPH10275196A (en) * | 1997-03-28 | 1998-10-13 | Sanyo Electric Co Ltd | Data input device |
JPH11272794A (en) * | 1998-03-24 | 1999-10-08 | Sanyo Electric Co Ltd | Receipt data processing device |
JP2001184453A (en) * | 1999-12-22 | 2001-07-06 | Hitachi Ltd | Document processing system and document filing system |
JP2002024760A (en) * | 2000-06-30 | 2002-01-25 | Toshiba Corp | Character reading method, character reader, and carrier sheet |
JP2003223610A (en) * | 2002-01-28 | 2003-08-08 | Toshiba Corp | Character recognizing device and character recognizing method |
JP2005038077A (en) * | 2003-07-17 | 2005-02-10 | Hitachi Ltd | Written data input device |
-
2011
- 2011-08-15 JP JP2011177408A patent/JP5385349B2/en active Active
-
2012
- 2012-08-15 CN CN201210289710.1A patent/CN103150652B/en active Active
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10242410B2 (en) | 2014-12-26 | 2019-03-26 | Brother Kogyo Kabushiki Kaisha | Storage medium, image processing method and image processing apparatus |
Also Published As
Publication number | Publication date |
---|---|
CN103150652B (en) | 2016-08-03 |
CN103150652A (en) | 2013-06-12 |
JP2013041388A (en) | 2013-02-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5385349B2 (en) | Receipt definition data creation device and program thereof | |
JP5702342B2 (en) | Receipt definition data creation device and program | |
US10366123B1 (en) | Template-free extraction of data from documents | |
JP5204208B2 (en) | Receipt data collation support device and receipt data collation support program | |
JP6100532B2 (en) | Receipt definition data creation device and program thereof | |
JP5216890B2 (en) | Receipt data recognition device and program thereof | |
US9213893B2 (en) | Extracting data from semi-structured electronic documents | |
JP5202677B2 (en) | Receipt data recognition device and program thereof | |
JP2019086984A (en) | Computer and document identification method | |
CN108241603A (en) | A kind of financial statement generation method and system | |
CN112487859A (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP2019191665A (en) | Financial statements reading device, financial statements reading method and program | |
JP2013164740A (en) | Accounting information reading system, accounting information reading method, and program | |
JP2012194862A (en) | Information processing device, program, and data extraction method | |
JP5975766B2 (en) | Credit slip check support device, method and program | |
KR101606788B1 (en) | Method of form information management for electronic document-based business processes | |
JP2015005070A (en) | Clientele guidance system and clientele guidance method | |
US10614068B2 (en) | Transaction slip search method, information processing apparatus, and computer product | |
JP2017151627A (en) | Slip data creating system, slip data creating device, slip data creating method and control program of slip data creating device | |
WO2023047570A1 (en) | Information processing device, information processing method, and information processing program | |
JP7473900B2 (en) | FORMAT CREATION DEVICE, FORMAT CREATION METHOD, AND FORMAT CREATION PROGRAM | |
JP2001312694A (en) | Method and device for recognizing many kinds of slips | |
US12088770B2 (en) | Display system, display method, and display program for displaying a content of electronic document | |
JP2015005156A (en) | Clientele guidance system and clientele guidance method | |
JP4463324B1 (en) | Chart creation program, computer-readable recording medium recording chart creation program, chart creation system, and business process visualization method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121227 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130402 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20130509 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131001 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131003 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5385349 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313115 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |