Nothing Special   »   [go: up one dir, main page]

JP3732254B2 - Format information generation method and format information generation apparatus - Google Patents

Format information generation method and format information generation apparatus Download PDF

Info

Publication number
JP3732254B2
JP3732254B2 JP14771395A JP14771395A JP3732254B2 JP 3732254 B2 JP3732254 B2 JP 3732254B2 JP 14771395 A JP14771395 A JP 14771395A JP 14771395 A JP14771395 A JP 14771395A JP 3732254 B2 JP3732254 B2 JP 3732254B2
Authority
JP
Japan
Prior art keywords
format information
format
field
image
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP14771395A
Other languages
Japanese (ja)
Other versions
JPH096865A (en
Inventor
純一 大槻
利幸 小野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP14771395A priority Critical patent/JP3732254B2/en
Publication of JPH096865A publication Critical patent/JPH096865A/en
Application granted granted Critical
Publication of JP3732254B2 publication Critical patent/JP3732254B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Controls And Circuits For Display Device (AREA)

Description

【0001】
【産業上の利用分野】
本発明は、文字、数字、記号、マーク等(この明細書では、これらを総称して単に「文字」という)の記入された読取フィールド(読取領域)を有する帳票上の文字を光学的に読み取る光学式文字読取装置(以下、OCRという)において、その読取の際に参照用に用いられる読取情報であるフォーマット情報を生成するためのフォーマット情報生成方法とそのフォーマット情報生成装置に関するものである。
【0002】
【従来の技術】
従来のOCRでは、イメージスキャナ等によって一定のフォーマット(書式)の帳票のイメージを取り込み、その帳票イメージのイメージデータをイメージメモリ(イメージ記憶装置)に記憶させる。そして、帳票の読取フィールドを指定したフォーマット情報(即ち、帳票の読取位置や文字種等を指定したフォーマット情報)を用い、イメージメモリに記憶されたイメージデータから文字切出手段によって読取フィールドを切り出し、その切り出された読取フィールド内の文字の特徴を文字認識手段によって抽出することにより、帳票上の文字を認識する。
即ち、帳票には、そのフォーマットを識別するために、数字等で表された帳票IDが所定位置(例えば、右上等)に記入又は印字されている。そこで、OCRでは、まず、帳票IDを認識し、その帳票IDに対応させて予め用意されたフォーマット情報を参照し、帳票イメージから読取フィールドを切り出し、その切り出された読取フィールド内の文字を認識辞書を用いて認識するようになっている。
【0003】
【発明が解決しようとする課題】
しかしながら、従来のOCRに用いられるフォーマット情報は、オペレータが手作業によって帳票上の各読取フィールドの位置や大きさ等を定規等で測定して作成している。作成したフォーマット情報は、オペレータがパーソナルコンピュータ等を用いてOCRの記憶装置に記憶(登録)する。そのため、次の(a)〜(c)のような問題があり、それを解決することが困難であった。
(a) 同一の帳票IDが付された帳票が複数枚ある場合、オペレータが作業効率を考えてその複数枚の帳票から適切と判断する1つの帳票を選び、その帳票を基に読取フィールドの位置や大きさ等を定規で測定してフィールド情報を作成している。このように、オペレータが手作業でフィールド情報を作成しているので、作業効率が良くない。
(b) オペレータは、作業効率を考慮して1枚の帳票からフォーマット情報を作成している。しかし、帳票には、印刷誤差やその裁断誤差等によって該帳票上の読取フィールドの位置等がばらつく。それらの帳票の印刷誤差や裁断誤差等が大きい場合、作成されたフォーマット情報の誤差も大きくなる。
(c) 前記のように作業効率を考慮して通常は1枚の帳票からフィールド情報を作成しているので、間違って異なるフィールドを読取位置と選んでも、その間違いを検出することが困難である。
本発明は、前記従来技術が持っていた課題として、オペレータが手作業によってフォーマット情報を作成しているので、作業効率が良くない、1枚の帳票からフォーマット情報を作成しているので、印刷誤差や裁断誤差等によって作成されたフォーマット情報に誤差が生じるか、あるいはその誤差が大きい、さらに間違って異なるフィールドを読取位置と選んでも、そのフォーマット作成の異常を検出することが困難であるといった点について解決した、フォーマット情報生成方法とそのフォーマット情報生成装置を提供することを目的とする。
【0004】
【課題を解決するための手段】
第1の発明は、前記課題を解決するために、帳票識別用の帳票ID、及び文字の記入された読取フィールドを有する帳票上の該文字を、OCRによって読み取る際に用いる参照用のフォーマット情報を生成するフォーマット情報生成方法において、同一の前記帳票IDが付された同一フォーマットの複数の前記帳票のイメージをそれぞれ取得して複数の帳票イメージを出力するイメージ取得処理と、フォーマット情報作成処理と、比較選択処理とを、実行するようにしている。 ここで、フォーマット情報作成処理では、前記各帳票イメージ中に含まれる線分の位置及び/又は文字の位置を検出し、その検出結果に対し、前記帳票IDに対応するフォーマット生成規則を適用して読取フィールド位置を決定する。そして、1つの前記帳票イメージについて全ての読取フィールドが検出できたときにはOKフォーマット情報として、検出できなかった読取フィールドが1つ以上あるときにはNGフォーマット情報として、前記各帳票毎に出力する。また、比較選択処理では、前記OKフォーマット情報同士を比較し、同じ読取フィールドの位置、大きさを示す情報の差(即ち、それらのOKフォーマット情報間の差が所定のマージン値(余裕値)以下のものの中から最も平均的なOKフォーマット情報1つを多数決によって選択し、これを前記帳票IDのフォーマット情報として出力する。
【0005】
第2の発明では、第1の発明の比較選択処理を次のような処理内容としている。即ち、この第2の発明の比較選択処理では、前記フォーマット情報作成処理によって出力されるOKフォーマット情報が1つの場合、無条件にそのOKフォーマット情報を選択して出力する。これに対し、前記フォーマット情報作成処理によって出力されるOKフォーマット情報が複数の場合、所定のマージン値以下の同一フォーマット情報と見なせるOKフォーマット情報の組が1つ以上存在すれば、それらの中で最も平均的なOKフォーマット情報1つを多数決により選択して出力し、また、該OKフォーマット情報の組が存在しなければ、フォーマット情報生成エラー(即ち、フォーマット情報生成NG)とする処理を行う。
第3の発明では、第1又は第2の発明のフォーマット情報生成方法において、前記読取フィールドの位置及び大きさは、前記帳票の左上を原点0とするXY座標に基づき、読取項目を囲む矩形の左上位置p(x,y)、X軸方向の幅w、及びY軸方向の高さhを用いて表す。そして、前記フォーマット情報は、前記帳票ID、読取フィールド数、及び各読取フィールド毎のp(x,y)、w、hの情報を有している。
第4の発明では、第2の発明のフォーマット情報生成方法において、前記比較選択処理の結果がフォーマット情報生成エラーの場合には、その結果を表示手段の画面上に表示するようにしている。
【0006】
第5の発明では、帳票識別用の帳票ID、及び文字の記入された読取フィールドを有する帳票上の該文字を、OCRによって読み取る際に用いる参照用のフォーマット情報を生成するフォーマット情報生成装置において、同一の前記帳票IDが付された同一フォーマットの複数の前記帳票のイメージをそれぞれ取得して複数の帳票イメージを出力するイメージ取得手段と、フォーマット情報作成手段とを、備えている。ここで、フォーマット情報作成手段は、前記各帳票イメージ中に含まれる線分の位置及び/又は文字の位置を検出し、その検出結果に対し、前記帳票IDに対応するフォーマット生成規則を適用して読取フィールド位置を決定し、1つの前記帳票イメージについて全ての読取フィールドが検出できたときにはOKフォーマット情報として、検出できなかった読取フィールドが1つ以上あるときにはNGフォーマット情報として、前記各帳票毎に出力するものである。
この第5の発明では、さらに、前記フォーマット情報作成手段から出力された前記全てのOKフォーマット情報同士を比較し、同じ読取フィールドの位置、大きさを示す情報の差(即ち、それらのOKフォーマット情報間の差)が所定のマージン値以下の同一フォーマット情報と見なせるOKフォーマット情報と異なるOKフォーマット情報と見なしたOKフォーマット情報とを検出する比較手段と、前記比較手段で検出された前記同一フォーマット情報と見なせるOKフォーマット情報の数を計数(カウント)する計数手段と、前記計数手段の計数値の最大のOKフォーマット情報を選択し、これを前記帳票IDのフォーマット情報として出力する選択手段とが、設けられている。
【0007】
【作用】
第1及び第3の発明によれば、イメージ取得処理により、同一帳票IDが付された複数の帳票の帳票イメージが取得される。イメージ取得処理で取得された各帳票イメージ中の線分の位置及び/又は文字の位置は、フォーマット情報作成処理によって検出される。即ち、このフォーマット情報作成処理では、例えば、前記検出結果と、フォーマット生成規則とを照合(マッチング)し、そのフォーマット生成規則に合致(マッチ)する前記検出結果を読取フィールド毎に検索してそれらの読取フィールドの位置を決定する。そして、フォーマット情報作成処理では、1つの帳票イメージについて全ての読取フィールドが検出できたときにはOKフォーマット情報として出力し、検出できなかった読取フィールドが1つ以上あるときにはNGフォーマット情報として出力する。
比較選択処理では、フォーマット情報作成処理から出力された複数のOKフォーマット情報同士を比較し、それらのOKフォーマット情報間の差が所定のマージン値以下のものの中から多数決によって1つのOKフォーマットを選択し、これを当該帳票IDのフォーマット情報として出力する。
【0008】
第2及び第3の発明によれば、比較選択処理により、フォーマット情報作成処理によって出力されるOKフォーマット情報から、例えば次のようにして1つのOKフォーマット情報を選択する。即ち、フォーマット情報作成処理によって出力されるOKフォーマット情報が1つの場合、そのOKフォーマット情報をそのまま選択して出力する。これに対し、フォーマット情報作成処理によって出力されるOKフォーマット情報が複数の場合、同一フォーマット情報と見なせるOKフォーマット情報の組が1つ以上存在すれば、それらの中から多数決によって1つのOKフォーマット情報を選択して出力する。この際、OKフォーマット情報の組が存在しなければ、フォーマット情報生成エラーとする。
第4の発明によれば、第2の発明の比較選択処理の結果がフォーマット情報生成エラーの場合には、その結果が表示手段の画面上に表示される。すると、オペレータは、例えば、画面上の情報に基づき、最適なOKフォーマット情報の選択等が行える。
【0009】
第5の発明によれば、イメージ取得手段により、入力された複数の帳票の帳票イメージが取得され、フォーマット情報作成手段へ送られる。フォーマット情報作成手段では、各帳票イメージ中に含まれる線分の位置及び/又は文字の位置を検出する。そして、例えば、その検出結果とフォーマット生成規則とをマッチングし、そのフォーマット生成規則にマッチする前記検出結果を読取フィールド毎に検索してそれらの読取フィールドの位置を決定し、OKフォーマット情報あるいはNGフォーマット情報を各帳票毎に出力する。
フォーマット情報作成手段から出力された全てのOKフォーマット情報同士が比較手段で比較され、同一フォーマット情報と見なせるOKフォーマット情報と、異なるOKフォーマット情報と見なしたOKフォーマット情報とが検出される。同一フォーマット情報と見なせるOKフォーマット情報の数は、計数手段でカウントされ、その計数値(カウント値)の最大のOKフォーマット情報が選択手段で選択され、当該帳票IDのフォーマット情報として出力される。
【0010】
【実施例】
本発明の実施例では、フォーマット情報生成装置によって同一の帳票IDが付された複数枚(z)の帳票11〜1zを読み取り、その各帳票11〜1zの内容をフォーマット生成規則とマッチングしてそれらの各帳票11〜1zに対応するフォーマット情報を作成し、その複数のフォーマット情報から最適な1つのフォーマット情報を選択して出力する方法を具体的に説明する。そのため、まず読取対象となる同一の帳票IDが付された複数枚(z)のうちの1枚の帳票11の例を図2に示す。
図2の帳票11には、そのフォーマットを識別するために帳票ID20が所定位置、例えば右上に記入あるいは印字されている。帳票ID20は、同一フォーマットの帳票11〜1zの共通の位置に設けられており、通常、2〜5桁の帳票固有の数字(図2では4桁の数字)で表現されている。また、帳票11には、読取対象となる文字が記入された読取フィールド(項目)FIELD が複数(n)設けられている(図2では、4つの読取フィールドFIELD 1〜FIELD 4が設けられている)。これらの4つの読取フィールドFIELD 1〜FIELD 4のうち、例えば、上方の読取フィールドFIELD 1は請求月フィールド、その下の読取フィールドFIELD 2は顧客番号フィールド、左下の読取フィールドFIELD 3は物流経路フィールド、及び右下の読取フィールドFIELD 4は総計フィールドである。
本実施例では、この4つの読取フィールドFIELD 1〜FIELD 4を光学的に読み取り、その位置と大きさを検出し、各帳票11〜1zに対応する複数のフォーマット情報を作成し、その複数のフォーマット情報の中から最適なものを1つ選択する。
【0011】
図3は、図2に示す読取フィールドFIELD 1〜FIELD 4の位置の表現形式を説明するための図である。
図2の各読取フィールドFIELD 1〜FIELD 4の位置及び大きさは、各帳票11〜1zの左上を原点0とするXY座標により、読取項目を囲む矩形の左上位置p1(x1,y1)、X軸方向の幅w、及びY軸方向の高さhを用いて表すものとする。
図1は、本発明の実施例を示すフォーマット情報生成装置の概略の機能ブロック図である。
このフォーマット情報生成装置は、図2に示すような同一の帳票ID20が付された複数枚(z)の帳票11〜1zを読み取り、その読取結果に基づきそれらの各帳票11〜1zに対応する複数のフォーマット情報を生成し、その中から最適な1つのフォーマット情報を選択して出力する装置であり、入力される複数枚の帳票11〜1zをそれぞれ読み取る光電変換手段31を有し、その出力側にイメージ記憶手段32及び制御部40が接続されている。光電変換手段31は、イメージスキャナ等で構成され、入力される各帳票11〜1zを光学的に読み取り、それらの帳票イメージIMAGE 1〜IMAGE zを取得すると共に、それらの各帳票11〜1z中の帳票ID20を認識するイメージ取得手段としての機能を有している。イメージ記憶手段32は、光電変換手段31で読み取られた複数の帳票イメージIMAGE 1〜IMAGE zをイメージデータの形で記憶するメモリである。
【0012】
制御部40は、フォーマット情報生成装置全体を制御すると共に、イメージ記憶手段32に記憶されたイメージデータに基づいて複数のフォーマット情報を作成し、そのうち最適な1つのフォーマット情報を選択して出力する機能を有し、1つ又は複数のパーソナルコンピュータ等で構成されている。この制御部40内には、フォーマット情報作成手段41、比較選択手段42、及び入出力制御手段43等が設けられている。
フォーマット情報作成手段41は、イメージ記憶手段32に記憶された各イメージデータに基づき、OKフォーマット情報COD1〜CODmあるいはNGフォーマット情報ALFNG を作成して出力するものである。即ち、このフォーマット情報作成手段41では、1つの帳票イメージIMAGE について、全ての読取フィールドFIELD が検出できた場合、そのフォーマット情報をOKフォーマット情報COD1〜CODmとして出力し、検出できなかった読取フィールドFIELD が1つ以上ある場合、そのフォーマット情報をNGフォーマット情報ALFNG として出力する機能を有し、イメージ解析手段41a、文字認識手段41b、及び照合検索手段41cを有している。
【0013】
イメージ解析手段41aは、イメージ記憶手段32に記憶された各イメージデータに基づき、その各帳票イメージIMAGE 1〜IMAGE z中に含まれる線分の位置及び文字の位置を解析してイメージ解析結果を出力する機能を有し、その出力側に文字認識手段41b及び照合検索手段41cが接続されている。文字認識手段41bは、イメージ解析手段41aで解析されたイメージ解析結果の文字の位置からその位置の文字を切り出し、認識辞書等を用いて文字を認識する機能を有し、その出力側に照合検索手段41cが接続されている。照合検索手段41cには、制御部40外に設けられたフォーマット生成規則記憶手段51が接続されている。フォーマット生成規則記憶手段51は、読取対象となる帳票11〜1zの帳票ID20に対応させて予め作成されたフォーマット生成規則を記憶するメモリである。
【0014】
照合検索手段41cは、イメージ解析手段41aで解析されたイメージ解析結果と、フォーマット生成規則記憶手段51から読み出された帳票ID20に対応するフォーマット生成規則とをマッチングし、該フォーマット生成規則にマッチするイメージ解析結果を各読取フィールドFIELD 毎に検索してそれらの読取フィールドFIELD の位置を決定し、フォーマット情報(OKフォーマット情報COD1〜CODm又はNGフォーマット情報ALFNG )を作成する機能を有し、その出力側にフォーマット情報記憶手段52及び比較選択手段42が接続されている。フォーマット情報記憶手段52は、照合検索手段41cから出力されたフォーマット情報(OKフォーマット情報COD1〜CODm又はNGフォーマット情報ALFNG )を記憶するメモリである。
比較選択手段42は、フォーマット情報記憶手段52に記憶された全てのOKフォーマット情報COD1〜CODm同士を比較してその中から最適な1つのOKフォーマット情報CODを選択し、これを当該帳票ID20のフォーマット情報として出力する機能を有し、比較手段42a、計数手段42b、及び選択手段42cを有している。
【0015】
比較手段42aは、フォーマット情報記憶手段52に記憶された全てのOKフォーマット情報COD1〜CODm同士を比較し、マージン記憶手段53から読み出した所定のマージン値以下の同一フォーマット情報と見なせるOKフォーマット情報CODと、異なるOKフォーマット情報と見なしたOKフォーマット情報CODとを検出し、その検出結果を比較結果記憶手段54に記憶させる機能を有し、その出力側に計数手段42bが接続されている。計数手段42bは、比較結果記憶手段54に記憶された同一フォーマット情報と見なせるOKフォーマット情報CODの数をカウントする機能を有し、その出力側に選択手段42cが接続されている。選択手段42cは、計数手段42bのカウント値の最大のOKフォーマット情報CODを選択し、これを当該帳票ID20のフォーマット情報として出力する機能を有し、その出力側に制御部40外のフォーマット情報登録手段55が接続されている。フォーマット情報登録手段55は、選択手段42cから出力された帳票ID20のOKフォーマット情報CODを該帳票ID20と共に記憶(登録)するものであり、磁気ドラム、磁気ディスク等の記憶装置で構成されている。
【0016】
また、制御部40内には入出力制御手段43が設けられ、その入出力制御手段43に、制御部40外の入力操作手段56及び表示手段57が接続されている。入力操作手段56は、キーボード及びマウス等で構成され、制御部40に対してデータの入力や作業内容の指示等を行う機能を有している。表示手段57は、CRTや液晶等のディスプレイで構成され、制御部40の出力データ等を画面上に表示する機能を有している。これらの入力操作手段56及び表示手段57の制御部40に対する入出力が、入出力制御手段43で制御されるようになっている。
図4は、以上のようなフォーマット情報生成装置を用いた、本実施例のフォーマット情報生成方法におけるフォーマット情報生成処理の全体のフローチャートである。
【0017】
この図4のフォーマット情報生成処理では、ステップS1のイメージ取得処理において、同一の帳票ID20が付された複数枚の帳票11〜1zが光電変換手段31で読み取られ、その複数の帳票イメージIMAGE 1〜IMAGE zがイメージデータの形でイメージ記憶手段32に記憶される。次に、ステップS2のフォーマット情報作成処理において、フォーマット情報作成手段41では、イメージ記憶手段32に記憶されたイメージデータを読み出し、それらの各帳票イメージIMAGE 1〜IMAGE z中に含まれる線分の位置及び文字の位置を解析し、その解析結果と、フォーマット生成規則記憶手段51に記憶された帳票ID20に対応したフォーマット生成規則とをマッチングし、該フォーマット生成規則に合致する該解析結果を各読取フィールドFIELD 1〜FIELD n毎に検索してそれらの読取フィールドFIELD 1〜FIELD nの位置を決定し、フォーマット情報(OKフォーマット情報COD1〜CODm又はNGフォーマット情報ALFNG )を出力する。このフォーマット情報は、ステップS3でフォーマット情報記憶手段52に記憶される。
その後、ステップS4の比較選択処理において、比較選択手段42では、フォーマット情報記憶手段52に記憶されたOKフォーマット情報COD1〜CODmを読み出してそれらを比較し、該OKフォーマット情報COD1〜CODm間の差(即ち、同じ読取フィールドの位置、大きさを示す情報の差)が、マージン記憶手段53に記憶された所定のマージン値以下のものの中から最も平均的な1つのOKフォーマット情報CODを多数決によって選択し、これを当該帳票IDのフォーマット情報として出力する。出力されたフォーマット情報は、ステップS5でフォーマット情報登録手段55に登録される。
【0018】
次に、図5〜図12を参照しつつ、前記のイメージ取得処理(1)、フォーマット情報作成処理(2)、及び比較選択処理(3)の具体例を説明する。
(1) イメージ取得処理
入力操作手段56からの指令によってフォーマット情報生成処理が開始されると、図4のステップS1において、光電変換手段31では、図2のような同一の帳票ID20が付された複数枚の帳票11〜1zの各帳票イメージIMAGE 1〜IMAGE zを光電変換し(例えば、ビット単位に白紙の部分は“0”に、線分(罫線)や文字の部分は“1”に変換し)、イメージデータとしてイメージ記憶手段32に記憶させる。このステップS1では、図2の各帳票11〜1zの右上に記載された帳票ID20の認識も行われる。
図5は、図4のステップS1で読み取られた帳票イメージIMAGE 1の例を示す図である。
この帳票イメージIMAGE 1は、例えば、その左上を原点(0,0)とするXY座標によって表されている。X軸上の数字0〜24、及びY軸上の数字0〜34は、説明の便宜上付したものである。また、請求月フィールド(読取フィールドFIELD 1)及び物流経路フィールド(読取フィールドFIELD 3)を表す矩形の破線は、説明の便宜上付したものであり、帳票イメージIMAGE 1上には現れない。フォーマット生成規則により、例えば、読取対象となる4つの読取フィールドFIELD 1〜FIELD 4が予め決められていると仮定する。各々の各矩形の読取フィールドFIELD 1〜FIELD 4の4隅には、説明の便宜上座標位置p(x,y)が付されているが、これらは帳票イメージIMAGE 1上に現れない。
【0019】
このようなXY座標で表される帳票イメージIMAGE 1のイメージデータが、イメージ記憶手段32に記憶される。
なお、図4のステップS1において、印刷が薄い等といった理由によって帳票ID20が認識できなかった場合、次のような手段を講じることも可能である。
即ち、帳票ID20が認識できなかった場合、制御部40によって帳票IDコードの入力画面が表示手段57の画面に表示され、該帳票ID20が認識できなかった帳票(例えば、11)の帳票イメージIMAGE 1を表示し、オペレータがその画面上の帳票イメージIMAGE 1を見ながら、入力操作手段56のキーボード等によって帳票ID20を入力するようにしてもよい。
【0020】
(2) フォーマット情報作成処理
図4のステップS2では、イメージ解析手段41aによってイメージ解析処理が行われた後、例えば、本願出願人が先に出願した特願平7−142122号の明細書及び図面に記載されているように、照合検索手段41cで照合検索処理が行われてフォーマット情報が作成される。
まず、イメージ解析手段41aでは、イメージ記憶手段32に記憶されたイメージデータを読み出し、投影法等によって各帳票イメージIMAGE 1〜IMAGE z中に含まれる全ての線分の位置及び文字の位置を検出(解析)し、そのイメージ解析結果を照合検索手段41cへ送る。また、イメージ解析手段41aで解析されたイメージ解析結果から、必要に応じて、文字認識手段41bにより、文字位置における文字ブロックの検出(切り出し)が行われ、その検出された文字ブロックに対し認識辞書を用いて文字の認識が行われ、その文字認識結果が照合検索手段41cへ送られる。
即ち、前記イメージ解析処理では、図5の帳票イメージIMAGE 1に対し、X軸方向の投影処理によって該X軸に平行な線分を検出し、さらに、Y軸方向の投影処理によってY軸に平行な線分を検出する。検出されたX軸に平行な線分とY軸に平行な線分とから、それらの交点の座標を求めることができる。
【0021】
例えば、図5中の顧客番号フィールド(FIELD 2)は、x=7のY軸方向の線分と、x=23のY軸方向の線分と、y=6のX軸方向の線分と、y=8のX軸方向の線分とによって囲まれた矩形領域となる。この顧客番号フィールド(FIELD 2)のフィールド情報は、左上の始点の座標位置がp(7,6)、及び右下の終点の座標位置がp(23,8)であるので、図3に示すように、始点の座標位置p(7,8)、X軸方向の幅w=16、及びY軸方向の高さh=2の座標位置によって表される。
請求月フィールド(FIELD 1)のような矩形の枠で囲まれていない文字ブロック中の文字の位置を検出するには、X軸方向の投影結果とY軸方向の投影結果とを比較することにより、文字ブロックからなる請求月フィールド(FIELD 1)内の各文字を囲む枠の位置、つまり各文字の位置を検出できる。そのため、文字認識手段41bにより、文字ブロックからなる請求月フィールド(FIELD 1)を切り出し、認識辞書等を用いてその文字ブロック内の各文字の認識を行えば、文字認識結果が得られる。
図6は、フォーマット生成規則記憶手段51に記憶されたフォーマット生成規則の例を示す図である。
このフォーマット生成規則では、読取対象となる帳票11〜1zの帳票ID20に対応した読取フィールドFIELD 数、読取フィールドFIELD 名、及び各読取フィールドFIELD 1〜FIELD 4の特徴等が規定されている。各読取フィールドFIELD 1〜FIELD 4の特徴としては、フィールド枠や文字ブロックの大きさ(寸法)、存在位置、及び検索方法等といった各読取フィールドFIELD 1〜FIELD 4に適合する内容が規定されている。
【0022】
次に、照合検索処理を行う照合検索手段41cでは、イメージ解析手段41a及び文字認識手段41bで検出された線分及び文字と、フォーマット生成規則記憶手段51から読み出した帳票ID20に対応する図6のようなフォーマット生成規則とをマッチングし、該フォーマット生成規則にマッチする線分及び文字を検索する。そして、照合検索手段41cは、各読取フィールドFIELD 1〜FIELD 4のXY座標軸上の位置を順次決定し、その位置の情報である各フィールド情報をフォーマット情報記憶手段52に順次記憶していく。読取フィールドFIELD の位置を決定(検出)できなかったの場合(NG)、そのNGの情報も、フォーマット情報記憶手段52に記憶する。このような各読取フィールドFIELD 1〜FIELD 4のフィールド情報がフォーマット情報記憶手段52に記憶されると、それらのフィールド情報からなるフォーマット情報が作成されたことになる。
1つの帳票イメージIMAGE について、全ての読取フィールドFIELD 1〜FIELD 4が検出できた場合、そのフォーマット情報はOKフォーマット情報CODであり、検出できなかった読取フィールドFIELD が1つ以上ある場合、そのフォーマット情報はNGフォーマット情報ALFNG である。このフォーマット情報の例を図7に示す。
図7のフォーマット情報では、読取対象となる帳票11〜1zに対応する帳票ID20=1234、読取フィールドFIELD 数=4、及び各読取フィールドFIELD 1〜FIELD 4のフィールド位置及び属性等の情報が含まれている。検出できなかった読取フィールドFIELD があるときには、例えば、その読取フィールドFIELD 欄にNGマークが付されている。
【0023】
(3) 比較選択処理
図4のステップS4において、比較選択手段42では、同一の帳票ID20が付された複数のOKフォーマット情報COD1〜CODmを読み出し、それらのOKフォーマット情報COD1〜CODm同士を比較し、その中で最も平均的なフォーマット情報1つを、多数決によって選択する。この際、同一の帳票ID20が付された複数のOKフォーマット情報CODがあり、かつ同一フォーマット情報と見なすOKフォーマット情報CODの組が存在しなかった場合は、該フォーマット情報をNGフォーマット情報ALFNG とする。
以下、図8〜図12を参照しつつ、多数決によるフォーマット情報の選択方法について具体的に説明する。
図8は、フォーマット情報記憶手段52に記憶されたOKフォーマット情報COD11〜CODmnを示す図である。
例えば、光電変換手段31により、同一帳票ID20に対して複数の帳票イメージIMAGE 1〜IMAGE zを取得し、これらの帳票イメージIMAGE 1〜IMAGE zに対し、フォーマット情報作成手段41によってフォーマット情報を作成した結果、帳票イメージIMAGE 1〜IMAGE mのm個のイメージによるフォーマット情報がOKフォーマット情報CODとなり、読取フィールドFIELD 1〜FIELD nの各項目に対して、図8に示すように、OKフォーマット情報COD11〜CODmnのフォーマット情報が作成されたものとする。
【0024】
図8では、帳票イメージIMAGE kに対し、フォーマット情報作成処理を実行した結果生成されたOKフォーマット情報をCODkとし、そのCODkの項目である読取フィールドFIELD jに対応するフォーマット情報項目をOKフォーマット情報CODkjとしたとき、そのOKフォーマット情報CODkjは帳票イメージIMAGE kと読取フィールドFIELD jの座標で表される。即ち、OKフォーマット情報CODkjは、帳票イメージ IMAGE kに対応するOKフォーマット情報CODkの読取フィールド FIELD jを意味しており、図3に示すように、読取フィールド FIELD jの位置(例えば、左上位置p1(x1,y1))、大きさ(X方向の幅w及びY方向の高さh)を示す情報からなる。
まず、比較手段42aでは、フォーマット情報記憶手段52から各帳票イメージIMAGE 1〜IMAGE m毎の全てのOKフォーマット情報COD11〜CODmnを読み出し、それらの全てのOKフォーマット情報COD11〜CODmn同士を比較する。その比較結果を図9に示す。例えば、OKフォーマット情報COD1とCOD2との同じ読取フィールド FIELD を比較して差を求める場合の計算は、X方向の幅wについてはw1−w2、Y方向の高さhについてはh1−h2、左上位置P(x,y)についてはx1−x2、y1−y2となる。
図9では、帳票イメージIMAGE kに対応するOKフォーマット情報CODkと、帳票イメージIMAGE jに対応するOKフォーマット情報CODjとを比較した結果が、CMPkjと記されている。比較した結果、同一フォーマット情報と見なした場合は○、異なるフォーマット情報と見なした場合は×とする。そして、OKフォーマット情報COD1〜CODmの全てのOKフォーマット同士を比較し、○となった数を計数手段42bでカウントする。図9では、OKフォーマット情報CODkの○の数がCkと記されている。その結果、最も○の多いフォーマット情報を当該帳票ID20のフォーマット情報として選択手段42cで選択し、それをフォーマット情報登録手段55に登録する。
なお、以上のような多数決テストにおいて、例えば、同一の帳票ID20に対するフォーマット情報数(帳票の枚数)mの最大値を5とし、OKフォーマット情報COD6以降のフォーマット情報を多数決テストの対象としないで無視してもよい。このようにすれば、多数決テストの処理の簡単化が図れる。
【0025】
図9に示す比較結果の算出方法を、以下説明する。
比較結果CMPkiは、マージン記憶手段53に記憶された、OKフォーマット情報CODkとOKフォーマット情報CODiのマージン値を比較して求める。もし○のときに同一で、もしカウント数CkがC1,C2,…,Ck,…,Cmの中の最大であれば、そのOKフォーマット情報CODkが代表である。
例えば、図9のOKフォーマット情報COD1とOKフォーマット情報COD2を比較して比較結果CMP21を求める場合、
(COD21−COD11):Margin1
(COD22−COD12):Margin2
(COD2j−COD1j):Marginj
(COD2n−COD1n):Marginn



のように、各OKフォーマット情報COD11,COD21,…毎に両者の差を取り、その差が予め設定された所定のマージン値(Margin1,Margin2,…)以下であるか否かを判定し、もし全読取フィールドFIELD jがマージン値(Marginj)以下であれば、OKフォーマット情報COD1はCOD2と同一と見なせる。
【0026】
図10は、以上のようなOKフォーマット情報CODkとCODiの比較選択処理を示すフローチャートである。
このフローチャートでは、ステップS11において計数手段42bのカウント数cを0に設定し、ステップS12においてk,iに1を設定する。ステップS13でマージン記憶手段53からフォーマット情報CODkを読み出し、さらにステップS14でフォーマット情報CODiを読み出し、ステップS15へ進む。ステップS15では、比較手段42aによってOKフォーマット情報CODkとCODiの差αを取り、その差αが予め設定された所定のマージン値以下であるか否かを判定する。このマージン値は、読取フィールドFIELD に応じて予め設定されており(例えば、0.5mm〜1.0mm)、マージン記憶手段53に記憶されている。
差αが所定のマージン値以下であれば、ステップS16においてカウント数cが+1加算され、ステップS17でiに+1加算される。差αがマージン値より大きければ、直接、ステップS17へ進む。ステップS18では、OKフォーマット情報CODiをm個まで処理したか否かを判定し、処理していなければステップS14へ戻って前記の処理を繰り返す。
m個のOKフォーマット情報CODiの比較処理を行った場合、ステップS19でカウント数cの記憶を行う。その後、ステップS20でカウント数cを0に設定し、ステップS21でkに+1加算してステップS22へ進む。ステップS22では、OKフォーマット情報CODkをm個まで比較処理したか否かを判定し、比較処理していなければ、ステップS13へ戻って前記の処理を繰り返す。ステップS22において、OKフォーマット情報CODkをm個まで比較処理を行った場合、ステップS23において、選択手段42cがカウント数cよりフォーマット情報CODkを選択し、比較選択処理を終了する。
【0027】
以上のような多数決テストでOKとする条件は、次の2つの場合(i),(ii)である。
(i) 1つの帳票ID20に対し、OKフォーマット情報CODが1つの場合無条件に該OKフォーマット情報CODを選択し、多数決テスト結果をOKとする。
(ii) 1つの帳票ID20に対し、複数のOKフォーマット情報CODが存在する場合
同一フォーマット情報と見なすOKフォーマット情報CODの組が1つ以上存在すれば、多数決テスト結果をOKとする。これに対し、存在しなければ、多数決テスト結果をNGとする。このNGは、各帳票11〜1z毎のOKフォーマット情報間の差が予め設定されたマージン値より大きい場合にフォーマット作成エラーとなる。この場合には、例えば、そのNGを表示手段57の画面に表示してオペレータに知らせる。オペレータは、適切な帳票を選択し、その選択した帳票からフォーマット情報を作成するようにしてもよい。
【0028】
以上のように、本実施例では次の(a)〜(c)のような利点がある。
(a) 図1のフォーマット情報生成装置を用いて自動的にフォーマット情報を作成できるので、オペレータの負担を軽減できる。さらに、高精度なフォーマット情報が得られると共に、その作成作業効率を著しく向上できる。
(b) 複数枚の帳票11〜1zに基づきフォーマット情報を作成し、その中から最適なものを1つ選択するようにしたので、帳票における印刷誤差や裁断誤差等を吸収して精度の高いフォーマット情報を得ることができる。
(c) 複数枚の帳票11〜1zからフォーマット情報を作成し、その中から最適なものを選択するので、フォーマット情報の作成の異常を簡単かつ的確に検出できる。
【0029】
なお、本発明は図示の実施例に限定されず、種々の変形が可能である。その変形例としては、例えば次の(i)〜(iii)のようなものがある。
(i) 図4のフォーマット情報生成処理において、ステップS4の比較選択処理によって選択したフォーマット情報をステップS5でそのまま登録するようにしたが、この登録の前に、選択されたフォーマット情報を表示手段57の画面上に表示し、それが正しく作成されているか否かをオペレータに確認させた後に登録するようにすれば、正確なフォーマット情報の登録が行える。
(ii) 図4のフォーマット情報生成処理において、帳票11〜1z、フォーマット生成規則、及びフォーマット情報作成手段41で作成されたフォーマット情報の各内容は、図示のものに限定されず、種々の種類の帳票に適合するように任意に変更可能である。
(iii) 図1のフォーマット情報生成装置では、文字認識手段41bによってイメージ解析結果から文字認識を行っているが、帳票11〜1zの読取内容によっては該文字認識手段41bを省略してもよい。また、制御部40内に機能向上のための他の機能ブロックを追加したり、あるいは複数の記憶手段32,51〜55を1つ又は複数の共通の記憶手段で構成する等、帳票11〜1zの種類と内容に応じて装置構成を任意に変更可能である。
【0030】
【発明の効果】
以上詳細に説明したように、第1、第2及び第3の発明によれば、イメージ取得処理、フォーマット情報作成処理、及び比較選択処理を実行してフォーマット情報を作成するようにしたので、入力された複数枚の帳票からフォーマット生成規則を用いて自動的に複数のフォーマット情報を作成し、その中から最適なフォーマット情報を選択して出力できる。そのため、オペレータの負担を軽減できるばかりか、フォーマット情報の作成精度や作成作業効率を著しく向上できる。さらに、同一帳票IDが付された複数枚の帳票に基づき、その帳票IDに対する1つのフォーマット情報を作成するので、帳票における印刷誤差や裁断誤差等を吸収でき、精度の高いフォーマット情報が得られる。しかも、複数のフォーマット情報を作成した後、それらのフォーマット情報同士を比較して最も平均的なフォーマット情報を選び、これを当該帳票IDのフォーマット情報とするので、フォーマット情報の作成異常を簡単かつ的確に検出できる。
第4の発明によれば、比較選択処理の結果がフォーマット情報生成エラーの場合、その結果を表示手段の画面上に表示するようにしたので、例えば、オペレータがそのフォーマット情報生成エラーを見て、適切な帳票を選択してフォーマット情報を作成することも可能になる。
第5の発明によれば、フォーマット情報作成手段を備えているので、フォーマット生成規則を用いて簡単かつ的確に複数のフォーマット情報の作成が行える。作成された複数のフォーマット情報は、比較手段、計数手段、及び選択手段によって最も適切な1つのフォーマット情報が選択されるので、精度の高いフォーマット情報を自動的に作成することができる。
【図面の簡単な説明】
【図1】本発明の実施例を示すフォーマット情報生成装置の概略の機能ブロックである。
【図2】図1のフォーマット情報生成装置に入力される帳票の例を示す図である。
【図3】図2の読取フィールドFIELD の位置の表現形式を説明する図である。
【図4】図1のフォーマット情報生成装置を用いたフォーマット情報生成処理の全体のフローチャートである。
【図5】図4における帳票イメージIMAGE1の例を示す図である。
【図6】図1におけるフォーマット生成規則の例を示す図である。
【図7】図1におけるフォーマット情報の例を示す図である。
【図8】図4のOKフォーマット情報COD11〜CODmnの説明図である。
【図9】図8の比較結果を示す図である。
【図10】図9におけるOKフォーマット情報CODkとCODiの比較選択処理のフローチャートである。
【図11】図10の多数決テストの例を示す図である。
【図12】図10の多数決テストの例を示す図である。
【符号の説明】
11〜1z 帳票
20 帳票ID
31 光電変換手段
32 イメージ記憶手段
40 制御部
41 フォーマット情報作成手段
41a イメージ解析手段
41b 文字認識手段
41c 照合検索手段
42 比較選択手段
42a 比較手段
42b 計数手段
42c 選択手段
43 入出力制御手段
51 フォーマット生成規則記憶手段
52 フォーマット情報記憶手段
53 マージン記憶手段
54 比較結果記憶手段
55 フォーマット情報登録手段
56 入力操作手段
57 表示手段
S1 イメージ取得処理
S2 フォーマット情報作成処理
S3 フォーマット情報記憶処理
S4 比較選択処理
S5 フォーマット情報登録処理
[0001]
[Industrial application fields]
The present invention optically reads a character on a form having a reading field (reading area) in which letters, numbers, symbols, marks, and the like (in this specification, these are collectively referred to simply as “characters”) are written. The present invention relates to a format information generation method for generating format information, which is read information used for reference in reading an optical character reader (hereinafter referred to as OCR), and the format information generator.
[0002]
[Prior art]
In the conventional OCR, a form image of a certain format (format) is captured by an image scanner or the like, and the image data of the form image is stored in an image memory (image storage device). Then, using the format information specifying the reading field of the form (that is, the format information specifying the reading position and character type of the form), the reading field is cut out by the character cutting means from the image data stored in the image memory. The character on the form is recognized by extracting the character features in the extracted reading field by the character recognition means.
That is, in order to identify the format of the form, a form ID represented by numbers or the like is entered or printed at a predetermined position (for example, upper right). Therefore, in the OCR, first, the form ID is recognized, the format information prepared in advance corresponding to the form ID is referred to, the reading field is cut out from the form image, and the characters in the cut out reading field are recognized as a dictionary. It has come to recognize using.
[0003]
[Problems to be solved by the invention]
However, the format information used in the conventional OCR is created by the operator manually measuring the position and size of each reading field on the form with a ruler or the like. The created format information is stored (registered) in an OCR storage device by an operator using a personal computer or the like. Therefore, there are problems such as the following (a) to (c), and it is difficult to solve them.
(A) When there are a plurality of forms with the same form ID, the operator selects one form judged to be appropriate from the plurality of forms in consideration of work efficiency, and the position of the reading field based on the form. Field information is created by measuring the size and size with a ruler. As described above, since the operator manually creates the field information, the work efficiency is not good.
(B) The operator creates format information from one form in consideration of work efficiency. However, the position of the reading field on the form varies depending on the printing error and the cutting error. When the printing error or cutting error of these forms is large, the error of the created format information also becomes large.
(C) As described above, field information is usually created from a single form in consideration of work efficiency, and it is difficult to detect the mistake even if a different field is selected as a reading position by mistake. .
In the present invention, as the problem that the conventional technology has, since the operator creates the format information manually, the work efficiency is not good, and the format information is created from a single form. There is an error in the format information created due to cutting errors, etc., or the error is large, and even if a different field is selected as the reading position by mistake, it is difficult to detect abnormal formatting. It is an object of the present invention to provide a solved format information generation method and format information generation apparatus.
[0004]
[Means for Solving the Problems]
In order to solve the above-described problems, the first invention provides a form ID for form identification and format information for reference used when reading the character on the form having a reading field in which the character is entered by OCR. In the format information generation method to be generated, an image acquisition process for acquiring images of a plurality of forms having the same format with the same form ID and outputting a plurality of form images, a format information creation process, and a comparison The selection process is executed. Here, in the format information creation process, the position of the line segment and / or the position of the character included in each form image is detected, and the format generation rule corresponding to the form ID is applied to the detection result. Determine the reading field position. Then, when all the reading fields can be detected for one form image, it is output as OK format information, and when there is one or more reading fields that cannot be detected, it is output as NG format information for each form. In the comparison and selection process, the OK format information is compared with each other,Difference in information indicating the position and size of the same reading field (ie,Difference between those OK format information)One of the most average OK format information is selected by majority vote from those having a predetermined margin value (margin value) or less, and this is output as format information of the form ID.
[0005]
In the second invention, the comparison and selection process of the first invention has the following processing contents. That is, in the comparison and selection process of the second invention, when there is one OK format information output by the format information creation process, the OK format information is selected and output unconditionally. On the other hand, when there are a plurality of OK format information output by the format information creation process, if there is one or more sets of OK format information that can be regarded as the same format information not exceeding a predetermined margin value, the most among them is One piece of average OK format information is selected and output by majority decision. If there is no set of OK format information, a process of generating a format information generation error (ie, format information generation NG) is performed.
According to a third aspect, in the format information generation method according to the first or second aspect, the position and size of the reading field is a rectangular shape surrounding the reading item based on XY coordinates with the origin 0 at the upper left of the form. The upper left position p (x, y), the width w in the X-axis direction, and the height h in the Y-axis direction are used. The format information includes the form ID, the number of read fields, and p (x, y), w, and h information for each read field.
According to a fourth aspect, in the format information generation method of the second aspect, when the result of the comparison and selection process is a format information generation error, the result is displayed on the screen of the display means.
[0006]
According to a fifth aspect of the invention, in the format information generating apparatus for generating the format ID for reference used when reading the form ID having the form ID for the form identification and the form on the form having the reading field filled with the character by OCR, Image acquisition means for acquiring images of a plurality of forms having the same format with the same form ID and outputting a plurality of form images, and format information creating means are provided. Here, the format information creating means detects the position of the line segment and / or the position of the character included in each form image, and applies the format generation rule corresponding to the form ID to the detection result. The reading field position is determined and output as OK format information when all the reading fields can be detected for one form image, and as NG format information when there is one or more reading fields that cannot be detected for each form. To do.
In the fifth aspect of the invention, furthermore, all the OK format information output from the format information creating means is compared,The difference in information indicating the position and size of the same reading field (that is, the difference between the OK format information)Comparing means for detecting OK format information that can be regarded as the same format information equal to or less than a predetermined margin value and OK format information that is regarded as different OK format information, and OK format information that can be regarded as the same format information detected by the comparing means And counting means for selecting the maximum OK format information of the count value of the counting means and outputting this as format information of the form ID is provided.
[0007]
[Action]
According to the first and third inventions, form images of a plurality of forms with the same form ID are acquired by the image acquisition process. The position of the line segment and / or the position of the character in each form image acquired by the image acquisition process is detected by the format information creation process. That is, in this format information creation process, for example, the detection result and the format generation rule are collated (matched), and the detection result that matches (matches) the format generation rule is searched for each reading field, Determine the position of the reading field. Then, in the format information creation process, when all the read fields can be detected for one form image, it is output as OK format information, and when there is one or more read fields that cannot be detected, it is output as NG format information.
In the comparison and selection process, a plurality of OK format information output from the format information creation process is compared, and one OK format is selected by majority vote from among those whose difference between the OK format information is a predetermined margin value or less. This is output as the format information of the form ID.
[0008]
According to the second and third inventions, one OK format information is selected from the OK format information output by the format information creation process by the comparison and selection process, for example, as follows. That is, when there is one OK format information output by the format information creation process, the OK format information is selected and output as it is. On the other hand, when there are a plurality of OK format information output by the format information creation process, if there are one or more sets of OK format information that can be regarded as the same format information, one OK format information is determined by majority vote from among them. Select and output. At this time, if the set of OK format information does not exist, a format information generation error occurs.
According to the fourth invention, when the result of the comparison and selection process of the second invention is a format information generation error, the result is displayed on the screen of the display means. Then, the operator can select optimal OK format information based on the information on the screen, for example.
[0009]
According to the fifth aspect, the image acquisition unit acquires the form images of a plurality of input forms and sends them to the format information creation unit. The format information creating means detects the position of the line segment and / or the position of the character included in each form image. Then, for example, the detection result and the format generation rule are matched, the detection result that matches the format generation rule is searched for each reading field, the position of the reading field is determined, and OK format information or NG format is determined. Output information for each form.
All OK format information output from the format information creating means is compared by the comparing means, and OK format information that can be regarded as the same format information and OK format information that is regarded as different OK format information are detected. The number of OK format information that can be regarded as the same format information is counted by the counting means, the OK format information having the maximum count value (count value) is selected by the selecting means, and is output as the format information of the form ID.
[0010]
【Example】
In the embodiment of the present invention, the format information generation device reads a plurality (z) of the forms 11 to 1z with the same form ID, matches the contents of the forms 11 to 1z with the format generation rule, A method of creating format information corresponding to each of the forms 11 to 1z and selecting and outputting one optimum format information from the plurality of format information will be specifically described. Therefore, FIG. 2 shows an example of one form 11 out of a plurality (z) with the same form ID to be read.
In the form 11 of FIG. 2, a form ID 20 is entered or printed at a predetermined position, for example, at the upper right, in order to identify the format. The form ID 20 is provided at a common position of the forms 11 to 1z having the same format, and is usually expressed by a number unique to the form of 2 to 5 digits (a 4-digit number in FIG. 2). Further, the form 11 is provided with a plurality (n) of reading fields (items) FIELD in which characters to be read are entered (in FIG. 2, four reading fields FIELD 1 to FIELD 4 are provided. ). Of these four reading fields FIELD 1 to FIELD 4, for example, the upper reading field FIELD 1 is the billing month field, the lower reading field FIELD 2 is the customer number field, the lower left reading field FIELD 3 is the logistics route field, The lower right reading field FIELD 4 is a grand total field.
In the present embodiment, these four reading fields FIELD 1 to FIELD 4 are optically read, their positions and sizes are detected, a plurality of format information corresponding to the respective forms 11 to 1z are created, and the plurality of formats are detected. Select the most appropriate piece of information.
[0011]
FIG. 3 is a diagram for explaining the expression format of the positions of the reading fields FIELD 1 to FIELD 4 shown in FIG.
The positions and sizes of the respective reading fields FIELD 1 to FIELD 4 in FIG. 2 are determined based on the XY coordinates with the origin 0 as the upper left of each of the forms 11 to 1z, and the rectangular upper left position p1 (x1, y1), X It is expressed using the width w in the axial direction and the height h in the Y-axis direction.
FIG. 1 is a schematic functional block diagram of a format information generating apparatus showing an embodiment of the present invention.
This format information generation apparatus reads a plurality (z) of forms 11 to 1z with the same form ID 20 as shown in FIG. 2, and a plurality of forms 11 to 1z corresponding to the forms 11 to 1z based on the read result. Is a device that selects and outputs one of the most suitable format information, and has a photoelectric conversion means 31 that reads each of a plurality of input forms 11 to 1z, on the output side The image storage means 32 and the control unit 40 are connected to each other. The photoelectric conversion means 31 is configured by an image scanner or the like, optically reads each of the input forms 11 to 1z, acquires the form images IMAGE 1 to IMAGE z, and includes the forms 11 to 1z in the respective forms 11 to 1z. It has a function as an image acquisition means for recognizing the form ID 20. The image storage means 32 is a memory for storing a plurality of form images IMAGE 1 to IMAGE z read by the photoelectric conversion means 31 in the form of image data.
[0012]
The control unit 40 functions to control the entire format information generating device, create a plurality of format information based on the image data stored in the image storage means 32, and select and output the optimum one of the format information And one or a plurality of personal computers. In the control unit 40, a format information creating unit 41, a comparison / selection unit 42, an input / output control unit 43, and the like are provided.
The format information creating means 41 creates and outputs OK format information COD1 to CODm or NG format information ALFNG based on each image data stored in the image storage means 32. That is, in the format information creating means 41, when all the reading fields FIELD can be detected for one form image IMAGE, the format information is output as OK format information COD1 to CODm, and the reading fields FIELD that could not be detected are output. When there is one or more, it has a function of outputting the format information as NG format information ALFNG, and has an image analysis means 41a, a character recognition means 41b, and a collation search means 41c.
[0013]
Based on each image data stored in the image storage means 32, the image analysis means 41a analyzes the position of the line segment and the character contained in each of the form images IMAGE 1 to IMAGE z and outputs the image analysis result. The character recognition means 41b and the collation search means 41c are connected to the output side. The character recognizing unit 41b has a function of extracting a character at the position from the character position of the image analysis result analyzed by the image analyzing unit 41a and recognizing the character using a recognition dictionary or the like. A means 41c is connected. A format generation rule storage unit 51 provided outside the control unit 40 is connected to the collation search unit 41c. The format generation rule storage means 51 is a memory for storing a format generation rule created in advance corresponding to the form ID 20 of the forms 11 to 1z to be read.
[0014]
The collation search unit 41c matches the image generation result analyzed by the image analysis unit 41a with the format generation rule corresponding to the form ID 20 read from the format generation rule storage unit 51, and matches the format generation rule. The image analysis result is searched for each reading field FIELD, the position of the reading field FIELD is determined, and the format information (OK format information COD1 to CODm or NG format information ALFNG) is created, and its output side The format information storage means 52 and the comparison / selection means 42 are connected. The format information storage means 52 is a memory for storing the format information (OK format information COD1 to CODm or NG format information ALFNG) output from the collation search means 41c.
The comparison / selection means 42 compares all the OK format information COD1 to CODm stored in the format information storage means 52, selects the optimum one of the OK format information COD, and uses this to select the format of the form ID 20 It has a function of outputting as information, and has a comparison means 42a, a counting means 42b, and a selection means 42c.
[0015]
The comparison unit 42a compares all the OK format information COD1 to CODm stored in the format information storage unit 52, and the OK format information COD that can be regarded as the same format information not more than a predetermined margin value read from the margin storage unit 53. The OK format information COD regarded as different OK format information is detected, and the detection result is stored in the comparison result storage means 54. The counting means 42b is connected to the output side. The counting means 42b has a function of counting the number of OK format information COD that can be regarded as the same format information stored in the comparison result storage means 54, and a selection means 42c is connected to the output side thereof. The selecting unit 42c has a function of selecting the OK format information COD having the maximum count value of the counting unit 42b and outputting it as the format information of the form ID 20, and registering format information outside the control unit 40 on the output side. Means 55 are connected. The format information registration means 55 stores (registers) the OK format information COD of the form ID 20 output from the selection means 42c together with the form ID 20, and is constituted by a storage device such as a magnetic drum or a magnetic disk.
[0016]
Further, an input / output control unit 43 is provided in the control unit 40, and an input operation unit 56 and a display unit 57 outside the control unit 40 are connected to the input / output control unit 43. The input operation unit 56 includes a keyboard and a mouse, and has a function of inputting data to the control unit 40 and instructing work contents. The display means 57 is composed of a display such as a CRT or a liquid crystal, and has a function of displaying output data of the control unit 40 on the screen. Input / output with respect to the control unit 40 of the input operation means 56 and the display means 57 is controlled by the input / output control means 43.
FIG. 4 is an overall flowchart of format information generation processing in the format information generation method of the present embodiment using the format information generation apparatus as described above.
[0017]
In the format information generation process of FIG. 4, in the image acquisition process of step S <b> 1, a plurality of forms 11-1 z with the same form ID 20 are read by the photoelectric conversion means 31, and the plurality of form images IMAGE 1-1. IMAGE z is stored in the image storage means 32 in the form of image data. Next, in the format information creation process in step S2, the format information creation means 41 reads the image data stored in the image storage means 32, and the position of the line segment included in each of these form images IMAGE 1 to IMAGE z. And the character position are analyzed, the analysis result is matched with the format generation rule corresponding to the form ID 20 stored in the format generation rule storage means 51, and the analysis result matching the format generation rule is matched with each read field. Each field 1 to FIELD n is searched to determine the positions of the reading fields FIELD 1 to FIELD n, and format information (OK format information COD 1 to CODm or NG format information ALFNG) is output. This format information is stored in the format information storage means 52 in step S3.
Thereafter, in the comparison / selection process in step S4, the comparison / selection means 42 reads the OK format information COD1 to CODm stored in the format information storage means 52 and compares them, and the difference between the OK format information COD1 to CODm.(Ie, the difference in information indicating the position and size of the same reading field)However, the average one OK format information COD is selected from the ones below the predetermined margin value stored in the margin storage means 53 by majority decision, and this is output as the format information of the form ID. The output format information is registered in the format information registration means 55 in step S5.
[0018]
Next, specific examples of the image acquisition process (1), the format information creation process (2), and the comparison / selection process (3) will be described with reference to FIGS.
(1) Image acquisition processing
When the format information generation process is started by a command from the input operation unit 56, in step S1 of FIG. 4, the photoelectric conversion unit 31 has a plurality of forms 11 to 11 having the same form ID 20 as shown in FIG. 1z form images IMAGE1 to IMAGEz are photoelectrically converted (for example, blank pages are converted to "0" for bit units, line segments (ruled lines) and character portions are converted to "1") as image data The image is stored in the image storage unit 32. In step S1, the form ID 20 described at the upper right of the forms 11 to 1z in FIG. 2 is also recognized.
FIG. 5 is a diagram showing an example of the form image IMAGE 1 read in step S1 of FIG.
The form image IMAGE 1 is represented by, for example, XY coordinates with the upper left as the origin (0, 0). Numbers 0 to 24 on the X axis and numbers 0 to 34 on the Y axis are given for convenience of explanation. Further, rectangular broken lines representing the billing month field (reading field FIELD 1) and the distribution route field (reading field FIELD 3) are given for convenience of explanation and do not appear on the form image IMAGE1. It is assumed that, for example, four reading fields FIELD 1 to FIELD 4 to be read are determined in advance by the format generation rule. For convenience of explanation, coordinate positions p (x, y) are attached to the four corners of each rectangular reading field FIELD 1 to FIELD 4, but these do not appear on the form image IMAGE 1.
[0019]
The image data of the form image IMAGE 1 represented by such XY coordinates is stored in the image storage means 32.
Note that in step S1 in FIG. 4, if the form ID 20 cannot be recognized due to light printing or the like, the following measures can be taken.
That is, when the form ID 20 cannot be recognized, the control unit 40 displays a form ID code input screen on the screen of the display means 57, and the form image IMAGE 1 of the form (for example, 11) for which the form ID 20 could not be recognized. May be displayed, and the operator may input the form ID 20 using the keyboard of the input operation means 56 while viewing the form image IMAGE 1 on the screen.
[0020]
(2) Format information creation processing
In step S2 of FIG. 4, after image analysis processing is performed by the image analysis means 41a, for example, as described in the specification and drawings of Japanese Patent Application No. 7-142122 filed earlier by the applicant of the present application. Then, the collation search process is performed by the collation search means 41c to create the format information.
First, the image analysis unit 41a reads the image data stored in the image storage unit 32, and detects the positions of all line segments and characters included in each form image IMAGE1 to IMAGEz by a projection method or the like ( The image analysis result is sent to the collation search means 41c. Further, from the image analysis result analyzed by the image analysis unit 41a, the character recognition unit 41b detects (cuts out) the character block at the character position as necessary, and recognizes the detected character block using the recognition dictionary. Is recognized, and the character recognition result is sent to the collation search means 41c.
That is, in the image analysis process, a line segment parallel to the X axis is detected by the projection process in the X axis direction with respect to the form image IMAGE 1 in FIG. 5, and further, parallel to the Y axis by the projection process in the Y axis direction. Detects line segments. From the detected line segment parallel to the X axis and line segment parallel to the Y axis, the coordinates of the intersection can be obtained.
[0021]
For example, the customer number field (FIELD 2) in FIG. 5 includes a line segment in the Y-axis direction of x = 7, a line segment in the Y-axis direction of x = 23, and a line segment in the X-axis direction of y = 6. , A rectangular region surrounded by a line segment in the X-axis direction of y = 8. The field information of this customer number field (FIELD 2) is shown in FIG. 3 because the coordinate position of the upper left starting point is p (7, 6) and the lower right end point is p (23, 8). Thus, it is represented by the coordinate position p (7, 8) of the starting point, the width w = 16 in the X-axis direction, and the height h = 2 in the Y-axis direction.
To detect the position of a character in a character block that is not surrounded by a rectangular frame such as the billing month field (FIELD 1), the projection result in the X-axis direction is compared with the projection result in the Y-axis direction. The position of the frame surrounding each character in the billing month field (FIELD 1) consisting of character blocks, that is, the position of each character can be detected. Therefore, a character recognition result is obtained by cutting out the billing month field (FIELD 1) made up of character blocks by the character recognition means 41b and recognizing each character in the character block using a recognition dictionary or the like.
FIG. 6 is a diagram illustrating an example of the format generation rule stored in the format generation rule storage unit 51.
In this format generation rule, the number of read fields FIELD corresponding to the form ID 20 of the forms 11 to 1z to be read, the name of the read field FIELD, the characteristics of the read fields FIELD 1 to FIELD 4, and the like are defined. The characteristics of each of the reading fields FIELD 1 to FIELD 4 are defined as contents suitable for each of the reading fields FIELD 1 to FIELD 4 such as the size (dimension) of the field frame and the character block, the existing position, and the search method. .
[0022]
Next, in the collation search means 41c that performs collation search processing, the line segments and characters detected by the image analysis means 41a and the character recognition means 41b and the form ID 20 read from the format generation rule storage means 51 in FIG. Such a format generation rule is matched, and line segments and characters that match the format generation rule are searched. Then, the collation search means 41c sequentially determines the positions on the XY coordinate axes of the respective reading fields FIELD1 to FIELD4, and sequentially stores each field information as the position information in the format information storage means 52. If the position of the reading field FIELD cannot be determined (detected) (NG), the NG information is also stored in the format information storage means 52. When the field information of each of the read fields FIELD 1 to FIELD 4 is stored in the format information storage means 52, the format information including the field information is created.
When all the reading fields FIELD 1 to FIELD 4 can be detected for one form image IMAGE, the format information is OK format information COD. When there is one or more reading fields FIELD that could not be detected, the format information Is NG format information ALFNG. An example of this format information is shown in FIG.
The format information in FIG. 7 includes information such as the form ID 20 = 1234 corresponding to the forms 11 to 1z to be read, the number of reading fields FIELD = 4, and the field positions and attributes of the reading fields FIELD1 to FIELD4. ing. When there is a reading field FIELD that could not be detected, for example, an NG mark is added to the reading field FIELD column.
[0023]
(3) Comparison selection process
In step S4 of FIG. 4, the comparison / selection means 42 reads out a plurality of OK format information COD1 to CODm with the same form ID 20, compares the OK format information COD1 to CODm, and averages them among them. One format information is selected by majority vote. At this time, when there are a plurality of OK format information CODs with the same form ID 20 and there is no set of OK format information COD regarded as the same format information, the format information is set as NG format information ALFNG. .
Hereinafter, a method for selecting format information by majority decision will be described in detail with reference to FIGS.
FIG. 8 is a diagram showing OK format information COD11 to CODmn stored in the format information storage means 52. As shown in FIG.
For example, a plurality of form images IMAGE 1 to IMAGE z are acquired for the same form ID 20 by the photoelectric conversion means 31, and format information is created by the format information creation means 41 for these form images IMAGE 1 to IMAGE z. As a result, the format information of m images of the form images IMAGE 1 to IMAGE m becomes OK format information COD, and for each item of the reading fields FIELD 1 to FIELD n, as shown in FIG. It is assumed that the format information of CODmn has been created.
[0024]
In FIG. 8, the OK format information generated as a result of executing the format information creation process for the form image IMAGE k is CODk, and the format information item corresponding to the reading field FIELD j that is the item of CODk is the OK format information CODkj. The OK format information CODkj is expressed by the coordinates of the form image IMAGE k and the reading field FIELD j.That is, OK format information CODkj is a form image. IMAGE Read field of OK format information CODk corresponding to k FIELD j, and as shown in FIG. FIELD It consists of information indicating the position of j (for example, the upper left position p1 (x1, y1)) and the size (the width w in the X direction and the height h in the Y direction).
First, the comparison means 42a reads all the OK format information COD11 to CODmn for each form image IMAGE1 to IMAGEm from the format information storage means 52, and compares all the OK format information COD11 to CODmn. The comparison result is shown in FIG.For example, the same reading field of OK format information COD1 and COD2 FIELD Are calculated by calculating w1-w2 for the width w in the X direction, h1-h2 for the height h in the Y direction, and x1-x2, y1 for the upper left position P (x, y). -Y2.
In FIG. 9, the result of comparing the OK format information CODk corresponding to the form image IMAGE k and the OK format information CODj corresponding to the form image IMAGE j is described as CMPkj. As a result of comparison, “◯” indicates that the format information is the same, and “x” indicates that the format information is different. Then, all the OK formats of the OK format information COD1 to CODm are compared with each other, and the number of ◯ is counted by the counting means 42b. In FIG. 9, the number of o in the OK format information CODk is written as Ck. As a result, the format information with the most ○ is selected by the selection means 42 c as the format information of the form ID 20 and registered in the format information registration means 55.
In the majority test as described above, for example, the maximum value of the number of format information (number of forms) m for the same form ID 20 is set to 5, and the format information after OK format information COD6 is ignored without being subject to the majority test. May be. In this way, the majority test process can be simplified.
[0025]
A method for calculating the comparison result shown in FIG. 9 will be described below.
The comparison result CMPki is obtained by comparing the margin values of the OK format information CODk and the OK format information CODi stored in the margin storage means 53. If it is the same in the case of ◯ and the count number Ck is the maximum among C1, C2,..., Ck,..., Cm, the OK format information CODk is representative.
For example, when the comparison result CMP21 is obtained by comparing the OK format information COD1 and the OK format information COD2 in FIG.
(COD21-COD11): Margin1
(COD22-COD12): Margin2
(COD2j-COD1j): Marginj
(COD2n-COD1n): Marginn



As shown in FIG. 5, for each OK format information COD11, COD21,..., The difference between the two is taken, and it is determined whether or not the difference is less than or equal to a predetermined margin value (Margin1, Margin2,...). If all the read fields FIELD j are equal to or less than the margin value (Marginj), the OK format information COD1 can be regarded as the same as COD2.
[0026]
FIG. 10 is a flowchart showing the comparison / selection processing of the OK format information CODk and CODi as described above.
In this flowchart, the count number c of the counting means 42b is set to 0 in step S11, and 1 is set to k and i in step S12. In step S13, the format information CODk is read from the margin storage means 53, and in step S14, the format information CODi is read, and the process proceeds to step S15. In step S15, the comparison unit 42a takes the difference α between the OK format information CODk and CODi, and determines whether or not the difference α is equal to or less than a predetermined margin value. This margin value is preset according to the reading field FIELD (for example, 0.5 mm to 1.0 mm) and is stored in the margin storage means 53.
If the difference α is equal to or less than the predetermined margin value, the count number c is incremented by 1 in step S16, and i is incremented by 1 in step S17. If the difference α is larger than the margin value, the process proceeds directly to step S17. In step S18, it is determined whether or not up to m pieces of OK format information CODi have been processed. If not, the process returns to step S14 to repeat the above processing.
When the comparison process of m pieces of OK format information CODi is performed, the count number c is stored in step S19. Thereafter, the count number c is set to 0 in step S20, +1 is added to k in step S21, and the process proceeds to step S22. In step S22, it is determined whether or not up to m pieces of OK format information CODk have been compared. If not, the process returns to step S13 to repeat the above processing. When the comparison process is performed for up to m pieces of OK format information CODk in step S22, the selection means 42c selects the format information CODk from the count number c in step S23, and the comparison selection process ends.
[0027]
The following two cases (i) and (ii) are the conditions for OK in the majority test as described above.
(I) If there is one OK format information COD for one form ID 20, the OK format information COD is selected unconditionally, and the majority test result is OK.
(Ii) When a plurality of OK format information COD exists for one form ID 20
If there is one or more sets of OK format information COD that are regarded as the same format information, the majority test result is OK. On the other hand, if it does not exist, the majority test result is NG. This NG results in a format creation error when the difference between the OK format information for each of the forms 11 to 1z is larger than a preset margin value. In this case, for example, the NG is displayed on the screen of the display means 57 to notify the operator. The operator may select an appropriate form and create format information from the selected form.
[0028]
As described above, this embodiment has the following advantages (a) to (c).
(A) Since the format information can be automatically created using the format information generating apparatus of FIG. 1, the burden on the operator can be reduced. Further, highly accurate format information can be obtained, and the creation work efficiency can be remarkably improved.
(B) Format information is created based on a plurality of forms 11 to 1z, and an optimum one is selected from the format information. Therefore, a printing format, cutting error, etc. in the form are absorbed and the format is highly accurate. Information can be obtained.
(C) Since format information is created from a plurality of forms 11 to 1z and an optimum one is selected from the format information, an abnormality in the creation of format information can be detected easily and accurately.
[0029]
The present invention is not limited to the illustrated embodiment, and various modifications can be made. Examples of such modifications include the following (i) to (iii).
(I) In the format information generation process of FIG. 4, the format information selected by the comparison / selection process of step S4 is registered as it is in step S5, but before this registration, the selected format information is displayed on the display means 57. If the information is displayed on the screen and the operator confirms whether or not it has been correctly created, the format information can be registered correctly.
(Ii) In the format information generation process of FIG. 4, the contents of the forms 11 to 1z, the format generation rules, and the format information created by the format information creation means 41 are not limited to those shown in the figure, but various types It can be arbitrarily changed to fit the form.
(iii) In the format information generating apparatus of FIG. 1, the character recognition unit 41b performs character recognition from the image analysis result, but the character recognition unit 41b may be omitted depending on the read contents of the forms 11 to 1z. In addition, the forms 11 to 1z, such as adding another functional block for improving the function in the control unit 40, or configuring the plurality of storage units 32 and 51 to 55 by one or a plurality of common storage units. The device configuration can be arbitrarily changed according to the type and content of the device.
[0030]
【The invention's effect】
As described above in detail, according to the first, second, and third inventions, the image acquisition process, the format information creation process, and the comparison / selection process are executed to create the format information. A plurality of format information is automatically created from a plurality of forms using a format generation rule, and optimum format information can be selected and output from the plurality of format information. Therefore, not only the burden on the operator can be reduced, but also the format information creation accuracy and creation work efficiency can be significantly improved. Furthermore, since one format information for the form ID is created based on a plurality of forms with the same form ID, printing errors and cutting errors in the form can be absorbed, and highly accurate format information can be obtained. In addition, after creating a plurality of format information, the format information is compared with each other, and the most average format information is selected and used as the format information of the form ID. Can be detected.
According to the fourth invention, when the result of the comparison selection process is a format information generation error, the result is displayed on the screen of the display means. For example, the operator looks at the format information generation error, It is also possible to create format information by selecting an appropriate form.
According to the fifth aspect, since the format information creating means is provided, a plurality of format information can be created easily and accurately using the format generation rule. As the plurality of created format information, the most appropriate format information is selected by the comparison unit, the counting unit, and the selection unit, so that the format information with high accuracy can be created automatically.
[Brief description of the drawings]
FIG. 1 is a schematic functional block diagram of a format information generating apparatus showing an embodiment of the present invention.
FIG. 2 is a diagram illustrating an example of a form input to the format information generation device in FIG. 1;
FIG. 3 is a diagram for explaining a representation format of a position of a reading field FIELD in FIG. 2;
4 is an overall flowchart of format information generation processing using the format information generation apparatus of FIG. 1. FIG.
FIG. 5 is a diagram illustrating an example of a form image IMAGE1 in FIG.
6 is a diagram showing an example of a format generation rule in FIG. 1. FIG.
7 is a diagram illustrating an example of the format information in FIG. 1. FIG.
8 is an explanatory diagram of OK format information COD11 to CODmn in FIG. 4;
FIG. 9 is a diagram showing a comparison result of FIG.
10 is a flowchart of a comparison / selection process of OK format information CODk and CODi in FIG. 9;
11 is a diagram illustrating an example of the majority test of FIG.
FIG. 12 is a diagram illustrating an example of the majority test of FIG.
[Explanation of symbols]
11-1z form
20 Form ID
31 Photoelectric conversion means
32 Image storage means
40 Control unit
41 Format information creation means
41a Image analysis means
41b Character recognition means
41c collation search means
42 Comparison selection means
42a comparison means
42b Counting means
42c selection means
43 I / O control means
51 Format generation rule storage means
52 Format information storage means
53 Margin storage means
54 Comparison result storage means
55 Format information registration means
56 Input operation means
57 Display means
S1 Image acquisition processing
S2 format information creation process
S3 format information storage processing
S4 Comparison selection process
S5 Format information registration process

Claims (1)

帳票識別用の帳票ID、及び文字の記入された読取フィールドを有する帳票上の該文字を、光学的に読み取る際に用いる参照用のフォーマット情報を生成するフォーマット情報生成装置において、In a format information generating apparatus that generates a format ID for reference used when optically reading the text on a form having a form ID for identifying the form and a reading field in which characters are entered.
同一の前記帳票IDが付された同一フォーマットの複数の前記帳票のイメージをそれぞれ取得して複数の帳票イメージを出力するイメージ取得手段と、Image acquisition means for acquiring images of a plurality of forms in the same format each having the same form ID and outputting a plurality of form images;
前記各帳票イメージ中に含まれる線分の位置及び/又は文字の位置を検出し、その検出結果に対し、前記帳票IDに対応して設けられ、前記帳票の読取フィールドの存在位置が規定されているフォーマット生成規則を適用して読取フィールド位置を決定し、1つの前記帳票イメージについて全ての読取フィールドが検出できたときにはOKフォーマット情報として、検出できなかった読取フィールドが1つ以上あるときにはNGフォーマット情報として、前記各帳票毎に出力するフォーマット情報作成手段と、The position of a line segment and / or the position of a character included in each form image is detected, and the detection result is provided corresponding to the form ID and the position of the reading field of the form is defined. The read field position is determined by applying the format generation rule, and when all the read fields can be detected for one form image, the OK format information is obtained. When there is one or more read fields that cannot be detected, the NG format information is obtained. Format information creating means for outputting each form, and
前記フォーマット情報作成手段から出力された前記全てのOKフォーマット情報の各読取フィールド位置を比較し、同じ読取フィールドの位置、大きさを示す情報の差が所定のマージン値以下の同一フォーマット情報と見なせるOKフォーマット情報と、異なるOKフォーマット情報と見なしたOKフォーマット情報とを検出する比較手段と、The read field positions of all the OK format information output from the format information creating means are compared, and the difference between the information indicating the position and size of the same read field can be regarded as the same format information with a predetermined margin value or less. A comparison means for detecting format information and OK format information regarded as different OK format information;
前記比較手段で検出された前記同一フォーマット情報と見なせるOKフォーマット情報の数を計数する計数手段と、Counting means for counting the number of OK format information that can be regarded as the same format information detected by the comparison means;
前記計数手段の計数値の最大のOKフォーマット情報を選択し、これを前記帳票IDのフォーマット情報として出力する選択手段とを、Selecting the maximum OK format information of the count value of the counting means, and outputting the selected format ID format information as the form ID;
備えたことを特徴とするフォーマット情報生成装置。A format information generating apparatus comprising:
JP14771395A 1995-06-14 1995-06-14 Format information generation method and format information generation apparatus Expired - Fee Related JP3732254B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP14771395A JP3732254B2 (en) 1995-06-14 1995-06-14 Format information generation method and format information generation apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14771395A JP3732254B2 (en) 1995-06-14 1995-06-14 Format information generation method and format information generation apparatus

Publications (2)

Publication Number Publication Date
JPH096865A JPH096865A (en) 1997-01-10
JP3732254B2 true JP3732254B2 (en) 2006-01-05

Family

ID=15436528

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14771395A Expired - Fee Related JP3732254B2 (en) 1995-06-14 1995-06-14 Format information generation method and format information generation apparatus

Country Status (1)

Country Link
JP (1) JP3732254B2 (en)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6295485B1 (en) 1999-01-29 2001-09-25 Mobil Oil Corporation Control of lubricant production by a method to predict a base stock's ultimate lubricant performance
US6317654B1 (en) 1999-01-29 2001-11-13 James William Gleeson Control of crude refining by a method to predict lubricant base stock's ultimate lubricant preformance
JP2002024764A (en) * 2000-07-05 2002-01-25 Fujitsu Ltd Handwritten character average pattern generator and method
JP2014002662A (en) * 2012-06-20 2014-01-09 Hitachi Solutions Ltd Form printing system
JP6665498B2 (en) 2015-11-16 2020-03-13 富士ゼロックス株式会社 Information processing apparatus, image processing system and program

Also Published As

Publication number Publication date
JPH096865A (en) 1997-01-10

Similar Documents

Publication Publication Date Title
US11868717B2 (en) Multi-page document recognition in document capture
US6782144B2 (en) Document scanner, system and method
US7668372B2 (en) Method and system for collecting data from a plurality of machine readable documents
JP4996940B2 (en) Form recognition device and program thereof
US20100094888A1 (en) Method and system for acquiring data from machine-readable documents
JP6874729B2 (en) Image processing equipment, image processing methods and programs
WO2019194052A1 (en) Image processing device, image processing method, and storage medium storing program
CN112084748A (en) Text comparison method
EP2168077A1 (en) Information processing apparatus and information processing method
Hamzah et al. Data capturing: Methods, issues and concern
JP3732254B2 (en) Format information generation method and format information generation apparatus
JPH04175966A (en) Document logical structure generating method
JP4983464B2 (en) Form image processing apparatus and form image processing program
WO2019193923A1 (en) Image processing device, image processing method and recording medium
JP3711636B2 (en) Information retrieval apparatus and method
JP4160206B2 (en) Database registration method using character recognition device
JP7111143B2 (en) Image processing device, image processing method and program
JP4356908B2 (en) Automatic financial statement input device
JPH0689365A (en) Document image processor
JP2006252575A (en) Financial statement automatic input apparatus and method therefore
JP4517822B2 (en) Image processing apparatus and program
JP2005165978A (en) Business form ocr program, method and device thereof
JP3673616B2 (en) Gift certificate identification method and apparatus
JPH0689330A (en) Image filing system
KR0183779B1 (en) Bill registering method and apparatus thereof

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20021112

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050902

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051012

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081021

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091021

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees