JP3573945B2 - Format recognition device and character reading device - Google Patents
Format recognition device and character reading device Download PDFInfo
- Publication number
- JP3573945B2 JP3573945B2 JP06180698A JP6180698A JP3573945B2 JP 3573945 B2 JP3573945 B2 JP 3573945B2 JP 06180698 A JP06180698 A JP 06180698A JP 6180698 A JP6180698 A JP 6180698A JP 3573945 B2 JP3573945 B2 JP 3573945B2
- Authority
- JP
- Japan
- Prior art keywords
- format
- character
- pattern
- format recognition
- recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Character Input (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、帳票のフォーマットの種別を認識するフォーマット認識装置と、帳票フォーマットの種別を認識しその認識結果に応じた文字読取りを行う文字読取り装置とに関する。
【0002】
【従来の技術】
帳票には、文字記入領域の数、形状、大きさおよび位置等(以下、フォーマットという。)が異なる多種類の帳票がある。帳票から文字を読み取る場合、この帳票がいかなるフォーマットの帳票かを認識して、そのフォーマットに合わせて文字を読み取る方が好ましい。そうした方が、文字の読み取りを正確かつ高速に行えるからである。
【0003】
帳票のフォーマットを認識するための従来技術の一例として、例えば文献1(「文字認識概論」、橋本 新一郎 編著、オーム社、昭和57年3月20日、p.203〜206)に開示された技術がある。
【0004】
この文献1に開示された技術では、図16に示したように、帳票11の一部分に、帳票種別番号13(図では、0123)を印刷している。一方、文字読み取り装置は、帳票から文字を読み取るために必要な読み取り制御データを、多種類の帳票毎に、予め記憶している。ここで、読み取り制御データとは、帳票の文字記入領域それぞれの位置情報や、帳票に書かれている文字種や字体に関する情報等である。
【0005】
そして、文字読み取り装置は、帳票に印刷されている帳票種別番号を読み取るために文字認識をする。さらに、該認識した番号により、該帳票に対応する読み取り制御データを読み出す。そして、文字読み取り装置は、この制御データに基づいて、帳票のイメージデータから、文字の読み取りすなわち文字認識を行う。
【0006】
【発明が解決しようとする課題】
しかしながら、帳票の中には帳票識別番号が印刷されていないものもある。例えば、振り込み依頼書などのような私製の帳票や、市販の一般伝票である。すると、このような帳票の場合、従来の文字読み取り装置では、読み取り制御データを利用することができないという問題点がある。
【0007】
従って、帳票種別番号が印刷されていない帳票でもそのフォーマットを認識できるフォーマット認識装置の実現が望まれる。
【0008】
また、帳票種別番号が印刷されていない帳票でもそのフォーマットを認識でき、かつ、このフォーマット認識結果を利用して帳票から文字を読み取ることができる文字読み取り装置が望まれる。
【0009】
【課題を解決するための手段】
(1)そこで、この出願のフォーマット認識装置の第1の発明によれば、帳票のフォーマットを認識する装置において、第1のフォーマット認識系と第2のフォーマット認識系とを具える。ただし、第1のフォーマット認識系は、認識対象の帳票の全体の特徴を抽出し、この特徴を既存の帳票の全体の特徴データと照合して、認識対象の帳票のフォーマットを認識する系である。なお、第1のフォーマット認識系を、認識対象である帳票全体の罫線パタンについての特徴を抽出する認識系とするのが良い。かつ、既存の帳票の全体の特徴データとして既存の帳票の罫線パタンによる特徴データを用いる認識系とするのが良い。なぜなら、一般に、帳票は罫線を含む。さらに、罫線は帳票の構造を特徴づける顕著なパラメータである。従って、罫線パタンに着目して第1段階のフォーマット認識を行うと、かなりの精度で帳票のフォーマットを認識できるからである。また、第2のフォーマット認識系は、認識対象の帳票の一部の特徴を抽出し、この特徴を既存の帳票の一部(以下、「特徴的な一部分」ともいう)の特徴データと照合して、認識対象の帳票のフォーマットを認識する系である。
【0010】
このフォーマット認識装置の第1の発明によれば、帳票の全体(第2のフォーマット認識系が動作する場合は帳票の全体および帳票の一部)を、パタンマッチングに用いる。そして、認識対象の帳票のフォーマットが、既存のいずれの帳票のフォーマットに該当するかを、パタンマッチング手法により判断する。そのため、帳票種別番号が印刷されていない帳票であっても、その帳票のフォーマットを認識することができる。
【0011】
また、このフォーマット認識装置の第1の発明の場合、第2のフォーマット認識系を具えているので、以下の様な独特の作用が得られる。
【0012】
既存の各種の帳票の中には、例えば、一部分のみが異なるような帳票が在る。例えば図1(A)に示した帳票15と、図1(B)に示した帳票17との関係のように、罫線L1が在るか無いかという点を除いて罫線の配置が同じで、かつ、それぞれが異なる特徴的な図形(図の例では、帳票15は五角形の図形、帳票17は星型の図形)を有した帳票が在る。また、図2(A)に示した帳票21と、図2(B)に示した帳票23との関係のように、罫線L1の位置のみが異なりそれ以外の罫線の配置が同一であるような帳票が在る。この種の帳票を識別する場合で、例えば、この帳票(認識対象の帳票)に汚れがあったり、折れ目があったり、また、罫線がかすれていたりした場合等は、この帳票全体から抽出されるパタンは、例えば、帳票15と帳票17との中間のような罫線パタン、帳票21と帳票23との中間のような罫線パタンになり易い。すると、この罫線パタンを第1のフォーマット認識系のみを用いて照合した場合、帳票15(21)のフォーマットであるという第1の認識結果および帳票17(23)のフォーマットであるという第2の認識結果(もちろん3以上の結果があっても良い。)が、それぞれ、第1のフォーマット認識系に予め設定されている判断基準を満足してしまって、認識結果とされてしまうことがある。すなわち、複数の認識結果が出力される場合がある。しかも、真の認識結果でない方の結果が、第1位のフォーマット認識結果となってしまうことがある。
【0013】
すると、このフォーマット認識結果を用いて、例えば文字読み取りのための読み取り制御データを読み出した場合、適正な読み取り制御データでない場合も生じる。そして、そのような場合は、文字読み取りを所望の通りに行えない。
【0014】
この様なとき、この出願のフォーマット認識装置の第1の発明では、第2のフォーマット認識系を用いて帳票の特徴的な一部分に着目した第2のフォーマット識別が行えるので、正確なフォーマット認識が行える。
【0015】
なお、このフォーマット認識装置の第1の発明を実施するに当たり、第2のフォーマット認識系は、第1のフォーマット認識系が所定個数以上の候補を出力した場合に動作する認識系とするのが好ましい。ただし、ここでいう所定個数とは1または2以上の任意の数である。
【0016】
こうすれば、第1のフォーマット認識系の結果をさらに補完できると考えられる。また、第1のフォーマット認識系で1つも候補が得られない場合は、第2のフォーマット認識系を動作させることなく、その旨を例えばオペレータに通報する等した方が、認識処理を効率的に実行できると考えられるからである。
【0017】
または、前記第2のフォーマット認識を、第1のフォーマット認識系が所定個数未満の候補を出力した場合は、認識対称の帳票の一部の特徴と、既存の帳票の全ての帳票毎の一部の特徴データとの照合をして、認識対象の帳票のフォーマットを認識し、第1のフォーマット認識系が所定個数以上の候補を出力した場合は、該出力された帳票毎の一部の特徴データと認識対称の帳票の一部の特徴との照合をして、認識対象の帳票のフォーマットを認識する認識系としても良い。こうした場合は、第1のフォーマット認識系が候補を挙げた場合、挙げない場合それぞれで、第2のフォーマット認識系による効果的なフォーマット認識が行える。なお、このようにする場合は、第2のフォーマット認識系による照合等を行う前に、候補としての既存の全ての帳票それぞれの第1のフォーマット認識結果として、第1のフォーマット認識系での閾値(候補を選択する閾値)以上の所定値を強制的に設定するのが良い。なぜなら、後に詳細は説明するが、第2のフォーマット認識系での候補帳票の並べ替えのための初期設定を確保するためである。
【0018】
また、このフォーマット認識装置の第1の発明を実施するに当たり、第1および第2のフォーマット認識系でそれぞれ用いる特徴データを、辞書に予め用意しておくのが好適である。こうすれば、例えば、迅速な処理が可能となるからである。そこで、この発明を実施にするに当たり、帳票の全体の特徴データを保持している第1の辞書と、既存の帳票の一部の特徴を保持している第2の辞書とをフォーマット認識装置に設けて置くのが好ましい。
【0019】
また、このフォーマット認識装置の第1の発明を実施するに当たり、第2のフォーマット認識系は、既存の帳票上の、特徴データを得た領域(すなわち特徴的な一部分)の位置情報を予め保持していて、かつ、認識対象の帳票の、該位置情報で特定される一部から、特徴を抽出する認識系であるのが好ましい。こうすると、認識対象の帳票の、既存の帳票の特徴的な一部分に対応する領域を、容易に特定できる。もちろん、既存の帳票を複数用意する場合(典型的にはこのような場合がほとんど)、各既存の帳票毎の、特徴データを得た領域の位置情報を第2のフォーマット認識系はそれぞれ保持するのが良い。また、1つの帳票上に特徴的な一部分を複数箇所設定する場合は、これら複数箇所それぞれの位置情報を保持するのが良い。なお、このような位置情報は辞書(例えば上述の第2の辞書)に保持しておくのが好ましい。
【0020】
また、帳票の特徴的な一部分をどのようなものとするかは、任意である。しかし、この帳票の特徴的な一部分を、帳票の所定箇所(具体的には1箇所または複数箇所)に存在する特徴的な1又は複数の図形(例えば、ロゴ、任意のマーク、文字じパタン等。図1参照)とするのが良い。帳票には例えば会社のロゴ等が記載されていることが多い。このような特徴的な図形に着目すると、帳票の種別区分けがし易いと考えられるからである。
【0021】
または、帳票の特徴的な一部分を、罫線を有する帳票の場合の、特徴的な罫線が存在する1又は複数箇所(例えば、図2(A)、(B)中の罫線L1が存在する箇所)とするのが好ましい。帳票は罫線を含むことが多い。しかも、各帳票はそれぞれ特徴的な罫線部分を含むことが多い。この特徴的な罫線部分に着目すると、帳票の種別区分けがし易いと考えられるからである。
【0022】
または、帳票の特徴的な一部分を、帳票の所定箇所(具体的には1箇所または複数箇所)に存在する特徴的な1又は複数の文字(例えば図11(A)、(B)中の「○電気」や「△△電気」)とするのが好ましい。帳票に記されている会社名等は、帳票の種別区分けがし易いと考えられるからである。
【0023】
なお、帳票の特徴的な一部分を帳票上の文字とする場合は、第2のフォーマット認識系を以下のような認識系とするのが好ましい。
【0024】
すなわち、既存の帳票の特徴データとして前記特徴的な文字の文字名を予め保持している構成とする。然も、この第2のフォーマット認識系は、認識対象の帳票の、既存の帳票の特徴的な文字が書かれていた領域に対応する領域から、文字を切り出す(もちろん、この領域に文字が存在しない場合もある。)。そして、この切り出した文字を文字認識して文字名を得る。そして、既存の帳票の特徴データとして予め保持してある文字名と照合して、フォーマットを認識する構成とする。
【0025】
また、場合によっては、従来技術で説明した帳票種別番号を、帳票の特徴的な一部分として用いても良い。ただし、この場合は、この帳票種別番号を文字認識するのではなくパタンマッチング用の特徴的なパタンとして扱って、本発明を適用する。
【0026】
また、帳票の特徴的な一部分を1つの帳票上に複数箇所すなわち2箇所以上設定する場合があっても良い。こうすると、照合箇所が増えるので、その分、フォーマット認識精度が向上する。
【0027】
また、このフォーマット認識装置の第1の発明を実施するに当たり、第1のフォーマット認識系が抽出する特徴および第1のフォーマット認識系が照合に用いる特徴データは、両者が同じ方式で帳票全体から抽出されれば、特に限定されない。しかし、前述の通り、第1のフォーマット認識系を、帳票全体の罫線パタンについての特徴を抽出する認識系とするのが良い。かつ、既存の帳票の全体の特徴データとして既存の帳票の罫線パタンによる特徴データを用いる認識系とするのが良い。なぜなら、一般に、帳票は罫線を含む。さらに、罫線は帳票の構造を特徴づける顕著なパラメータである。従って、罫線パタンに着目して第1段階のフォーマット認識を行うと、かなりの精度で帳票のフォーマットを認識できるからである。
【0028】
なお、帳票の罫線パタンに着目して帳票のフォーマットを認識しようとする装置は、この出願人に係る特開平9−259221号に開示されている。
【0029】
また、このフォーマット認識装置の第1の発明を実施するに当たり、第1のフォーマット認識系が出力する候補帳票および第2のフォーマット認識系が出力する候補帳票の一方又は双方を表示する表示部と、該表示部に表示された帳票から1若しくは複数の帳票を選択するための指示、又は、該当なしという指示を入力する入力部とをさらに具えた構成とするのが好適である。
【0030】
この様な表示部および入力部を具えた構成とすると、フォーマット認識装置が自動的に認識したフォーマットの正否をオペレータは確認することができる。そのため、より精度良く帳票フォーマットを認識できる。
【0031】
また、このフォーマット認識装置の第1の発明を実施するに当たり、照合のためのデータを特徴マトリクスとするのが良い。特徴マトリクスを用いると、パタンの特徴を良好に表せ、しかも、効果的な照合(パタンマッチング)を行えるからである。なお、特徴マトリクスをどのような方法で作成するかは特に限定されない。ただし、請求項16〜18で主張するような特徴マトリクスの作成方法は、この発明の目的から好ましい。
【0032】
また、このフォーマット認識装置の第1の発明では、帳票の全体の特徴の抽出の仕方が互いに異なる2以上のフォーマット認識系により第1のフォーマット認識系を構成する場合があっても良い。また、帳票の一部の特徴の抽出の仕方が互いに異なる2以上のフォーマット認識系により第2のフォーマット認識系を構成する場合があっても良い。この第2のフォーマット認識系を複数の認識系で構成する1つの例として、例えば、帳票の一部分に存在する特徴的な図形に着目したフォーマット認識系、帳票の一部の罫線に着目したフォーマット認識系および帳票上の特徴的な文字に着目したフォーマット認識系のうちの少なくとも2つの認識系で構成する例を挙げることができる。
【0033】
(2)また、この出願のフォーマット認識装置の第2の発明によれば、帳票のフォーマットを認識する装置において、認識対象の帳票の一部の特徴を抽出し、該特徴を既存の帳票の一部(特徴的な一部分)の特徴データと照合して、前記認識対象の帳票のフォーマットを認識するフォーマット認識系を具えたことを特徴とする。
【0034】
このフォーマット認識装置の第2の発明によれば、帳票の一部を、パタンマッチングに用いる。そして、認識対象の帳票のフォーマットが、既存のいずれの帳票のフォーマットに該当するかを、パターンマッチング手法により判断する。そのため、帳票種別番号が印刷されていない帳票であっても、その帳票のフォーマットを認識することができる。然も、帳票の特徴的な一部分のみに着目するので、フォーマット認識処理の高速化が図れる。
【0035】
なお、このフォーマット認識装置の第2の発明を実施するに当たり、そのフォーマット認識系の構成を、フォーマット認識装置の第1の発明の第2のフォーマット認識系について上記のごとく説明した好適な構成例と同様な構成とするのが好ましい。
【0036】
また、この第2の発明の場合も、帳票の一部の特徴の抽出の仕方が互いに異なる2以上のフォーマット認識系によりフォーマット認識系を構成する場合があっても良い。
【0037】
(3)また、この出願の文字読み取り装置の第1の発明によれば、上述の第1の発明のフォーマット認識装置と、前記既存の帳票ごとの該帳票から文字を読み取るために必要な読み取り制御データを保持していて、前記フォーマット認識装置の認識結果によって1又は複数の制御データを出力する読み取り制御データメモリと、該読み取り制御データメモリから出力される読み取り制御データに基づいて前記認識対象の帳票から文字を認識する文字認識装置とを具えることを特徴とする。
【0038】
この文字読み取り装置によれば、認識対象の帳票に適切な制御データに基づいて、文字認識が行える。そのため、精度良くかつ効率良く文字認識が行える。
【0039】
なお、この文字読み取り装置の第1の発明を実施するに当たり、前記フォーマット認識装置の第2のフォーマット認識系が、帳票の一部の文字に着目してフォーマット認識をする認識系である場合、文字切り出しや文字認識で使用される構成成分を、第2のフォーマット認識系および文字認識系で兼用する構成とするのが好適である。
【0040】
すなわち、認識対象の帳票の画像データから文字パタンを切り出すための文字切り出し部、該切り出した文字を格納する文字パタンメモリ、文字認識辞書、および、切り出した文字パタンを前記文字認識辞書中のデータと照合して文字を認識する文字認識部として、第2のフォーマット認識系および文字認識系で兼用される、文字切り出し部、文字パタンメモリ、文字認識辞書および文字認識部を具える構成とするのが好適である。こうすると、こうしない場合に比べ、文字読み取り装置のハードウエア規模およびソフトウエア規模を削減できる等の効果が得られる。
【0041】
(4)また、この出願の文字読み取り装置の第2の発明によれば、上述の第2の発明のフォーマット認識装置と、前記既存の帳票ごとの該帳票から文字を読み取るために必要な読み取り制御データを保持していて、前記フォーマット認識装置の認識結果によって1又は複数の制御データを出力する読み取り制御データメモリと、該読み取り制御データメモリから出力される読み取り制御データに基づいて前記認識対象の帳票から文字を認識する文字認識装置とを具えることを特徴とする。
【0042】
この文字読み取り装置によれば、認識対象の帳票に適切な制御データに基づいて、文字認識が行える。そのため、精度良くかつ効率良く文字認識が行える。
【0043】
【発明の実施の形態】
以下、図面を参照してこの発明のフォーマット認識装置および文字読み取り装置の実施の形態について説明する。なお、説明に用いる各図はこの発明を理解することが出来る程度に各構成成分を概略的に示してあるにすぎない。また、各図において同様な構成成分については同一の番号を付して示し、その重複する説明を省略することもある。
【0044】
1.フォーマット認識装置および文字読み取り装置の第1の発明
1−1.第1の発明の概略説明
はじめに、第1の発明の概略について説明する。帳票には多種類の帳票がある。帳票のいくつかの例を、図1、図2、図11を参照して説明する。
【0045】
図1(A)および(B)は、フォーマットが少しずつ異なる帳票群の第1の例として既存の帳票15,17を示した図である。図1(C)はフォーマットが未知である認識対象の帳票19の例を示した図である。いずれの帳票も帳票種別番号が印刷されていない例である。認識対象の帳票19のフォーマットは帳票15のフォーマットであると認識されれば、正解となる例である。
【0046】
帳票15と帳票17とは、罫線L1が在るか無いかという点と、帳票の右上隅に互いに異なる特徴的な図形が印刷されている点とを除いて同じフォーマットとなっている。
【0047】
また、図2(A)および(B)は、フォーマットが少しずつ異なる帳票群の第2の例として既存の帳票21,23を示した図である。図2(C)はフォーマットが未知である認識対象の帳票25の例を示した図である。いずれの帳票も帳票種別番号が印刷されていない例である。認識対象の帳票25のフォーマットは帳票21のフォーマットであると認識されれば、正解となる例である。
【0048】
帳票21と帳票23とは、罫線L1の位置が異なる点を除いて同じフォーマットとなっている。
【0049】
また、図11(A)および(B)は、フォーマットが少しずつ異なる帳票群の第3の例として既存の帳票31,33を示した図である。図11(C)はフォーマットが未知である認識対象の帳票35の例を示した図である。いずれの帳票も帳票種別番号が印刷されていない例である。認識対象の帳票35のフォーマットは帳票31のフォーマットであると認識されれば、正解となる例である。
【0050】
帳票31と帳票33とは、罫線L1が在るか無いかという点と、帳票の右上隅に互いに異なる特徴的な文字が印刷されている点とを除いて同じフォーマットとなっている。すなわち、帳票31は、その左上隅に罫線L1があり、かつ、帳票の右上隅に「○電気」という特徴的な文字が印刷されている。帳票33は、罫線L1がなく、かつ、その右上隅に「△△電気」という特徴的な文字が印刷されている。
【0051】
図1(A)〜図2(C)、図11(A)〜(C)のいずれの帳票も、紙面aに、所定事項が記載される領域を区分する罫線が印刷された帳票である。そして、使用された帳票(図1(C)、図2(C)、図11(C))には、書き込まれた文字の属性を表す文字(図では01、02)と、所定事項を伝達するための文字(図では、ABC、あいう、DEF、かきくけこ、アイウエオカキクケコ)とが記載されている。
【0052】
ここで、図1(A)〜図1(C)に示した帳票15、17、19では、五角形または星形の図形を含む所定領域Tが、帳票毎の特徴的な一部分(個別フォーマット認識領域ともいう)といえる。なお、この帳票15、19の場合、罫線L1も特徴的な一部分といえるが、ここでは五角形の図形の部分を特徴的な一部分と考える。
【0053】
また、図2(A)〜図2(C)に示した帳票21、23、25では、罫線の1本である罫線L1が帳票の右上隅にあるか左上隅にあるかという点が特徴といえるので、この罫線L1を含む領域Tが、帳票毎の特徴的な一部分(個別フォーマット認識領域)といえる。
【0054】
また、図11(A)〜(C)に示した帳票31,33,35では、○電気又は△△電気を含む所定領域Tが、帳票毎の特徴的な一部分(個別フォーマット認識領域)といえる。なお、この帳票31〜35の場合、罫線L1も特徴的な部分といえるが、ここでは○電気又は△△電気の部分を特徴的な部分と考える。
【0055】
もちろん、この特徴的な図形、特徴的な罫線、または特徴的な文字とは、上記の例に限られず、任意の特徴的な図形(例えば矩形、円形、楕円形など)、任意の特徴的な罫線または任意の特徴的な文字とできる。また、領域Tは1つの帳票に複数箇所の場合でも良い。
【0056】
ところで、図1(C)に示した認識対象の帳票19は、帳票種別番号が印刷されていないが、この帳票19の罫線パタンは、図1(A)に示した帳票15と同じである。また、図2(C)に示した認識対象の帳票25は、帳票種別番号が印刷されていないが、この帳票25の罫線パタンは、図2(A)に示した帳票21と同じである。また、図11(C)に示した認識対象の帳票35は、帳票種別番号が印刷されていないが、この帳票35の罫線パタンは、図11(A)に示した帳票31と同じである。そのため、帳票の全体から抽出したパタンを予め辞書中に用意したパタンと比較する方法、例えば、この出願の出願人に係る特開平9−259221号公報に開示されている、帳票全体から抽出した罫線パタンを予め用意した辞書と照合する方法により、帳票19は帳票15と同じフォーマットの帳票であると認識でき、帳票25は帳票21と同じフォーマットの帳票であると認識でき、帳票35は帳票31と同じフォーマットの帳票であると認識できる。
【0057】
しかし、帳票19(帳票25、帳票35)に、汚れがあったり、折り目があったり、また、罫線がかすれていたりした場合等は、この帳票全体から抽出されるパタンは、例えば、帳票15と帳票17との中間のような罫線パタン(帳票21(帳票31)と帳票23(帳票33)との中間のような罫線パタン)になり易い。すると、両者の識別はしずらくなる。
【0058】
そこで、この出願の第1の発明では、帳票全体のパタンを第1の辞書中の複数の帳票毎のパタンと照合して認識対象の帳票のフォーマットを認識する第1のステップと、複数の帳票毎の特徴的な一部分に対応するパタンを、認識対象の帳票からそれぞれ抽出して該パタンを第2の辞書中のパタンと照合して認識対象の帳票のフォーマットを認識する第2のステップとを実施するフォーマット認識装置と、該認識装置を含む文字読み取り装置とを提案している。以下、説明する。
【0059】
1−2.第1の実施の形態の装置40の構成説明
先ず、図1を用いて説明した帳票群のフォーマットを認識し、そして文字読み取りをするために好適な文字読み取り装置の実施の形態(第1の実施の形態)について説明する。
【0060】
図3は、第1の実施の形態の文字読み取り装置40の構成を概略的に示す機能ブロック図である。この文字読み取り装置40は、第1の実施の形態のフォーマット認識装置50と、読み取り制御データメモリ60と、文字認識系70と、制御部80と、表示部91と、入力部93とを具えている。
【0061】
また、この文字読み取り装置40には、帳票(図示せず)を光学的に読み取る手段としての例えばスキャナ95と、該スキャナ95が読んだ帳票のイメージデータを格納する帳票イメージメモリ97とを、接続してある。以下、各構成成分50〜93について詳細に説明する。
【0062】
フォーマット認識装置50は、第1の辞書51と、第2の辞書53と、第1のフォーマット認識系55と、第2のフォーマット認識系57と、制御部80(文字読み取り装置40の制御部でもある)とで構成してある。
【0063】
第1の辞書51(以下、フォーマット認識辞書51ともいう)は、フォーマットが異なる既存の複数の帳票それぞれの全体からそれぞれ抽出したパタンのデータを特徴データとして予め保持している。
【0064】
フォーマットが異なる既存の複数の帳票は、予め用意した任意の帳票とする。例えば、図1(A)に示した帳票15、図1(B)に示した帳票17を含む各種の帳票とすることが出来る。
【0065】
また、この第1の辞書51は、パタンのデータとして、各既存の帳票それぞれの全体からそれぞれ抽出した罫線パタンのデータを保持している。さらに、この第1の辞書51は、各帳票の種別を示す情報も保持している。
【0066】
第1の辞書51に保持される罫線パタンのデータは、読み取り装置40の仕様に応じた任意好適な形態のものとできる。この実施の形態では、罫線パタンを複数の領域に分割して得られる各領域の特徴で表される、特徴マトリクスとしてある。各分割領域の特徴をいかなるものとするかも、任意である。例えば、罫線パタンを予め複数の異なる方向に走査して方向パタンを抽出し、そして、この罫線パタンをM×Nの複数領域に分割して、各分割領域の方向パタン数を各領域の特徴とする方法(例えば特開昭57−23185)が挙げられる。
【0067】
第2の辞書53(以下、個別フォーマット認識辞書53ともいう)は、フォーマットが異なる既存の複数の帳票毎の特徴的な一部分からそれぞれ抽出したパタンのデータを特徴データとして予め保持している。図1の例でいえば、帳票15については五角形のパタンのデータ、帳票17については星型のパタンのデータを保持している。
【0068】
これらパタンのデータは任意好適な形態で第2の辞書53に格納できる。この実施の形態の場合は、第2の辞書53に格納するパタンのデータとして、帳票上に特徴的な一部分をいくつ設定したかという個数(なお図1(A)、(B)の場合はそれぞれ1)、特徴的な一部分の位置情報、大きさ、帳票の種別を示す情報(これらを以下、個別フォーマット認識情報という。)、およびパタンの特徴マトリクスを保持している。
【0069】
第1のフォーマット認識系55(以下、単にフォーマット認識系ともいう)は、認識対象の帳票のイメージデータから該帳票全体の特徴を抽出し、該抽出した特徴を前記第1の辞書中の特徴データと照合して、前記認識対象の帳票のフォーマットを認識する。具体的には、この場合は、認識対象の帳票から抽出したパタンの特徴マトリクスと、第1の辞書51中の特徴マトリクスとを照合して、認識対象の帳票のフォーマットを認識する。
【0070】
なお、この実施の形態の第1のフォーマット認識系55は、認識対象の帳票全体のパタンとして、罫線パタンを抽出する。そのため、この実施の形態の第1のフォーマット認識系55は、認識対象の帳票から帳票全体の罫線パタンを抽出する罫線抽出部55aと、抽出された罫線パタンを格納する罫線パタンメモリ55bと、抽出した罫線パタンを第1の辞書51と照合して認識対象の帳票のフォーマットがいかなるものかを認識するフォーマット認識部55cとで構成してある。このような第1のフォーマット認識系55の詳細は、後の動作説明にて説明する。このような第1のフォーマット認識系55は、例えば、この出願に係る特開平9−259221号に開示されているフォーマット認識系により構成できる。
【0071】
第2のフォーマット認識系57(以下、個別フォーマット認識系57ともいう)は、第1のフォーマット認識系55が認識結果として所定個数以上(例えばここでは1以上の例を考える)の候補帳票(以下、候補帳票を種別とかフォーマット候補ともいう)を示した場合に動作する。そして、認識対象の帳票の一部の特徴を抽出する。この実施の形態では、第1のフォーマット認識系が挙げた前記1以上の候補帳票毎の前記特徴的な一部分に相当するパタンの特徴を抽出し、該抽出した特徴を前記第2の辞書中の特徴データと照合して、前記認識対象の帳票のフォーマットを認識する。
【0072】
この実施の形態の第2のフォーマット認識系57は、認識対象の帳票のイメージデータから既存の帳票の特徴的な一部分に対応するパタンを切り出す切り出し部57a(以下、部分パタン切り出し部57aという)と、該切り出した部分パタンを格納するメモリ57b(以下、個別フォーマット認識パタンメモリ57bともいう)と、該切り出したパタンのデータを第2の辞書53中のパタンのデータと照合して、認識対象の帳票のフォーマットがいかなるフォーマットかを認識する認識部57c(以下、個別フォーマット認識部57cという)とで構成してある。
【0073】
図4は、この第2のフォーマット認識系57の、特に個別フォーマット認識部57cの具体的な構成例を説明する機能ブロック図である。もちろん、1例であり他の構成でも良い。
【0074】
この図4の場合の個別フォーマット認識部57cは、線幅算出部101と、枠検出部103と、サブパタン抽出部105と、特徴マトリクス作成部107と、照合部109とで構成してある。各構成成分101〜107の詳細は、後の動作説明の項で説明するが、簡単にいえば次の通りである。
【0075】
線幅算出部101は、認識対象の帳票から部分パタン切り出し部57aが切り出したパタンの、すなわち個別フォーマット認識パタンメモリ57bに格納してあるパタンの、線幅を算出する。
【0076】
枠検出部103は、認識対象の帳票から部分パタン切り出し部57aが切り出したパタンに外接する枠(図形枠)を、検出する。
【0077】
サブパタン抽出部105は、認識対象の帳票から部分パタン切り出し部57aが切り出したパタンを、複数の方向に走査して、各走査方向毎にサブパタンを抽出する。この場合のサブパタン抽出部105は、水平方向サブパタン(HSP)を抽出するHSP抽出部105aと、垂直方向サブパタン(VSP)を抽出するVSP抽出部105bと、左斜めサブパタン(LSP)を抽出するLSP抽出部105cと、右斜めサブパタン(RSP)を抽出するRSP抽出部105dと、各サブパタンを格納するためのHSPメモリ105e、VSPメモリ105f、LSPメモリ105gおよびRSPメモリ105hとで構成してある。
【0078】
特徴マトリクス作成部107は、水平、垂直、左斜めおよび右斜めの各走査方向毎に、サブパタンから特徴を抽出し、各サブパタンの特徴から特徴マトリクスを作成する。
【0079】
照合部109は、特徴マトリクス作成部107が作成した特徴マトリクスと、個別フォーマット認識辞書53に格納してある各標準帳票の特徴マトリクスとを用いて照合を行い、その結果に基づいて認識対象の帳票と照合に用いた各標準帳票との確信度、距離を出力する。
【0080】
読み取り制御データメモリ60は、前記複数の帳票ごとの、該帳票から文字を読み取るために必要な読み取り制御データをそれぞれ格納している。読み取り制御データとして、例えば、文字パタンの切出しに関わるデータと、文字パタンの認識に関わるデータとを記憶させる。
【0081】
文字パタンの切出しに関わるデータとしては、例えば帳票の紙面a上に存在する文字行の位置、帳票紙面a上に存在するフィールドの位置及び個数、帳票紙面a上に存在する文字のピッチ及び個数を挙げることができる。また、文字パタンの認識に関わるデータとしては、例えば帳票紙面a上に記載される文字の字種及び字体を挙げることができる。もちろんこれらに限られない。
【0082】
この読み取り制御データメモリ60は、フォーマット認識装置40から出力される認識結果に応じた1又は複数のフォーマットについての読み取り制御データを、出力する。この出力された読み取り制御データは、この例の場合は、制御部80を介して文字認識系70に入力される。
【0083】
文字認識系70は、読み取り制御データメモリ60から出力される読み取り制御データに基づいて認識対象の帳票から文字を認識する。この文字認識系70は、任意好適な構成とすることができる。この実施の形態では、文字認識系70を、文字切り出し部70aと、文字パタンメモリ70bと、文字認識辞書70cと、文字認識部70dとで構成してある。
【0084】
文字切り出し部70aは、帳票イメージデータから文字パタンを切り出す。文字パタンメモリ70bは、文字切り出し部70aが切り出した文字パタンを格納する。文字認識辞書70cは、文字の辞書データを保持している。文字認識部70dは、切り出された文字パタンから特徴を抽出し、この特徴を文字認識辞書70c中のデータと照合して、該照合結果に基づいて文字パタンを認識する。
【0085】
このような文字認識系は、例えば、この出願に係る特開平9−259221号に開示されている文字認識系により構成できる(詳細は後の動作説明にて説明する)。
【0086】
制御部80は、第1のフォーマット認識系55の各構成成分55a〜55cと、第2のフォーマット認識系57の各構成成分57a〜57cと、読み取り制御データメモリ60と、文字認識系70の各構成成分70a〜70dと、表示部91と、入力部93と、スキャナ95と、帳票イメージメモリ97とをそれぞれ制御する。
【0087】
表示部91は、文字読み取り装置40とオペレータとの情報授受のための表示をする。この表示部91はCRT等、任意好適な表示装置で構成できる。この表示部91は、第1のフォーマット認識系55が出力する候補帳票および第2のフォーマット認識系57が出力する候補帳票の一方又は双方を表示する表示部としても利用される。なお、複数の候補帳票(フォーマット候補)は、一覧の状態で表示しても良いし、一部ずつ分けて表示しても良い。
【0088】
入力部93は、オペレータからの種々の指示を、文字読み取り装置に入力する。この入力部93は、キーボード、マウス等任意好適な装置で構成できる。この入力部93は、第2のフォーマット認識系57が表示部91に複数のフォーマット候補を表示した際は、該表示部91に表示された複数の帳票から1若しくは複数の帳票を選択するための指示、又は、該当なしという指示を入力する入力部としても利用される。
【0089】
1−3.第1の実施の形態の装置40の動作説明
(全体的な動作の概略説明)
先ず、文字読み取り装置40の動作であって、全体的な動作について説明する。図5はこの実施の形態の文字読み取り装置40の全体的な動作の流れを示す図である。
【0090】
まずスキャナ95により、認識対象の帳票19のイメージデータを得る。そのため、スキャナ95は、帳票19の紙面aを光学的に走査して、量子化された電気信号例えば白黒2値の電気信号から成る帳票イメージデータを生成し、このデータを帳票イメージメモリ97に格納する。ここでは線描画素を黒ビットで、背景画素を白ビットで表す。なお、線描画素とは、帳票19の紙面a内に在る線を表す画素のことであり、具体的にはこの場合は黒ビットが所定数連なる部分のことである。また背景画素は帳票19の紙面aの地の部分(線の背景となる部分)を表す画素である。スキャナ95にセットした帳票19を押さえる押え面は帳票19の紙面aの地と同様に背景画素に変換される色例えば白色となっており、従ってここでは押え面も白ビットで表わされる。
【0091】
なお、帳票を押さえる押え面を帳票19の紙面a内に在る線と同様に黒画素に変換される色例えば黒色としても良い。
【0092】
帳票イメージメモリ97に帳票イメージデータが格納されると、制御部80は第1のフォーマット認識系55の罫線抽出部55aを起動する(図5の開始)。
【0093】
起動された罫線抽出部55aは、帳票イメージメモリ97に格納されている帳票イメージデータを走査して、罫線パタンを抽出し(詳細は後述する)、抽出した罫線パタンを罫線パタンメモリ55bに格納する(図5のS1)。
【0094】
罫線抽出部55aが罫線パタンの抽出を終了すると、制御部80はフォーマット認識部55cを起動する。
【0095】
起動されたフォーマット認識部55cは、罫線パタンメモリ55bに格納されている罫線パタンを、フォーマット認識辞書51に格納されている帳票フォーマットの辞書データと照合する(図5のS2)。該照合の結果、所定個数以上(ここでは例えば1以上)の候補帳票帳票があった場合は(図5のS3)、ステップS4以降の処理(詳細は後述する)をする。候補帳票が1つも無かった場合は、その旨を、制御部80に出力する(S21)。この場合制御部80は、例えばリジェクト処理をする。
【0096】
一方、第1のフォーマット認識系55での認識において、1以上の候補帳票が出力された場合は、制御部80は第2のフォーマット認識系57を起動する。そして、後に説明するように、帳票の一部に着目した照合をして認識対象の帳票のフォーマットを認識する。
【0097】
ただし、第1のフォーマット認識系55での認識において1以上の候補帳票が示された場合であっても、これら候補それぞれに対応した個別フォーマット認識情報が個別フォーマット認識辞書53にない場合は、第1のフォーマット認識系55で得た認識結果を制御部80に出力する。なお、個別フォーマット認識辞書53に格納するデータとして、フォーマット認識辞書51に格納してある標準帳票のデータを少なくとも格納しておけば、上記複数の帳票種別に対応した個別フォーマット認識情報が個別フォーマット認識辞書53から得られるので好ましい。
【0098】
第1のフォーマット認識系55が挙げた候補帳票の全部又は一部それぞれに対応した個別フォーマット認識情報が個別フォーマット認識辞書53にあった場合は、制御部80は、認識対象の帳票のイメージデータから各帳票毎の特徴的な一部分に対応する部分を切り出すための位置情報を、個別フォーマット認識辞書53からそれぞれ得る(図5のS5)。すなわち、認識対象の帳票19に対して、例えば図1(A)の帳票15および図1(B)の帳票17がフォーマット候補となっている場合であれば、帳票15、17各々の特徴的な一部分Tに対応する部分を認識対象の帳票19のイメージデータから切り出すための位置情報を、個別フォーマット認識辞書53から制御部80は得る。そしてこれを部分パタン切り出し部57aに入力する。
【0099】
部分パタン切り出し部57aは、上記の位置情報に基づいて、帳票イメージメモリ97から、パタンを切出して、それを個別フォーマット認識パタンメモリ57bに格納する(図5のS6)。
【0100】
部分パタン切り出し部57aがパタン切出しを終了すると、制御部80は、個別フォーマット認識部57cを起動する。起動された個別フォーマット認識部57cは、個別フォーマット認識パタンメモリ57bに格納されているパタンから特徴を抽出し、この特徴と個別フォーマット認識辞書53に格納されている個別フォーマット認識辞書の特徴データと照合する(図5のS7)。1つの帳票中に特徴的な一部分Tを複数箇所定めた場合は、その個数分、ステップS5から処理を繰り返し、照合結果を得る(図5のS8)。
【0101】
個別フォーマット識別を行なう種別毎に、すなわち、複数のフォーマット候補毎に、上記処理(S4〜S8)を繰り返す。
【0102】
次に、制御部80は、個別フォーマット認識系の照合結果に基づいて類似度の高い種別と判断する順番に照合結果を入れ替えて(図5のS10)、その中から一又は複数の種別を選択し、選択した種別を認識結果とする。
【0103】
制御部80が帳票フォーマットの認識結果として一つの種別のみを入力する場合には、当該認識結果に対応した読み取り制御データを読み取り制御データメモリ60から読み出し、読み出した読取り制御データを文字認識系70へ出力する(図5のS11)。
【0104】
制御部80が帳票フォーマットの認識結果として複数の種別を入力する場合には、これら認識結果を確認するための情報を表示部91に表示できる構成とするのが良い。そして、この情報を判断基準として、オペレータが上記の複数の帳票の中から所望の帳票を選択する指示又は該当なしの指示をできるように入力部93を構成するのが良い。
【0105】
例えば、制御部80は、帳票フォーマットの認識結果に基づいて候補帳票を表示部91に表示させる。オペレータは、この表示を見て正しいと判断できる認識結果を選択し、選択した認識結果を指示する信号を、入力部93を介して、制御部80に入力する。
【0106】
制御部80はオペレータが選択した認識結果に対応する読取り制御データを読み取り制御データメモリ60から読み出し、これを文字認識系70へ出力する(図5のS11)。
【0107】
この場合の読み取り制御データは、上述した様に、文字パタン切り出しのための制御データと、文字パタンを認識するための制御データである。そのため、詳細には、制御部80は、文字パタンの切出しのための制御データを文字切出し部70aへ、また文字パタンの認識のための制御データを文字認識部70dへ出力する。
【0108】
次に制御部80は文字切出し部70a及び文字認識部70dを起動する。すると文字切出し部70aは、帳票イメージデータから、1文字単位に、文字パタンを切出し、切出した文字パタンを文字パタンメモリ70bに格納する(図5のS12)。文字認識部70dは、切出された文字パタンから特徴を抽出し、該特徴と文字認識辞書70cの辞書データと照合し(図5のS13)、この照合結果に基づいて文字パタンを認識し、その認識結果を制御部80へ出力する(図5のS14)。
【0109】
制御部80は、1文字単位に、文字パタンの認識結果を入力し、そして認識対象の帳票19の紙面a上のすべての文字について認識を終了したか否かを判定する(図5のS15)。
【0110】
認識対象の帳票19上のすべての文字について認識を終了していなければ、文字切出し部70a及び文字認識部70dは、制御部80の動作制御に従ってS11〜S14の処理を繰り返す。また帳票19の紙面a上のすべての文字について認識を終了したならば、帳票1枚分の文字読取りを終了し、帳票1枚につき得た文字認識結果を後段の装置へ出力する(図5の終了)。
【0111】
次に、各部の詳細な動作について説明する。
【0112】
(罫線パタンの抽出動作)
先ず、罫線抽出部55aが行なう罫線パタンの抽出につき説明する。罫線抽出部55aは、帳票イメージメモリ97内を帳票19全面にわたり走査し、帳票フォーマットを表す罫線パタンとして水平罫線パタンと垂直罫線パタンとを抽出する。
【0113】
水平罫線パタンを抽出するときは、帳票イメージデータを水平走査し、水平走査線上で水平罫線閾値TH(Lh)以上の長さLhだけ連続する帳票イメージデータの線描画素を、水平罫線パタンの線描画素として抽出する。連続する長さLhが水平罫線閾値TH(Lh)未満となる帳票イメージデータの線描画素(水平走査線上で連続せずに孤立して存在する1個の線描画素を含む)は、水平罫線パタンの背景画素として抽出する。帳票イメージデータの背景画素もまた、水平罫線パタンの背景画素として抽出する。水平罫線パタンはこのようにして帳票イメージデータから抽出した線描画素及び背景画素から成るパタンである。
【0114】
同様に垂直罫線パタンを抽出するときは、帳票イメージデータを垂直走査し、垂直走査線上で垂直罫線閾値TH(Lv)以上の長さLvだけ連続する帳票イメージデータの線描画素を、垂直罫線パタンの線描画素として抽出する。連続する長さLvが垂直罫線閾値TH(Lv)未満となる帳票イメージデータの線描画素(垂直走査線上で連続せずに孤立して存在する1個の線描画素を含む)は、垂直罫線パタンの背景画素として抽出する。帳票イメージデータの背景画素もまた、垂直罫線パタンの背景画素として抽出する。垂直罫線パタンはこのようにして帳票イメージデータから抽出した線描画素及び背景画素から成るパタンである。
【0115】
なお、抽出した罫線パタンを罫線パタンメモリ55bに格納する場合、抽出した水平罫線パタン及び垂直罫線パタンに共通の格納領域(以下、罫線共通格納領域)を罫線パタンメモリ55bに設け、水平罫線パタン及び垂直罫線パタンを重ね合わせて罫線共通格納領域に格納しても良い。また、抽出した水平罫線パタン及び垂直罫線パタンの各パタン毎に個別の格納領域(以下、罫線個別格納領域)を罫線パタンメモリ55bに設け、水平罫線パタン及び垂直罫線パタンをそれぞれ別々の罫線個別格納領域に格納するようにしても良い。
【0116】
罫線共通格納領域に格納する場合には、罫線共通格納領域全面に背景画素を格納し(罫線共通格納領域の初期化)、然る後、抽出した水平罫線パタンの線描画素を共通格納領域に格納すると共に抽出した垂直罫線パタンの線描画素を共通格納領域に格納する。
【0117】
また罫線個別格納領域に格納する場合には、水平罫線パタンに対し設けた罫線個別格納領域全面に背景画素を格納し(罫線個別格納領域の初期化)、然る後、水平罫線パタンに対し設けた罫線個別格納領域に、抽出した水平罫線パタンの線描画素を格納する。また垂直罫線パタンに対し設けた罫線個別領域全面に背景画素を格納し(罫線個別格納領域の初期化)、然る後、垂直罫線パタンに対し設けた罫線個別格納領域に、抽出した垂直罫線パタンの線描画素を格納する。
【0118】
図6はこの実施形態の罫線抽出部の動作の説明に供する図であって、罫線パタンの線描画素を抽出する動作に着目した動作の流れの具体的な一例を示す。ここでは、抽出した水平罫線パタンと垂直罫線パタンとを別々の格納領域に格納する場合について説明する。
【0119】
この場合、帳票イメージメモリ97の帳票イメージデータ格納領域上と罫線パタンメモリ55bの罫線共通格納領域上とには、相対応させたx−y座標系を設定してあり(例えば、水平方向をx軸方向及び垂直方向をy軸方向とする。)、この座標系で表される画素位置の格納領域から画素データを読み出し、或はまた、この座標系で表される画素位置の格納領域へ画素データを書き込むことができるようになっているものとする。
【0120】
制御部80により起動された罫線抽出部55aは、罫線パタンメモリ55bの罫線共通格納領域全面にわたって背景画素ここでは白ビットを格納する(罫線共通格納領域の初期化)。
【0121】
然る後、罫線抽出部55aは走査方向を水平方向として水平罫線パタンを抽出する処理を開始する(図6開始)。この場合、閾値THとして水平罫線閾値TH(Lh)を用い、また連続の長さLとして水平走査線上で連続する線描画素の長さLhを求めることとなる。
【0122】
次に罫線抽出部55aは、連続の長さLを零に初期化し(図6のS1)、然る後、帳票イメージメモリ97に格納されている帳票イメージデータを水平走査し、帳票イメージデータの画素データを読み出す(図6のS2)。画素データは1画素分のデータを表す。
【0123】
次に罫線抽出部55aは、読み出した帳票イメージデータの画素データが、線描画素ここでは黒ビットであるか否かを判定する(図6のS3)。
【0124】
S3で画素データが線描画素であるとの判定結果を得た場合は、連続の長さLを求めると共に水平罫線パタンに関する線描画素の候補位置(以下、水平罫線候補位置)として当該画素データの画素位置を記憶し(図6のS4)、然る後、帳票イメージデータにつき現走査線1ラインの走査を終了したか否かを判定する(図6のS5)。ここでは、S3で画素データが線描画素であるとの判定結果を得た場合に連続の長さLを1カウントアップすることによって従って連続する線描画素の個数を計数することによって、連続の長さLを求める。
【0125】
S5で現走査線1ラインの走査を終了していないとの判定結果を得た場合は、現走査線上の次の画素データを読み出すべくS2に戻る。
【0126】
S5の判定で現走査線1ラインの走査を終了したとの判定結果を得た場合は、連続の長さLを閾値THと比較する(図6のS6)。ここでは水平罫線パタンを抽出する場合であるので求めた連続の長さLは水平走査線上における連続の長さLhであり、そして閾値THには水平罫線閾値TH(Lh)を用いることとなる。
【0127】
S6で連続の長さLは閾値TH以上であるとの判定結果を得た場合、罫線抽出部55aは長さLの連続する線描画素を、罫線パタンメモリ55bに格納する(図6のS7)。ここでは記憶していた水平罫線候補位置の罫線共通格納領域に線描画素を格納することとなる。S7の次に、連続の長さLを初期化すると共に記憶していた水平罫線候補位置を消去し(図6のS8)、然る後、帳票19全面にわたって帳票イメージデータの走査を終了したか否かを判定する(図6のS9)。またS6で連続の長さLは閾値TH未満であるとの判定結果を得た場合は、S7を行なわずにS8〜S9を行なう。
【0128】
S9で帳票19全面にわたって帳票イメージデータの走査を終了していないとの判定結果を得た場合は、現走査線の次の走査線上に在る画素データを読み出すべくS2に戻る。またS9で帳票全面にわたって帳票イメージデータの走査を終了したとの判定結果を得た場合は、当該帳票19から水平罫線パタンを抽出する処理を終了する(終了)。
【0129】
また、S3の判定で読み出した画素データは線描画素でないとの判定結果を得た場合、即ち、1ラインの端まで黒画素であった場合は、連続の長さLを閾値THと比較する(図6のS10)。
【0130】
S10で連続の長さLは閾値TH以上であるとの判定結果を得た場合、罫線抽出部55aは長さLの連続する線描画素を、罫線パタンメモリ55bに格納する(図6のS11)。次に、連続の長さLを零に初期化すると共に記憶していた水平罫線候補位置を消去し(図6のS12)、然る後、現走査線一ラインの走査を終了したか否かを判定する(図6のS13)。現走査線一ラインの走査を終了していなければ、現走査線上の次の画素データを読み出すべくS2に戻る。、現走査線一ラインの走査を終了したならば、S9を行なう。またS10で連続の長さLは閾値TH未満であるとの判定結果を得た場合は、S11を行なわずにS12〜S13を行なう。
【0131】
次に、罫線抽出部55aは走査方向を今度は垂直方向として、垂直罫線パタンを抽出する処理を開始する(開始)。この場合、閾値THとして垂直罫線閾値TH(Lv)を用い、また連続の長さLとして垂直走査線上で連続する線描画素の長さLvを求めることとなる。それ以外の基本的な動作は、上記の水平罫線パタンの抽出動作と同じであるので、その説明を省略する。
【0132】
以上のようにして、図1(C)に示す帳票19について水平及び垂直罫線パタンの線描画素を抽出し、これらパタンの線描画素をそれぞれ別々の罫線個別格納領域に格納した例を、図7に示す。
【0133】
図7(A)中、110は水平罫線パタンに対して設けた罫線個別格納領域、111は罫線個別格納領域110において帳票紙面aに対応する領域、112は水平罫線パタンを示す。また図7(B)中、113は垂直罫線パタンに対して設けた罫線個別格納領域、114は罫線個別格納領域113において帳票紙面aに対応する領域、115は垂直罫線パタンを示す。罫線個別格納領域110、113内であって紙面対応領域111,114の外の領域は、帳票19をスキャナ95にセットしたとき帳票19を押えた押え面を表わす色の画素ここでは背景画素となる。
【0134】
なお、抽出した水平罫線パタンおよび垂直罫線パタンを共通の格納領域に格納する場合は、これら罫線パタンを重ねた状態に格納領域に格納すれば良いので、ここではその説明を省略する。
【0135】
(第1のフォーマット認識系での認識動作)
次に、第1のフォーマット認識系55の動作について説明する。第1のフォーマット認識系55での帳票フォーマットの認識に当っては、罫線抽出部55aは、帳票フォーマット未知の帳票イメージデータを走査して、上述のごとく罫線パタンを抽出する。そして、この抽出された罫線パタンから、フォーマット認識部55cは、例えば、上述した様な特開昭57−23185号に開示の方法で特徴を抽出し、この抽出特徴を、帳票標準フォーマットの各種別毎に、フォーマット認識辞書51に保持してある特徴と照合する。
【0136】
そして、フォーマット認識部55cは、この照合において、一定の条件( 以下個別認識条件) を満たした時にその種別のフォーマットを、認識対象の帳票のフォーマット候補とする。
【0137】
この個別認識条件は、任意好適な条件とできる。例えば、フォーマット認識部55cは帳票フォーマットの種別を類似度の高い順に出力し、またそれぞれの種別毎に距離と確信度を出力する。ここで、距離、類似度および確信度とは次のものである。フォーマット認識辞書51に保持してある帳票標準フォーマットの特徴と、認識対象の帳票のイメージデータから抽出した特徴とを照合した結果が距離である。距離の大小が類似度であり、距離が小さいほど類似度が高い。また確信度は距離を正規化して表わした数値であり、確信度が大きいほど類似度が高い。
【0138】
そして、これに限られないが、例えば、上記の確信度が高い順から指定数分を、フォーマット候補として選択するという第1の条件、また、上記の確信度がある一定の値以上のものをフォーマット候補として選択するという第2の条件、または、確信度の高い順に隣接する種別の距離差を求め距離差がある一定の値以下までの候補をフォーマット候補として選択するという第3の条件の少なくとも1つの条件を満たすものをフォーマット候補としてを選択する。通常はこれらの基準を組み合わせてフォーマット候補を選択する。
【0139】
上記の条件を組み合わせてフォーマット候補を選択する具体例について、以下、後に掲載した表を参照して説明する。
【0140】
表1は、フォーマット認識部55cが出力した帳票標準フォーマット、確信度、距離を示した表である。確信度の高い順にならべた表である。ここで個別認識条件として確信度の高い順に所定個数分を選択する。ここでは確信度が上位6位までをフォーマット候補として選択する例を考える。そのため、帳票標準フォーマットA〜Fが、フォーマット候補として選択されている。これら選択された候補を、以下、有効候補という。
【0141】
次に、表2は、表1の個別認識条件にさらに、帳票標準フォーマットの種別の確信度がある一定の値以上のものを選択した例を示している。ここでは確信度が90以上という条件を加えた例を示している。そのため、帳票標準フォーマットA〜Eが選択される。
【0142】
次に、表3は、表2の個別認識条件にさらに、隣接する帳票標準フォーマットの種別の距離差を求め、この距離差がある一定の値以下の候補を選択した例を示している。ここでは距離差が30以下という条件を加えた例を示している。そのため、帳票標準フォーマットA〜Dが選択される。
【0143】
(第2のフォーマット認識系での認識動作)
第1のフォーマット認識系55が、認識対象の帳票に対して所定個数以上(ここでは例えば1以上)のフォーマット候補を示した場合、第2のフォーマット認識系57によるフォーマット認識動作が以下のように行われる。
【0144】
既に説明した様に、第2の辞書である個別フォーマット認識辞書53は、標準帳票毎の特徴的な一部分のパタンデータを、予め保持している。
【0145】
個別フォーマット辞書53に保持させるデータの作成に当っては、既存の帳票を複数枚用意し、各帳票毎に個別フォーマット認識に用いる領域T(図1等参照)を設定し、帳票イメージデータから個別フォーマット認識領域Tとした図形を切り出し、切り出した図形を走査して特徴を抽出する。この特徴と、領域Tの位置、大きさ、形状等を定義した情報を合わせて、帳票標準フォーマットの各種別毎に個別に相対応付け、辞書データとして個別フォーマット認識辞書53に記憶させる。
【0146】
なお、この個別フォーマット認識領域Tは、帳票上に複数設定しても良い。その場合は、帳票標準フォーマットの種別に対応した個別フォーマット認識辞書53に、複数の領域の特徴と位置、大きさ、形状等を定義した情報を記憶させる。
【0147】
個別フォーマット認識に当っては、第1のフォーマット認識系55のフォーマット認識部55cが出力した有効候補内の最終候補(例えば表3に示した候補)から先頭候補に向かって順番に個別フォーマット認識を、以下のように行う。
【0148】
個別フォーマット認識系57の部分パタン切り出し部57aは、個別フォーマット認識辞書53から上記有効候補である帳票標準フォーマット種別に対応した予め保存されている個別フォーマット認識領域Tに関する情報を読み出す。個別フォーマット認識領域Tを複数設定した場合は、これら領域に予め順位付けしておき、その順番で個別フォーマット認識を行うのが良い。個別フォーマット認識の領域が設定されていない種別がもしあった場合は、そのまま有効候補に残しておく。
【0149】
部分パタン切り出し部57aは、帳票イメージメモリ97から、上記の個別フォーマット認識領域Tに当たる部分のイメージを切り出し、個別フォーマット認識パタンメモリ57bに格納する。個別フォーマット認識部57cは、個別フォーマット認識パタンメモリ57bを走査して、該パタンから特徴部分のパタンを切り出し、そして、切り出したイメージの特徴を抽出する。
【0150】
この個別フォーマット認識部57cの動作の詳細について、図4を参照して説明する。
【0151】
フォーマット認識部57cの線幅算出部101は、個別フォーマット認識パタンメモリ57bに格納してあるパタンについて、線幅Wを求める。ここでは線幅算出部101は、個別フォーマット認識パタンメモリ57bに格納された図形パタンを、2×2窓を用いて走査し、2×2窓のすべての点が線描画素となる状態の回数Qと図形パタン中の線描画素総個数Aとを計数する。そして図形パタンの線幅wとしてw=A/(A−Q)を求める。
【0152】
枠検出部103は切り出された図形パタンの線部分に外接する枠( 図形枠) を検出する。ここでは図形枠の水平方向における左辺及び右辺の位置をXL及びXR、垂直方向における上辺及び下辺の位置YU及びYDとするとき、図形枠の左上頂点位置(XL,YU)、左下頂点位置(XL,YD)、右上頂点位置(XR,YU)、右下頂点位置(XL、YD)となり、各位置XL,XR,YU,YDを次のように検出する。
【0153】
左辺位置XLの検出に当っては、垂直走査線を左から右へ線順次に移動させて、各垂直走査線毎に、捜査線上における線描画素の有無を判定し、線描画素有りと最初に判定された垂直走査線の副走査線位置を左辺位置XLとして検出する。また右辺位置XRの検出に当っては、垂直走査線を右から左へ線順次に移動させて、各垂直走査線毎に、捜査線上における線描画素の有無を判定し、線描画素有りと最初に判定された垂直走査線の副走査線位置を右辺位置XRとして検出する。また上辺位置YUの検出に当っては、水平走査線を上から下へ線順次に移動させて、各水平走査線毎に、走査線上における線描画素の有無を判定し、線描画素有りと最初に判定された水平走査線の副走査線位置を上辺位置YUとして検出する。また下辺位置YDの検出に当っては、水平走査線を下から上へ線順次に移動させて、各水平走査線毎に、走査線上における線描画素の有無を判定し、線描画素有りと最初に判定された水平走査線の副走査線位置を下辺位置YDとして検出する。
【0154】
次に、HSP抽出部105aは、個別フォーマット認識パタンメモリ57bに保持されている図形パタンを水平方向に走査して、該パタンから水平サブパタンを抽出し、抽出した水平サブパタンをHSPメモリ105eに格納する。
【0155】
なお、図形パタンの線描画素のうち、水平方向の走査線上で連続する長さLが図形閾値TH1以上となる線描画素を水平サブパタンの線描画素として抽出する。また図形パタンの線描画素のうち、水平方向の走査線上で連続する長さLが図形閾値TH1未満となる線描画素( 線描画素1個の場合を含む) と、図形パタンの背景画素とをそれぞれ、水平サブパタンの線描画素として抽出する。水平サブパタンの線描画素は、水平方向の線に対応するものである。
【0156】
また、VSP抽出部105bは、個別フォーマット認識パタンメモリ57bに保持されている図形パタンを垂直方向に走査して、 該パタンから垂直サブパタンを抽出し、抽出した垂直サブパタンをVSPメモリ105fに格納する。
【0157】
なお、図形パタンの線描画素のうち、垂直方向の走査線上で連続する長さLが図形閾値TH2以上となる線描画素を、垂直サブパタンの線描画素として抽出する。また図形パタンの線描画素のうち、垂直方向の走査線上で連続する長さが図形閾値TH2未満となる線描画素( 線描画素1個の場合を含む) と、図形パタンの背景画素とをそれぞれ、垂直サブパタンの線描画素として抽出する。垂直サブパタンの線描画素は、垂直方向の線に対応するものである。
【0158】
また、LSP抽出部105cは、個別フォーマット認識パタンメモリ57bに保持されている図形パタンを左斜め45度方向に走査して、該パタンから左斜めサブパタンを抽出し、抽出した左斜めサブパタンをLSPメモリ105gに格納する。
【0159】
なお、図形パタンの線描画素のうち、左斜め方向の走査線上で連続する長さLが図形閾値TH3以上となる線描画素を、左斜めサブパタンの線描画素として抽出する。また図形パタンの線描画素のうち、左斜め方向の走査線上で連続する長さが図形閾値TH3未満となる線描画素( 線描画素1個の場合を含む) と、図形パタンの背景画素とをそれぞれ、左斜めサブパタンの線描画素として抽出する。左斜めサブパタンの線描画素は、左斜め45度方向の線に対応するものである。
【0160】
また、RSP抽出部105dは切り出された図形パタンを右斜め45度方向に走査して、該パタンから右斜めサブパタンを抽出し、抽出した右斜めサブパタンをRSPメモ105hに格納する。
【0161】
なお、図形パタンの線描画素のうち、右斜め方向の走査線上で連続する長さLが図形閾値TH4以上となる線描画素を、右斜めサブパタンの線描画素として抽出する。また図形パタンの線描画素のうち、右斜め方向の走査線上で連続する長さが図形閾値TH4未満となる線描画素( 線描画素1個の場合を含む) と、図形パタンの背景画素とを、それぞれ右斜めサブパタンの線描画素として抽出する。右斜めサブパタンの線描画素は、右斜め45度方向の線に対応するものである。
【0162】
図形閾値TH1〜TH4を任意好適に設定することによって、図形パタンから水平、垂直、左斜め、右斜めの各サブパタンを抽出できる。ここでは、上記線幅wを基にしてTH1=N1・w、TH2=N2・w、TH3=N3・w、TH4=N4・wというように、図形閾値TH1〜TH4をそれぞれ設置している。なお、N1〜N4は任意に設定される値である。これに限られないが、例えば、N1=N2=N3=N4=2とすることができる。
【0163】
図8に、図1(C)に示した認識対象の帳票19の個別フォーマット認識領域Tから、垂直、水平、右斜めおよび左斜めの各サブパタンVSP、HSP、RSPおよびLSPを抽出した場合の例を示してある。
【0164】
次に、特徴マトリクス作成部107は、各走査方向毎にサブパタンから特徴を抽出し、各サブパタンの特徴から切り出された文字パタンの特徴マトリクスを作成する。
【0165】
この特徴マトリクス作成部107は、水平サブパタンの図形枠に対応する領域をN×M個の領域に分割し、各領域毎に特徴量lijを求め、こららN×M個の特徴量lijからなるN×M次元の特徴マトリクスを作成する。
【0166】
特徴量lijは第i行第j列目の領域において求めた特徴量を表わす。例えば、第i行第j列目の領域における線描画素の総個数Bijと図形パタンについて求めた線幅wとを用いて、lij=Bij/wを求める。同様にして、垂直、左斜め、右斜めの各サブパタンについて、それぞれN×M次元の特徴マトリクスを作成する。
【0167】
次に特徴マトリクス作成部107は、水平、垂直、左斜め及び右斜めの各サブパタンについて作成した特徴マトリクスから、図形枠の水平方向における長さをΔX及び垂直方向における長さをΔY、特徴量lijを正規化して得た特徴量をLijを求める。この特徴量Lijは、水平サブパタンについてはLij=lij/ΔX、垂直サブパタンについてはLij=lij/ΔY、左斜めサブパタンについてはLij=lij/(ΔX2 +ΔY2 )1/2 となる。
【0168】
次に、特徴マトリクス作成部107は、水平、垂直、左斜め及び右斜めの各サブパタン毎に正規化した特徴マトリクスを得ると、これら正規化した特徴マトリクスから成るN×M×4次元の特徴マトリクスfA を作成し、特徴マトリクスfA を照合部109へ出力する。
【0169】
照合部109は、切り出された図形パタンの特徴マトリクスと個別フォーマット辞書53の特徴マトリクスとを用いて照合を行い、該照合結果に基づいて切り出された図形と比較した特徴マトリクスの種別との確信度、距離を出力する。
【0170】
出力された確信度、または距離が、ある所定の条件を満たすならば、この帳票標準フォーマット種別は有効候補として選択しておく。
【0171】
ここである所定の条件とは任意好適な条件とできる。例えば、上記の距離がある値以下ならば有効候補であり、そうでなければ有効候補外とする方法がある。
【0172】
個別認識条件を満たす帳票標準フォーマット種別の全てに、個別フォーマット認識辞書53に保存されている領域について特徴を抽出する。そして、辞書データに予め保存してある特徴情報と照合して距離、確信度を算出し、これらが所定の条件を満たすならば、この種別を有効候補として選択し、所定の条件を満たさなければ有効候補から除外する。この有効候補の選択例を表4を用いて説明する。
【0173】
表4には、第1のフォーマット認識系55で最終候補となった種別A〜Dに対して第2のフォーマット認識を行う例を示している。
【0174】
すなわち、表4は、個別フォーマット認識部57cが、認識対象の帳票から、候補種別A,B,C,Dに対応した個別フォーマット認識の領域について特徴を取得し(詳細は後述する)、該抽出した特徴と辞書53に予め保持した特徴とを照合した結果を距離で表わした表である。ここで所定の条件として距離が30以下という条件を設定すると、表5に示したように、種別A,Cは有効候補外となる。
【0175】
個別フォーマット認識領域Tを複数設定した場合で、そのうちの第1の領域の個別フォーマット認識を行った結果、有効候補が複数存在するならば、第2、第3の個別フォーマット認識の領域についても上記で述べた特徴の抽出と辞書データの照合を行い、所定の条件に満たない種別を有効候補外とする。また、有効候補が一つになったならば、以降の処理を行わない。
【0176】
すべての個別フォーマット認識領域について処理終了後、有効候補が複数存在する場合には、各領域における距離や確信度の結果によって所定の条件で候補の入れ替えを行う。
【0177】
この候補入れ替えの例を後に掲載した表6〜表8を参照して説明する。先ず、第1の例を、表6および表7を参照して説明する。
【0178】
この第1の例は、候補帳票中に、個別フォーマット認識領域Tとして、第1及び第2の領域を設定してある場合の候補入れ替え例を示してある。そして、第1のフォーマット認識系での認識結果では、種別Bが第1位の候補帳票、種別Dが第2位の候補帳票というようになっている(表6参照)。しかし、第2のフォーマット認識系での、認識対象の帳票と種別B、Dそれぞれの第1及び第2の個別フォーマット認識領域との照合結果として、種別Bでは第1の個別フォーマット認識領域についてのみ閾値以上の認識結果が得られている。種別Dでは、第1および第2の個別フォーマット認識領域それぞれについて、閾値以上の認識結果が得られている。すなわち、種別Dの方が、種別Bより第2の辞書に対するマッチング個数が多い。このような場合、この発明では、候補帳票の入れ替えが表7のようになされる。すなわち、種別Dが第1位の候補帳票になり、種別Bが第2位の候補帳票になるというように、候補帳票の順位の入れ替えを行う。
【0179】
また、候補入れ替えの第2の例として、次のようにしても良い。すなわち、候補帳票中に個別フォーマット認識領域として複数の領域を設置した場合に、この複数の領域に優先順位を付けておく。そして、優先順位が上位の個別フォーマット認識領域についての照合で、距離または確信度などが最も小さかった種別を、第1位の候補帳票になるよう入れ替えをする。例えば、表6、表8の例では、第1の個別フォーマット認識領域の照合結果を優先するような順位付けをしている。そのため、この例の場合は、種別B、種別Dの有効候補の順番となる(たまたま、表6と同じ結果となっている)。
【0180】
以上の処理を行った後、有効候補となっている一又は複数の標準帳票フォーマットを個別フォーマット認識系57の結果として制御部80に出力する。ここで、個別フォーマット認識系57の認識結果が1つである場合、制御部80はこの認識結果に応じた読み取り制御データを読み取り制御データメモリ60から得て、これを文字認識系70に送る。また、個別フォーマット認識系57の認識結果が複数であった場合は、制御部80は、それぞれの認識結果に対応する読み取り制御データを読み取り制御データメモリ60から得て、これを文字認識系70に送っても良いし、または、表示部91にこれら認識結果に対応する帳票を表示して、これらの中から正確な帳票をオペレータによって選択させても良い。後者の場合は、制御部80は、オペレータが選択した帳票についての読み取り制御データを、読み取り制御データメモリ60から得て、これを文字認識系70に送る。
【0181】
文字認識系70は、送られてきた文字読み取りデータに基づいて、認識対象の帳票から文字パタンを切り出す等の文字認識のための一連の処理を行う。
【0182】
(文字認識動作)
文字認識処理は、フォーマット認識装置50のフォーマット認識の結果得られる読み取り制御データに基づいて行われる。
【0183】
すなわち、読み取り制御データ中の、文字パタンの切り出しに関わるデータに基づいて、認識対象の帳票のイメージデータから、文字パタンを切り出す。また、読み取り制御データ中の、文字パタンの認識に関わるデータ(例えば字体など)を利用して、認識用辞書の指定などをする。
【0184】
次に、切り出した文字パタンからその特徴を抽出する。抽出した文字パタンの特徴と、文字認識辞書70cに予め格納してある特徴とを照合する。例えば、切り出した文字パタンの特徴と文字認識辞書70cに格納してある特徴との間の距離を認識の「確からしさ」として用いて照合を行う。そして、文字認識辞書70c中に格納してある文字名の中から、上記の認識の確からしさに基づいて、一又は複数の文字名を選択し、選択した文字名を文字パタンの認識結果として出力する。
【0185】
1−4.第2の実施の形態の装置の構成説明
上述の第1の実施の形態の文字読み取り装置40は、帳票の特徴的な一部分が特徴的な図形である場合に特に好適な装置であった。もちろん、第1の実施の形態の文字読み取り装置40は、帳票の特徴的な一部分が罫線の特徴的な一部分である場合にも対応できる。しかし、帳票の特徴的な一部分が、罫線の特徴的な一部分である場合、例えば図2(A)〜(C)に示したような各帳票のように罫線L1の位置が、帳票の特徴的な一部分である場合は、図9に示したように、個別フォーマット認識部57cのサブパタン抽出部105の構成を第1の実施の形態より簡易にしても良い。すなわち、第1の実施の形態で設けていた、LSP抽出部105c、RSP抽出部105d、LSPメモリ105gおよびRSPメモリ105hを省略し、サブパタン抽出部105を、HSP抽出部105aと、VSP抽出部105bと、HSPメモリ105eと、VSPメモリ105fとで構成する。
【0186】
罫線の特徴的な一部分は、水平罫線または、垂直罫線または、垂直及び水平罫線の組み合わせであることは明らかなので、HSPおよびVSPに関係するパタン抽出およびパタン記憶ができれば、サブパタン抽出が可能だからである。
【0187】
なお、この第2の実施の形態の文字読み取り装置では、サブパタン抽出部の構成を変更したことに伴い、例えば第2の辞書に格納するデータを変更し、さらに、特徴マトリクス作成部や照合部の構成を変更する。それ以外の構成は、例えば、第1の実施の形態の文字読み取り装置40と同様な構成とすれば良い。
【0188】
1−5.第2の実施の形態の装置の動作説明
この第2の実施の形態の装置の、第1の実施の形態の装置に対する動作上の相違点は、第2のフォーマット認識系57でのサブパタン抽出部の動作と、サブパタン抽出部が抽出するサブパタンの種類が減ったことに伴う特徴マトリクス作成部や照合部の処理である。すなわち、サブパタン抽出部はVSPおよびHSPのみを抽出する。また、特徴マトリクス作成部や照合部は、認識対象の帳票から水平および垂直それぞれの走査方向について特徴を作成し、この特徴と、辞書に格納した特徴とを照合する。
【0189】
図10は、図2(C)に示した認識対象の帳票25の特徴的な一部分Tと、この部分Tから抽出される垂直サブパタン(VSP)および水平サブパタン(HSP)とを示した図である。
【0190】
この第2の実施の形態の文字読み取り装置では、第2のフォーマット認識系57での上記の動作以外の動作は、第1の実施の形態と同様に行われるので、その説明を省略する。
【0191】
1−6.第3の実施の形態の装置の構成説明
上述の第1の実施の形態の文字読み取り装置40は、帳票の特徴的な一部分が特徴的な図形である場合に特に好適な装置であった。しかし、図11を参照して既に説明したように、帳票の特徴的な一部分が文字である場合もあり得る。
【0192】
すなわち、図11(A)および(B)に示した帳票31と帳票33とは、罫線L1が在るか無いかという点と、帳票の右上隅に互いに異なる特徴的な文字が印刷されている点とを除いて同じフォーマットとなっている。すなわち、帳票31は、その左上隅に罫線L1があり、かつ、帳票の右上隅に「○電気」という特徴的な文字が印刷されている。帳票33は、罫線L1がなく、かつ、その右上隅に「△△電気」という特徴的な文字が印刷されている。一方、図11(C)に示した認識対象の帳票35は、帳票種別番号が印刷されていないが、帳票の罫線パタンは、図11(A)に示した帳票31と同じである。そのため、帳票の全体から抽出したパタンを予め辞書中に用意したパタンと比較する方法、例えば、この出願の出願人に係る特開平9−259221号公報に開示されている、帳票全体から抽出した罫線パタンを予め用意した辞書と照合する方法により、帳票35は帳票31と同じフォーマットの帳票であると認識できる。
【0193】
しかし、帳票35に、汚れがあったり、折り目があったり、また、罫線がかすれていたりした場合等は、この帳票全体から抽出されるパタンは、例えば、帳票31と帳票33との中間のような罫線パタンになり易い。すると、両者の認識はしづらくなる。
【0194】
そこで、この第3の実施の形態では、第1のフォーマット認識系55が所定個数以上(例えば1以上)の候補帳票を出力した場合は、第2のフォーマット認識として、帳票の一部の文字に着目したフォーマット認識をする。以下、詳細に説明する。
【0195】
図12はこの第3の実施の形態で用いて好適な文字読み取り装置140の構成を示したブロック図である。
【0196】
なお、この実施の形態の文字読み取り装置140の、第1の実施の形態の文字読み取り装置40との相違点は、第2の辞書153の構成と、第2のフォーマット認識系157の構成である。それ以外は、第1の実施の形態と同様としてある。そこで、以下の説明では、相違点のみを説明する。
【0197】
先ず、第2の辞書153(個別フォーマット認識辞書153ともいう)は、フォーマットが異なる既存の複数の帳票毎の、所定の一部分(個別フォーマット認識領域T)に印刷されている1又は複数の特徴的な文字の文字名を、予め保持している。ただし、この実施の形態の場合は、上記の1又は複数の特徴的な文字の文字名の他に、帳票毎の、個別フォーマット認識領域Tの設定数、その位置、特徴的な文字の文字種を表した情報など(これを、「個別フォーマット認識情報」ともいう)も、第2の辞書153は予め保持している。
【0198】
この様な個別フォーマット認識辞書153を作成するには、既存の帳票を複数枚用意する。例えば図11(A)、(B)に示した帳票31,33を含む複数枚の帳票を用意する。そして、各帳票毎に個別フォーマット識別領域Tを設定し、設定した領域の数、位置、特徴的な文字の文字種、文字数等などと共に、この1又は複数の特徴的な文字の文字名を、辞書データとして、個別フォーマット認識辞書153に予め保持させる。
【0199】
また、第2のフォーマット認識系157は、第1のフォーマット認識系55が1以上の候補帳票(以下、候補帳票を種別とかフォーマット候補ともいう)を示した場合に動作する。そして、認識対象の帳票の、前記1以上の候補帳票毎の前記特徴的な一部分Tに当たる領域から文字を切り出し、該切り出した文字を文字認識して文字名を得る。そして、該得られた文字名を前記第2の辞書中の文字名と照合して、前記認識対象の帳票のフォーマットを認識する。
【0200】
この実施の形態の第2のフォーマット認識系157は、文字切り出し部157aと、文字パタンメモリ157bと、文字認識辞書157cと、文字認識部157dと、個別フォーマット認識部157eとで構成してある。
【0201】
文字切り出し部157aは、第1のフォーマット認識系55が候補として候補帳票毎の、個別フォーマット認識領域Tの位置データを、第2の辞書153から得て、このデータに基づいて、帳票イメージメモリ97からパタンを切り出す。さらに、周知の方法で、文字毎のパタンを切り出す。
【0202】
文字パタンメモリ157bは、文字切り出し部157aが切り出した文字毎のパタンを格納する。
【0203】
文字認識辞書157cは、各種の文字の特徴(標準特徴)と文字名とを予め保持している。
【0204】
文字の特徴をどのようなデータとして保持するかは、任意である。しかし、この実施の形態の文字認識辞書は、文字パタンを複数領域に分割し該分割領域の特徴で表される特徴マトリクスの形で、文字の特徴を保持している。
【0205】
文字認識部157dは、文字パタンから特徴を抽出し、該抽出した特徴を文字認識辞書と照合して文字を認識し、その文字名を個別フォーマット認識部157eに出力する。
【0206】
この文字認識部157dの構成は任意好適なものとできる。例えば、特開平9−259221号公報に開示の文字認識部で構成することが出来る。もちろん、1例でありこれに限られない。
【0207】
図13は、この文字認部157dの具体的な構成例を説明する機能ブロック図である。
【0208】
この図13の場合の文字認識部157dは、線幅算出部201と、枠検出部203と、サブパタン抽出部205と、特徴マトリクス作成部207と、照合部209とで構成してある。これらの詳細は後の動作説明の項で説明するが、間単に説明すれば次の通りである。
【0209】
線幅算出部201は、文字切り出し部157aが切り出したパタンの線幅を算出する。
【0210】
枠検出部203は、文字切り出し部157aが切り出したパタンに外接する枠(文字枠)を検出する。
【0211】
サブパタン抽出部205は、文字パタン切り出し部157aが切り出したパタンを複数の方向に走査して、各走査方向毎にサブパタンを抽出する。この場合のサブパタン抽出部205は、水平方向サブパタン(HSP)を抽出するHSP抽出部205aと、垂直方向サブパタン(VSP)を抽出するVSP抽出部205bと、左斜めサブパタン(LSP)を抽出するLSP抽出部205cと、右斜めサブパタン(RSP)を抽出するRSP抽出部205dと、対応するサブパタンを格納するHSPメモリ205e、VSPメモリ205f、LSPメモリ205gおよびRSPメモリ205hとで構成してある。
【0212】
特徴マトリクス作成部207は、水平、垂直、左斜めおよび右斜めの各走査方向毎に、サブパタンから特徴を抽出し、各サブパタンの特徴から特徴マトリクスを作成する。
【0213】
照合部209は、特徴マトリクス作成部207が作成した特徴マトリクスと、文字認識辞書157cに格納してある各文字の特徴マトリクスとを用いて照合を行い、その結果に基づいて文字名を出力する。
【0214】
なお、文字切り出し部157a、文字パタンメモリ157b、文字認識辞書157cおよび文字認識部157dを、文字認識系70の、文字切り出し部70a、文字パタンメモリ70b、文字認識辞書70cおよび文字認識部70dで兼用するのが好ましい。こうすれば、文字読み取り装置140のハードウェア規模及びソフトウェア規模を削減できるという利点が得られる。
【0215】
個別フォーマット認識部157eは、文字認識部157dでの文字認識結果と、個別フォーマット認識辞書153に予め格納してあるデータとを照合して、認識対象の帳票の1又は複数のフォーマット候補を認識結果として出力する。
【0216】
1−7.第3の実施の形態の装置140の動作説明
次に、文字読み取り装置140の動作について説明する。図14は、文字読み取り装置140の全体的な動作の流れを示す図である。
【0217】
なお、第1のフォーマット認識系55による処理と、文字認識系70による処理は、第1の実施の形態の装置40の場合と同様であるので、以下の説明では、第2のフォーマット認識系157の動作について主に説明する。
【0218】
第1の実施の形態の文字読み取り装置40の場合と同様に、認識対象の帳票(例えば図11(C)に示した帳票35)から得たイメージデータから罫線パタンを抽出し(図14のS1)、この罫線パタンのデータを第1の辞書51内のパタンのデータと照合する(図14のS2)。
【0219】
次に、所定個数以上(ここでは例えば1以上の例を考える)の候補帳票が在るか否かが判定される(図14のS3)。候補帳票が1つも無かった場合、その旨が、制御部80に通知される(図14のS21)。候補帳票が1以上あった場合は、制御部80は第2のフォーマット認識系157を起動する。ただし、第1のフォーマット認識系55での認識において1以上の候補帳票が示された場合であっても、これら種別それぞれに対応した個別フォーマット認識情報が個別フォーマット認識辞書153にない場合は、第1のフォーマット認識系55で得た認識結果を制御部80に出力する。
【0220】
第1のフォーマット認識系55が出力した候補帳票の全部又は一部それぞれに対応した個別フォーマット認識情報が個別フォーマット認識辞書153にあった場合は(図14のS4)、制御部80は、認識対象の帳票のイメージデータから、各種別毎の所定の一部分に対応する部分を切り出すための位置情報を、個別フォーマット認識辞書153からそれぞれ得る(図14のS5)。すなわち、例えば、認識対象の帳票35に対して、例えば図11(A)の帳票31および図11(B)の帳票33がフォーマット候補となっている場合であれば、帳票31、33各々の特徴的な一部分Tに対応する部分を、認識対象の帳票35のイメージデータから切り出すための位置情報を、個別フォーマット認識辞書153から制御部80は得る。そしてこれを文字切り出し部157aに入力する。
【0221】
文字切り出し部157aは、上記の位置情報に基づいて、帳票イメージメモリ97から、パタンを切出して、それを文字パタンメモリ157bに格納する(図14のS6)。
【0222】
文字切り出し部157aがパタン切出しを終了すると、制御部80は、文字認識部157dを起動する。起動された文字認識部157dは、文字パタンメモリ157bに格納されているパタンから特徴を抽出し、この特徴と、文字認識辞書157cに格納されている標準パタンの特徴データとを照合し、認識結果としての文字名を出力する(図5のS7)。
【0223】
この文字認識部157dでの特徴抽出、照合および文字認識の各処理は、第1の発明の実施の形態で図4を用いて説明した個別フォーマット認識部57cでの各処理と同様に行える。したがって、以下では簡単に説明する。
【0224】
先ず、線幅算出部201は、文字パタンメモリ157b格納された文字パタンから、第1発明での線幅算出部101の場合と同様に、線幅wとしてw=A/(A−Q)を求める。
【0225】
枠検出部203は切り出された文字パタンの線部分に外接する枠( 文字枠) を、第1の発明での枠検出部103の場合と同様に、検出する。
【0226】
サブパタン抽出部205は、切り出された文字パタンを、ここでは水平、垂直、右斜め、左斜めの各方向に走査して、各走査方向毎にサブパタンを抽出する。各サブパタンの抽出処理は、第1の発明でのサブパタン抽出部105での処理と同様に行われる。
【0227】
特徴マトリクス作成部207は、第1の発明での特徴マトリクス107と同様に、各走査方向毎のサブパタンから特徴を抽出し、各サブパタンの特徴から、切り出された文字パタンの特徴マトリクスを作成する。すなわち、特徴マトリクス作成部207は、水平サブパタンの文字枠に対応する領域をN×M個の領域に分割し、各領域毎に特徴量lijを求め、こららN×M個の特徴量lijからなるN×M次元の特徴マトリクスを作成する。
【0228】
照合部209は、第1の発明での照合部107と同様に、切り出された文字パタンの特徴マトリクスと文字認識辞書157c中のデータの特徴マトリクスとを用いて照合を行う。そして、切り出された文字と比較した特徴マトリクスの文字名と確信度、距離を出力する。
【0229】
1つの候補帳票中に特徴的な一部分Tを複数箇所定めた場合は、その個数分、ステップS5から処理を繰り返し、認識結果を出力する(図5のS8)。
【0230】
個別フォーマット識別を行なう種別毎に、すなわち、複数のフォーマット候補毎に、上記処理(S4〜S8)を繰り返す。
【0231】
文字認識部157dが各フォーマット候補毎の認識結果を出力し終えたら、制御部80は、個別フォーマット認識部157eを起動する。
【0232】
起動された個別フォーマット認識部157eは、文字認識部157dからの各フォーマット候補ごとの文字名を個別フォーマット認識辞書153内のデータと照合して、認識対象の帳票のフォーマットを認識する(図14のS10)。この際、、類似度の高いフォーマット候補(種別)と判断する順に、認識結果を入れ換えて、1又は複数のフォーマット候補を選択する。
【0233】
制御部80が帳票フォーマットの認識結果として一つの種別のみを入力する場合には、制御部80は、当該認識結果に対応した読取り制御データを読み取り制御データメモリ60から読み出し、読み出した読み取り制御データを文字認識系70へ出力する(図14のS11)。
【0234】
制御部80が帳票フォーマットの認識結果として複数の種別を入力する場合には、これら認識結果を確認するための情報を表示部91に表示できる構成とするのが良い。そして、この情報を判断基準として、オペレータが上記の複数の帳票の中から所望の帳票を選択する指示又は該当なしの指示をできるように入力部93を構成するのが良い。
【0235】
例えば、制御部80は、帳票フォーマットの認識結果に基づいて候補帳票を表示部91に表示させる。オペレータは、この表示を見て正しいと判断できる認識結果を選択し、選択した認識結果を指示する信号を、入力部93を介して、制御部80に入力する。
【0236】
制御部80は、オペレータが選択した認識結果に対応する読み取り制御データを読み取り制御データメモリ60から読み出し、読み出した読み取り制御データを文字認識系70へ出力する(図14のS11)。
【0237】
この場合の読み取り制御データは、上述した様に、文字パタン切り出しのための制御データと、文字パタンを認識するための制御データである。制御部80は、文字パタンの切出しのための制御データを文字切出し部70aへ、また文字パタンの認識のための制御データを文字認識部70dへ出力する。
【0238】
その後は、第1の実施の形態にて説明したと同様に文字認識系70は認識対象の帳票上の文字を認識する。
【0239】
なお、これまでの説明では、第2のフォーマット認識系は、第1のフォーマット認識系が所定個数以上の候補を出力した場合に動作し、かつ、第1のフォーマット認識系が候補を所定個数未満しか出力しなかった場合(0も含む)は、制御部に処理を委ねる(図5や図14のステップS3,S21参照)認識系であった。しかし、第2のフォーマット認識系を、第1のフォーマット認識系が所定個数未満の候補を出力した場合は、認識対称の帳票の一部の特徴と、既存の帳票の全ての帳票毎の一部の特徴データとの照合をして、認識対象の帳票のフォーマットを認識し、第1のフォーマット認識系が所定個数以上の候補を出力した場合は、該出力された帳票毎の一部の特徴データと認識対称の帳票の一部の特徴との照合をして、認識対象の帳票のフォーマットを認識する認識系としても良い。
【0240】
こうすると、第1のフォーマット認識系が候補を挙げた場合、挙げない場合それぞれで、第2のフォーマット認識系による効果的なフォーマット認識が行えるからである。
【0241】
このような構成とする場合の動作例を、図15を参照して説明する。なお、この図15は、図5中のステップS21の処理を今回の態様に合わせて変更した図である。
【0242】
第1のフォーマット認識系55が所定個数以上の候補を出力した場合は、図5を参照して説明したと同様にステップS4〜S9の処理をする(図15)。一方、第1のフォーマット認識系55が所定個数未満(例えば1未満)の候補を出力した場合は、第2のフォーマット認識系57は、第2の辞書53中の既存の帳票全てを候補とする(図15のステップS31)。そして、認識対象の帳票について、各既存の帳票の特徴的な一部分に着目した照合等、すなわち第2のフォーマット認識系による処理をそれぞれ行う。ただし、第2のフォーマット認識系57による照合等を行う前に、第2の辞書53中の既存の全ての帳票それぞれの第1のフォーマット認識結果として、第1のフォーマット認識系での閾値(候補を選択する閾値)以上の所定値を制御部80は強制的に設定する(図15のステップS3)。こうする理由は、上述した候補帳票の並べ替えのための初期設定を確保するためである。その後は、第2のフォーマット認識系57によるフォーマット認識を行って、既存の帳票の中から認識対象の帳票のフォーマット候補としての1又は複数の候補帳票を決める。こうして決められた候補帳票を、好ましくは表示部91に表示し、オペレータが入力部93を用いて最終的な補帳帳票を決めるようにするのが良い。
【0243】
また、図14を用いて説明した特徴的な文字に着目する態様の場合でも、第1のフォーマット認識系が所定個数未満の候補を出力した場合に、第2のフォーマット認識系が第2の辞書中の既存の全ての帳票を候補として、認識対象の帳票のフォーマット認識をするように、第2のフォーマット認識系を構成することができる。その場合は、図14中のステップS21の処理の代わりに、図15のステップS31の処理が行われるように、第2のフォーマット認識系157(図12)の構成を変更すれば良い。
【0244】
2.フォーマット認識装置および文字読み取り装置の第2の発明
上述した第1の発明では、帳票全体のパタンを第1の辞書中の既存の帳票毎のパタンと照合して認識対象の帳票のフォーマットを認識する第1のステップと、認識対象の帳票の、前記候補帳票毎の特徴的な一部分に対応する領域から特徴を抽出して該特著を第2の辞書中の既存の帳票の特徴データと照合して認識対象の帳票のフォーマットを認識する第2のステップとを実施する装置を主張していた。
【0245】
しかし、場合によっては、帳票の一部分に在る帳票の特徴部分のみに着目して、帳票のフォーマットを識別しても良い。この第2の発明はその例である。
【0246】
そこで、この第2の発明のフォーマット認識装置は、認識対象の帳票の一部の特徴を抽出し、該特徴を既存の帳票の一部の特徴データと照合して、前記認識対象の帳票のフォーマットを認識するフォーマット認識系を具える。
【0247】
より具体的には、フォーマットが異なる既存の複数の帳票毎の特徴的な一部分からそれぞれ抽出したパタンのデータを、予め保持している辞書と、認識対象の帳票のイメージデータから、前記既存の帳票毎の特徴的な一部分に相当する部分のパタンをそれぞれ抽出するパタン抽出部と、該パタン抽出部が抽出したパタンのデータを前記辞書中のデータと照合して、前記認識対象の帳票のフォーマットを認識するフォーマット認識系を具える。
【0248】
また、この第2の発明の文字読み取り装置は、上記の第2の発明のフォーマット認識装置と、読み取り制御データメモリと、文字認識系とを備える。
【0249】
ただし、読み取り制御データメモリは、複数の帳票ごとの該帳票から文字を読み取るために必要な読み取り制御データを保持していて、フォーマット認識装置の認識結果によって1又は複数の読み取り制御データを出力するメモリである。また、文字認識系は、読み取り制御データメモリから出力される読み取り制御データに基づいて認識対象の帳票から文字を認識するものである。
【0250】
なお、帳票の特徴的な一部分とは、例えば、帳票の所定の一部分に印刷された図形(文字パタンの場合も含む)、または、罫線の特徴的な一部分、または、これら図形及び罫線の特徴的な一部分双方とできる。
【0251】
この第2の発明のフォーマット認識装置および文字読み取り装置の実施の形態としては、例えば、第1の発明の実施の形態で説明した文字読み取り装置40の構成から、第1の辞書51および第1のフォーマット認識系55をそれぞれ除去し、そして、第2のフォーマット認識系57の構成を以下に説明するような構成とする形態がある。
【0252】
すなわち、第2のフォーマット認識系57を、認識対象の帳票のフォーマットを認識する際に起動する系とする。そして、第2のフォーマット認識系57の部分パタン切り出し部57aは、認識対象の帳票のイメージデータから、既存の帳票の特徴的な一部分に相当する部分のパタンを切り出す構成とする。なお、既存の帳票が複数である場合は、認識対象の帳票のイメージデータから、これら複数の既存の帳票毎の特徴的な一部分に相当部分をそれぞれ切り出す。認識対象の帳票のイメージデータから、既存の帳票の特徴的な一部分に相当するパタンを切り出すための位置情報は、辞書に予め保持しておくのが良い。また、個別フォーマット認識部57cは、上記切り出したパタンから特徴を抽出し、この特徴を、個別フォーマット認識辞書53内の特徴と照合して、認識対象の帳票の1又は複数のフォーマットを選択する構成とする。
【0253】
このような構成とすれば、認識対象の帳票に対して、帳票の特徴的な一部分に着目したフォーマット認識処理と、この認識結果に基づいた文字読み取り処理とが行える。
【0254】
【表1】
【0255】
【表2】
【0256】
【表3】
【0257】
【発明の効果】
上述した説明から明らかなように、この出願の第1の発明のフォーマット認識装置によれば、帳票全体から抽出した特徴を既存の帳票の特徴と照合して帳票のフォーマットを認識でき、また、帳票の一部の特徴を既存の帳票の一部の特徴と照合して帳票のフォーマットを認識できる。なお、第1のフォーマット認識系を、帳票全体の罫線パタンについての特徴を抽出する認識系とするのが良い。かつ、既存の帳票の全体の特徴データとして既存の帳票の罫線パタンによる特徴データを用いる認識系とするのが良い。なぜなら、一般に、帳票は罫線を含む。さらに、罫線は帳票の構造を特徴づける顕著なパラメータである。従って、罫線パタンに着目して第1段階のフォーマット認識を行うと、かなりの精度で帳票のフォーマットを認識できるからである。
【0258】
また、この出願の第2の発明のフォーマット認識装置によれば、帳票の一部の特徴を既存の帳票の一部の特徴と照合して帳票のフォーマットを認識する。
【0259】
したがって、これら第1および第2の発明のフォーマット認識装置によれば、パタンマッチングのみで帳票のフォーマットを認識できる。そのため、帳票種別番号のない帳票であっても、そのフォーマットを、文字切り出しの処理を含むことなく、認識することができる。
【0260】
また、文字読み取り装置の各発明では、上記のフォーマット認識装置と、このフォーマット認識装置の認識結果に応じた読み取り制御データを出力する読み取り制御データメモリと、この読み取り制御データに基づいて文字を認識する文字認識系とを具える。そのため、フォーマット認識装置で認識されたフォーマットに基づいて認識対象の文字を認識することができる。
【図面の簡単な説明】
【図1】第1の発明で用いる帳票の第1の例である。
【図2】第1の発明で用いる帳票の第2の例である。
【図3】第1の発明の第1の実施の形態の文字読み取り装置の説明図である。
【図4】第1の発明の第1の実施の形態の個別フォーマット認識部の一構成例を説明する図である。
【図5】第1の発明の文字読み取り装置の動作説明図である。
【図6】罫線抽出部の動作例を説明する図である。
【図7】罫線パタンの抽出例を説明する図である。
【図8】個別フォーマット認識での特徴抽出の説明図である。
【図9】第1の発明の第2の実施の形態の個別フォーマット認識部の一構成例を説明する図である。
【図10】第1発明の第2の実施の形態の説明図であり、抽出される特徴の説明図である。
【図11】第1の発明で用いる帳票の第3の例である。
【図12】第1の発明の第3の実施の形態の説明図であり、第3の実施の形態の文字読み取り装置の説明図である。
【図13】第1の発明の第3の実施の形態の文字読み取り装置の特に文字認識部の説明図である。
【図14】第1の発明の第3の実施の形態の文字読み取り装置の動作説明図である。
【図15】第1の発明の文字読み取り装置のさらに別の実施の形態の説明図である。
【図16】従来技術および課題の説明図である。
【符号の説明】
15,17,21,23,31,33:帳票(既存の帳票)
19,25,35:認識対象の帳票
T:帳票毎の特徴的な一部分(個別フォーマット認識領域)
L1:罫線(罫線の特徴的な部分)
a:紙面
40、140:文字読み取り装置
50、150:フォーマット認識装置
51:第1の辞書
53,153:第2の辞書
55:第1のフォーマット認識系
57,157:第2のフォーマット認識系
60:読み取り制御データメモリ
70:文字認識系
80:制御部
91:表示部
93:入力部
95:スキャナ
97:帳票イメージメモリ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a format recognition device for recognizing a format type of a form, and a character reading device for recognizing the type of a form format and reading characters according to the recognition result.
[0002]
[Prior art]
There are many types of forms in which the number, shape, size, position, and the like (hereinafter, referred to as a format) of character entry areas are different. When reading characters from a form, it is preferable to recognize the form of the form and read the characters according to the format. This is because characters can be read accurately and at high speed.
[0003]
As an example of a conventional technique for recognizing a format of a form, for example, a technique disclosed in Document 1 (“Overview of Character Recognition”, edited by Shinichiro Hashimoto, Ohmsha, March 20, 1982, pp. 203-206) There is.
[0004]
According to the technique disclosed in this
[0005]
Then, the character reading device performs character recognition to read the form type number printed on the form. Further, the reading control data corresponding to the form is read based on the recognized number. Then, the character reading device reads characters, that is, performs character recognition from the image data of the form based on the control data.
[0006]
[Problems to be solved by the invention]
However, some forms have no form identification number printed thereon. For example, it is a private form such as a transfer request form, or a general slip on the market. Then, in the case of such a form, there is a problem that the reading control data cannot be used in the conventional character reading device.
[0007]
Therefore, it is desired to realize a format recognition device capable of recognizing the format of a form on which a form type number is not printed.
[0008]
Further, a character reading apparatus capable of recognizing a format of a form on which a form type number is not printed and reading characters from the form using the format recognition result is desired.
[0009]
[Means for Solving the Problems]
(1) Therefore, according to the first aspect of the format recognition apparatus of the present application, the apparatus for recognizing the format of a form includes a first format recognition system and a second format recognition system. However, the first format recognition system is a system that extracts the entire feature of the form to be recognized, compares this feature with the entire feature data of the existing form, and recognizes the format of the form to be recognized. .It is preferable that the first format recognition system is a recognition system that extracts features of ruled line patterns of the entire form to be recognized. In addition, it is preferable to use a recognition system that uses feature data based on ruled line patterns of the existing form as the entire feature data of the existing form. Because, in general, a form includes ruled lines. Furthermore, the ruled lines are salient parameters that characterize the form structure. Therefore, if the first-stage format recognition is performed by paying attention to the ruled line pattern, the format of the form can be recognized with considerable accuracy.In addition, the second format recognition system extracts a part of a feature of a form to be recognized, and compares the feature with feature data of a part of an existing form (hereinafter, also referred to as a “characteristic part”). This is a system for recognizing the format of a form to be recognized.
[0010]
According to the first aspect of the format recognition apparatus, the entire form (or the entire form and a part of the form when the second format recognition system operates) is used for pattern matching. Then, it is determined by a pattern matching method which of the existing forms the format of the form to be recognized corresponds to. Therefore, even if the form is not printed with the form type number, the format of the form can be recognized.
[0011]
Further, in the case of the first invention of this format recognition device, since the second format recognition system is provided, the following unique operation can be obtained.
[0012]
Among existing various forms, for example, there are forms in which only a part is different. For example, like the relationship between the
[0013]
Then, for example, when reading control data for character reading is read using the format recognition result, there may be a case where the reading control data is not proper reading control data. In such a case, character reading cannot be performed as desired.
[0014]
In such a case, in the first invention of the format recognition apparatus of the present application, the second format recognition can be performed by focusing on a characteristic part of the form using the second format recognition system, so that accurate format recognition can be performed. I can do it.
[0015]
In implementing the first invention of the format recognition apparatus, it is preferable that the second format recognition system be a recognition system that operates when the first format recognition system outputs a predetermined number or more of candidates. . Here, the predetermined number is an arbitrary number of 1 or 2 or more.
[0016]
In this way, it is considered that the result of the first format recognition system can be further complemented. Further, if no candidate is obtained in the first format recognition system, it is better to notify the operator, for example, of the fact without operating the second format recognition system, so that the recognition process can be performed more efficiently. This is because it is considered possible.
[0017]
Alternatively, when the first format recognition system outputs less than a predetermined number of candidates, the second format recognition may include a part of the recognition symmetric form and a part of the existing form for every form. When the first format recognition system outputs a predetermined number or more of candidates, a part of the feature data for each of the output forms is recognized. A recognition system that recognizes the format of a form to be recognized by comparing with a part of the form of the form that is symmetric with the form may be used. In such a case, an effective format recognition by the second format recognition system can be performed when the first format recognition system lists a candidate and when the candidate is not. In this case, a threshold value in the first format recognition system is used as a first format recognition result for each of all existing forms as candidates before performing collation or the like by the second format recognition system. It is preferable to forcibly set a predetermined value equal to or more than (threshold for selecting a candidate). This is because, as will be described in detail later, it is necessary to secure initial settings for rearranging candidate forms in the second format recognition system.
[0018]
In practicing the first invention of the format recognition apparatus, it is preferable to prepare in advance a feature data used in the first and second format recognition systems in a dictionary. This is because, for example, quick processing becomes possible. Therefore, in practicing the present invention, the format recognition device stores a first dictionary holding the characteristic data of the entire form and a second dictionary storing some of the characteristics of the existing form. It is preferable to provide them.
[0019]
In practicing the first invention of the format recognition apparatus, the second format recognition system stores in advance the position information of an area (ie, a characteristic part) where the characteristic data is obtained on the existing form. In addition, it is preferable that the recognition system extracts a feature from a part of the form to be recognized specified by the position information. This makes it possible to easily specify an area of the form to be recognized that corresponds to a characteristic part of the existing form. Of course, when a plurality of existing forms are prepared (typically in most cases), the second format recognition system holds the position information of the area where the characteristic data is obtained for each existing form. Is good. When a plurality of characteristic portions are set on one form, it is preferable to retain the position information of each of the plurality of portions. It is preferable that such position information be stored in a dictionary (for example, the above-mentioned second dictionary).
[0020]
The form of the characteristic part of the form is arbitrary. However, a characteristic part of the form is replaced with one or more characteristic figures (for example, a logo, an arbitrary mark, a character pattern, etc.) existing at a predetermined position (specifically, one or more positions) of the form. (See FIG. 1). For example, a company logo is often written on a form. This is because, if attention is paid to such a characteristic figure, it is considered that the classification of the form is easy.
[0021]
Alternatively, in the case of a form having a ruled line, a characteristic part of the form is one or more places where the characteristic ruled line exists (for example, a place where the ruled line L1 in FIGS. 2A and 2B exists). It is preferred that Forms often include ruled lines. Moreover, each form often includes a characteristic ruled line portion. This is because, if attention is paid to this characteristic ruled line portion, it is considered that the classification of the form is easy.
[0022]
Alternatively, a characteristic part of the form is replaced with one or more characteristic characters (for example, “A” in FIG. 11A and FIG. ○ electricity ”or“ △△ electricity ”). This is because it is considered that the company name or the like described in the form is easy to classify the form.
[0023]
When a characteristic part of the form is a character on the form, the second format recognition system is preferably a recognition system as described below.
[0024]
That is, the character name of the characteristic character is held in advance as characteristic data of the existing form. Of course, the second format recognition system cuts out a character from an area of a form to be recognized that corresponds to an area in which a characteristic character of an existing form was written (of course, if a character exists in this area). Sometimes not.) Then, the extracted character is recognized as a character to obtain a character name. Then, the format is recognized by collating with the character name stored in advance as the characteristic data of the existing form.
[0025]
In some cases, the form type number described in the related art may be used as a characteristic part of the form. However, in this case, the present invention is applied by treating the form type number as a characteristic pattern for pattern matching instead of character recognition.
[0026]
In addition, there may be a case where a characteristic part of a form is set at a plurality of positions, that is, two or more positions on one form. In this case, since the number of collation points increases, the format recognition accuracy improves accordingly.
[0027]
In implementing the first invention of the format recognition apparatus, the feature extracted by the first format recognition system and the feature data used for collation by the first format recognition system are extracted from the entire form in the same manner. If so, there is no particular limitation. But,As mentioned above,The first format recognition system uses the ruled line pattern of the entire form.Features aboutIt is good to use a recognition system that extracts And of the existing formoverallExisting forms as feature dataRuled lineIt is preferable to use a recognition system using feature data based on a line pattern. Because, in general, a form includes ruled lines. Furthermore, the ruled lines are salient parameters that characterize the form structure. Therefore, if the first-stage format recognition is performed by paying attention to the ruled line pattern, the format of the form can be recognized with considerable accuracy.
[0028]
An apparatus for recognizing the format of a form by focusing on the ruled line pattern of the form is disclosed in Japanese Patent Application Laid-Open No. Hei 9-259221 to the present applicant.
[0029]
In implementing the first invention of the format recognition apparatus, a display unit that displays one or both of a candidate form output by the first format recognition system and a candidate form output by the second format recognition system; It is preferable that the apparatus further includes an input unit for inputting an instruction for selecting one or a plurality of forms from the forms displayed on the display unit or an instruction for not applicable.
[0030]
With such a configuration including the display unit and the input unit, the operator can confirm the correctness of the format automatically recognized by the format recognition device. Therefore, the form format can be recognized more accurately.
[0031]
In practicing the first aspect of the format recognition apparatus, it is preferable to use data for collation as a feature matrix. This is because the use of the feature matrix allows the characteristics of the pattern to be expressed well and allows effective matching (pattern matching). Note that there is no particular limitation on how to create the feature matrix. However, the claim16-18The method of creating a feature matrix as claimed in the above is preferable for the purpose of the present invention.
[0032]
Further, in the first aspect of the format recognition apparatus, the first format recognition system may be constituted by two or more format recognition systems different in the manner of extracting the entire feature of the form. Further, there may be a case where the second format recognition system is configured by two or more format recognition systems different in the manner of extracting some features of the form. As examples of the second format recognition system including a plurality of recognition systems, for example, a format recognition system focusing on a characteristic figure existing in a part of a form, a format recognition focusing on a ruled line of a part of the form An example can be given in which at least two recognition systems are selected from among a system and a format recognition system focusing on characteristic characters on a form.
[0033]
(2) Further, the second recognition of the format recognition device of this applicationClearlyAccording to the apparatus for recognizing a format of a form, a part of a form to be recognized is extracted, and the characteristic is compared with characteristic data of a part (a characteristic part) of an existing form, and the recognition is performed. A format recognition system for recognizing a format of a target form is provided.
[0034]
According to the second aspect of the format recognition apparatus, a part of the form is used for pattern matching. Then, it is determined by a pattern matching method which of the existing forms the format of the form to be recognized corresponds to. Therefore, even if the form is not printed with the form type number, the format of the form can be recognized. Of course, since only the characteristic part of the form is focused on, the format recognition processing can be speeded up.
[0035]
In implementing the second invention of the format recognition apparatus, the configuration of the format recognition system is the same as the preferred configuration example described above for the second format recognition system of the first invention of the format recognition apparatus. It is preferable to have a similar configuration.
[0036]
Also in the case of the second invention, the format recognition system may be constituted by two or more format recognition systems which differ from each other in the manner of extracting a part of the form.
[0037]
(3) According to the first aspect of the character reading apparatus of the present application, the format recognition apparatus of the first aspect described above, and the reading control necessary for reading characters from the existing form for each of the existing forms A read control data memory that holds data and outputs one or a plurality of control data according to the recognition result of the format recognition device; and a form to be recognized based on the read control data output from the read control data memory. And a character recognizing device for recognizing characters from.
[0038]
According to this character reading device, character recognition can be performed based on control data appropriate for a form to be recognized. Therefore, character recognition can be performed accurately and efficiently.
[0039]
In practicing the first invention of this character reading device, if the second format recognition system of the format recognition device is a recognition system that performs format recognition by focusing on some characters of a form, It is preferable that the components used for clipping and character recognition are used for both the second format recognition system and the character recognition system.
[0040]
That is, a character cutout unit for cutting out a character pattern from image data of a form to be recognized, a character pattern memory for storing the cutout characters, a character recognition dictionary, and a cutout character pattern as data in the character recognition dictionary. As a character recognition unit for collating and recognizing a character, a character cutout unit, a character pattern memory, a character recognition dictionary, and a character recognition unit which are shared by the second format recognition system and the character recognition system are provided. It is suitable. In this case, compared with the case where the above is not performed, effects such as a reduction in the hardware scale and software scale of the character reading device can be obtained.
[0041]
(4) According to the second aspect of the character reading apparatus of the present application, the format recognition apparatus of the second aspect described above, and reading control necessary for reading characters from the existing form for each of the existing forms A read control data memory that holds data and outputs one or a plurality of control data according to the recognition result of the format recognition device; and a form to be recognized based on the read control data output from the read control data memory. And a character recognizing device for recognizing characters from.
[0042]
According to this character reading device, character recognition can be performed based on control data appropriate for a form to be recognized. Therefore, character recognition can be performed accurately and efficiently.
[0043]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, an embodiment of a format recognition device and a character reading device according to the present invention will be described with reference to the drawings. It should be noted that each drawing used in the description merely schematically shows each component so that the present invention can be understood. Further, in each of the drawings, the same components are denoted by the same reference numerals, and overlapping description thereof may be omitted.
[0044]
1. First invention of format recognition device and character reading device
1-1. Brief description of the first invention
First, the outline of the first invention will be described. There are many types of forms. Some examples of forms will be described with reference to FIGS. 1, 2, and 11. FIG.
[0045]
FIGS. 1A and 1B are diagrams showing existing
[0046]
The
[0047]
FIGS. 2A and 2B are diagrams showing existing
[0048]
The
[0049]
FIGS. 11A and 11B are diagrams showing existing
[0050]
The
[0051]
Each of the forms shown in FIGS. 1A to 2C and FIGS. 11A to 11C is a form on which a ruled line for dividing an area where a predetermined item is described is printed on a sheet a. Then, characters (01, 02 in the figure) representing the attributes of the written characters and predetermined items are transmitted to the used forms (FIG. 1 (C), FIG. 2 (C), FIG. 11 (C)). (In the figure, ABC, that is, DEF, Kakikukeko, Aiokaokikukeko) are described.
[0052]
Here, in the
[0053]
Also, the
[0054]
Also, in the
[0055]
Of course, this characteristic figure, characteristic ruled line, or characteristic character is not limited to the above example, but any characteristic figure (for example, a rectangle, a circle, an ellipse, etc.), any characteristic Can be ruled lines or any characteristic character. Further, the region T may be a case where there are a plurality of locations in one form.
[0056]
The
[0057]
However, when the form 19 (the
[0058]
Thus, in the first invention of this application, a first step of recognizing a format of a form to be recognized by collating a pattern of an entire form with a pattern of each of a plurality of forms in a first dictionary; Extracting a pattern corresponding to each characteristic part from the form to be recognized, collating the pattern with a pattern in the second dictionary, and recognizing the format of the form to be recognized. A format recognition device to be implemented and a character reading device including the recognition device are proposed. This will be described below.
[0059]
1-2. Description of the configuration of the
First, an embodiment (first embodiment) of a character reading apparatus suitable for recognizing the format of the form group described with reference to FIG. 1 and reading characters will be described.
[0060]
FIG. 3 is a functional block diagram schematically showing the configuration of the
[0061]
The
[0062]
The
[0063]
The first dictionary 51 (hereinafter, also referred to as a format recognition dictionary 51) previously holds, as characteristic data, pattern data extracted from the entire plurality of existing forms having different formats.
[0064]
A plurality of existing forms having different formats are arbitrary forms prepared in advance. For example, various forms including the
[0065]
Further, the
[0066]
The data of the ruled line pattern held in the
[0067]
The second dictionary 53 (hereinafter, also referred to as an individual format recognition dictionary 53) previously holds, as characteristic data, pattern data extracted from characteristic portions of a plurality of existing forms having different formats. In the example of FIG. 1, the
[0068]
The data of these patterns can be stored in the
[0069]
A first format recognition system 55 (hereinafter, also simply referred to as a format recognition system) extracts features of the entire form from the image data of the form to be recognized, and stores the extracted features in feature data in the first dictionary. And the format of the form to be recognized is recognized. More specifically, in this case, the format of the form to be recognized is recognized by comparing the feature matrix of the pattern extracted from the form to be recognized with the feature matrix in the
[0070]
The first
[0071]
The second format recognition system 57 (hereinafter, also referred to as an individual format recognition system 57) includes a predetermined number of candidate forms (for example, one or more in this example) as recognition results by the first
[0072]
The second
[0073]
FIG. 4 is a functional block diagram illustrating a specific configuration example of the second
[0074]
The individual
[0075]
The line
[0076]
The
[0077]
The
[0078]
The feature
[0079]
The collating
[0080]
The read
[0081]
Examples of the data relating to the character pattern extraction include, for example, the position of a character line existing on the form paper a, the position and number of fields existing on the form paper a, the pitch and number of characters existing on the form paper a. Can be mentioned. Further, as data relating to the recognition of a character pattern, for example, a character type and a character type of a character described on a form paper surface a can be cited. Of course, it is not limited to these.
[0082]
The read
[0083]
The
[0084]
The
[0085]
Such a character recognition system can be constituted by, for example, a character recognition system disclosed in Japanese Patent Application Laid-Open No. 9-259221 of the present application (details will be described later in the operation description).
[0086]
The
[0087]
The
[0088]
The
[0089]
1-3. Description of the operation of the
(Schematic description of overall operation)
First, the overall operation of the
[0090]
First, the image data of the
[0091]
The pressing surface for holding down the form may be a color converted into a black pixel, for example, black, like the line in the sheet a of the
[0092]
When the form image data is stored in the
[0093]
The activated ruled
[0094]
When the ruled
[0095]
The activated
[0096]
On the other hand, when one or more candidate forms are output in the recognition by the first
[0097]
However, even if one or more candidate forms are indicated in the recognition by the first
[0098]
When the individual format recognition information corresponding to all or a part of each of the candidate forms listed by the first
[0099]
The partial
[0100]
When the partial
[0101]
The above processing (S4 to S8) is repeated for each type of individual format identification, that is, for each of a plurality of format candidates.
[0102]
Next, the
[0103]
When the
[0104]
When the
[0105]
For example, the
[0106]
The
[0107]
As described above, the read control data in this case is control data for extracting a character pattern and control data for recognizing a character pattern. Therefore, in detail, the
[0108]
Next, the
[0109]
The
[0110]
If the recognition has not been completed for all the characters on the
[0111]
Next, a detailed operation of each unit will be described.
[0112]
(Operation for extracting ruled line patterns)
First, the extraction of a ruled line pattern performed by the ruled
[0113]
When extracting a horizontal ruled line pattern, the form image data is horizontally scanned, and a line drawing element of the form image data that is continuous on the horizontal scanning line by a length Lh equal to or longer than the horizontal ruled line threshold TH (Lh) is determined by a line drawing element of the horizontal ruled line pattern. Extract as Line drawing elements (including one line drawing element that is not continuous but continuous on a horizontal scanning line) of the form image data in which the continuous length Lh is less than the horizontal ruled line threshold TH (Lh) are defined by the horizontal ruled line pattern. Extract as background pixel. The background pixels of the form image data are also extracted as the background pixels of the horizontal ruled line pattern. The horizontal ruled line pattern is a pattern composed of line drawing elements and background pixels extracted from the form image data in this manner.
[0114]
Similarly, when extracting the vertical ruled line pattern, the form image data is vertically scanned, and a line drawing element of the form image data that is continuous on the vertical scanning line by a length Lv that is equal to or longer than the vertical ruled line threshold TH (Lv) is extracted. Extract as line drawing element. Line drawing elements (including one line drawing element that is not continuous but continuous on the vertical scanning line) of the form image data in which the continuous length Lv is less than the vertical ruled line threshold TH (Lv) are the vertical ruled line patterns. Extract as background pixel. Background pixels of the form image data are also extracted as background pixels of the vertical ruled line pattern. The vertical ruled line pattern is a pattern composed of line drawing elements and background pixels extracted from the form image data in this manner.
[0115]
When the extracted ruled line pattern is stored in the ruled
[0116]
When storing in the ruled line common storage area, the background pixels are stored in the entire ruled line common storage area (initialization of the ruled line common storage area), and then the line drawing elements of the extracted horizontal ruled line pattern are stored in the common storage area. At the same time, the extracted line drawing elements of the vertical ruled line pattern are stored in the common storage area.
[0117]
In the case of storing in the ruled line individual storage area, background pixels are stored in the entire ruled line individual storage area provided for the horizontal ruled line pattern (initialization of the ruled line individual storage area), and then provided for the horizontal ruled line pattern. The extracted line drawing elements of the horizontal ruled line pattern are stored in the ruled line individual storage area. Also, background pixels are stored in the entire ruled line individual area provided for the vertical ruled line pattern (initialization of the ruled line individual storage area), and then the extracted vertical ruled line pattern is stored in the ruled line individual storage area provided for the vertical ruled line pattern. The line drawing element of is stored.
[0118]
FIG. 6 is a diagram for explaining the operation of the ruled line extraction unit according to this embodiment, and shows a specific example of an operation flow focusing on an operation of extracting a line drawing element of a ruled line pattern. Here, a case where the extracted horizontal ruled line pattern and vertical ruled line pattern are stored in different storage areas will be described.
[0119]
In this case, a corresponding xy coordinate system is set on the form image data storage area of the
[0120]
The ruled
[0121]
Thereafter, the ruled
[0122]
Next, the ruled
[0123]
Next, the ruled
[0124]
If the determination result in S3 is that the pixel data is a line drawing element, the length L of the continuation is determined, and the pixel data of the pixel data is set as a line drawing element candidate position (hereinafter, horizontal ruled line candidate position) for the horizontal ruled line pattern. The position is stored (S4 in FIG. 6), and thereafter, it is determined whether or not scanning of one current scanning line has been completed for the form image data (S5 in FIG. 6). Here, when the determination result that the pixel data is a line drawing element is obtained in S3, the continuous length L is counted up by one, and thus the number of continuous line drawing elements is counted. Find L.
[0125]
If it is determined in S5 that the scanning of one line of the current scanning line has not been completed, the process returns to S2 to read the next pixel data on the current scanning line.
[0126]
When the result of the determination in S5 is that the scanning of one current scanning line has been completed, the continuous length L is compared with the threshold value TH (S6 in FIG. 6). Here, since the horizontal ruled line pattern is extracted, the determined continuous length L is the continuous length Lh on the horizontal scanning line, and the horizontal ruled line threshold TH (Lh) is used as the threshold TH.
[0127]
If it is determined in S6 that the continuous length L is equal to or greater than the threshold value TH, the ruled
[0128]
If it is determined in S9 that the scanning of the form image data has not been completed over the
[0129]
Further, when the pixel data read out in the determination of S3 is determined to be not a line drawing element, that is, when the pixel data is a black pixel up to the end of one line, the continuous length L is compared with the threshold value TH ( S10 in FIG. 6).
[0130]
When the determination result that the continuous length L is equal to or larger than the threshold value TH is obtained in S10, the ruled
[0131]
Next, the ruled
[0132]
FIG. 7 shows an example in which line drawing elements of horizontal and vertical ruled line patterns are extracted from the
[0133]
In FIG. 7A,
[0134]
When the extracted horizontal ruled line pattern and vertical ruled line pattern are stored in a common storage area, the ruled line patterns may be stored in the storage area in a state of being superimposed, and the description thereof will be omitted.
[0135]
(Recognition operation in the first format recognition system)
Next, the operation of the first
[0136]
Then, in this comparison, when a certain condition (hereinafter, an individual recognition condition) is satisfied in this comparison, the format of that type is set as a format candidate of the form to be recognized.
[0137]
This individual recognition condition can be any suitable condition. For example, the
[0138]
Then, the present invention is not limited to this. For example, the first condition that the specified number is selected as a format candidate in the order of the above certainty factors, At least the second condition of selecting as a format candidate or the third condition of obtaining a distance difference between adjacent types in descending order of the degree of certainty and selecting a candidate whose distance difference is equal to or less than a certain value as a format candidate A format satisfying one condition is selected as a format candidate. Usually, format candidates are selected by combining these criteria.
[0139]
A specific example of selecting a format candidate by combining the above conditions will be described below with reference to a table described later.
[0140]
Table 1 is a table showing the form standard format, the certainty factor, and the distance output by the
[0141]
Next, Table 2 shows an example in which, in addition to the individual recognition conditions of Table 1, a certainty factor of a form standard format type having a certainty factor or more is selected. Here, an example is shown in which a condition that the certainty factor is 90 or more is added. Therefore, the form standard formats A to E are selected.
[0142]
Next, Table 3 shows an example in which, in addition to the individual recognition conditions in Table 2, a distance difference between types of adjacent form standard formats is obtained, and a candidate whose distance difference is equal to or less than a certain value is selected. Here, an example is shown in which a condition that the distance difference is 30 or less is added. Therefore, the form standard formats A to D are selected.
[0143]
(Recognition operation in the second format recognition system)
When the first
[0144]
As described above, the individual
[0145]
In creating data to be held in the
[0146]
A plurality of the individual format recognition areas T may be set on the form. In this case, information defining the characteristics and positions, sizes, shapes, and the like of the plurality of areas is stored in the individual
[0147]
In the individual format recognition, the individual format recognition is performed in order from the last candidate (for example, the candidate shown in Table 3) in the valid candidates output by the
[0148]
The partial
[0149]
The partial
[0150]
The operation of the individual
[0151]
The line
[0152]
The
[0153]
In detecting the left side position XL, vertical scanning lines are sequentially moved from left to right, and for each vertical scanning line, the presence / absence of a line drawing element on the search line is determined. The sub-scanning line position of the obtained vertical scanning line is detected as the left side position XL. Further, in detecting the right side position XR, the vertical scanning lines are sequentially moved from right to left, and the presence or absence of a line drawing element on the search line is determined for each vertical scanning line. The sub-scanning line position of the determined vertical scanning line is detected as the right side position XR. Further, in detecting the upper side position YU, the horizontal scanning lines are sequentially moved from top to bottom, and for each horizontal scanning line, the presence or absence of a line drawing element on the scanning line is determined. The sub-scanning line position of the determined horizontal scanning line is detected as the upper side position YU. In detecting the lower side position YD, the horizontal scanning lines are sequentially moved from bottom to top, and for each horizontal scanning line, the presence or absence of a line drawing element on the scanning line is determined. The sub-scanning line position of the determined horizontal scanning line is detected as the lower side position YD.
[0154]
Next, the
[0155]
Note that among the line drawing elements of the graphic pattern, a line drawing element having a continuous length L on the horizontal scanning line that is equal to or larger than the graphic threshold TH1 is extracted as a line drawing element of the horizontal sub-pattern. In addition, among the line drawing elements of the graphic pattern, a line drawing element (including a single line drawing element) whose length L continuous on the horizontal scanning line is less than the graphic threshold value TH1 and a background pixel of the graphic pattern are Extract as a line drawing element of horizontal sub-pattern. The line drawing element of the horizontal sub-pattern corresponds to a line in the horizontal direction.
[0156]
The
[0157]
Note that, among the line drawing elements of the graphic pattern, line drawing elements having a continuous length L on the vertical scanning line that is equal to or greater than the graphic threshold TH2 are extracted as line drawing elements of the vertical sub-pattern. In addition, among the line drawing elements of the graphic pattern, a line drawing element (including one line drawing element) having a continuous length on the vertical scanning line less than the graphic threshold value TH2 and a background pixel of the graphic pattern are vertically It is extracted as a line drawing element of the sub pattern. The line drawing element of the vertical sub-pattern corresponds to a line in the vertical direction.
[0158]
Further, the
[0159]
Note that, among the line drawing elements of the graphic pattern, a line drawing element whose length L that is continuous on the scanning line in the diagonally left direction is equal to or larger than the graphic threshold TH3 is extracted as a line drawing element of the left diagonal sub-pattern. In addition, among the line drawing elements of the graphic pattern, a line drawing element (including a single line drawing element) whose continuous length on the scanning line in the diagonal left direction is less than the graphic threshold value TH3 and a background pixel of the graphic pattern are It is extracted as the line drawing element of the left oblique sub-pattern. The line drawing element of the left diagonal sub-pattern corresponds to a line in the diagonal left direction of 45 degrees.
[0160]
Further, the RSP extracting unit 105d scans the cut-out figure pattern in the diagonal right direction at 45 degrees, extracts a diagonal right sub-pattern from the pattern, and stores the extracted diagonal right sub-pattern in the
[0161]
Note that, among the line drawing elements of the graphic pattern, line drawing elements having a continuous length L on the scanning line in the diagonal right direction that is equal to or greater than the graphic threshold value TH4 are extracted as line drawing elements of the diagonal right sub-pattern. In addition, among the line drawing elements of the figure pattern, a line drawing element (including one line drawing element) having a continuous length on the scanning line in the diagonal right direction that is less than the figure threshold value TH4 and a background pixel of the figure pattern are It is extracted as a line drawing element of the right oblique sub-pattern. The line drawing element of the diagonally right sub-pattern corresponds to a line in the diagonally right direction of 45 degrees.
[0162]
By setting the figure thresholds TH1 to TH4 as appropriate, it is possible to extract horizontal, vertical, diagonally left, and diagonally right sub-patterns from the graphic pattern. Here, figure thresholds TH1 to TH4 are set such that TH1 = N1 · w, TH2 = N2 · w, TH3 = N3 · w, and TH4 = N4 · w based on the line width w. Note that N1 to N4 are arbitrarily set values. Although not limited to this, for example, N1 = N2 = N3 = N4 = 2.
[0163]
FIG. 8 shows an example in which vertical, horizontal, diagonally right and diagonally left sub patterns VSP, HSP, RSP and LSP are extracted from the individual format recognition area T of the
[0164]
Next, the feature
[0165]
The feature
[0166]
Feature lijRepresents the feature amount obtained in the area of the i-th row and the j-th column. For example, the total number B of line drawing elements in the region of the i-th row and the j-th columnijAnd the line width w obtained for the graphic pattern,ij= Bij/ W. Similarly, an N × M-dimensional feature matrix is created for each of the vertical, diagonally left, and diagonally right sub-patterns.
[0167]
Next, the feature
[0168]
Next, the feature
[0169]
The
[0170]
If the output certainty factor or distance satisfies a predetermined condition, this form standard format type is selected as a valid candidate.
[0171]
Here, the predetermined condition can be any suitable condition. For example, there is a method in which the distance is a valid candidate if the distance is equal to or less than a certain value;
[0172]
The feature is extracted for the area stored in the individual
[0173]
Table 4 shows an example in which the first
[0174]
In other words, in Table 4, the individual
[0175]
When a plurality of individual format recognition areas T are set, and as a result of performing individual format recognition of the first area, if there are a plurality of valid candidates, the second and third individual format recognition areas are also described above. The feature extraction described above and the dictionary data collation are performed, and a type that does not satisfy a predetermined condition is regarded as a non-valid candidate. When the number of valid candidates becomes one, the subsequent processing is not performed.
[0176]
After the processing is completed for all the individual format recognition areas, if there are a plurality of valid candidates, the candidates are exchanged under predetermined conditions according to the result of the distance and certainty in each area.
[0177]
Examples of the candidate replacement will be described with reference to Tables 6 to 8 described later. First, a first example will be described with reference to Tables 6 and 7.
[0178]
The first example shows an example of candidate replacement in the case where first and second areas are set as individual format recognition areas T in a candidate form. In the recognition result of the first format recognition system, the type B is the first candidate form and the type D is the second candidate form (see Table 6). However, in the second format recognition system, as a result of comparing the form to be recognized with the first and second individual format recognition areas of the types B and D, only the first individual format recognition area in the type B is obtained. A recognition result equal to or greater than the threshold is obtained. In the type D, a recognition result equal to or larger than the threshold is obtained for each of the first and second individual format recognition areas. That is, type D has a larger number of matchings with the second dictionary than type B. In such a case, in the present invention, replacement of candidate forms is performed as shown in Table 7. That is, the order of the candidate forms is changed such that the type D becomes the first candidate form and the type B becomes the second candidate form.
[0179]
As a second example of candidate replacement, the following may be performed. That is, when a plurality of areas are set as individual format recognition areas in the candidate form, the plurality of areas are prioritized. Then, in the collation of the individual format recognition areas having higher priorities, the type having the smallest distance or certainty is replaced so as to become the first candidate form. For example, in the examples of Tables 6 and 8, ranking is performed such that the matching result of the first individual format recognition area is prioritized. Therefore, in the case of this example, the order of the valid candidates of the type B and the type D is the same (accordingly, the result is the same as in Table 6).
[0180]
After performing the above processing, one or more standard form formats that are valid candidates are output to the
[0181]
The
[0182]
(Character recognition operation)
The character recognition process is performed based on read control data obtained as a result of format recognition by the
[0183]
That is, a character pattern is cut out from the image data of a form to be recognized based on data related to cutting out a character pattern in the read control data. In addition, the recognition dictionary is specified by using data (for example, a font) related to character pattern recognition in the read control data.
[0184]
Next, the feature is extracted from the extracted character pattern. The features of the extracted character pattern are collated with the features stored in advance in the
[0185]
1-4. Description of the configuration of the device according to the second embodiment
The
[0186]
It is clear that a characteristic part of the ruled line is a horizontal ruled line, a vertical ruled line, or a combination of vertical and horizontal ruled lines, and if a pattern relating to HSP and VSP can be extracted and stored, a sub-pattern can be extracted. .
[0187]
In the character reading device according to the second embodiment, for example, data stored in the second dictionary is changed in accordance with a change in the configuration of the sub-pattern extraction unit. Change the configuration. Other configurations may be the same as those of the
[0188]
1-5. Description of the operation of the device of the second embodiment
The difference between the operation of the apparatus of the second embodiment and the apparatus of the first embodiment is that the operation of the sub-pattern extraction unit in the second
[0189]
FIG. 10 is a diagram showing a characteristic part T of the
[0190]
In the character reading device according to the second embodiment, operations other than the above-described operations in the second
[0191]
1-6. Description of the configuration of the device according to the third embodiment
The
[0192]
That is, the
[0193]
However, when the
[0194]
Therefore, in the third embodiment, when the first
[0195]
FIG. 12 is a block diagram showing a configuration of a
[0196]
Note that the
[0197]
First, the second dictionary 153 (also referred to as an individual format recognition dictionary 153) includes one or a plurality of characteristic features printed on a predetermined part (individual format recognition area T) of each of a plurality of existing forms having different formats. Character names of various characters are stored in advance. However, in the case of this embodiment, in addition to the character names of one or a plurality of characteristic characters described above, the set number of individual format recognition areas T, their positions, and character types of characteristic characters for each form. The
[0198]
To create such an individual
[0199]
The second
[0200]
The second
[0201]
The
[0202]
The character pattern memory 157b stores a pattern for each character cut out by the
[0203]
The
[0204]
What kind of data holds the characteristics of the character is arbitrary. However, the character recognition dictionary according to the present embodiment divides a character pattern into a plurality of regions and holds the characteristics of the characters in the form of a characteristic matrix represented by the characteristics of the divided regions.
[0205]
The
[0206]
The configuration of the
[0207]
FIG. 13 is a functional block diagram illustrating a specific configuration example of the
[0208]
The
[0209]
The line
[0210]
The
[0211]
The
[0212]
The feature
[0213]
The
[0214]
The
[0215]
The individual
[0216]
1-7. Description of the operation of the
Next, the operation of the
[0217]
Note that the processing by the first
[0218]
As in the case of the
[0219]
Next, it is determined whether or not there is a predetermined number or more (here, for example, one or more examples) of candidate forms (S3 in FIG. 14). If there is no candidate form, the
[0220]
When the individual format recognition information corresponding to all or a part of each of the candidate forms output by the first
[0221]
The
[0222]
When the
[0223]
Each process of feature extraction, collation, and character recognition in the
[0224]
First, the line
[0225]
The
[0226]
The
[0227]
The feature
[0228]
The
[0229]
When a plurality of characteristic portions T are defined in one candidate form, the process is repeated from step S5 by the number of the portions, and a recognition result is output (S8 in FIG. 5).
[0230]
The above processing (S4 to S8) is repeated for each type of individual format identification, that is, for each of a plurality of format candidates.
[0231]
When the
[0232]
The activated individual
[0233]
When the
[0234]
When the
[0235]
For example, the
[0236]
The
[0237]
As described above, the read control data in this case is control data for extracting a character pattern and control data for recognizing a character pattern. The
[0238]
Thereafter, as described in the first embodiment, the
[0239]
In the above description, the second format recognition system operates when the first format recognition system outputs a predetermined number or more of candidates, and the first format recognition system determines that the number of candidates is less than the predetermined number. In the case of only outputting (including 0), the recognition system leaves the process to the control unit (see steps S3 and S21 in FIGS. 5 and 14). However, when the second format recognition system outputs less than a predetermined number of candidates, the first format recognition system outputs a part of the recognition-symmetric form and a part of the existing form for every form. When the first format recognition system outputs a predetermined number or more of candidates, a part of the feature data for each of the output forms is recognized. A recognition system that recognizes the format of a form to be recognized by comparing with a part of the form of the form that is symmetric with the form may be used.
[0240]
In this way, effective format recognition by the second format recognition system can be performed when the first format recognition system names a candidate and when the candidate is not.
[0241]
An operation example of such a configuration will be described with reference to FIG. FIG. 15 is a diagram in which the process of step S21 in FIG. 5 is changed according to the present mode.
[0242]
When the first
[0243]
Further, even in the case of focusing on the characteristic characters described with reference to FIG. 14, when the first format recognition system outputs less than a predetermined number of candidates, the second format recognition system outputs the second dictionary. The second format recognition system can be configured so as to recognize the format of a form to be recognized, using all existing forms in the list as candidates. In that case, the configuration of the second format recognition system 157 (FIG. 12) may be changed so that the process of step S31 of FIG. 15 is performed instead of the process of step S21 in FIG.
[0244]
2. Second invention of format recognition device and character reading device
In the above-described first invention, a first step of recognizing a format of a form to be recognized by collating a pattern of the entire form with a pattern of each existing form in the first dictionary; A feature is extracted from an area corresponding to a characteristic part of each candidate form, and the special work is compared with feature data of an existing form in a second dictionary to recognize a format of a form to be recognized. Claimed device to perform the steps and.
[0245]
However, in some cases, the format of the form may be identified by focusing only on the characteristic part of the form existing in a part of the form. This second invention is an example.
[0246]
Therefore, the format recognition apparatus according to the second aspect of the present invention extracts a part of a form of a form to be recognized, compares the characteristic with a part of characteristic data of an existing form, and formats the form of the form to be recognized. It has a format recognition system that recognizes
[0247]
More specifically, data of patterns extracted from characteristic portions of each of a plurality of existing forms having different formats are stored in advance in a dictionary and image data of a form to be recognized. A pattern extraction unit for extracting a pattern corresponding to a characteristic part of each of the patterns, and comparing the data of the pattern extracted by the pattern extraction unit with the data in the dictionary, to format the form of the form to be recognized. It has a format recognition system to recognize.
[0248]
Further, a character reading device according to a second aspect of the present invention includes the format recognition device according to the second aspect of the invention, a read control data memory, and a character recognition system.
[0249]
However, the read control data memory holds read control data necessary for reading characters from the form for each of the forms, and outputs one or a plurality of read control data according to the recognition result of the format recognition device. It is. The character recognition system recognizes a character from a form to be recognized based on read control data output from a read control data memory.
[0250]
The characteristic part of the form is, for example, a figure (including a character pattern) printed on a predetermined part of the form, a characteristic part of the ruled line, or a characteristic part of these figures and the ruled line. Some can be both.
[0251]
Embodiments of the format recognition device and the character reading device according to the second invention include, for example, the configuration of the
[0252]
That is, the second
[0253]
With this configuration, a format recognition process that focuses on a characteristic part of the form and a character reading process based on the recognition result can be performed on the form to be recognized.
[0254]
[Table 1]
[0255]
[Table 2]
[0256]
[Table 3]
[0257]
【The invention's effect】
As is clear from the above description, according to the format recognition apparatus of the first invention of the present application, the features extracted from the entire form can be checked against the features of the existing form to recognize the format of the form. Can be compared with some features of existing forms to recognize the format of the form.It is preferable that the first format recognition system is a recognition system that extracts features of ruled line patterns of the entire form. In addition, it is preferable to use a recognition system that uses feature data based on ruled line patterns of the existing form as the entire feature data of the existing form. Because, in general, a form includes ruled lines. Furthermore, the ruled lines are salient parameters that characterize the form structure. Therefore, if the first-stage format recognition is performed by paying attention to the ruled line pattern, the format of the form can be recognized with considerable accuracy.
[0258]
Further, according to the format recognition apparatus of the second invention of this application, a part of the form is compared with a part of the existing form to recognize the form of the form.
[0259]
Therefore, according to the format recognition devices of the first and second inventions, the format of the form can be recognized only by pattern matching. Therefore, even for a form without a form type number, its format can be recognized without including a character cutout process.
[0260]
Further, in each invention of the character reading device, the format recognition device described above, a read control data memory that outputs read control data according to a recognition result of the format recognition device, and recognizes characters based on the read control data. It has a character recognition system. Therefore, the character to be recognized can be recognized based on the format recognized by the format recognition device.
[Brief description of the drawings]
FIG. 1 is a first example of a form used in the first invention.
FIG. 2 is a second example of a form used in the first invention.
FIG. 3 is an explanatory diagram of the character reading device according to the first embodiment of the first invention.
FIG. 4 is a diagram illustrating a configuration example of an individual format recognition unit according to the first embodiment of the first invention.
FIG. 5 is an operation explanatory diagram of the character reading device of the first invention.
FIG. 6 is a diagram illustrating an operation example of a ruled line extraction unit.
FIG. 7 is a diagram illustrating an example of extracting a ruled line pattern.
FIG. 8 is an explanatory diagram of feature extraction in individual format recognition.
FIG. 9 is a diagram illustrating a configuration example of an individual format recognition unit according to the second embodiment of the first invention.
FIG. 10 is an explanatory diagram of the second embodiment of the first invention, and is an explanatory diagram of features to be extracted;
FIG. 11 is a third example of a form used in the first invention.
FIG. 12 is an explanatory diagram of the third embodiment of the first invention, and is an explanatory diagram of the character reading device of the third embodiment.
FIG. 13 is an explanatory diagram particularly illustrating a character recognition unit of the character reading device according to the third embodiment of the first invention.
FIG. 14 is an operation explanatory diagram of the character reading device according to the third embodiment of the first invention.
FIG. 15 is an explanatory diagram of still another embodiment of the character reading device of the first invention.
FIG. 16 is an explanatory diagram of a conventional technique and a problem.
[Explanation of symbols]
15, 17, 21, 23, 31, 33: Form (existing form)
19, 25, 35: Form to be recognized
T: Characteristic part of each form (individual format recognition area)
L1: Ruled line (characteristic part of ruled line)
a: space
40, 140: character reading device
50, 150: Format recognition device
51: First dictionary
53,153: Second dictionary
55: First format recognition system
57, 157: Second format recognition system
60: Read control data memory
70: Character recognition system
80: control unit
91: Display section
93: Input section
95: Scanner
97: Form image memory
Claims (21)
認識対象の帳票の全体の特徴を抽出し、該特徴を既存の帳票の全体の特徴データと照合して、前記認識対象の帳票のフォーマットを認識する第1のフォーマット認識系と、
前記認識対象の帳票の一部の特徴を抽出し、該特徴を既存の帳票の一部の特徴データと照合して、前記認識対象の帳票のフォーマットを認識する第2のフォーマット認識系とを具え、
前記第1のフォーマット認識系は、前記認識対象の帳票から罫線パタンについての特徴を抽出し、かつ、前記既存の帳票の全体の特徴データとして該帳票の罫線パタンについての特徴データを用いる認識系であること
を特徴とするフォーマット認識装置。In a device that recognizes the format of a form,
A first format recognition system that extracts the entire feature of the form to be recognized, compares the feature with the entire feature data of the existing form, and recognizes the format of the form to be recognized;
A second format recognition system for extracting a part of the form of the form to be recognized, collating the characteristic with a part of characteristic data of the existing form, and recognizing the format of the form to be recognized. ,
The first format recognition system is a recognition system that extracts a feature of a ruled line pattern from a form to be recognized and uses feature data of a ruled line pattern of the existing form as feature data of the entire existing form. format recognition apparatus according to claim <br/> that.
前記既存の帳票の全体の特徴データを保持している第1の辞書と、
前記既存の帳票の一部の特徴を保持している第2の辞書と
を具えたことを特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A first dictionary holding the entire feature data of the existing form;
A format recognition device, comprising: a second dictionary that holds some features of the existing form.
第2のフォーマット認識系は、
前記認識対象の帳票から所定個数以上の部分パタンについての特徴を抽出し、かつ、前記既存の帳票の一部の特徴データとして該帳票の所定個数以上の部分パタンについての特徴データを用いる認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The second format recognition system is
A recognition system that extracts features of a predetermined number or more of partial patterns from the form to be recognized, and uses feature data of a predetermined number or more of partial patterns of the form as feature data of a part of the existing form. A format recognition device, comprising:
前記第2のフォーマット認識系は、前記第1のフォーマット認識系が所定個数以上の候補を出力した場合に動作する認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The format recognition apparatus according to claim 2, wherein the second format recognition system is a recognition system that operates when the first format recognition system outputs a predetermined number or more of candidates.
前記第2のフォーマット認識系は、
前記第1のフォーマット認識系が所定個数未満の候補を出力した場合は、前記認識対象の帳票の一部の特徴と、前記既存の帳票の全ての帳票毎の一部の特徴データとの照合をして、前記認識対象の帳票のフォーマットを認識し、
前記第1のフォーマット認識系が所定個数以上の候補を出力した場合は、該出力された帳票毎の一部の特徴データと前記認識対象の帳票の一部の特徴との照合をして、前記認識対象の帳票のフォーマットを認識する認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The second format recognition system includes:
When said first format recognition system outputs the candidate less than predetermined number, and some of the features of the form of the recognition Target, matching a part of the feature data of each of all of the form of the existing form To recognize the format of the form to be recognized,
When said first format recognition system has output more candidate predetermined number, and the matching with the some of the features of some of the characteristic data and the recognition subject to form for each form that is the output, A format recognition apparatus, which is a recognition system that recognizes a format of the form to be recognized.
前記帳票の一部が、1帳票中に複数設定されていることを特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A format recognition apparatus, wherein a plurality of the forms are set in one form.
前記第1のフォーマット認識系は、
前記認識対象の帳票の画像データを縦方向および横方向に走査して罫線パタンを抽出し、該抽出した罫線パタンについて特徴を抽出し、該抽出した特徴を辞書中の特徴データと照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The first format recognition system includes:
The image data of the form to be recognized is scanned vertically and horizontally to extract ruled line patterns, features are extracted from the extracted ruled line patterns, and the extracted features are compared with feature data in a dictionary and formatted. A format recognition apparatus characterized by being a system for recognizing a character.
前記帳票の一部を、帳票中の一部の図形(文字パタンの場合も含む)とし、
前記第2のフォーマット認識系は、前記認識対象の帳票の画像データから該一部の図形パタンを抽出し、該抽出した図形パタンについて特徴を抽出し、該特徴を辞書中の特徴データと照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A part of the form is a part of the form (including a character pattern) in the form,
The second format recognition system extracts a part of the graphic pattern from the image data of the form to be recognized, extracts a feature of the extracted graphic pattern, and compares the feature with feature data in a dictionary. A format recognition apparatus characterized by being a system for recognizing a format by using a format.
前記帳票の一部を、帳票中の一部の罫線とし、
前記第2のフォーマット認識系は、前記認識対象の帳票の画像データから該一部の罫線パタンを抽出し、該抽出した罫線パタンについて特徴を抽出し、該特徴を辞書中の特徴データと照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A part of the form is a part of a ruled line in the form,
The second format recognition system extracts a part of the ruled line pattern from the image data of the form to be recognized, extracts a feature of the extracted ruled line pattern, and compares the feature with feature data in a dictionary. A format recognition apparatus characterized by being a system for recognizing a format by using a format.
前記帳票の一部を、帳票中の文字とし、
前記第2のフォーマット認識系は、前記認識対象の帳票の画像データから前記文字のパタンを切り出して文字認識をして文字名を得、該文字名を既存の帳票毎の特徴データとして予め定めた文字名と照合して、フォーマットを認識する系であることを特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A part of the form is a character in the form,
The second format recognition system cuts out the pattern of the character from the image data of the form to be recognized, performs character recognition to obtain a character name, and determines the character name in advance as characteristic data for each existing form. A format recognizing device, which is a system for recognizing a format by collating with a character name.
前記第2のフォーマット認識系は、その照合結果によって認識候補順位を入れ換える認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The format recognition apparatus according to claim 2, wherein the second format recognition system is a recognition system that changes the order of recognition candidates based on a result of the comparison.
前記第2のフォーマット認識系は、
前記照合の結果、前記既存の帳票のうち前記認識対象の帳票に対する距離が小さい帳票ほど又は確信度が大きい帳票ほど上位の候補とし、ただし、
1帳票中に前記帳票の一部として複数箇所を設定した候補帳票との照合をした場合は、該照合結果としての距離が閾値以下または確信度が閾値以上となる箇所が多い候補帳票ほど上位の候補に入れ換え、又は、前記複数箇所に予め優先順位を付けておき優先度の高い箇所についての認識結果が良好な候補帳票ほど上位の候補に入れ換える認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The second format recognition system includes:
As a result of the collation, of the existing forms, the smaller the distance to the form to be recognized or the higher the degree of certainty the higher the degree of certainty, the higher the candidate,
In a case where a plurality of places are set as a part of the form in one form and the candidate form is compared with the form, a candidate form in which the distance as a result of the comparison is equal to or less than a threshold value or a certainty degree is greater than or equal to a threshold value is higher in a candidate form. A format recognition apparatus characterized in that the recognition system replaces candidates or assigns priorities to the plurality of places in advance, and replaces a candidate form with a better recognition result for a place with a higher priority with a higher candidate.
前記第2のフォーマット認識系は、前記既存の帳票上の、前記一部の特徴データを得た領域の位置情報を予め保持していて、前記認識対象の帳票の、該位置情報で特定される一部から、特徴を抽出する認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The second format recognition system previously holds position information of an area where the partial feature data is obtained on the existing form, and is specified by the position information of the form to be recognized. A format recognition device, which is a recognition system for extracting a feature from a part.
前記位置情報は、請求項2に記載の第2の辞書中に保持してあることを特徴とするフォーマット認識装置。The format recognition device according to claim 13 ,
3. The format recognition device according to claim 2, wherein the position information is held in a second dictionary according to claim 2.
前記第1のフォーマット認識系は、
前記照合結果が上位第N位までの帳票を候補帳票とする第1の条件(Nは1以上の任意の整数)、
照合結果としての確信度がある値以上または距離がある値以下の帳票を候補帳票とする第2の条件、および、
照合結果が第M位の帳票が候補帳票であるとき、該第M位の帳票の照合結果としての距離又は確信度と第M+1位の帳票の距離又は確信度との差分がある値以下であった場合、該第M+1位までの帳票を候補帳票とする第3の条件(Mは1以上の任意の整数)
の1又は2以上の条件を組み合わせた条件により、候補帳票を決める認識系であること
を特徴とするフォーマット認識装置。The format recognition device according to claim 1,
The first format recognition system includes:
A first condition (N is an arbitrary integer of 1 or more) in which the forms up to the Nth place in the comparison result are set as candidate forms;
A second condition that a form having a certainty factor or more as a collation result or a value having a distance or less is set as a candidate form, and
When the matching result of the M-th form is a candidate form, the difference between the distance or certainty as the matching result of the M-th form and the distance or certainty of the M + 1-th form is smaller than a certain value. and when a third condition that the form of the until the M + 1 of a candidate document (M being any integer not less than 1)
A format recognition apparatus characterized in that the format recognition apparatus is a recognition system that determines a candidate form based on a combination of one or more of the above conditions.
前記第2のフォーマット認識系は、
前記抽出した図形パタンをM×Nに分割し、該分割した各領域の水平、垂直、左斜めおよび右斜め方向それぞれで図形と判断される閾値以上の線描画素を、水平方向サブパタン、垂直方向サブパタン、左斜め方向サブパタンおよび右斜め方向サブパタンとしてそれぞれ抽出し、これら各方向サブパタンについて特徴マトリクスを作成し、
該特徴マトリクスを辞書中の特徴マトリクスと照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置(ただし、M,Nは正の整数であり、互いは同じでも、異なっても良い。)。The format recognition device according to claim 8 ,
The second format recognition system includes:
The extracted figure pattern is divided into M × N, and line drawing elements having threshold values or more that are determined to be figures in the horizontal, vertical, diagonally left and diagonally right directions of each of the divided areas are classified into a horizontal sub pattern and a vertical sub pattern. , Extracted as a left diagonal direction sub-pattern and a right diagonal direction sub-pattern, and creates a feature matrix for each of these direction sub-patterns.
A format recognition apparatus characterized in that the system recognizes the format by comparing the feature matrix with a feature matrix in a dictionary (where M and N are positive integers, and may be the same or different from each other) .).
前記第2のフォーマット認識系は、
前記抽出した罫線パタンをM×Nに分割し、該分割した各領域の水平および垂直方向それぞれで罫線と判断される閾値以上の線描画素を、水平方向サブパタンおよび垂直方向サブパタンとしてそれぞれ抽出し、これら各方向サブパタンについて特徴マトリクスを作成し、
該特徴マトリクスを辞書中の特徴マトリクススと照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置(ただし、M,Nは正の整数であり、互いは同じでも、異なっても良い。)。The format recognition device according to claim 9 ,
The second format recognition system includes:
The extracted ruled line pattern is divided into M × N, and line drawing elements that are determined to be ruled lines in the horizontal and vertical directions of each of the divided regions are extracted as horizontal and vertical sub-patterns, respectively. Create a feature matrix for each direction sub-pattern,
A format recognition apparatus characterized in that the system recognizes the format by comparing the feature matrix with a feature matrix in a dictionary (where M and N are positive integers and may be the same or different from each other). good.).
前記第2のフォーマット認識系は、
前記切り出した文字パタンをM×Nに分割し、該分割した各領域から水平、垂直、左斜めおよび右斜め方向サブパタンをそれぞれ抽出し、これら各方向サブパタンについて特徴マトリクスを作成し、
該特徴マトリクスを辞書中の特徴マトリクススと照合して前記文字名を得、
該文字名を辞書と照合してフォーマットを認識する系であること
を特徴とするフォーマット認識装置(ただし、M,Nは正の整数であり、互いは同じでも、異なっても良い。)。The format recognition device according to claim 10 ,
The second format recognition system includes:
The cut out character pattern is divided into M × N, horizontal, vertical, left diagonal and right diagonal sub-patterns are extracted from each of the divided areas, and a feature matrix is created for each of these sub-patterns.
The feature matrix is compared with a feature matrix in a dictionary to obtain the character name,
A format recognition apparatus characterized in that the character name is compared with a dictionary to recognize a format (however, M and N are positive integers, and may be the same or different).
前記第1のフォーマット認識系が出力する候補帳票、および、前記第2のフォーマット認識系が出力する候補帳票の一方または双方を表示する表示部と、
該表示部に表示された帳票から1または複数の帳票を選択するための指示、または、該当なしという指示を入力する入力部と
を具えたことを特徴とするフォーマット認識装置。The format recognition device according to claim 1,
A display unit for displaying one or both of a candidate form output by the first format recognition system and a candidate form output by the second format recognition system;
A format recognition apparatus comprising: an input unit for inputting an instruction for selecting one or a plurality of forms from the forms displayed on the display unit, or an instruction for not applicable.
既存の帳票ごとの該帳票から文字を読み取るために必要な読み取り制御データを保持していて、前記フォーマット認識装置の認識結果によって1又は複数の読み取り制御データを出力する読み取り制御データメモリと、
該読み取り制御データメモリから出力される読み取り制御データに基づいて前記認識対象の帳票から文字を認識する文字認識系と
を具えたことを特徴とする文字読み取り装置。A format recognition device according to any one of claims 1 to 19 ,
A read control data memory that holds read control data necessary to read characters from the form for each existing form and outputs one or a plurality of read control data according to the recognition result of the format recognition device;
A character recognition system for recognizing a character from the form to be recognized based on the read control data output from the read control data memory.
前記フォーマット認識装置の第2のフォーマット認識系が、帳票の一部の文字に着目してフォーマット認識をする認識系である場合、
認識対象の帳票の画像データから文字パタンを切り出すための文字切り出し部、
該切り出した文字を格納する文字パタンメモリ、
文字認識辞書、および、
切り出した文字パタンを前記文字認識辞書中のデータと照合して文字を認識する文字認識部であって、
前記の第2のフォーマット認識系および前記文字認識系で兼用される、文字切り出し部、文字パタンメモリ、文字認識辞書および文字認識部を具えること
を特徴とする文字読み取り装置。The character reading device according to claim 20 ,
When the second format recognition system of the format recognition device is a recognition system that performs format recognition by focusing on some characters of a form,
A character extraction unit for extracting a character pattern from image data of a form to be recognized,
A character pattern memory for storing the extracted characters,
Character recognition dictionary, and
A character recognition unit that recognizes a character by comparing the cut-out character pattern with data in the character recognition dictionary,
A character reading device comprising a character cutout unit, a character pattern memory, a character recognition dictionary, and a character recognition unit, which are used in the second format recognition system and the character recognition system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06180698A JP3573945B2 (en) | 1998-03-12 | 1998-03-12 | Format recognition device and character reading device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP06180698A JP3573945B2 (en) | 1998-03-12 | 1998-03-12 | Format recognition device and character reading device |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2004015293A Division JP3923474B2 (en) | 2004-01-23 | 2004-01-23 | Character reader |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11259597A JPH11259597A (en) | 1999-09-24 |
JP3573945B2 true JP3573945B2 (en) | 2004-10-06 |
Family
ID=13181714
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP06180698A Expired - Lifetime JP3573945B2 (en) | 1998-03-12 | 1998-03-12 | Format recognition device and character reading device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3573945B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008165339A (en) * | 2006-12-27 | 2008-07-17 | Mitsubishi Electric Information Systems Corp | Business form identification unit and business form identification program |
JP4840224B2 (en) * | 2007-03-29 | 2011-12-21 | 沖電気工業株式会社 | Form processing device |
JP2009025856A (en) * | 2007-07-17 | 2009-02-05 | Hitachi Computer Peripherals Co Ltd | Document discrimination program and document discrimination device |
JP4539756B2 (en) | 2008-04-14 | 2010-09-08 | 富士ゼロックス株式会社 | Image processing apparatus and image processing program |
JP5617249B2 (en) | 2010-01-20 | 2014-11-05 | 富士ゼロックス株式会社 | Form identification device, form identification program, and form processing system |
JP6989455B2 (en) * | 2018-07-24 | 2022-01-05 | 富士通フロンテック株式会社 | Program and form classification device |
JP2020154667A (en) | 2019-03-20 | 2020-09-24 | 株式会社Pfu | Information processing device, method, and program |
JP6896260B1 (en) * | 2020-04-08 | 2021-06-30 | Arithmer株式会社 | Layout analysis device, its analysis program and its analysis method |
-
1998
- 1998-03-12 JP JP06180698A patent/JP3573945B2/en not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JPH11259597A (en) | 1999-09-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7519226B2 (en) | Form search apparatus and method | |
US5721940A (en) | Form identification and processing system using hierarchical form profiles | |
JPH08293001A (en) | Image processing unit and method and optical character recognition unit and method | |
EP2830024A1 (en) | System for reading paper sheet serial number, and method for reading paper sheet serial number | |
JP2002312385A (en) | Document automated dividing device | |
EP2553626A2 (en) | Segmentation of textual lines in an image that include western characters and hieroglyphic characters | |
US6920247B1 (en) | Method for optical recognition of a multi-language set of letters with diacritics | |
US5561720A (en) | Method for extracting individual characters from raster images of a read-in handwritten or typed character sequence having a free pitch | |
JP3573945B2 (en) | Format recognition device and character reading device | |
JP3923474B2 (en) | Character reader | |
JP2010061471A (en) | Character recognition device and program | |
JP4347675B2 (en) | Form OCR program, method and apparatus | |
JP3276555B2 (en) | Format recognition device and character reader | |
JP3159087B2 (en) | Document collation device and method | |
JP2003030654A (en) | Pattern identification device, pattern identification method and program for pattern identification | |
US7110600B1 (en) | Document identifying device and method | |
JP4810853B2 (en) | Character image cutting device, character image cutting method and program | |
JP3114446B2 (en) | Character recognition device | |
JPH09305701A (en) | Slip recognition method | |
JP2537973B2 (en) | Character recognition device | |
JP3998439B2 (en) | Image processing apparatus, image processing method, and program causing computer to execute these methods | |
JP3428504B2 (en) | Character recognition device | |
JP3276554B2 (en) | Format recognition device and character reader | |
JPH09326012A (en) | Character recognizing device and its method | |
JP2887823B2 (en) | Document recognition device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20040629 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20040630 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080709 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090709 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100709 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110709 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120709 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130709 Year of fee payment: 9 |
|
EXPY | Cancellation because of completion of term |