Nothing Special   »   [go: up one dir, main page]

JP5591578B2 - 文字列認識装置および文字列認識方法 - Google Patents

文字列認識装置および文字列認識方法 Download PDF

Info

Publication number
JP5591578B2
JP5591578B2 JP2010095638A JP2010095638A JP5591578B2 JP 5591578 B2 JP5591578 B2 JP 5591578B2 JP 2010095638 A JP2010095638 A JP 2010095638A JP 2010095638 A JP2010095638 A JP 2010095638A JP 5591578 B2 JP5591578 B2 JP 5591578B2
Authority
JP
Japan
Prior art keywords
character string
character
search range
section
strings
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010095638A
Other languages
English (en)
Other versions
JP2011227636A (ja
Inventor
宏 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nidec Instruments Corp
Original Assignee
Nidec Sankyo Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nidec Sankyo Corp filed Critical Nidec Sankyo Corp
Priority to JP2010095638A priority Critical patent/JP5591578B2/ja
Priority to CN201110111273.XA priority patent/CN102222241B/zh
Priority to US13/088,781 priority patent/US8315462B2/en
Publication of JP2011227636A publication Critical patent/JP2011227636A/ja
Application granted granted Critical
Publication of JP5591578B2 publication Critical patent/JP5591578B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/147Determination of region of interest
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Description

本発明は、紙やプラスチックなどの材質からなる媒体(記録担体)上にある文字列を光学的に読み取るための文字列認識装置および文字列認識方法に関するものである。
本発明における「文字列」とは、複数個の文字の並びを意味する。ここで、「文字」は、一般的なアルファベットだけでなく、記号文字や絵文字、バーコード、2次元コード、さらには数字なども含み、媒体上で視認できる限り、いかなる形態・大きさでも構わない。さらに、活字文字であると手書き文字であるとを問わない。
従来から、例えば小切手などの媒体の表面に印刷された文字列を認識するための文字認識方法およびその装置がある。このような文字列認識方法およびその装置では、手動操作に起因して媒体搬送速度が変動し、媒体移動方向への画像の歪みが発生した場合、それに伴って、媒体移動方向と垂直な方向にも画像歪みが発生する場合がある(例えば、文字列が傾いたり、うねったりする場合がある)。また、媒体下辺部が撮像装置(文字認識装置)の搬送路面から浮き上がることによっても、媒体移動方向と垂直な方向に画像歪みが発生する場合がある。
このような問題を解決するために、例えば特許文献1に開示された文字認識方法では、媒体上の文字列の方向(文字の配列方向であり、これを「水平方向」という)と垂直な方向(これを「垂直方向」という)に、画素を1或いは数画素ずつシフトさせながら、文字列の方向への画像データの射影を計算する第1ステップと、この第1ステップにより得られた第1射影データに基づいて、垂直方向における文字列の位置を検出する第2ステップと、を含ませることとし、かつ、上述した第1ステップでは、画像データが文字列の方向において所定数の区画(セグメント)に分割された後、その区画ごとに水平方向への射影データの計算が行われている。
すなわち、垂直方向における文字列の位置を検出するのに必要な水平方向への射影(第1射影データ)の計算において、画素値の加算範囲を媒体の進行方向または文字列の方向に沿った全幅とするのでなく、それを何等分かに区切り、区画ごとにその長さを加算範囲として区分的に水平方向への射影計算を行うようにしている。これにより、仮に文字列が斜めに傾いていても、それに起因して第1射影データがなだらかになるという悪影響を抑えることができる。その結果、たとえ画像歪みの方向が文字列の方向と垂直な方向であったとしても、文字列認識の精度低下を防ぐことができるようになっている。
特開2007−272348号公報
しかしながら、特許文献1に開示された文字認識方法では、文字列に関して、想定と異なるフォーマットの媒体が投入されたときにおいても、区画ごとに検出された文字列の本数と想定するフォーマットの行数条件が一致するともともと想定しているフォーマットと誤判定されてしまい、結果的に正しい読取動作ができなくなるという問題があった。なお、このフォーマットとは、文字の記載される領域の位置や範囲、文字列の数や文字数、文字の大きさ等である。
本発明は、このような事情に鑑み、複数のフォーマットが想定される認識処理系であっても、それぞれのフォーマットを正しく識別することが可能な文字列認識装置および文字列認識方法を提供することを目的とする。
かかる目的を達成するために、請求項1に記載の発明は、媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識装置であって、前記媒体上に文字列検索範囲を設定する文字列検索範囲設定手段と、前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成手段と、前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算手段と、前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出手段と、前記区画ごとの文字列本数に基づいて、所定の文字列本数を示す前記区画の数の度数分布を求め、度数が最も大きい値を示す文字列本数を、前記文字列検索範囲全体としての文字列本数決定する文字列本数決定手段と、前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証手段とを備えている文字列認識装置としたことを特徴とする。
また、請求項に記載の発明は、請求項に記載の構成に加え、前記文字列検索範囲設定手段は、前記所定の文字列本数を示す前記区画の数の度数分布が正常でない場合に、前記媒体上に前記文字列検索範囲と異なる文字列検索範囲を設定することを特徴とする。
また、請求項に記載の発明は、請求項に記載の構成に加え、前記区画生成手段は、前記所定の文字列本数を示す前記区画の数の度数分布が正常でない場合に、文字列検索範囲の分割数を増減して前記区画と異なる区画を生成することを特徴とする。
また、請求項4に記載の発明は、請求項1乃至3のいずれかに記載の構成に加え、前記文字列妥当性検証手段は、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする。
また、請求項5に記載の発明は、媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識装置であって、前記媒体上に文字列検索範囲を設定する文字列検索範囲設定手段と、前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成手段と、前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算手段と、前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出手段と、前記区画ごとの文字列本数に基づいて前記文字列検索範囲全体としての文字列本数を決定する文字列本数決定手段と、前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証手段とを備え、前記文字列妥当性検証手段は、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定する文字列認識装置としたことを特徴とする。
また、請求項6に記載の発明は、請求項5に記載の構成に加え、前記文字列検索範囲設定手段は、前記文字列内に異常が検出された場合に、前記媒体上に前記文字列検索範囲と異なる文字列検索範囲を設定することを特徴とする。
また、請求項7に記載の発明は、請求項5に記載の構成に加え、前記文字列妥当性検証手段は、前記文字列内の異常の有無を検出するに際して、前記区画ごとの文字列位置の2次差分の絶対値の最大値が所定の閾値を超えた場合に前記文字列内に異常があると判定することを特徴とする。
また、請求項8に記載の発明は、請求項5に記載の構成に加え、前記文字列位置は、文字列中心位置であることを特徴とする。
また、請求項9に記載の発明は、請求項1乃至4のいずれかに記載の構成に加え、前記区画の生成個数は、2のn乗(nは正の整数)であることを特徴とする。
さらに、請求項10に記載の発明は、媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識方法であって、前記媒体上に文字列検索範囲を設定する文字列検索範囲設定工程と、前記文字列の方向において文字列検索範囲を分割して複数個の区画を生成する区画生成工程と、前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算工程と、前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出工程と、前記区画ごとの文字列本数に基づいて、所定の文字列本数を示す前記区画の数の度数分布を求め、度数が最も大きい値を示す文字列本数を、前記文字列検索範囲全体としての文字列本数決定する文字列本数決定工程と、前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証工程とが含まれる文字列認識方法としたことを特徴とする。
また、請求項11に記載の発明は、請求項10に記載の構成に加え、前記文字列妥当性検証工程において、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする。
また、請求項12に記載の発明は、媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識方法であって、前記媒体上に文字列検索範囲を設定する文字列検索範囲設定工程と、前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成工程と、前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算工程と、前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出工程と、前記区画ごとの文字列本数に基づいて前記文字列検索範囲全体としての文字列本数を決定する文字列本数決定工程と、前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証工程とが含まれ、前記文字列妥当性検証工程において、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定する文字列認識方法としたことを特徴とする。
本発明に係る文字列認識装置および文字列認識方法によれば、複数のフォーマットが想定される認識処理系であっても、それぞれのフォーマットを正しく識別することができる。
また、本発明によれば、媒体上の文字列検索範囲が文字列の方向において複数個の区画に分割され、これらの区画ごとの文字列本数に基づいて文字列検索範囲全体としての文字列本数が決定され、この文字列本数に基づいて文字列の妥当性(この文字列が所定の文字列であるか否か)を検証することが可能である。
本発明の実施の形態1に係る文字列認識装置の電気的構成を示すブロック図である。 図1に示す文字列認識装置の文字列切り出し部を示すブロック図である。 同実施の形態1に係る文字列認識方法の全体的な流れを示すフローチャートである。 図3に示すフローチャートにおいて、文字列切り出しの詳細な流れを示すフローチャートである。 IDカードの正面図である。 媒体上の文字列を撮像したときの画像データの第1例を示す図である。 図6に示す画像データを文字列の方向へ射影したときの水平射影曲線を示す図である。 図6に示す画像データにおける区画ごとの文字列本数を示す表である。 図8に示す文字列本数に基づき所定の文字列本数を示す区画の数の度数分布表である。 区画ごとの文字列本数の別の例を示す表である。 図10に示す文字列本数に基づき所定の文字列本数を示す区画の数の度数分布表である。 媒体上の文字列を撮像したときの画像データの第2例を示す図である。 図12に示す画像データを文字列の方向へ射影したときの水平射影曲線を示す図である。 図12に示す画像データにおける区画ごとの文字列本数を示す表である。 図14に示す文字列本数に基づき所定の文字列本数を示す区画の数の度数分布表である。 図12に示す画像データにおける文字列中心位置の1次差分を示す表である。 図12に示す画像データにおける文字列中心位置の2次差分を示す表である。 図3に示すフローチャートにおいて、文字切り出しの詳細な流れを示すフローチャートである。 本発明の実施の形態2に係る文字列認識方法の全体的な流れを示すフローチャートにおいて、文字列切り出しの詳細な流れを示すフローチャートである。
以下、本発明の実施の形態について説明する。
[発明の実施の形態1]
図1乃至図18には、本発明の実施の形態1を示す。
(文字列認識装置の構成)
この実施の形態1に係る文字列認識装置1は、図1に示すように、媒体としてのIDカード(身分証明書)6(以下、「IDカード6」とする。)上の文字記録領域60を撮像して得られた画像データを処理することにより、文字記録領域60内に印字されている文字列を認識する装置であって、データ入力部2と、画像メモリ3と、データ処理部5とを有している。
データ入力部2は、IDカード6上の文字記録領域60を撮像し、多値画像データに変換して画像メモリ3に記憶するようにしている。実施の形態1では、図1に示すように、IDカード6を搬送する媒体搬送機構2aと、IDカード6上の文字記録領域60を撮像して読み取る密着型の1次元撮像素子2bとを備えている。
媒体搬送機構2aは、IDカード6を、図示しない搬送手段によって所定の搬送方向T(図1では左から右)に搬送するようになっている。実施の形態1では、媒体搬送機構2aには搬送ガイド2cが形成されており、IDカード6は、その一端(図1においては下端)が搬送ガイド2cに接して搬送されるようになっている。
撮像素子2bは、CCD等からなるラインセンサであり、搬送方向Tとほぼ直交する方向(IDカード6の短手方向)に一列に配置され、かつ、図1に示すように、IDカード6上に形成された文字記録領域60の短手方向の幅よりも長く形成されている。なお、実施の形態1では、撮像素子2bから出力されたアナログ画像データは、図示しないアナログ/ディジタル変換回路が接続され、このアナログ画像データをディジタル画像データに変換される。より具体的には、アナログ画像データは、例えば8ビットの256階調の多値画像データに変換されて画像メモリ3に出力される。なお、このようなアナログ/ディジタル変換回路自体は、既に公知であるので、ここでの詳細な説明は省略する。
画像メモリ3は、撮像して得られた多値画像データを有限個の画素からなる行列とみなし、各画素の画素値である輝度値を読み出し自在に記憶する機能を備えている。この輝度値は一定の範囲の数で表される。具体的には、8ビットの256階調の多値画像データは、その輝度値は0から255までの整数値として表される。また、この実施の形態1では、M×N個の画素をマトリクス状に配列して構成し、M×N個の領域に文字記録領域60全体の多値画像データが記憶されている。なお、この画像メモリ3は、RAM、SDRAM、DDRSDRAM、RDRAMなど、多値画像データを読み出し自在に記憶しうるものであれば如何なるものであってもよい。
さらに、画像メモリ3は、後述する画像二値化部5aにより生成される白黒二値画像データを記憶する機能も有する。
データ処理部5は、図1に示すように、データ処理部5全体を制御する主制御部50と、画像二値化部5aと、文字列切り出し部5bと、文字列検索範囲格納部5cと、文字切り出し部5dと、特徴抽出部5eと、特徴比較部5fと、特徴辞書格納部5gと、文字判定部5hとを有している。
画像二値化部5aは、画像メモリ3に記憶されている多値画像データを二値画像データに変換するようになっている。なお、二値化処理については、既に公知となっている判別分析法など適当な方法によって二値化閾値を求め、多値画像データの輝度値が相対的に大きな値を示す画素を白エレメントとし、輝度値が相対的に小さな値になる画素を黒エレメントとして白黒の二値画像データに変換を行うようにしている。そして、M×N個の画素をマトリクス状に配列したM×N個の領域に文字記録領域60全体の二値画像データが生成される。
文字列切り出し部5bは、画像二値化部5aで得られた二値画像データの中から文字列を切り出す処理を行うようにしている。本実施の形態では、図2に示すように、文字列検索範囲設定部51、画像処理領域設定部52、区画生成部53、射影計算部54、文字列本数算出部55、文字列本数決定部56、文字列本数正否判定部57、差分演算部58および文字列妥当性検証部59と、を有している。また、文字列切り出し部5bは、主制御部50の制御の下にある。
文字列検索範囲格納部5cは、この文字列認識装置1で対応する各種の媒体(IDカード6の他、小切手、クレジットカードなど)に応じた文字列検索範囲の位置や形状等の情報を格納している。例えば、IDカード6は、図5に示すように、矩形の文字列検索範囲A1は下部領域となっている。また、上部領域は、顔写真と氏名、住所等の個人情報は印刷されている。なお、実施の形態1では、図6に示すように、文字列検索範囲A1は、図1に示す文字記録領域60よりも小さい範囲に設定されている。
文字切り出し部5dは、文字列切り出し部5bで切り出された文字列の二値画像データにより、例えば、外接する矩形特徴や黒画素の文字列の配列方向およびこの配列方向に直交する方向のヒストグラム特徴等を求めて1文字領域を推定し、1文字ごとに二値画像データとして切り出す処理を行うようにしている。
特徴抽出部5eは、文字切り出し部5dで切り出された1文字ごとの二値画像データの特徴ベクトルを抽出するようにしている。抽出する文字特徴としては、文字のエッジの方向特徴、文字ストローク密度特徴、構造解析的特徴等がある。実施の形態1においては、任意の特徴抽出方法を適用することが可能である。
特徴比較部5fは、認識したい1文字の二値画像データの特徴ベクトルと特徴辞書格納部5gに登録されている基準特徴ベクトルとの間の対応付けを行い、距離値、類似度、または基準特徴ベクトルに属する特徴成分が、認識したい1文字の二値画像データの特徴ベクトルに存在するか否かのチェック等により、照合の度合を判定して、認識候補文字を出力するようになっている。
特徴辞書格納部5gは、IDカード6で使用される全文字についての基準特徴ベクトルが格納されている。
文字判定部5hは、特徴比較部5fから出力された認識候補文字を、IDカード6に用いられた文字として出力するようにしている。
(文字列認識方法の手順)
次に、図3に示すフローチャートに基づいて一連の文字列認識方法について説明する。
上述した構成を有する文字列認識装置1を用いて、IDカード6上の文字列を認識する際には、IDカード6は、データ入力部2の媒体搬送機構2aの搬送ガイドに沿って搬送され、データ入力部2の1次元撮像素子2bを通過することにより、このIDカード6上の文字列が印刷された文字記録領域60を含む表面が撮像される。1次元撮像素子2bによって光学像を撮像し、撮像によって得られたアナログの画像信号を光電変換し、デジタルの多階調、例えば、8ビットの256階調の多値画像データに変換した後に、画像メモリ3に記憶している。画像メモリ3は、多値画像データをデータ処理部5に出力する。データ処理部5は、以下に詳述するとおり、一連の文字列認識処理(画像二値化処理、文字列切り出し処理、文字切り出し処理、特徴抽出処理、特徴比較処理、文字認識処理)を順に実行する。
(画像二値化処理)
まず、ステップS1では、画像二値化部5aが画像二値化処理を行う。すなわち、画像二値化部5aは、画像メモリ3から多値画像データを読み出し、この多値画像データを二値画像データに変換する。変換した二値画像データは、画像メモリ3に、多値画像データが格納されているメモリ領域とは別のメモリ領域に、二値画像データとして格納されている。なお、これ以降の処理は、この白黒の二値画像データを用いて行われる。
(文字列切り出し処理)
画像二値化処理が行われた後、ステップS2に移行し、文字列切り出し部5bが文字列の切り出し処理を行う。以下、この文字列切り出し処理を図4に示すフローチャートに基づいて説明する。
まず、ステップS11(文字列検索範囲設定工程)で、文字列切り出し部5bの文字列検索範囲設定部51は、IDカード6に応じた文字列検索範囲A1の位置や形状等の情報を文字列検索範囲格納部5cから読み出す。具体的には、矩形の文字列検索範囲A1は、図6に示すように、2列の文字列が形成されている領域に絞りこまれた範囲に設定されている。
さらに、ステップS12(画像処理領域設定工程)で、文字列切り出し部5bの画像処理領域設定部52は、図6に示すように、2列の文字列の左エッジELと右エッジERを検出し、文字列検索範囲A1を、文字列の方向において絞り込んで画像処理領域(有効領域)B1を設定する。換言すれば、画像処理領域(有効領域)B1は、切り出された文字列の左エッジELおよび右エッジERに外接するような矩形となっている。なお、画像処理領域(有効領域)B1は、以降の文字列切り出しから文字認識までの処理を有効にする処理有効領域である。
具体的には、二値文字列検索範囲A1の左上端点POを起点として右方向にスキャンして得られる垂直射影データにおいて、各画素列の計数値(黒画素の検出)が連続して一定回数(例えば3回)、所定の閾値を上回ったら、その最初の地点からさらに数画素分、左側に戻った位置を画像処理領域B1の左エッジELとする。また、文字列検索範囲A1の右上端点PEを起点として左方向にスキャンして得られる垂直射影データにおいて、各画素列の計数値が連続して一定回数、所定の閾値を上回ったら、その最初の地点から数画素分、右側に戻った位置を画像処理領域B1の右エッジERとする。これにより、文字列検索範囲A1内に画像処理領域B1が設定される。
なお、画像処理領域(有効領域)B1は、図6に示すように、垂直方向における長さ(幅)は、文字列検索範囲A1と同じである。
ここで、スキャンとは、二値画像データ(画素を要素とする行列/マトリクス)の画素を1或いは数画素ずつ行(水平)方向または縦(垂直)方向へシフトさせながら、シフト方向に対して垂直な方向への画像データの射影を計算することをいう。また、射影計算は、二値化によって「1」または「0」の濃度に変換された画素を濃度別に合計した濃度投影(濃度分布図/ヒストグラム)を求めることであり、白または黒のどちらを合計値として計算してもよい。本実施の形態では黒画素を計算している。
次に、ステップS13(区画生成工程)で、区画生成部53は、図6に示すように、IDカード6上の文字列の配列方向(水平方向)に沿って画像処理領域B1を分割して8個の区画SE(SE1〜SE8)を生成する。ここでは、区画SEの生成個数を8に設定しているが、これ以外でもよい。区画SEの生成個数が2のn乗(nは正の整数)、つまり2、4、8、16…であれば、後処理が容易になる利点がある。
次いで、ステップS14(射影計算工程)で、射影計算部54は、これらの区画SE1〜SE8ごとに、IDカード6上の文字列の方向(水平方向)への二値画像データの水平射影を計算する。具体的には、文字列の方向に直交する方向(垂直方向)方向へ画素をシフトさせながら各画素行の黒画素に相当する二値画像データ「1」の画素数を合計し水平射影ヒストグラムを作成する。すると、図6に示す8個の区画SEの配置に対して、図7に示す水平射影曲線が得られる。
図7に示す区画SEごとにおいて、水平方向の軸は、黒画素に相当する二値画像データ「1」の画素数を表し、各区画の右端が黒画素数0基準線で、黒画素が増加すると右から左にむかって輝度値が低下する。また、垂直方向の軸は、画像処理領域B1における上端から下端の間の位置/距離を表す。
次に、ステップS15(文字列本数算出工程)で、文字列本数算出部55は、射影計算部54で作成された区画SEごとの水平射影曲線を用いて、区画SEごとの文字列の中心位置および本数を算出する。例えば、図8に示す表には、図7に示す水平射影曲線(二値画像データの水平射影ヒストグラム)に基づいて算出された結果、すなわち、区画SE1〜SE8ごとの2つの文字列の中心位置および本数が示されている。
具体的な算出方法は、図7に示すSE8において、射影を始点S(始点Sは既定値であってIDカード6に応じて適当な数に設定する)から開始して下に向かって、輝度値が低下し始める(所定の閾値を下回る)ポイントLT1と再び出力が増加して元に戻る(所定の閾値を上回る)ポイントLB1を求め、これらの中点LC1、つまり(LT1+LB1)/2で与えられるポイントを図6に示す上側の文字列中心位置として記憶する。同様に、次に出現する下側の文字列についてLT2およびLB2を求める操作を射影の最終点に達するまで続け、図6に示す下側の文字列中心位置LC2=(LT2+LB2)/2として記憶する。同様に、各区画SE1〜SE7において、文字列中心位置の個数を計数し、この個数を文字列本数とする。本実施の形態1では、IDカード6には、図5、6、7に示すように、2つの文字列が形成されているので、図8の例では、すべての区画SEにおいて、文字列本数は2となる。なお、図8において、LC1を示す文字列中心位置は250〜253までの値となっているが、これらは許容範囲と考え、同一の上側の文字列と考える。同様に、LC2を示す文字列中心位置、395〜400は許容範囲と考え、同一の下側の文字列と考える。
また、IDカード6以外の媒体には、図示しないが、文字列検索範囲に1つの文字列が形成された場合がある。このように、1つの文字列の場合について、文字列本数を算出した場合を図10に示す。この図10の例では、すべての区画SE1〜SE8において、文字列中心位置がほぼ416となり、文字列本数は1となる。
このように、この実施の形態1では、文字列中心位置を文字列位置として用いているため、後処理工程が簡便化される利点がある。
次いで、ステップS16(文字列本数決定工程)で、文字列本数決定部56は、図9に示すように、ステップ15で求めた区画SE1〜SE8の文字列本数に基づいて、所定の文字列本数を示す区画の数の度数分布を作成し、この度数分布に基づいて文字列本数を決定する。
例えば、図8の例では、すべての区画SE1〜SE8では、文字列本数が2であるため、図9に示すように、文字列本数が2の場合の度数が8、それ以外の場合の度数が0となる。その結果、「文字列本数は2」であることが確定し、画像処理領域B1全体としての文字列本数が2と決定される。
同様にして、図10の例では、すべての区画SEで文字列本数が1であるため、図11に示すように、文字列本数が1の場合の度数が8、それ以外の場合の度数が0となる。その結果、「文字列本数は1」であることが確定し、画像処理領域B1全体としての文字列本数が1と決定される。
なお、区画SEの配置などの影響によっては、区画SEごとの文字列本数が全て同じ本数とならない場合がありうる。特に、両端の区画SE(SE1、SE8)は、文字列の左または右の余白部分をある程度含むことから、文字列本数に誤差を生じることがある。この場合、最大度数が生成した区画SEの数である8よりも小さくなるが、7までを許容することにし、例えば、図8に示す例では、文字列本数が2の場合の度数が7であれば、所定の文字列本数を示す区画の数の度数分布が正常であると判定する。つまり、両端のいずれかに端効果が現れて実際よりも少ない文字列本数が検出された場合でも有効とみなす。このとき、両端のうちいずれか1の区画SEを除く7個の区画SEは同じ文字列本数であるため、数値の信頼性は高いと判断できる。
次に、この媒体が所定フォーマットのIDカード6でない場合を排除するため、ステップS17(文字列本数正否判定工程)で、文字列本数正否判定部57は、ステップ13で生成した区画SEごとの文字列本数に基づき、所定の文字列本数を示す区画の数の度数分布が正常であるか否かを判定する。この判定の結果、生成した区画SEごとの文字列本数に基づき所定の文字列本数を示す区画の数の度数分布が正常でないと判定された場合は、この媒体がIDカード6でないと判定し、ステップS20に移行する。一方、所定の文字列本数を示す区画の数の度数分布が正常であると判定された場合は、この媒体がIDカード6である可能性があると判定し、この媒体がIDカード6であることを確定させるためにステップS18へ移行する。
(IDカード6とは、フォーマットが異なる媒体が投入された場合)
ここで、区画SEごとの文字列本数に基づいて、所定の文字列本数を示す区画の数を示す区画の数の度数分布が正常であると判定された場合でも、この媒体がIDカード6であると断言できないのは、この度数分布が正常であることが、この媒体がIDカード6であることの十分条件にはならないからである。つまり、以下に例示するとおり、所定の文字列本数を示す区画の数の度数分布が正常であっても、この媒体がIDカード6でないケースが想定されるからである。
具体的に、IDカード6と文字列のフォーマットが異なる媒体が投入された場合を考える。例えば、投入された媒体が、図12のようなIDカード6以外の媒体(例えば、クレジットカード、社員証など)である場合である。図12に示す媒体において、文字列検索範囲B2には、範囲B2のほぼ中央に1列の文字列が形成され、右側上端には、顔写真の一部が印刷されている。このような媒体が処理系に入力されたとする。すると、文字列切り出しの処理結果は図13〜図15のようになる。図13は、図12に示す8個の区画SE11〜SE18の配置に対応した水平射影曲線である。水平方向の軸は画素数を示し、垂直方向の軸は文字列検索範囲B2の上端から下端の位置/距離を示す。図14に示す表は、水平射影曲線に基づく算出結果、すなわち、区画SE11〜SE18ごとの1つの文字列の中心位置および本数を示している。図15は、区画SE11〜SE18ごとの文字列本数に基づく所定の文字列本数を示す区画の数の度数分布を示す。
図15において、文字列本数が2である場合の度数が7となり、上述したように、7以上という文字列本数決定基準を満たす。このため、見かけ上は、文字列本数が2であるので、媒体がIDカード6であると判別することが成立してしまう。これは、文字列以外のパターンが区画SEの配置との位置関係により、偶然に真の文字列と同等の条件が生成されてしまったことに由来する。その結果、区画SEごとの文字列本数に基づき所定の文字列本数を示す区画の数の度数分布が正常であると誤判定され、この媒体がIDカード6でないことを判別することができない。
そこで、このような誤判定を回避するため、ステップS18およびステップS19では、この媒体がIDカード6である可能性があると判定された場合でも、媒体がIDカード6であれば、互いに隣接する2個の区画SE間で文字列中心位置の変動量が急激に変化しないという仮定に依拠して、文字列内の異常の有無を検出している。すなわち、区画SEごとの文字列中心位置の2次差分を求め、この2次差分により、文字列内の異常の有無を検出することができ(ステップS18)、IDカード6以外の媒体上の文字列が所定の文字列であるか否か、つまり、この媒体が間違いなくIDカード6であるか否かを判定する(ステップS19)。以下で、これらステップを具体的に説明する。
ステップS18(文字列内異常検出工程)で、差分演算部58は、各文字列について、文字列内異常を示す指標として、図16および図17に示す文字列中心位置の1次差分および2次差分を演算する。ここで、図16は、図12に示す画像データにおける文字列中心位置の1次差分を示す表であり、図17は、さらにその2次差分を示す表である。
具体的には、差分演算部58は、まず、互いに隣接する2個の区間SE間での文字列中心位置の1次差分を演算する。例えば、図12に示す画像データにおける区画ごとの文字列本数および文字列中心位置を示す図14の上側の文字列と推定されるデータLC11(「上側の文字列」という)において、区間SE13のLC11=149、その左側区間SE12のLC11=147であるから両者の差分は2となる。同様に他の区間および文字列についても文字列中心位置の1次差分を演算し、図16の表を生成する。次に、この1次差分の演算結果を用いて、図17に示すように、区画SEごとに文字列中心位置の2次差分を演算し、図17の表を生成する。例えば、図17において、上側の列の左から3番目の2次差分−91は、図16に示す上側の文字列の区間SE15〜16の1次差分−19から、左側の区間SE14〜15の1次差分72を引いた差分である。
次いで、ステップS19(文字列妥当性検証工程)では、この媒体がIDカード6であるか否かを確認する。具体的に、文字列妥当性検証部59は、各文字列について、区画SEごとの文字列中心位置の2次差分の絶対値の最大値が所定の閾値(例えば、20)を超えるか否かを判定する。そして、この2次差分の絶対値の最大値が所定の閾値を超えた場合には、文字列内に異常があり、この媒体上の文字列が所定の文字列でない(この媒体がIDカード6でない)と判定する。また、それ以外の場合には、文字列内に異常がなく、この媒体上の文字列が所定の文字列である(この媒体がIDカード6である)と判定する。
例えば、図17に示す場合は、上側の文字列中心位置2次差分は、左から、−2、72、−91、19、1となっており、区画SEごとの文字列中心位置の2次差分の絶対値の最大値は91であり、これは、上述した閾値20に比べて異常に大きい値であるため、上側の文字列内に異常があると判定する。一方、下側の文字列中心位置2次差分は、左から、0、0、0、1、−2となり、絶対値の最大値は2となる。これは、閾値20より小さい値であるので、下側の文字列は正常であると判定する。これらより、上側の文字列内に異常があるので、この媒体がIDカード6でないと判定される。
このようにステップS18(文字列内異常検出工程)およびステップS19(文字列妥当性検証工程)により、媒体がIDカード6でないにもかかわらず、偶然に真の文字列と同等の条件が生成してしまった場合であっても、この媒体がIDカード6でないことを判別することが可能となる。
また、上述したとおり、IDカード6以外の媒体で設定された画像処理領域B2を複数の区画SEに分割した上で、区画SEごとの文字列中心位置の2次差分を利用して文字列内の異常の有無を検出しているため、たとえ媒体上の文字列が斜めに傾いていても、文字列を正しく読み取る可能性が向上する。
そして、ステップS19での処理の結果、この媒体がIDカード6であると判定された場合は、文字列に異常なしと判断され、図4に示すフローチャートが終了する。
一方、この媒体がIDカード6でないと判定された場合は、先程のステップS17で、この媒体がIDカード6でないと判定された場合と同様に、ステップS20(文字列検索範囲再設定工程)に移行する。
ステップS20で、文字列切り出し部5bの文字列検索範囲設定部51は、IDカード6で使用する文字列検索範囲A1と異なる、別の文字列検索範囲を文字列検索範囲格納部5cから読み出し、この別の文字列検索範囲を画像メモリ3に保存されている二値画像データ上に設定する。
次に、ステップS21(文字列検索範囲残存判定工程)で、データ処理部5の主制御部50は、未設定の文字列検索範囲が残っているか否かを判定し、未設定の文字列検索範囲が残っていなければ、図4に示すフローチャートが終了する。一方、未設定の文字列検索範囲が残っていれば、ステップS12に戻り、上述した処理を繰り返す。なお、ステップS20とステップS21は、S21を先に、または両ステップを同時に実行してもよい。
こうすることにより、文字列検索範囲格納部5cに格納されたすべての文字列検索範囲について文字列切り出し処理が順に実行され、想定される各種のフォーマットを正しく識別することが可能となる。
ここで、図4に示すフローチャートが終了すると、図3に示すフローチャートのステップS3に移行する。
(文字切り出し処理)
以下、図18に示すフローチャートに基づいてステップS3の文字切り出し処理を説明する。まず、文字切り出し部5dは、ステップS31で、文字列の方向にシフトさせながら、文字列の方向と垂直な方向への垂直射影計算を行う。具体的には、図6に示す画像処理領域B1内において、1つの文字列、例えば、上側の文字列において、文字列の方向に直交する方向(垂直方向)の各画素行毎に各行の黒画素に相当する二値画像データ「1」の画素数を計数(集計)し垂直射影ヒストグラムを作成する。
次に、文字切り出し部5dは、ステップS32に移行し、ステップS31で得られた垂直射影データを用いて検出された文字列の両端間の画素数に応じて、文字ライン長の計算を行う。
次いで、文字切り出し部5dは、ステップS33に移行し、ステップS31で得られた垂直射影データが所定の閾値を超えた箇所を、文字列を構成する文字の区切り位置として検出する。具体的には、文字列を構成する文字と文字間の空白部分が含まれているため、この空白部分の輝度値(実施の形態1では白画素に相当する二値画像データ「0」)を閾値となるように設定することで、文字の区切り位置とする。
こうした文字切り出し処理により、認識対象となっている文字の外接矩形領域、すなわち左右上下の座標値が求まることになる。ここで、図18に示すフローチャートが終了する。そして、図3に示すフローチャートのステップS4に移行する。
(特徴抽出処理)
文字切り出しが行われた後、ステップS4に移行し、特徴抽出部5eが特徴抽出を行う。すなわち、特徴抽出部5eは、文字の外接矩形領域をn×n個のサブ領域に分割する。例えば、n=5とすると、25個のサブ領域が生成される。各サブ領域において、そのサブ領域内の全画素数に占める黒画素数の割合を求め、それらを要素とする特徴ベクトルを生成する。
(特徴比較処理)
特徴抽出が行われた後、ステップS5に移行し、特徴比較部5fが特徴比較を行う。
すなわち、特徴比較部5fは、ステップS4で生成された特徴ベクトルについて、特徴辞書格納部5gに格納された基準特徴ベクトルと比較して、類似度(例えば、正規化相関係数)が最も高いものをその文字が該当する候補文字に設定する。
(文字認識処理)
特徴比較が行われた後、ステップS6に移行し、文字判定部5hが文字認識を行う。
すなわち、文字判定部5hは、ステップS5で設定された候補文字を、媒体6に用いられた文字として認識する。
なお、類似度が一定値を超える候補文字が複数個存在する場合、この段階では文字認識を行うことができない。この場合、認識不能として処理をするか、或いは、特徴ベクトルから導き出せる2次的な特徴量を利用して、類似文字の判別を行う。
例えば、左右線対称性、上下線対称性および点対称性の3種類の対象性に着目する。左右線対称性ではn×nサブ領域を左側半分と右側半分の2領域に分けて、部分特徴ベクトルを構成しそれらの間の類似性を調べる。また、上下線対称性ではn×nサブ領域を上半分と下半分の2領域に分けて、部分特徴ベクトルを構成し、それらの間の類似性を調べる。さらに、点対称性についても同様の考え方で類似性を調べる。1つの文字について3種類の形状特徴量が得られたので、それらの値の相互関係から、該当する文字を対応付ける。
但し、これでも分離できない場合もある。例えば、媒体に用いられる文字タイプによっては‘O’(アルファベットのオー)と‘0’(数字のゼロ)の判別が難しい場合がある。この場合は、例えば、文字の高さ違いや、四隅の曲率の違いを調べることにより、この判別が可能になる。
ここで、文字列認識装置1による文字列認識方法が終了する。
(実施の形態1の主な効果)
以上説明したように、この実施の形態1では、IDカード6等の媒体のように、複数のフォーマットが想定される認識処理系であっても、それぞれのフォーマットを正しく識別することが可能となる。
また、IDカード6等の媒体上の画像処理領域B1が文字列の配列方向に沿って複数個の区画SEに分割され、これらの区画SEごとの文字列本数に基づいて画像処理領域B1全体としての文字列本数が決定され、この文字列本数に基づいて文字列の妥当性(この文字列が所定の文字列であるか否か)を検証することができる。
[発明の実施の形態2]
図19には、本発明の実施の形態2を示す。
上述した実施の形態1では、図4に示すフローチャートのステップS17での判定の結果、区画SEごとの文字列本数に基づき所定の文字列本数を示す区画の数の度数分布が正常でない(媒体6がIDカード6でない)と判定された場合に、新たな文字列検索範囲を媒体6上に設定する場合について説明した。しかし、新たな文字列検索範囲A2を設定する代わりに、元の文字列検索範囲A1内の画像処理領域B1に対して新たな区画SEを生成するようにしてもよい。以下、新たな区画SEを生成する場合について説明する。
すなわち、この実施の形態2では、図19に示すように、ステップS17での判定の結果、区画SEごとの文字列本数に基づき所定の文字列本数を示す区画の数の度数分布が正常でないと判定された場合、ステップS22(区画再生成工程)で、文字列切り出し部5bの区画生成部53は、画像処理領域B1の分割数を増減変更する。
次に、ステップS23(分割回数判定工程)で、文字列切り出し部5bの主制御部50は、画像処理領域B1のこれまでの分割数を増減変更した回数が所定の回数(例えば、5回)を超えたか否かを判定する。
その結果、画像処理領域B1の分割数を増減変更した回数が所定の回数を超えていなければ、ステップS13に戻り、文字列切り出し部5bの区画生成部53は、媒体6上の文字列の方向に沿って画像処理領域B1をステップS22で増減変更した分割数で分割して複数個(例えば、16個)の区画SEを生成する。
一方、画像処理領域B1の分割数を増減変更した回数が所定の回数を超えていれば、これ以上この画像処理領域B1でその分割数をいくら増減しても、区画SEごとの文字列本数に基づき所定の文字列本数を示す区画の数の度数分布が正常になる見込みが少ないと判断し、ステップS20に移行し、文字列切り出し部5bの文字列検索範囲設定部51は、文字列検索範囲A1と異なる文字列検索範囲A2を画像メモリ3に保存されている二値画像データ上に設定し、これ以降は図4の実施形態と同様の処理を進める。
こうすることにより、画像処理領域B1の分割処理が所定の回数まで実行され、フォーマットの識別をきめ細かく実行することが可能となる。
なお、その他の処理については、上述した実施の形態1と同様であり、実施の形態1と同じ作用効果を奏する。
[発明のその他の実施の形態]
上述した実施の形態1、2では、IDカード6のフォーマットに応じて設定した文字列検索範囲A1を、さらに、絞り込んで、文字列切り出し以降の処理を有効にする画像処理領域(有効領域)B1を設定しているが、敢えて画像処理領域B1を設定せずに、文字列検索範囲A1を画像処理領域(有効領域)として文字列切り出し以降の処理を行うようにしてもよい。すなわち、S11およびS12は一つの工程として併合してもよい。
上述した実施の形態1、2では、媒体がIDカード6であるか否かを確認する際に、区画SEごとの文字列中心位置の2次差分を利用して媒体上の文字列が所定の文字列であるか否かを判定する場合について説明した。しかし、文字列の方向と垂直な方向における文字列の位置を示す文字列位置としては、必ずしも文字列中心位置を採用する必要はなく、例えば、(LT+2LB)/3で与えられる3等分点の1つを文字列位置としても構わない。また、2次差分を利用する手法に代えて、回帰分析、主成分分析などの多変量解析を用いることも可能である。
また、上述した実施の形態1、2では、媒体搬送機構2aと1次元撮像素子2bとを組み合わせたデータ入力部2について説明したが、これに限らず、例えば、2次元CCDやCMOSイメージャなどのエリアセンサと被写体支持機構とを組み合わせてデータ入力部2を構成することもできる。
また、上述した実施の形態1、2の文字列認識装置1は媒体搬送機構2aを備えるが、媒体搬送機構2aを備えず手動により搬送ガイド2cなどの基準面に沿って媒体を搬送する手動式の文字認識装置としてもよい。
さらに、上述した実施の形態1、2では、IDカード6用の文字列認識装置1について説明したが、IDカード6以外の媒体(例えば、パスポート(旅券)、小切手、クレジットカード、デビットカード、電子マネー、運転免許証、健康保険被保険者証、年金手帳、社員証、会員証、図書貸出カードなど)に記録された文字列を認識する文字列認識装置に本発明を同様に適用することも勿論できる。
本発明に係る文字列認識装置および文字列認識方法は、IDカード、パスポート、小切手など各種の媒体に記録された文字列を読み取る際に好適に適用することができる。
1……文字列認識装置
2……データ入力部
2a……媒体搬送機構
2b……1次元撮像素子
3……画像メモリ
5……データ処理部
5a……画像二値化部
5b……文字列切り出し部
5c……文字列検索範囲格納部
5d……文字切り出し部
5e……特徴抽出部
5f……特徴比較部
5g……特徴辞書格納部
5h……類似文字認識部
6……媒体としてのIDカード
50……主制御部
51……文字列検索範囲設定部(文字列検索範囲設定手段)
52……画像処理領域設定部(画像処理領域設定手段)
53……区画生成部(区画生成手段)
54……射影計算部(射影計算手段)
55……文字列本数算出部(文字列本数算出手段)
56……文字列本数決定部(文字列本数決定手段)
57……文字列本数正否判定部
58……差分演算部
59……文字列妥当性検証部(文字列妥当性検証手段)
A……文字列検索範囲
B……画像処理領域
SE……区画

Claims (12)

  1. 媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識装置であって、
    前記媒体上に文字列検索範囲を設定する文字列検索範囲設定手段と、
    前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成手段と、
    前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算手段と、
    前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出手段と、
    前記区画ごとの文字列本数に基づいて、所定の文字列本数を示す前記区画の数の度数分布を求め、度数が最も大きい値を示す文字列本数を、前記文字列検索範囲全体としての文字列本数決定する文字列本数決定手段と、
    前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証手段とを備えていることを特徴とする文字列認識装置。
  2. 前記文字列検索範囲設定手段は、前記所定の文字列本数を示す前記区画の数の度数分布が正常でない場合に、前記媒体上に前記文字列検索範囲と異なる文字列検索範囲を設定する請求項1に記載の文字列認識装置。
  3. 前記区画生成手段は、前記所定の文字列本数を示す前記区画の数の度数分布が正常でない場合に、前記文字列検索範囲の分割数を増減して前記区画と異なる区画を生成することを特徴とする請求項に記載の文字列認識装置。
  4. 前記文字列妥当性検証手段は、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする請求項1乃至3のいずれかに記載の文字列認識装置。
  5. 媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識装置であって、
    前記媒体上に文字列検索範囲を設定する文字列検索範囲設定手段と、
    前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成手段と、
    前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算手段と、
    前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出手段と、
    前記区画ごとの文字列本数に基づいて前記文字列検索範囲全体としての文字列本数を決定する文字列本数決定手段と、
    前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証手段とを備え、
    前記文字列妥当性検証手段は、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする文字列認識装置。
  6. 前記文字列検索範囲設定手段は、前記文字列内に異常が検出された場合に、前記媒体上に前記文字列検索範囲と異なる文字列検索範囲を設定することを特徴とする請求項5に記載の文字列認識装置。
  7. 前記文字列妥当性検証手段は、前記文字列内の異常の有無を検出するに際して、前記区画ごとの文字列位置の2次差分の絶対値の最大値が所定の閾値を超えた場合に前記文字列内に異常があると判定することを特徴とする請求項5に記載の文字列認識装置。
  8. 前記文字列位置は、文字列中心位置であることを特徴とする請求項5に記載の文字列認識装置。
  9. 前記区画の生成個数は、2のn乗(nは正の整数)であることを特徴とする請求項1乃至4のいずれかに記載の文字列認識装置。
  10. 媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識方法であって、
    前記媒体上に文字列検索範囲を設定する文字列検索範囲設定工程と、
    前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成工程と、
    前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算工程と、
    前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出工程と、
    前記区画ごとの文字列本数に基づいて、所定の文字列本数を示す前記区画の数の度数分布を求め、度数が最も大きい値を示す文字列本数を、前記文字列検索範囲全体としての文字列本数決定する文字列本数決定工程と、
    前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証工程と
    が含まれることを特徴とする文字列認識方法。
  11. 前記文字列妥当性検証工程において、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする請求項10に記載の文字列認識方法。
  12. 媒体上の文字列を撮像して得られた画像データを処理することにより、前記文字列を認識する文字列認識方法であって、
    前記媒体上に文字列検索範囲を設定する文字列検索範囲設定工程と、
    前記文字列の方向において前記文字列検索範囲を分割して複数個の区画を生成する区画生成工程と、
    前記文字列の方向への前記画像データの射影を前記区画ごとに計算する射影計算工程と、
    前記画像データの射影に基づいて前記区画ごとの文字列本数を算出する文字列本数算出工程と、
    前記区画ごとの文字列本数に基づいて前記文字列検索範囲全体としての文字列本数を決定する文字列本数決定工程と、
    前記文字列検索範囲全体としての文字列本数に基づき、前記文字列が所定の文字列であるか否かを判定する文字列妥当性検証工程とが含まれ、
    前記文字列妥当性検証工程において、前記文字列の方向と垂直な方向における文字列位置を前記区画ごとに求め、これらの文字列位置の1次差分に基づいて前記文字列内の異常の有無を検出した後、前記文字列内に異常を検出しない場合に、前記文字列が所定の文字列であると判定することを特徴とする文字列認識方法。
JP2010095638A 2010-04-19 2010-04-19 文字列認識装置および文字列認識方法 Expired - Fee Related JP5591578B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010095638A JP5591578B2 (ja) 2010-04-19 2010-04-19 文字列認識装置および文字列認識方法
CN201110111273.XA CN102222241B (zh) 2010-04-19 2011-04-18 字符串识别装置及字符串识别方法
US13/088,781 US8315462B2 (en) 2010-04-19 2011-04-18 Apparatus and method for character string recognition

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010095638A JP5591578B2 (ja) 2010-04-19 2010-04-19 文字列認識装置および文字列認識方法

Publications (2)

Publication Number Publication Date
JP2011227636A JP2011227636A (ja) 2011-11-10
JP5591578B2 true JP5591578B2 (ja) 2014-09-17

Family

ID=44778788

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010095638A Expired - Fee Related JP5591578B2 (ja) 2010-04-19 2010-04-19 文字列認識装置および文字列認識方法

Country Status (3)

Country Link
US (1) US8315462B2 (ja)
JP (1) JP5591578B2 (ja)
CN (1) CN102222241B (ja)

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10528925B2 (en) 2008-01-18 2020-01-07 Mitek Systems, Inc. Systems and methods for mobile automated clearing house enrollment
US9298979B2 (en) 2008-01-18 2016-03-29 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
US10102583B2 (en) 2008-01-18 2018-10-16 Mitek Systems, Inc. System and methods for obtaining insurance offers using mobile image capture
US8983170B2 (en) 2008-01-18 2015-03-17 Mitek Systems, Inc. Systems and methods for developing and verifying image processing standards for mobile deposit
US9292737B2 (en) 2008-01-18 2016-03-22 Mitek Systems, Inc. Systems and methods for classifying payment documents during mobile image processing
US9842331B2 (en) 2008-01-18 2017-12-12 Mitek Systems, Inc. Systems and methods for mobile image capture and processing of checks
US10685223B2 (en) 2008-01-18 2020-06-16 Mitek Systems, Inc. Systems and methods for mobile image capture and content processing of driver's licenses
KR101380783B1 (ko) * 2008-08-22 2014-04-02 정태우 영상에 포함된 객체를 식별하여 부가 서비스를 제공하는 시스템
US8483518B2 (en) 2010-02-19 2013-07-09 Microsoft Corporation Image-based CAPTCHA exploiting context in object recognition
US10891475B2 (en) 2010-05-12 2021-01-12 Mitek Systems, Inc. Systems and methods for enrollment and identity management using mobile imaging
US20120272302A1 (en) * 2011-04-21 2012-10-25 Microsoft Corporation Human User Verification
JP5935324B2 (ja) * 2012-01-04 2016-06-15 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
CN104115194B (zh) * 2012-03-22 2016-09-07 光荣株式会社 纸张号码读取系统以及纸张号码读取方法
US9317767B2 (en) * 2012-10-17 2016-04-19 Cognex Corporation System and method for selecting segmentation parameters for optical character recognition
US9286534B2 (en) 2012-10-17 2016-03-15 Cognex Corporation System and method for selecting and displaying segmentation parameters for optical character recognition
US10963535B2 (en) 2013-02-19 2021-03-30 Mitek Systems, Inc. Browser-based mobile image capture
KR102204676B1 (ko) * 2014-01-06 2021-01-19 삼성전자 주식회사 디스플레이 장치, 모바일 장치, 이를 포함하는 시스템 및 그 접속 제어방법
US10133948B2 (en) * 2014-07-10 2018-11-20 Sanofi-Aventis Deutschland Gmbh Device and method for performing optical character recognition
CN105631486A (zh) * 2014-10-27 2016-06-01 深圳Tcl数字技术有限公司 图像文字识别方法及装置
US9659213B2 (en) * 2015-07-03 2017-05-23 Cognizant Technology Solutions India Pvt. Ltd. System and method for efficient recognition of handwritten characters in documents
US9836646B2 (en) * 2015-10-15 2017-12-05 I.R.I.S. Method for identifying a character in a digital image
CN106611176B (zh) * 2015-10-26 2019-10-25 北京国双科技有限公司 异常中文字符串的识别方法及装置
CN105426818B (zh) * 2015-10-30 2019-07-02 小米科技有限责任公司 区域提取方法及装置
CN105528606B (zh) 2015-10-30 2019-08-06 小米科技有限责任公司 区域识别方法及装置
CN105528600A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域识别方法及装置
CN105528602A (zh) * 2015-10-30 2016-04-27 小米科技有限责任公司 区域识别方法及装置
JP2017162148A (ja) * 2016-03-09 2017-09-14 キヤノン株式会社 情報処理装置、プログラム、情報処理方法
CN107241342A (zh) * 2017-06-30 2017-10-10 北京奇安信科技有限公司 一种网络攻击串检测方法及装置
JP7247472B2 (ja) * 2018-04-19 2023-03-29 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
CN109063614A (zh) * 2018-07-19 2018-12-21 江苏省计量科学研究院 一种液晶屏数字识别方法
CN109325496B (zh) * 2018-09-30 2021-07-23 武汉斗鱼网络科技有限公司 基于字符去除的弹幕校验方法、装置、终端及存储介质
JP6929823B2 (ja) * 2018-11-16 2021-09-01 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体
JP6868057B2 (ja) * 2019-05-27 2021-05-12 株式会社東芝 読取システム、読取方法、プログラム、記憶媒体、及び移動体
CN110443258B (zh) * 2019-07-08 2021-03-02 北京三快在线科技有限公司 文字检测方法、装置、电子设备及存储介质
US11393272B2 (en) 2019-09-25 2022-07-19 Mitek Systems, Inc. Systems and methods for updating an image registry for use in fraud detection related to financial documents
FR3106428B1 (fr) * 2020-01-16 2022-07-29 Surys Procédé de traitement d’une image candidate
CN111695550B (zh) * 2020-03-26 2023-12-08 深圳市新良田科技股份有限公司 一种文字提取方法、图像处理设备和计算机可读存储介质
CN115984859B (zh) * 2022-12-14 2024-07-26 广东保伦电子股份有限公司 一种图像文字识别的方法、装置及存储介质

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4907285A (en) * 1984-08-24 1990-03-06 Hitachi, Ltd. Image understanding system
JPH0797373B2 (ja) * 1985-08-23 1995-10-18 株式会社日立製作所 文書フアイリングシステム
JPS62243083A (ja) * 1986-04-16 1987-10-23 Sharp Corp 読取り方式
GB2199680A (en) * 1986-11-28 1988-07-13 Sharp Kk Translating apparatus
EP0381773B1 (en) * 1988-07-20 1998-06-10 Fujitsu Limited Character recognition apparatus
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
US5471610A (en) * 1989-06-14 1995-11-28 Hitachi, Ltd. Method for character string collation with filtering function and apparatus
US5341439A (en) * 1989-09-21 1994-08-23 Hsu Shin Yi System for texture-based automatic detection of man-made objects in representations of sensed natural environmental scenes
US5254990A (en) * 1990-02-26 1993-10-19 Fujitsu Limited Method and apparatus for compression and decompression of data
US5119433A (en) * 1990-03-12 1992-06-02 International Business Machines Corporation Method and system for locating the amount field on a document
US5191612A (en) * 1990-03-13 1993-03-02 Fujitsu Limited Character recognition system
US5157736A (en) * 1991-04-19 1992-10-20 International Business Machines Corporation Apparatus and method for optical recognition of chemical graphics
US5335290A (en) * 1992-04-06 1994-08-02 Ricoh Corporation Segmentation of text, picture and lines of a document image
US5987170A (en) * 1992-09-28 1999-11-16 Matsushita Electric Industrial Co., Ltd. Character recognition machine utilizing language processing
JP3268084B2 (ja) * 1993-09-21 2002-03-25 株式会社東芝 帳票読取システム
JP2758826B2 (ja) * 1994-03-02 1998-05-28 株式会社リコー 文書検索装置
US5745745A (en) * 1994-06-29 1998-04-28 Hitachi, Ltd. Text search method and apparatus for structured documents
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法
JP2734386B2 (ja) * 1994-12-20 1998-03-30 日本電気株式会社 文字列読み取り装置
JP2929963B2 (ja) * 1995-03-15 1999-08-03 松下電器産業株式会社 文書検索装置および単語索引作成方法および文書検索方法
JP3425834B2 (ja) * 1995-09-06 2003-07-14 富士通株式会社 文書画像からのタイトル抽出装置および方法
US6104833A (en) * 1996-01-09 2000-08-15 Fujitsu Limited Pattern recognizing apparatus and method
JPH09259219A (ja) * 1996-03-26 1997-10-03 Sharp Corp 文字認識方法
JP3113814B2 (ja) * 1996-04-17 2000-12-04 インターナショナル・ビジネス・マシーンズ・コーポレ−ション 情報検索方法及び情報検索装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
JP3246432B2 (ja) * 1998-02-10 2002-01-15 株式会社日立製作所 宛名読取り装置および郵便物等区分機
JP4658848B2 (ja) * 2006-03-30 2011-03-23 日本電産サンキョー株式会社 文字列認識方法及び文字列認識装置
CN100541521C (zh) * 2007-11-14 2009-09-16 哈尔滨工程大学 中文印刷体公式识别方法

Also Published As

Publication number Publication date
US8315462B2 (en) 2012-11-20
US20110255795A1 (en) 2011-10-20
CN102222241B (zh) 2016-01-27
CN102222241A (zh) 2011-10-19
JP2011227636A (ja) 2011-11-10

Similar Documents

Publication Publication Date Title
JP5591578B2 (ja) 文字列認識装置および文字列認識方法
JP5334042B2 (ja) 文字列認識方法及び文字列認識装置
JP4658848B2 (ja) 文字列認識方法及び文字列認識装置
US9158986B2 (en) Character segmentation device and character segmentation method
JP6268023B2 (ja) 文字認識装置およびその文字切り出し方法
US10740899B2 (en) Image processing apparatus for identifying region within image, information processing method, and storage medium
JP6039413B2 (ja) 文字切り出し装置、文字認識装置、文字切り出し方法、およびプログラム
US9251430B2 (en) Apparatus, method, and program for character recognition using minimum intensity curve of image data
Rebelo et al. Staff line detection and removal in the grayscale domain
JP2008250754A (ja) 文字列認識方法及び文字列認識装置
JP5676183B2 (ja) バーコード読取装置およびバーコード読取方法
US8200016B2 (en) Method and apparatus for character string recognition
KR102094234B1 (ko) 지폐 일련번호 인식 장치 및 방법
JP5630689B2 (ja) 文字認識方法及び文字認識装置
US20140086473A1 (en) Image processing device, an image processing method and a program to be used to implement the image processing
JP2898562B2 (ja) ナンバープレート決定方法
JP5379626B2 (ja) スタック型バーコード情報読取方法及びスタック型バーコード情報読取装置
JP2003091730A (ja) 画像照合装置、画像照合方法および画像照合プログラム
CN116469090A (zh) 喷码图案的检测方法、装置、电子设备和存储介质
KR101070051B1 (ko) 도트 패턴에서 불변 영역을 인식하는 방법
JP3957471B2 (ja) 分離文字列統合装置
TWI549099B (zh) 紙鈔序號辨識方法
JPH11184965A (ja) 帳票識別登録装置
JP2023028563A (ja) 画像処理プログラム、画像処理装置、及び画像処理方法
JP2006330873A (ja) 指紋照合装置、方法およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130305

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140212

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140407

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140722

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140730

R150 Certificate of patent or registration of utility model

Ref document number: 5591578

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees