Nothing Special   »   [go: up one dir, main page]

JPH08287184A - 画像切り出し装置及び文字認識装置 - Google Patents

画像切り出し装置及び文字認識装置

Info

Publication number
JPH08287184A
JPH08287184A JP7072104A JP7210495A JPH08287184A JP H08287184 A JPH08287184 A JP H08287184A JP 7072104 A JP7072104 A JP 7072104A JP 7210495 A JP7210495 A JP 7210495A JP H08287184 A JPH08287184 A JP H08287184A
Authority
JP
Japan
Prior art keywords
frame
character
character frame
wall
corner
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP7072104A
Other languages
English (en)
Other versions
JP2761467B2 (ja
Inventor
Hiroyasu Takahashi
弘晏 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP7072104A priority Critical patent/JP2761467B2/ja
Priority to US08/604,046 priority patent/US5790696A/en
Publication of JPH08287184A publication Critical patent/JPH08287184A/ja
Application granted granted Critical
Publication of JP2761467B2 publication Critical patent/JP2761467B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/155Removing patterns interfering with the pattern to be recognised, such as ruled lines or underlines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【目的】 黒枠から黒枠内の画像を高速かつ高精度に切
り出す。 【構成】 文字フィールドのコーナー座標を文字枠レイ
アウトのパラメータから推定し、局所範囲の画素分布か
らより正確にコーナー座標を検出する。次に検出された
コーナー座標と文字枠のパラメータから黒枠の内壁の位
置を推定して検出エリアを設定し、このエリア内の画素
分布から内壁位置を正確に検出し、この検出値を隣接す
る他の黒枠の検出値によって平滑化する。次に、この内
壁に沿って白線を引いて黒枠と画像を分離した後ノイズ
を除去する。また、スキューの値に応じて、検出エリア
を分割して設定範囲を変更したり、段差のある2本の白
線によるデータ分離を行う。これにより、スキューが大
きい場合でも高精度に黒枠の位置を決めることができ、
局所的な範囲のみスキャンするので高速化できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、画像切り出し装置及び
文字認識装置に係り、特に黒色の文字枠から文字若しく
は画像を高速で切り出す画像切り出し装置とこの装置に
より切り出された文字を認識する文字認識装置に関す
る。
【0002】
【従来の技術】近年、OCR(Optical Character Read
ing)の応用において、従来のドロップアウトカラーで印
刷された文字枠に対して、黒色の文字枠(以下「黒枠」
という)が重要性を増してきている。主な理由として、
(1)FAX−OCRの需要が増え、OCRセンターか
らエンドユーザにOCRフォームがFAXで送られてく
ることが珍しくなくなった、(2)黒一色のOCRフォ
ームの方がコストが安い、(3)太い黒枠を使えば隣の
文字枠へのはみ出しを吸収しやすく、文字間をドロップ
アウト枠より小さくできる、等が挙げられる。
【0003】ところで、この黒枠内に書かれた文字をO
CRで認識するためには、先ず、黒枠から文字を切り出
す前処理が必要となる。
【0004】そこで、従来では、黒枠から文字を切り出
すため、次のような処理を行っていた。すなわち、上位
のプログラムから与えられたリファレンスマークと文字
フィールドとの相対位置に基づいて量子化後の文字フィ
ールドのコーナー座標を推定し、このコーナー座標から
範囲を限定せず丁寧に画素数をカウントしてヒストグラ
ムを算出し、このヒストグラムに基づいて垂直と水平の
辺を持つ長方形に近似した黒枠の内壁位置を検出する。
場合によっては、黒枠の形状を正確に追跡することによ
り、その内壁位置を検出する。なお、ヒストグラムを算
出するとき、黒枠のすべての行或いはすべての列を通し
て水平線又は垂直線上にある画素数をカウントする。
【0005】内壁が検出されると、この内壁から内側に
向かって追跡を開始し、文字が黒枠に接している状態の
ときは、接している付近の画素の形状等に基づいて黒枠
から文字を適切に分離する処理を行う。
【0006】2行目以降に検出処理が移行しても、一度
推定したコーナー座標は変更せず、この推定値から2行
目の黒枠コーナーの位置を求めて、黒枠の形状等やヒス
トグラム等を丁寧に追跡して同様の処理を繰り返す。
【0007】また、黒枠の場合、文字フィールドとして
個別文字枠(1文字分それぞれが分離した1つの長方形
の文字枠を持つ)と表形式(M行N列の文字のフィール
ドが(M+1)*(N+1)の黒い直線で区切られる長
方形で構成される)の2種類が一般的に選択可能となっ
ている。従来技術では、この2種類の黒枠の各々に対し
て別個のアルゴリズムに基づいて切り出し処理を行って
いた。
【0008】さらに、黒枠に対処する方法として、黒枠
を除去してから既存のドロップアウト方式に処理を渡す
のであるが、従来では、エラー修正時におけるインター
フェイスの観点から、画像表示用の原画像データと文字
切り出し用の画像データの両方を持っていた。
【0009】
【発明が解決しようとする課題】しかしながら、上記従
来の技術では次のような問題が生じる。すなわち、ヒス
トグラムを求めるとき範囲をあまり限定しないで画素数
をカウントし、場合によってはさらに黒枠の形状を丁寧
に追跡したりするので、処理時間が非常にかかる。さら
に文字と黒枠とを分離する処理にも時間がかかりすぎる
ので、もし黒枠から文字を切り出す処理を新しいOCR
の製品バージョンに組み入れた場合に、旧バージョンと
比べて処理が遅くなり、ユーザは間違いなく不満を持つ
こととなる。
【0010】また、スキャナで文字を読み取るとき、必
然的にスキューが生じるが、従来技術では、黒枠を水平
と垂直の辺を持つ長方形に近似しているので、このスキ
ューに対処できず、黒枠の抽出と文字切り出し精度が低
下する。しかも、ヒストグラムを算出するとき、黒枠の
すべての行或いはすべての列を通して画素数をカウント
したり、最初に推定したコーナー座標を後の行において
もそのまま用いているため、部分毎にスキューの角度が
異なる非線形スキューに対処することはさらに困難とな
る。そこで、このスキューに対処するため詳細に黒枠の
位置や文字を追跡して切り出し精度を上げようとすれ
ば、さらに処理時間がかかることとなり、ジレンマに陥
ることとなる。
【0011】また、個別文字枠と表形式の黒枠の場合と
で異なる切り出しアルゴリズムを用いているため、プロ
グラムが長大となり、プログラムメンテナンスも煩雑な
ものとなる。
【0012】さらに、エラー修正などの画像表示用の原
画像データと文字切り出し用の画像データの両方を持っ
ているので、メモリ容量が圧迫されるという問題も生じ
る。
【0013】本発明は、上記事実を考慮し、簡単なアル
ゴリズムで動作し、黒枠からの文字の切り出し処理が全
体処理に対して無視しうるほど高速であると共に、スキ
ューがあっても高精度に黒枠から文字を分離できるメモ
リの節約可能な文字切り出し装置及び文字認識装置を提
供することが目的である。
【0014】
【課題を解決するための手段】上記目的を達成するため
に、請求項1に記載の発明は、文字枠を含むディジタル
画像データを入力する入力手段と、 前記文字枠に関す
るパラメータを取得するパラメータ取得手段と、前記文
字枠の画像上の位置を検出する位置検出手段と、この位
置検出手段により検出された前記文字枠の位置及び前記
文字枠のパラメータに基づいて、前記文字枠の上下左右
の内壁の位置を推定する内壁推定手段と、この内壁推定
手段により推定された前記文字枠の内壁の位置及び前記
文字枠のパラメータに基づいて、前記文字枠を構成する
上下左右の各枠の領域を推定し、これら各領域と部分的
に重なる局所的な範囲をそれぞれ設定する範囲設定手段
と、この範囲設定手段により設定された各範囲における
画素を実際にスキャンすることにより前記範囲毎の画素
分布を求め、各画素分布に基づいて前記文字枠の上下左
右の内壁の位置を検出する内壁検出手段と、この内壁検
出手段により検出された前記文字枠の内壁に基づいて、
文字枠とこの文字枠内の画像データとを分離する分離手
段と、を備えたことが特徴である。
【0015】請求項2に記載の発明は、請求項1の発明
において、前記内壁検出手段により検出された前記文字
枠の上下左右の内壁の位置を、この検出された内壁の位
置と前記文字枠に隣接する他の文字枠で検出された内壁
の位置とに基づいて平滑化する平滑手段と、を備えたこ
とが特徴である。
【0016】請求項3に記載の発明は、請求項1又は請
求項2の発明において、前記分離手段が、検出された内
壁の位置を基準として、この内壁に沿って所定幅のデー
タ分離枠を設定し、このデータ分離枠内を画像データと
は異なる濃度又は色相の単一画像データに書き直す分離
枠設定手段を備えたことが特徴である。
【0017】請求項4に記載の発明は、請求項3の発明
において、前記分離枠設定手段が、得られたスキューの
値に応じて、前記データ分離枠を、所定の段差を持つよ
うに接続された所定幅の2本の線分で近似することが特
徴である。
【0018】請求項5に記載の発明は、請求項3又は請
求項4の発明において、前記データ分離枠から内側の所
定幅以内に収まる黒画素を除去するノイズ除去手段と、
を備えたことが特徴である。
【0019】請求項6に記載の発明は、請求項1又請求
項2の発明において、前記範囲設定手段が、得られたス
キューの値に応じて設定範囲を可変とすることが特徴で
ある。
【0020】請求項7に記載の発明は、請求項1又請求
項2の発明において、前記位置検出手段が、前記文字枠
のパラメータに基づいて、文字枠の行におけるコーナー
の座標を推定するコーナー座標推定手段と、このコーナ
ー座標推定手段により推定されたコーナーの座標付近に
その行における文字枠を構成する水平枠と垂直枠とを各
々部分的に含む局所的な範囲をそれぞれ設定し、前記水
平枠を含む範囲の画素分布に基づいて、その行のコーナ
ーのY座標を決定し、前記垂直枠を含む範囲の画素分布
に基づいて、その行のコーナーのX座標を決定するコー
ナー座標決定手段と、 を備えたことが特徴である。
【0021】請求項8に記載の発明は、請求項7の発明
において、前記コーナー座標推定手段が、同一文字フィ
ールドにおいて、1行目の文字枠の場合、前記文字枠の
パラメータに基づいてその行のコーナーの座標を推定
し、2行目以降の場合は、前記文字枠のパラメータとそ
の直前の行において検出されたコーナーの座標とに基づ
いてその行のコーナーの座標を推定することが特徴であ
る。
【0022】請求項9に記載の発明は、請求項1又は請
求項2の発明において、前記内壁検出手段が、前記範囲
において水平方向又は垂直方向に沿って画素値の論理積
をとることにより、前記範囲内の画素をそれぞれ垂直方
向又は水平方向にAND射影した2値の疑似ヒストグラ
ムを作成する疑似ヒストグラム作成手段と、この疑似ヒ
ストグラムの変化点を前記内壁推定手段により推定され
た内壁の位置近傍の範囲内で検出する変化検出手段と、
を備え、この変化検出手段により検出された前記変化点
の座標を前記文字枠の内壁の座標とすることが特徴であ
る。
【0023】請求項10に記載の発明は、請求項9の発
明において、前記疑似ヒストグラム作成手段が、得られ
たスキューの値に応じて、サーチする方向と直交する方
向に前記範囲を複数に分割すると共に、分割された範囲
の各々についてAND射影を求める分割射影手段と、前
記AND射影の結果得られた黒画素の隣接関係に基づい
て分割された枠の接続性を判定する接続判定手段と、こ
の接続判定手段により接続性があると判定された枠のA
ND射影結果のみに基づいて疑似ヒストグラムを作成す
ることが特徴である。
【0024】請求項11に記載の発明は、文字認識装置
において、前記請求項1乃至請求項10のいずれか1項
に記載の画像切り出し装置により分離された文字枠内の
画像データを認識することが特徴である。
【0025】請求項12に記載の発明は、請求項11に
記載の発明において、文字枠とこの文字枠の内側領域に
ある画像データを表示する表示手段と、を備えたことが
特徴である。
【0026】
【作用】請求項1に記載の発明によれば、入力手段によ
り文字枠を含むディジタル画像データが入力されると、
パラメータ取得手段によりこの文字枠に関するパラメー
タが取得される。そして、位置検出手段により、この文
字枠の位置が検出されると、この検出された位置と文字
枠のパラメータに基づいて内壁推定手段がこの文字枠の
上下左右の内壁の位置を推定する。そして、この内壁位
置の推定値が得られると、範囲設定手段がこの推定値と
文字枠のパラメータに基づいて、文字枠を構成する上下
左右の各枠の領域と重なる局所的な範囲をそれぞれの枠
毎に設定する。そして、内壁検出手段は、この局所的な
範囲内の画素を実際にスキャンすることにより、各範囲
毎の画素分布を求め、各画素分布に基づいて文字枠の上
下左右の内壁の位置を検出する。
【0027】そして、分離手段は検出された内壁位置に
基づいて、文字枠とこの文字枠内の画像データとを分離
する。
【0028】このように、文字枠のパラメータから得ら
れた推定値から適切な局所的な範囲を設定して、この範
囲内だけスキャンを行うので、検出精度を低下させるこ
となく処理時間を大幅に短縮化できる。
【0029】請求項2に記載の発明によれば、平滑手段
により、内壁検出手段により検出された内壁位置は、こ
の内壁位置とそれに隣接する他の文字枠で検出された内
壁位置とに基づいて平滑化される。これにより、ノイズ
や文字の部分の影響が緩和され、高精度な内壁位置検出
が可能となる。
【0030】請求項3に記載の発明によれば、分離枠設
定手段は、検出された内壁の位置を基準として、この内
壁に沿って所定幅のデータ分離枠を設定し、このデータ
分離枠内を画像データとは異なる濃度又は色相の単一画
像データに書き直す処理を行う。これにより、文字枠に
文字が接しているような場合でも正確に文字枠から文字
等のデータを分離できる。
【0031】請求項4に記載の発明によれば、分離枠設
定手段は、得られたスキューの値に応じて、データ分離
枠を、所定の段差を持つように接続された所定幅の2本
の線分で近似する。これにより、スキューが大きい場合
でも正確に文字枠から画像データを分離できる。
【0032】請求項5に記載の発明によれば、ノイズ除
去手段は、データ分離枠から内側の所定幅以内に収まる
黒画素を除去する。これにより、文字枠の部分を文字と
して切り出すおそれは少なくなり、高精度の切り出しが
可能となる。
【0033】請求項6に記載の発明によれば、範囲設定
手段は、得られたスキューの値に応じて設定範囲を変え
ることができる。これにより、スキューが大きい場合で
も、適切に範囲が設定されるので、内壁検出精度の低下
を防止することができる。
【0034】請求項7に記載の発明によれば、コーナー
座標推定手段が文字枠のパラメータに基づいて、文字枠
の行におけるコーナーの座標を推定する。そして、コー
ナー座標決定手段は、この推定されたコーナーの座標付
近にその行における文字枠を構成する水平枠と垂直枠と
を各々部分的に含む局所的な範囲をそれぞれ設定し、水
平枠を含む範囲の画素分布に基づいて、その行のコーナ
ーのY座標を決定し、垂直枠を含む範囲の画素分布に基
づいて、その行のコーナーのX座標を決定する。これに
より、文字枠の位置をより正確に検出することができ
る。
【0035】請求項8に記載の発明によれば、コーナー
座標推定手段は、1行目の文字枠の場合、文字枠のパラ
メータに基づいてその行のコーナーの座標を推定し、2
行目以降の場合は、文字枠のパラメータとその直前の行
において検出されたコーナーの座標とに基づいてその行
のコーナーの座標を推定する。これにより、行毎にスキ
ューの値が異なる非線形スキューがあっても、行毎に正
確なコーナー座標を検出することができる。
【0036】請求項9に記載の発明によれば、疑似ヒス
トグラム作成手段は、設定された範囲において水平方向
又は垂直方向に沿って画素値の論理積をとることによ
り、この範囲内の画素をそれぞれ垂直方向又は水平方向
にAND射影した2値の疑似ヒストグラムを作成する。
次に、変化検出手段は、この疑似ヒストグラムの変化点
を前記内壁推定手段により推定された内壁の位置近傍の
範囲内で検出する。そして、内壁検出手段は、この変化
点の座標を文字枠の内壁の位置座標として出力力する。
このAND射影をとることにより、ヒストグラム作成の
時間が短縮化され、さらに処理を高速化することができ
る。また、処理を高速化しても、変化点をみることによ
り検出精度の低下を防止することができる。
【0037】請求項10に記載の発明によれば、分割射
影手段は、スキューの値に応じて、サーチする方向と直
交する方向に前記範囲を複数に分割すると共に、分割さ
れた範囲の各々についてAND射影を求める。次に接続
判定手段は、AND射影の結果得られた黒画素の隣接関
係に基づいて分割された枠の接続性を判定する。そし
て、疑似ヒストグラム作成手段は、接続性があると判定
された枠のAND射影結果のみに基づいて疑似ヒストグ
ラムを作成する。これにより、スキューが大きくてもA
ND射影がとれるので、高速処理を維持できると共に、
接続チェックにより内壁検出精度の低下が防止できる。
【0038】請求項11に記載の発明によれば、文字認
識装置は、上記発明に係る画像切り出し装置により分離
された文字枠内の画像データに対して認識処理を行う。
これにより、黒枠内に書かれた文字であっても高速かつ
高精度に切り出されるので、全体の処理速度を低下させ
ることなく、高精度の文字認識が可能となる。
【0039】請求項12に記載の発明によれば、表示手
段は、文字枠とこの文字枠の内側領域にある画像データ
とを表示する。これにより、文字枠と文字等とがきれい
に分離した画像表示が得られるので、1つの画像で表示
用と切り出し用とを兼ねることができ、メモリを節約で
きる。
【0040】
【実施例】図1に本実施例に係る文字認識装置の構成ブ
ロックの概要を示す。
【0041】スキャナ12は、ペーパーに白色光を照射
しながらスキャンし、その反射光の強度を量子化するこ
とにより、ペーパーの原画像11をディジタル画像デー
タに変換する装置である。
【0042】スキャナI/F(インターフェイス)制御
回路14は、スキャナ12へ制御命令を伝達したり、ス
キャナ12から出力されたディジタル画像データをCP
Uバス21に送出するためのインターフェイスの制御回
路である。
【0043】CPU16は、プログラムメモリ18から
読み取ったプログラムに基づいて、制御命令をCPUバ
ス21を介して各構成部に伝達することにより、認識処
理や画像切り出し処理を実行させるための制御回路であ
る。
【0044】プログラムメモリ18は、画像切り出し処
理を実行するプログラムを格納しておくためのメモリで
ある。
【0045】CPUバス21は、CPU16の命令、各
構成部からの出力データ及びディジタル画像データを伝
達するためのバスであり、CPU16を始め他の構成部
と接続されている。
【0046】画像メモリ20は、スキャナ12から出力
されたディジタル画像データ及び後述する画像切り出し
処理の実行中、実行後の画像データを格納しておくため
のメモリである。
【0047】パラメータメモリ22は、原画像11に含
まれている文字フィールド及びそのフィールド内の文字
枠に関するパラメータを格納しておくためのメモリであ
る。このパラメータは、例えばリファレンスマークを基
準とした文字フィールドの相対位置、文字枠のサイズ、
文字枠を構成する線の太さ、文字枠間ギャップ、各文字
フィールドにおける文字枠数等の定義値である。なお、
このパラメータは、オペレータからの入力操作やホスト
コンピュータから受信したデータから取得されるように
してもよい。
【0048】操作部24は、オペレータからの指令を文
字認識部に入力するための入力手段である。この操作部
24は、例えば、キーボード、タッチパネル、マウス等
から構成される。
【0049】表示部26は、画像メモリ20に格納され
ているディジタル画像データ又は後述する分離枠設定処
理を施した画像データ等をオペレータに表示するための
CRT等の表示手段である。
【0050】認識I/F(インターフェイス)制御回路
28は、文字認識部30へCPU16からの制御命令を
伝達したり、文字枠から切り出された文字データを文字
認識部30に出力するためのインターフェイスの制御回
路である。
【0051】認識部30は、CPU16から命令によ
り、入力された文字データに対して内部のプログラムに
基づいて文字認識処理を実行し、キャラクタコードに変
換された認識結果32を出力する装置である。
【0052】次に、本実施例に係る文字認識装置におけ
る全体処理の流れを図2のフローチャートに沿って説明
する。
【0053】先ず、スキャナ12は、ペーパーに白色光
を照射しながらスキャンし、その反射光の強度を量子化
することによって、ペーパーの文字枠を含んだ原画像1
1をディジタル画像データに変換し、このデータをスキ
ャナI/F制御回路14を介して入力する(ステップ9
9)。なお、ディジタル画像データにおける文字枠を、
原画像11の文字枠と区別するため以下に「黒枠」とい
う。
【0054】次に、CPU16は、入力されたディジタ
ル画像データの文字フィールドをサーチし、各々の文字
フィールドの黒枠から黒枠内の文字データを切り出すた
めの以下のような画像切り出し処理を実行する。
【0055】原画像11に含まれる文字フィールドの処
理順を示すための番号fを1に(ステップ100)、1
つの文字フィールドにおける黒枠の行の処理順を示すた
めの番号nを1にセットする(ステップ102)。これ
は、1番目の文字フィールドの1行目から次の処理を開
始するためである。
【0056】次に、f番目の文字フィールドにおける文
字枠のパラメータを取得する(ステップ103)。ここ
でfは1であるから1番目の文字フィールドの文字枠の
パラメータが取得される。
【0057】次に、この文字フィールドにおける左上と
右上のコーナーの座標を推定する処理を行う(ステップ
104)。この処理では、パラメータメモリ22に格納
されているリファレンスマークに対する当該文字フィー
ルドの相対位置等のパラメータに基づいて、ディジタル
画像データにおけるこの文字フィールドの位置を計算す
る。なお、このコーナーの座標のことを以下単に「コー
ナー座標」という。
【0058】そして、この推定座標値をさらに正確な値
に補正するコーナー座標検出処理を行う(ステップ10
5)。この処理では、ステップ104若しくは後述する
ステップ120で推定されたコーナー座標付近の近傍に
所定範囲の検出エリアを設定し、この検出エリア内の画
素分布に基づいてコーナー座標をより正確に求める。
【0059】コーナー座標を検出すると、次にこの行に
おける黒枠のスキューの度合いを示すスキュー値を取得
する(ステップ106)。この取得方法としては、所定
範囲の画像をスキャンすることによってスキュー値を算
出する方法、スキャナ12で原画像11を読み取る際に
算出されたスキュー値を受け取る方法等がある。なお、
一度取得したスキュー値を例えば検出された右上と左上
のコーナー座標から算出された傾き角に基づいて補正し
たり、黒枠の所定範囲をスキャンすることにより補正す
るようにしてもよい。
【0060】次に、1行目の内壁推定処理を行い、1行
目における黒枠すべての内壁を構成する上下左右の各辺
の位置を推定する(ステップ107)。この推定処理で
は、黒枠の内壁を横の辺が水平で縦の辺が垂直である長
方形と仮定し、ステップ104で検出された文字フィー
ルドの左上と右上のコーナー座標を基準として、文字枠
内壁の縦横の長さ、文字枠間ギャップ、文字枠を構成す
る線の太さ等の定義値を用いて、この仮想長方形のコー
ナー座標(左右辺のX座標、上下辺のY座標)を算出す
る。なお、この計算をするとき、ステップ106で計算
されたスキュー値が所定の値よりも大きいときは、内壁
各辺の中央の点における座標を求め、これを推定値とす
る。
【0061】但し、この推定された内壁位置は、原画像
11における文字枠の定義値等を用いているため、スキ
ャナ12で読み取る際のスキューやノイズ等の影響によ
り数ピクセル程度の誤差を含んでいる。
【0062】内壁推定処理が終了すると、誤差を含んだ
推定値をより正確にするため、所定の局所範囲の黒枠の
画素分布を実際に調べて推定値の補正を行う内壁検出処
理を行う(ステップ108)。
【0063】この内壁検出処理が終了すると、次に平滑
化処理を行う(ステップ110)。この平滑化処理の1
つの方法として、処理の対象とする1つの黒枠における
内壁検出位置を、その黒枠を含む近傍の黒枠の内壁検出
位置に適当な重みのウインドウを乗じて算出された値を
総和し、その総和値を、その黒枠を含む近傍の黒枠数で
割ることにより求められる。例えば、着目する1つの黒
枠自身の内壁検出位置とこの行で隣接する他の2つの黒
枠の内壁検出位置とを足した後、これらの黒枠数3で割
った値を、この黒枠の内壁検出位置として出力するとい
うものがある。この方法の場合、この行の左端又は右端
にある黒枠に関しては、例えば、自分自身の検出値の2
倍とこの右隣又は左隣の黒枠の検出値とを足して3で割
るという処理を行う。この平滑化処理により、ノイズや
枠近傍にある文字のストローク等による内壁位置の誤差
が緩和されて正確な検出値が得られ、ひいては黒枠から
の文字切り出し精度を向上させることができる。なお、
ウインドウの各係数値、近傍黒枠の取り方等は、任意好
適に変更できる他、様々な平滑方法があり、上述の例に
限定されるものではない。
【0064】この行におけるすべての黒枠について内壁
位置が平滑化されたら、次に、この行が当該文字フィー
ルドにおける最後の行であるか否かを判定する(ステッ
プ112)。
【0065】この判定の結果、最後の行でない場合(ス
テップ112否定判定)、行番号nが1だけインクリメ
ントされる(ステップ118)。これは、この次の行に
上述の処理を移すことを意味する。そして、次の行の黒
枠の右上と左上のコーナー座標の推定処理を行ない(ス
テップ120)、ステップ105に戻って、この推定値
に基づくコーナー座標の正確な検出を行い、同様の処理
を当該文字フィールドにおける最後の行まで繰り返す。
【0066】なお、2行目以降の黒枠の場合、ステップ
120のコーナー座標の推定方法を、その前の行におい
て検出されたコーナー座標を基準として、行間ギャッ
プ、文字枠のサイズ等の文字枠のパラメータを用いてこ
の行におけるコーナー座標を算出するという方法にして
もよい。これにより、リファレンスマークとの相対位置
からコーナー座標を推定するよりも正確な推定値が得ら
れる。しかも、画像の位置によりスキューの度合いが異
なる非線形スキューの影響も緩和される。
【0067】当該文字フィールドの最後の行まで平滑化
処理が終了したら(ステップ112肯定判定)、当該文
字フィールドのすべての黒枠に対して分離枠設定処理を
行う(ステップ114)。この処理は、検出された内壁
の位置を基準として、この内壁に沿って所定幅のデータ
分離枠を設定し、このデータ分離枠内を白画素に書き直
すという処理である。この処理により、黒枠と文字領域
とがきれいに分離されるので、切り出し精度が向上する
のみならず、表示用として使用した場合、画像がきわめ
て見やすくなるという効果がある。
【0068】分離枠設定処理が終了したら、次にノイズ
除去処理を実行する(ステップ116)。このノイズ除
去処理により、分離枠設定処理時にデータ分離枠の内側
近傍に残った黒枠のかけらを除去できる。従って、この
ようなノイズをも文字データとして切り出すことから発
生する誤認識等の弊害を防止できる。
【0069】次に、当該文字フィールドが原画像11に
おいて最後のものであるか否かを判定する(ステップ1
22)。当該文字フィールドが最後のものではなかった
場合(ステップ122否定判定)、文字フィールド番号
fを1だけインクリメントし(ステップ124)、次の
文字フィールドに対する切り出し処理を行うため、ステ
ップ102に戻って同様の処理を繰り返す。
【0070】原画像11におけるすべての文字フィール
ドの処理が終了した場合(ステップ122肯定判定)、
ステップ114で設定されたデータ分離枠の内側の画像
データを文字データとして切り出す(ステップ12
6)。
【0071】そして、CPU16は、ステップ126で
切り出された文字データを認識I/F制御回路28を介
して文字認識部30に出力すると共に、認識を開始する
ための指令を発する。この指令を受けた文字認識部30
は、切り出された文字データを予め用意された辞書と照
合し、最も類似と判断した文字コードを認識結果32と
して出力する(ステップ128)。なお、ステップ12
6の文字切り出し処理を文字認識部30で行うようにし
てもよい。この場合には、CPU16は、切り出し処理
を実行せずにデータ分離枠の位置を文字認識部30に渡
し、文字認識部30は、このデータ分離枠内の画像デー
タを黒枠から切り出してから認識処理を実行することと
なる。
【0072】次に、表示部26は、認識結果32を表示
する(ステップ130)。このとき、切り出された文字
だけを表示するのではなく、黒枠と文字とを一緒に表示
するようにしてもよい。ステップ114の分離枠設定処
理でデータ分離枠が画像データとは異なる濃度又は色彩
(2値の画像データの場合は白色)に書き直されている
ので、黒枠と文字とがきれいに分離され、これをそのま
まエラー修正用の画像として用いることができるためで
ある。これにより、1つの画像でエラー修正時の表示用
と切り出し用とを兼用することができることとなるの
で、画像メモリ20が大幅に節約できる、という効果が
得られる。
【0073】次に、表示された画像に切り出しエラーや
誤認識があった場合(ステップ132肯定判定)、オペ
レータは操作部24を操作してこれらのエラーを修正し
(ステップ134)、原画像11に対する処理を終え
る。一方、エラーが無ければ(ステップ132否定判
定)、修正無しで処理を終える。
【0074】以上説明した文字認識装置の画像切り出し
処理によれば、画像データを実際にスキャンする範囲
は、局所範囲に限定されているため、高速な処理を実現
することができる。しかも、文字枠のパラメータからの
推定、この推定値近傍の範囲の画像スキャン及び平滑化
処理を適切に組み合わせたので、黒枠からの文字切り出
しを高精度に保つことができる。さらに、個別文字枠と
表形式の場合の処理は、文字枠間ギャップを用いた計算
が多少異なっているだけで処理の内容は変わらないた
め、両者を統一的に処理することができる。
【0075】次に、図2で示された各ステップの処理に
ついてそれぞれ以下に詳細に説明する。
【0076】先ず、ステップ105のコーナー座標の検
出処理の流れを図3によって詳細に説明する。なお、図
3の処理は、原則として図4の黒枠312、314、3
16からなる黒枠行に対して行われる例を示し、便宜上
左上コーナー座標の検出処理のみを扱う。
【0077】図3によれば、ステップ104若しくは1
20において推定された文字フィールド若しくは当該行
における黒枠のコーナーの座標値を取得する(ステップ
140)。図4の例では、黒枠312の左上コーナーの
推定座標値(X0 、Y0 )が取得される。
【0078】次に、Y座標検出エリア300(図4参
照)及びX座標検出エリア302(図4参照)を設定す
る(ステップ142)。このY座標検出エリア300
は、図4に示されたように、左端の黒枠312の推定さ
れた上枠に十分収まる横幅とその横幅内の上枠を十分に
含む高さを持った長方形である。また、X座標検出エリ
ア302は、黒枠312の推定された左枠に十分収まる
高さとその高さ内の左枠を十分に含む横幅を持った長方
形である。
【0079】次に、Y座標検出エリア300に対して横
からの射影を取り縦のヒストグラムを作成する(ステッ
プ144)。この縦のヒストグラムは、このエリアの横
線(Y座標が同じ画素からなる線)上にある画素数をこ
のエリアの上辺から下辺までカウントして得たものであ
る。また、X座標検出エリア302に対しても縦からの
射影を取り横のヒストグラムを作成する(ステップ14
4)。この横のヒストグラムは、このエリアの縦線(X
座標が同じ画素からなる線)上にある画素数をこのエリ
アの左辺から右辺までカウントして得たものである。
【0080】次に、この縦のヒストグラムを上辺から下
辺に向かってサーチし(ステップ146)、Y座標検出
エリア300の横幅分の画素数があるポイント(このポ
イントのY座標をY1 とする)があるか否かをチェック
する(ステップ148)。同様に横のヒストグラムを左
辺から右辺に向かってサーチし(ステップ146)、X
座標検出エリア302の高さ分の画素数があるポイント
(このポイントのX座標をX1 とする)があるか否かを
チェックする(ステップ148)。
【0081】ステップ148のチェックは、ステップ1
46のサーチが終了するまで続けられ(ステップ149
否定判定)、検出エリアの横幅分又は高さ分の画素数を
持つポイントが検出されると(ステップ148肯定判
定)、そのポイントより前、所定の距離以内に画素数0
のポイントがあるか否かが判定される(ステップ15
0)。すなわち、画素のないはずの黒枠の外側があるか
否かが判定される。
【0082】画素数0のポイントが検出された場合(ス
テップ150肯定判定)、ステップ148で検出された
ポイントY1 が左上コーナーのY座標、X1 がこのコー
ナーのX座標として決定される(ステップ152)。図
4では、ポイント304が,この点に相当する。
【0083】一方、画素数0のポイントが検出されなか
った場合(ステップ150否定判定)、直角に折れ曲が
ったコーナーを検出するための輪郭追跡を行う(ステッ
プ151)。輪郭追跡の結果、コーナーが検出されたら
(ステップ153肯定判定)、検出された直角コーナー
の座標(X2 、Y2 )をコーナー座標の決定値とする
(ステップ155)。輪郭追跡してもコーナーが検出さ
れなかった場合(ステップ153否定判定)、コーナー
座標の推定値(X0 、Y0 )をこのコーナー座標の決定
値とする(ステップ154)。
【0084】また、検出エリアの横幅分又は高さ分の画
素数を持つポイントが検出されずにサーチ終了した場合
(ステップ149肯定判定)にも直角コーナー検出のた
めの輪郭追跡を行い(ステップ151)、検出の結果に
応じて(ステップ153)、検出値(X2 、Y2 )又は
推定値(X0 、Y0 )をこのコーナー座標の決定値とす
る(ステップ154、ステップ155)。
【0085】右上コーナーの座標も黒枠316にY座標
検出エリア306及びX座標検出エリア308を設定
し、上述と同様の処理をすることにより、ポイント31
0に決定される。
【0086】次に、図2のステップ108の内壁検出処
理について図5乃至図9により詳細に説明する。なお、
本実施例に係る内壁検出処理は、左右の内壁と上下の内
壁とでその検出方法が異なるため、それぞれに分けて説
明する。
【0087】先ず、左右内壁の検出処理の流れを図5に
よって示す。図2のステップ106で算出されたスキュ
ーの絶対値が所定値S1 を超えているか否かを判定し
(ステップ160)、超えていない場合(ステップ16
0否定判定)、横辺が水平で縦辺が垂直な1つの長方形
を左右内壁検出エリアとして設定する(ステップ16
2)。この長方形は、縦のサイズを黒枠の縦のサイズよ
り小さくとり(例えば黒枠の縦のサイズの約80%程
度)、横のサイズをこの行の横のサイズよりも大きくと
って、この行の黒枠すべての左右の枠を部分的に含み、
かつ、上枠と下枠を含まないと推定される位置に配置す
る。一方、スキューの絶対値が所定値S1 を超えている
場合(ステップ160肯定判定)、1つの長方形では、
上枠と下枠を含むおそれがあるので、図6で示されるよ
うに、左右内壁検出エリア318、320という2つに
分割されたエリアをスキュー値に応じた段差だけ縦にず
らして設定する(ステップ164)。図6の例では、黒
枠は右上がりに傾いており、この傾き方向に応じてエリ
ア320の方がエリア318よりも上にくるように配置
する。これにより、スキューが大きい場合でも左右内壁
検出エリアに上枠と下枠の画素が含まないようにでき、
検出精度を向上させることができる。なお、本実施例で
は、検出エリアを2つに分割する例を扱うが、3つ以上
に分割してもよく、さらにスキュー値の大小に応じて分
割数を可変とすることもできる。
【0088】次に、スキューの絶対値が所定値S2 を超
え、かつ、枠の太さが所定値S3 よりも小さいか否かが
判定される(ステップ165)。否定判定の場合は、ス
キューが小さいか又は枠の太さが十分にあってAND射
影をとっても左右枠を検出できる場合に相当すると考え
られる。そこで、このままの検出エリアで縦方向にAN
D射影をとり(ステップ166)、この結果を2値の疑
似ヒストグラムとしてメモリに格納する(ステップ17
6)。このAND射影とは、画素がある座標を1、画素
がない座標を0として所定の方向に論理積をとり、この
演算結果を射影結果(0又は1)とするものである。従
って、ステップ166の射影では、検出エリア内で縦方
向に連続して画素がある場合にのみ、左右枠が検出され
ることになる。図6の例では、射影線332に点在する
黒点が、検出エリア318又は320内において黒枠3
32〜330をAND射影した結果残った射影画素であ
る。
【0089】一方、ステップ165で肯定判定の場合
は、スキューが大きい割りに枠の太さが小さく、直接A
ND射影をとれば左右枠を検出できないと考えられるの
で、検出エリアをさらに横方向に複数に分割する(ステ
ップ168)。この検出エリアの横分割例を図7(A)
に示した。この図では、ステップ162又はステップ1
64で設定された検出エリア334が、分割線336、
338により3つの分割エリアに等分割され、これによ
り、このエリア内にある1つの右枠が341、342、
343の3つの部分に区分化されることになる。
【0090】そして、分割されたそれぞれのエリアにつ
いて縦方向に分割AND射影を行う(ステップ17
0)。図7(A)の右枠を分割AND射影した例を図7
(B)に示す。この図では、分割枠341、342、3
43がそれぞれ射影画素344、345、346として
残っていることがわかる。図7(A)の右枠のようにス
キューが大きい例では、検出エリア334を分割しない
で射影すると、射影画素が全く残らないので、この分割
された検出エリア毎にAND射影する方法が有効である
ことがわかる。
【0091】検出エリア内のすべての画素について分割
AND射影が終了すると、この射影の結果できたすべて
の射影画素に対して、隣接する分割エリアにおける射影
画素と接続しているか否かの接続性チェックを行う(ス
テップ172)。このチェックにより文字の縦方向の成
分やノイズ等が黒枠として検出されてしまうおそれを回
避できる。
【0092】そして、接続性チェックの結果に基づいて
射影画素の取捨選択を行い(ステップ174)、2値の
疑似ヒストグラムを作成する(ステップ176)。具体
的な例で示せば、すべての分割エリア間で接続している
と判定された射影画素のみを抽出し、これらの接続して
いる射影画素の内、中央の分割エリアにおける射影画素
のみを残して2値の疑似ヒストグラムを作成するという
ものである。
【0093】次に、このようにして得られた疑似ヒスト
グラム上で、白(0)−>黒(1)、黒(1)−>白
(0)の変り目を検出する(ステップ178)。なお、
この変り目検出を、図2のステップ107で推定された
左右内壁位置の近傍の数画素の範囲内において行う。こ
れにより処理の高速化が達成できる。
【0094】次に、この変り目のパターンが正しいか否
かを判定する(ステップ180)。変り目のパターンが
正しい場合(ステップ180肯定判定)、この変り目を
左右内壁のX座標として検出する(ステップ182)。
図6の例では、黒枠322〜330の左右内壁のX座標
がX1 〜X10として検出されている。一方、変り目のパ
ターンが正しくなかった場合(ステップ180否定判
定)、ステップ107の推定値を左右内壁のX座標とし
てそのまま用いる。なお、検出された左右内壁の位置は
平滑化処理(図2ステップ110)により平滑化され
る。
【0095】以上が上下内壁検出処理の流れであるが、
ここで、ステップ172における接続性チェック処理の
流れを図8により図9の具体例を対象として詳細に説明
する。なお、図9(A)、(B)は、図7(A)で示さ
れた分割枠341、342,343同士の接続チェック
の例を各々示し、(C)は接続していない他の分割枠の
例を示している。
【0096】図8によれば、先ず分割エリア番号iに1
を代入する(ステップ188)。次に、i番目の分割エ
リアの射影画素と、i+1番目の分割エリアの射影画素
との4連結又は8連結の隣接関係をチェックする(ステ
ップ191)。ここで、このステップ190とステップ
191について、図7(B)の射影画素を例にとり図9
(A)によって説明する。図9(A)は、2番目の分割
エリアの射影画素345と1番目の分割エリアの射影画
素344との隣接関係を示した例であるが、この射影画
素345の右端の黒画素は、射影画素344の左端の黒
画素と互いに4連結で隣接していることが分かる。従っ
て、この例では、射影画素344と345は隣接関係に
あると判定される。
【0097】隣接していると判定された場合(ステップ
192肯定判定)、分割エリア番号iが1だけインクリ
メントされ、iが最後の分割エリアを示す番号であるか
否かを判定する(ステップ194)。今、iは2である
からステップ190に戻って(ステップ194否定判
定)同様の処理を繰り返す。図7(B)の例では、射影
画素345と346との隣接関係がチェックされること
になる。この場合を図9(B)に示す。この図によれ
ば、射影画素345の左端の黒画素と射影画素346の
右端の黒画素とは、8連結で隣接している。従って、図
7(B)の射影画素はすべて隣接関係にあることとなり
(ステップ194肯定判定)、チェックの結果を「接
続」にして(ステップ196)リターンする。
【0098】一方、射影画素が隣接関係に無い場合(ス
テップ192否定判定)、チェックの結果を「非接続」
にして(ステップ198)リターンする。すなわち、1
組でも隣接関係にない場合は、接続していないと判定さ
れることとなる。ここで、隣接関係にない射影画素の組
を図9(C)に示す。この図によれば、射影画素357
の左端の黒画素と射影画素358の右端の黒画素とは、
4連結でも8連結でもなく、隣接関係にないということ
が分かる。
【0099】次に、上下内壁の検出処理について、図1
0により説明する。図10によれば、上下内壁の位置を
推定値より正確に求めるため、先ず実際に画像をスキャ
ンする範囲の上下内壁検出エリアをそれぞれ設定する
(ステップ200)。この上下内壁検出エリアの設定例
を図11に示した。図11の例によれば、黒枠364の
上枠、下枠の大部分を含む範囲にそれぞれ長方形の上枠
検出エリア366、下枠検出エリア368が設定されて
いる。この長方形の縦の長さは、文字枠の太さの定義値
よりも大きく(例えば8本/mmの分解能では10〜1
2画素程度)、横の長さは、左右内壁検出処理で求めら
れた左右内壁の間に収まる程度に設定される。なお、こ
こで用いられる左右内壁の位置は、平滑化処理した後の
値を用いる。
【0100】次に、これら検出エリア内の画素に対し、
横からの射影によるヒストグラムをとる(ステップ20
2)。このとき、検出エリア内の1行分の画像データを
バイト単位に分割し、各バイト(8画素分)の値で黒画
素数を求め、バイト毎に求められた黒画素数を総和して
この行の黒画素数を求めれば、画素数のカウント時間を
大幅に短縮できる。
【0101】次に、このヒストグラムを縦方向にサーチ
し、画素数が所定のしきい値T1 よりも小さくなる変り
目を検出する(ステップ204)。
【0102】そして、この変り目が検出され(ステップ
206肯定判定)、かつ、この変り目のパターンが正し
い場合(ステップ207肯定判定)、この変り目のY座
標を上下内壁のY座標として決定する(ステップ20
8)。一方、変り目が検出されず(ステップ206否定
判定)、又は、検出されても変り目のパターンが正しく
なかった場合(ステップ207否定判定)は、内壁推定
処理で推定された上下内壁のY座標を検出値とする(ス
テップ210)。図11の例では、黒枠360の上枠内
壁、下枠内壁は、それぞれ370、372によって示さ
れるY座標を持つ線分として検出される。
【0103】以上のような処理をこの行にある他の黒枠
362、364に対しても行い、上下内壁検出処理を終
了する。なお、検出された上下内壁の位置は平滑化処理
(図2ステップ110)により平滑化される。
【0104】次に、分離枠設定処理からノイズ除去処理
に至る流れについて図12に沿って詳細に説明する。
【0105】先ず、スキューの絶対値が所定のしきい値
4 を超えているか否かを判定する(ステップ21
2)。
【0106】この判定の結果、スキューの絶対値がしき
い値を超えていない場合(ステップ212否定判定)、
検出された上下左右の内壁(近似した長方形の各辺)に
沿って1本の所定幅の白線を書き込む処理を行う(ステ
ップ216)。なお、この処理は、画像メモリ20の画
像データ上で、当該白線の領域にある画素の画素値をす
べて0にする処理に相当する。また、画像データが2値
を超える階調を持つ場合は、この白線の領域を画像デー
タとは異なる濃度又は色相の単一画像データに書き直す
ようにしてもよい。
【0107】スキューの絶対値がしきい値S4 を超えて
いる場合(ステップ212肯定判定)、スキューの方向
に応じて、所定の段差を持つように接続された互いに等
しい長さで所定幅の2本の白線を、検出された上下左右
の内壁に沿って各々書き込む処理を行う(ステップ21
4)。
【0108】図13にステップ214の処理を説明する
ための画像の例を示した。図13(A)は、白線処理を
施す前の画像であり、文字と黒枠とが接していることが
わかる。次の図13(B)は、図13(A)の画像に対
してステップ214の処理を施した場合の画像例を示
し、図13(B)の画像によれば、図13(A)の画像
と比較して文字と黒枠とがきれいに分離されていること
がわかる。
【0109】また、図13の画像は左上がりの方向にス
キューしているので、2本の白線もこの方向に沿うよう
に段差をつけて接続される。図13(C)はこの2本の
白線の接続状態を示している。この図によれば、上枠の
内壁に引かれる白線400は、右側の白線の方が左側の
白線よりも下にくるように左上がりに接続される。他の
枠の内壁に引かれる白線402、404、406につい
ても、このスキューの方向に沿う方向に段差をつけて接
続される。
【0110】なお、図13(C)の例は、上下左右の内
壁の位置がそれぞれ408、410、412、414に
示す位置になるように白線を配置し、白線の幅及び段差
を1画素分に設定している。この例に示されたように、
8本/mmの分解能で、文字枠の太さやスキューがこの
程度であるならば、1画素分の幅を持った相等しい長さ
の2本の白線を段差1画素分つけて接続するのが、最も
好適であると考えられる。
【0111】この白線を引く処理を施しても、なお図1
3(B)のノイズ390、392、394、396のよ
うに黒枠のかけらが依然として残る。そこで、次にこの
ノイズを除去するための処理を行い、白線から内側の所
定幅以内に収まる黒画素をすべて消去する(ステップ2
18)。図13(B)の画像のノイズを消去した後の画
像を図13(D)に示す。図13(D)では、図13
(B)の画像にはあったノイズがすべて消去されている
ことが分かる。
【0112】このような分離枠設定処理とノイズ除去処
理により、黒枠の内側には文字そのものの黒画素のみが
残るので、オリジナルの画像に近い視認性の優れた画像
が得られる。従って、この黒枠付の文字をそのまま切り
出し処理の途中結果の確認や認識エラー修正時用の画像
としても利用でき、これにより1つの画像データで済む
のでメモリが節約できる。また、この画像はそのまま従
来の文字外接長方形の検出ステップに渡すことができ
る。
【0113】以上が本実施例に係る文字認識装置である
が、この例に限定されるものではない。例えば、本実施
例では、ソフトウェアに基づくCPU16の制御により
画像切り出し等に関する各処理を行うようにしたが、こ
れらの処理を実行する専用の回路を設けることによって
も実現可能である。特に本実施例に係る画像切り出し処
理を行う装置を、文字認識装置に挿入可能なボード、或
いは接続可能な装置として独立させることもできる。
【0114】また、コーナー検出処理において、最初か
らステップ151のような輪郭追跡を行うようにしても
よく、文字枠のレイアウトのパラメータがない場合に
は、画像データの中の黒い直線をサーチするという手法
を追加してもよい。
【0115】さらに、文字フィールドや2行目以降の黒
枠の位置を特定するため、左上と右上のコーナー座標を
求めるようにしたが、これらの位置が特定できれば、左
下や右下のコーナー或いは黒枠の中央付近など、どのポ
イントでもよい。
【0116】左右内壁の検出処理では2値の疑似ヒスト
グラムを作成し、上下内壁の検出処理では画素数をカウ
ントすることで通常のヒストグラムを作成したが、後者
の処理においても、2値の疑似ヒストグラムを用いるよ
うにすることができる。この場合、スキューの値に応じ
て検出エリアを分割する等の手法がそのまま適用できる
ことはいうまでもない。
【0117】その他、検出エリアの設定範囲、検出エリ
アの分割の仕方、処理の流れ等は、この発明の効果の奏
する範囲内で任意好適に変更可能である。
【0118】
【発明の効果】以上詳細に説明したように請求項1に係
る発明によれば、文字枠のパラメータから得られた推定
値から適切な局所的な範囲を設定して、この範囲内だけ
スキャンを行うようにしたので、簡単なアルゴリズムで
もって検出精度を低下させることなく処理時間を大幅に
短縮化できる、という効果が得られる。
【0119】請求項2に係る発明によれば、平滑手段を
付加したので、ノイズや文字の部分の影響が緩和され、
さらに高精度な内壁位置検出が可能となる、という効果
が得られる。
【0120】請求項3に係る発明によれば、検出された
内壁の位置を基準として、データ分離枠を設定するよう
にしたので、文字枠に文字が接しているような場合でも
適切に文字を文字枠から分離できる、という効果が得ら
れる。
【0121】請求項4に係る発明によれば、得られたス
キューの値に応じて、データ分離枠を、所定幅の2本の
線分で近似するようにしたので、スキューが大きい場合
でも正確に文字枠から画像を分離できる、という効果が
得られる。
【0122】請求項5に係る発明によれば、ノイズ除去
手段を付加したので文字枠の部分を枠内の画像として切
り出すおそれは少なくなり、高精度の切り出しが可能と
なる、という効果が得られる。
【0123】請求項6に係る発明によれば、得られたス
キューの値に応じて設定範囲を変えるようにしたので、
スキューによる内壁検出の精度の低下を防止することが
できる、という効果が得られる。
【0124】請求項7に係る発明によれば、コーナー座
標検出において、文字枠のパラメータに基づく推定と局
所範囲のスキャンとを適切に組み合わせたので、文字枠
の位置をより正確に検出することができる、という効果
が得られる。
【0125】請求項8に係る発明によれば、行毎にその
前の行のコーナー座標を用いてコーナー座標を推定する
ようにしたので、行毎にスキューの値が異なる非線形ス
キューがあっても、正確なコーナー座標を検出すること
ができる、という効果が得られる。
【0126】請求項9に係る発明によれば、AND射影
と変化点検出を適切に組み合わせることにより、処理の
高速化と高精度の維持を同時に達成できる、という効果
が得られる。
【0127】請求項10に係る発明によれば、スキュー
の値に応じてスキャンする範囲を分割してAND射影を
行った後さらに接続の確認を行うようにしたので、スキ
ューが大きくても高速処理を維持できると共に検出精度
の低下を防止する、という効果が得られる。
【0128】請求項11に係る発明によれば、文字認識
部に上記発明に係る画像切り出し装置を利用するように
したので、黒枠内の文字を認識するときでも全体の処理
速度が従来とほとんど変わらず、しかも高精度に認識で
きる文字認識部が提供できる、という効果が得られる。
【0129】請求項12に係る発明によれば、表示手段
を付加することにより文字枠と文字とがきれいに分離し
た画像表示を得ることができるようになったので、この
画像1つで表示と切り出しチェック等を兼用すれば、メ
モリの節約につながる、という効果が得られる。
【図面の簡単な説明】
【図1】本実施例に係る文字認識装置の概略構成を示す
ブロック図である。
【図2】本実施例に係る文字認識装置における処理全体
の流れを示すフローチャートである。
【図3】コーナー座標検出処理を示すフローチャートで
ある。
【図4】コーナー座標検出処理の際に設定される検出エ
リアの範囲を具体的に示す図である。
【図5】左右内壁検出処理を示すフローチャートであ
る。
【図6】左右内壁検出処理の際に設定される検出エリア
の範囲及び疑似ヒストグラムを具体的に示す図である。
【図7】(A)は、左右内壁検出処理の際に設定された
検出エリアをさらに分割した場合の例、(B)は、各分
割エリアにおけるAND射影の結果を示す図である。
【図8】接続性チェックの処理を示すフローチャートで
ある。
【図9】(A)及び(B)は、接続している2つの分割
枠に関するAND射影の隣接関係の例、(C)は、接続
していない2つの分割枠に関するAND射影の隣接関係
の例を示す図である。
【図10】上下内壁検出処理を示すフローチャートであ
る。
【図11】上下内壁検出処理の際に設定される検出エリ
アの範囲を具体的に示す図である。
【図12】分離枠設定処理とノイズ除去処理を示すフロ
ーチャートである。
【図13】(A)は、黒枠とこの黒枠に接している文字
の画像例を、(B)は、(A)で示された画像に分離枠
設定処理を施した後の画像例を、(C)は、分離枠設定
処理において上下左右の内壁に設定する段差をつけた2
本の白線を、(D)は、(B)で示された画像にノイズ
除去処理を施した後の画像例を示す図である。
【符号の説明】
12 スキャナ 16 CPU 20 画像メモリ 22 パラメータメモリ 26 表示部 30 文字認識部

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 文字枠を含むディジタル画像データを入
    力する入力手段と、 前記文字枠に関するパラメータを取得するパラメータ取
    得手段と、 前記文字枠の画像上の位置を検出する位置検出手段と、 この位置検出手段により検出された前記文字枠の位置及
    び前記文字枠のパラメータに基づいて、前記文字枠の上
    下左右の内壁の位置を推定する内壁推定手段と、 この内壁推定手段により推定された前記文字枠の内壁の
    位置及び前記文字枠のパラメータに基づいて、前記文字
    枠を構成する上下左右の各枠の領域を推定し、これら各
    領域と部分的に重なる局所的な範囲をそれぞれ設定する
    範囲設定手段と、 この範囲設定手段により設定された各範囲における画素
    を実際にスキャンすることにより前記範囲毎の画素分布
    を求め、各画素分布に基づいて前記文字枠の上下左右の
    内壁の位置を検出する内壁検出手段と、 この内壁検出手段により検出された前記文字枠の内壁に
    基づいて、文字枠とこの文字枠内の画像データとを分離
    する分離手段と、 を備えたことを特徴とする画像切り出し装置。
  2. 【請求項2】 前記内壁検出手段により検出された前記
    文字枠の上下左右の内壁の位置を、この検出された内壁
    の位置と前記文字枠に隣接する他の文字枠で検出された
    内壁の位置とに基づいて平滑化する平滑手段と、 を備えたことを特徴とする請求項1に記載の画像切り出
    し装置。
  3. 【請求項3】 前記分離手段は、 検出された内壁の位置を基準として、この内壁に沿って
    所定幅のデータ分離枠を設定し、このデータ分離枠内を
    画像データとは異なる濃度又は色相の単一画像データに
    書き直す分離枠設定手段を備えたことを特徴とする請求
    項1又は請求項2に記載の画像切り出し装置。
  4. 【請求項4】 前記分離枠設定手段は、得られたスキュ
    ーの値に応じて、前記データ分離枠を、所定の段差を持
    つように接続された所定幅の2本の線分で近似すること
    を特徴とする請求項3に記載の画像切り出し装置。
  5. 【請求項5】 前記データ分離枠から内側の所定幅以内
    に収まる黒画素を除去するノイズ除去手段と、 を備えたことを特徴とする請求項3又は請求項4に記載
    の画像切り出し装置。
  6. 【請求項6】 前記範囲設定手段は、 得られたスキューの値に応じて設定範囲を可変とするこ
    とを特徴とする請求項1又は請求項2に記載の画像切り
    出し装置。
  7. 【請求項7】 前記位置検出手段は、 前記文字枠のパラメータに基づいて、文字枠の行におけ
    るコーナーの座標を推定するコーナー座標推定手段と、 このコーナー座標推定手段により推定されたコーナーの
    座標付近にその行における文字枠を構成する水平枠枠と
    垂直枠とを各々部分的に含む局所的な範囲をそれぞれ設
    定し、前記水平枠を含む範囲の画素分布に基づいて、そ
    の行のコーナーのY座標を決定し、前記垂直枠を含む範
    囲の画素分布に基づいて、その行のコーナーのX座標を
    決定するコーナー座標決定手段と、 を備えたことを特徴とする請求項1又は請求項2に記載
    の画像切り出し装置。
  8. 【請求項8】 前記コーナー座標推定手段は、 同一文字フィールドにおいて、 1行目の文字枠の場合、前記文字枠のパラメータに基づ
    いてその行のコーナーの座標を推定し、2行目以降の場
    合は、前記文字枠のパラメータとその直前の行において
    検出されたコーナーの座標とに基づいてその行のコーナ
    ーの座標を推定することを特徴とする請求項7に記載の
    画像切り出し装置。
  9. 【請求項9】 前記内壁検出手段は、 前記範囲において水平方向又は垂直方向に沿って画素値
    の論理積をとることにより、前記範囲内の画素をそれぞ
    れ垂直方向又は水平方向にAND射影した2値の疑似ヒ
    ストグラムを作成する疑似ヒストグラム作成手段と、 この疑似ヒストグラムの変化点を前記内壁推定手段によ
    り推定された内壁の位置近傍の範囲内で検出する変化検
    出手段と、を備え、 この変化検出手段により検出された前記変化点の座標を
    前記文字枠の内壁の座標とすることを特徴とする請求項
    1又は請求項2に記載の画像切り出し装置。
  10. 【請求項10】 前記疑似ヒストグラム作成手段は、 得られたスキューの値に応じて、サーチする方向と直交
    する方向に前記範囲を複数に分割すると共に、分割され
    た範囲の各々についてAND射影を求める分割射影手段
    と、 前記AND射影の結果得られた黒画素の隣接関係に基づ
    いて分割された枠の接続性を判定する接続判定手段と、 この接続判定手段により接続性があると判定された枠の
    AND射影結果のみに基づいて疑似ヒストグラムを作成
    することを特徴とする請求項9に記載の画像切り出し装
    置。
  11. 【請求項11】 前記請求項1乃至請求項10のいずれ
    か1項に記載の画像切り出し装置により分離された文字
    枠内の画像データを認識することを特徴とする文字認識
    装置。
  12. 【請求項12】 文字枠とこの文字枠の内側領域にある
    画像データを表示する表示手段と、 を備えたことを特徴とする請求項11に記載の文字認識
    装置。
JP7072104A 1995-03-29 1995-03-29 画像切り出し装置及び文字認識装置 Expired - Lifetime JP2761467B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP7072104A JP2761467B2 (ja) 1995-03-29 1995-03-29 画像切り出し装置及び文字認識装置
US08/604,046 US5790696A (en) 1995-03-29 1996-02-20 Image segmentation apparatus and a character recognition apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7072104A JP2761467B2 (ja) 1995-03-29 1995-03-29 画像切り出し装置及び文字認識装置

Publications (2)

Publication Number Publication Date
JPH08287184A true JPH08287184A (ja) 1996-11-01
JP2761467B2 JP2761467B2 (ja) 1998-06-04

Family

ID=13479764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7072104A Expired - Lifetime JP2761467B2 (ja) 1995-03-29 1995-03-29 画像切り出し装置及び文字認識装置

Country Status (2)

Country Link
US (1) US5790696A (ja)
JP (1) JP2761467B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6983071B2 (en) 2001-05-16 2006-01-03 Nec Corporation Character segmentation device, character segmentation method used thereby, and program therefor

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7898695B1 (en) 2000-10-06 2011-03-01 Lexmark International, Inc. Method of compensating for electronic printhead skew and bow correction in an imaging machine to reduce print artifacts
US7392472B2 (en) * 2002-04-25 2008-06-24 Microsoft Corporation Layout analysis
US7024039B2 (en) 2002-04-25 2006-04-04 Microsoft Corporation Block retouching
US7263227B2 (en) * 2002-04-25 2007-08-28 Microsoft Corporation Activity detector
US7043079B2 (en) 2002-04-25 2006-05-09 Microsoft Corporation “Don't care” pixel interpolation
US7120297B2 (en) * 2002-04-25 2006-10-10 Microsoft Corporation Segmented layered image system
US7110596B2 (en) * 2002-04-25 2006-09-19 Microsoft Corporation System and method facilitating document image compression utilizing a mask
US7164797B2 (en) * 2002-04-25 2007-01-16 Microsoft Corporation Clustering
US6956587B1 (en) * 2003-10-30 2005-10-18 Microsoft Corporation Method of automatically cropping and adjusting scanned images
JP4574235B2 (ja) * 2004-06-04 2010-11-04 キヤノン株式会社 画像処理装置、及びその制御方法、プログラム
US20060224953A1 (en) * 2005-04-01 2006-10-05 Xiaofan Lin Height-width estimation model for a text block
JP4909216B2 (ja) * 2006-09-13 2012-04-04 株式会社キーエンス 文字切り出し装置、方法およびプログラム
US8009928B1 (en) 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
CN101713819B (zh) * 2008-10-08 2012-12-19 鸿富锦精密工业(深圳)有限公司 万用表校验系统及方法
TWI414804B (zh) * 2008-10-24 2013-11-11 Hon Hai Prec Ind Co Ltd 萬用表校驗系統及方法
US8917329B1 (en) 2013-08-22 2014-12-23 Gopro, Inc. Conversion between aspect ratios in camera
US10200575B1 (en) 2017-05-02 2019-02-05 Gopro, Inc. Systems and methods for determining capture settings for visual content capture
CN109255356B (zh) * 2018-07-24 2022-02-01 创新先进技术有限公司 一种文字识别方法、装置及计算机可读存储介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2951814B2 (ja) * 1993-02-25 1999-09-20 富士通株式会社 画像抽出方式
JP3338537B2 (ja) * 1993-12-27 2002-10-28 株式会社リコー 画像傾き検出装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6983071B2 (en) 2001-05-16 2006-01-03 Nec Corporation Character segmentation device, character segmentation method used thereby, and program therefor

Also Published As

Publication number Publication date
JP2761467B2 (ja) 1998-06-04
US5790696A (en) 1998-08-04

Similar Documents

Publication Publication Date Title
JP2761467B2 (ja) 画像切り出し装置及び文字認識装置
JP2940960B2 (ja) 画像の傾き検出方法および補正方法ならびに画像情報処理装置
JP3308032B2 (ja) スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置
JP3943638B2 (ja) Ocrを利用しない文書画像中のドロップワードの自動認識方法
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
US5509092A (en) Method and apparatus for generating information on recognized characters
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JPH07220023A (ja) 表認識方法及びその装置
JP3031579B2 (ja) 帳票の文字認識領域指定方法
CN111340040A (zh) 一种纸张字符识别方法、装置、电子设备及存储介质
JPH0410087A (ja) 基本ライン抽出方法
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP2004094427A (ja) 帳票画像処理装置及び該装置を実現するためのプログラム
JP3311551B2 (ja) イメージデータ入力処理方法およびその装置
JP5146199B2 (ja) 差分抽出装置及び差分抽出プログラム
JPH06215181A (ja) 文字・文字列切り出し方法および文字認識装置
JP2003016385A (ja) 画像処理装置、方法、プログラム、及び記憶媒体
JP3190794B2 (ja) 文字切り出し装置
JP2859307B2 (ja) 文字切出し装置
JPH0573718A (ja) 領域属性識別方式
JPH05128305A (ja) 領域分割方法
JP3275475B2 (ja) 文字配列が既知の対象文字列の認識装置
JP2755299B2 (ja) 画像処理方法
JP2000207490A (ja) 文字切出装置、および文字切出方法
JP4439054B2 (ja) 文字認識装置及び文字枠線の検出方法

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090320

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100320

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110320

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120320

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130320

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140320

Year of fee payment: 16

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

S633 Written request for registration of reclamation of name

Free format text: JAPANESE INTERMEDIATE CODE: R313633

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term