JP2000022899A - 画像認識装置 - Google Patents
画像認識装置Info
- Publication number
- JP2000022899A JP2000022899A JP10190672A JP19067298A JP2000022899A JP 2000022899 A JP2000022899 A JP 2000022899A JP 10190672 A JP10190672 A JP 10190672A JP 19067298 A JP19067298 A JP 19067298A JP 2000022899 A JP2000022899 A JP 2000022899A
- Authority
- JP
- Japan
- Prior art keywords
- size
- image
- character
- document
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000009826 distribution Methods 0.000 claims abstract description 12
- 238000000034 method Methods 0.000 claims description 44
- 238000001514 detection method Methods 0.000 claims description 5
- 238000013500 data storage Methods 0.000 claims description 4
- 230000001172 regenerating effect Effects 0.000 claims description 2
- 238000002955 isolation Methods 0.000 abstract 3
- 230000008030 elimination Effects 0.000 abstract 2
- 238000003379 elimination reaction Methods 0.000 abstract 2
- 238000012545 processing Methods 0.000 description 55
- 238000010586 diagram Methods 0.000 description 16
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000007781 pre-processing Methods 0.000 description 7
- 230000000630 rising effect Effects 0.000 description 5
- 238000009792 diffusion process Methods 0.000 description 4
- 239000011521 glass Substances 0.000 description 4
- 238000003705 background correction Methods 0.000 description 3
- 238000012937 correction Methods 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 1
- 101100135116 Oryza sativa subsp. japonica RR12 gene Proteins 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000000428 dust Substances 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Landscapes
- Image Input (AREA)
- Image Processing (AREA)
- Facsimile Scanning Arrangements (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
してより正確な原稿方向認識を行うことが可能な画像認
識装置を提供すること。 【解決手段】 画像データ内の孤立点をノイズ除去フィ
ルタ3×3を用いて除去する(S1、S2)。孤立点の
除去された画像データから文字画像の濃度分布を示すヒ
ストグラムを生成する(S3)。生成されたヒストグラ
ムの形状を解析することにより原稿の文字画像のサイズ
を検出し(S7)、これが所定サイズよりも大きい場合
は(S8で「Y])、ノイズ除去フィルタのサイズを3
×3よりも大きな5×5に変更して画像データ内の孤立
点を再度除去し、ヒストグラムを再度生成する(S9〜
S11)。文字サイズが所定サイズ以下の場合には(S
8で「N」)、S14に移る。生成されたヒストグラム
に基づいて、原稿方向をページ毎に認識し、この認識結
果に基づいて原稿の回転角度を設定する(S14、S1
5)。
Description
読取部に用いられる原稿の方向を認識する画像認識装置
に関する。
複写機において、複数枚の原稿を連続して読み取ってコ
ピーする場合には、読み取られた原稿の向きに応じてコ
ピーが出力されるので、原稿を原稿自動搬送装置にセッ
トする際に、操作者は各原稿が一律に同じ方向を向いて
いるか否かを確認する必要があった。しかし、このよう
な確認作業は結構手間がかかるものであり、原稿枚数が
多ければ、それだけ反対方向の原稿を見落とすおそれも
多くなる。この確認作業を怠ると、出力されたコピーに
ついていちいちコピーの向きを修正しなければならない
という不都合を生じ、さらには自動的にステープル止め
を行うステープルユニットを備えた複写機において、ス
テープルを行うと、異なる方向のコピーを含むコピー束
をそのままステープル止めしてしまい、最悪の場合には
もう一度コピー作業をやり直さなければならない事態も
生じる。
同じ方向を向いていなくても、読み取った原稿データか
らまず原稿の向きを認識し(このような原稿方向の認識
を以下、「原稿方向認識」という。)、その画像出力が
適切な方向になるように画像データを回転処理して出力
する方法が提案されている。このような原稿方向認識の
手法としては、まず原稿の画像データに基づいて原稿画
像の濃度分布を示すヒストグラムを生成するのが一般的
である。例えば、特開平9−9040号公報において
は、次のような原稿方向認識方法が開示されている。
画像に属するブロックを判別し、このブロックについて
の主走査方向および副走査方向における濃度分布を示す
ヒストグラムをそれぞれ生成し、これらのヒストグラム
のグラフ(図形)上における変化点(立ち上がりあるい
は立ち下がりエッジ部分)の変化の方向を考慮に入れて
カウントすることにより文字の並びと原稿の向きとを認
識する。
ち文字の書き始めの位置が各文で一致する傾向があるの
に対し、文の終わる箇所は各文でまちまちであるため、
変化点は文の先頭方向に比べて分散する傾向にある。そ
のため、グラフは文の先頭方向から見たときに、立ち上
がりエッジ数が少なく、文の終わる方向に立ち下がりエ
ッジ数が多い形状になる。従って、グラフを見たとき
に、立ち上がりエッジ数が少なくなる方向が文の先頭方
向と認識することができるようになり、その結果から原
稿方向認識を行う。
うには、ヒストグラムをより正確に生成する必要がある
が、例えば原稿に微小な汚れやごみなど(以下、「ノイ
ズ」という。)が多数点在している場合には、このノイ
ズの影響により行間や文の先頭箇所などの正確な位置が
判別できなくなる恐れがあり、これにより求められたヒ
ストグラムも正確さに欠けたものとなるという問題があ
る。従って、原稿方向認識の信頼性を向上させるために
は、ヒストグラムを生成する前にこのノイズを極力除去
しておくことが必要になる。
法として、例えば特開平7−105312号公報には、
1文字分の文字画像を切り出して、この文字画像の代表
線幅を検出し、当該代表線幅により形成される画像の外
接矩形を求め、この外接矩形よりも外に位置する画像の
画像データを消去することによりノイズ除去を行う技術
が開示されている。
ように1文字ずつ文字画像を切り出してノイズ除去を行
う方法では、確かにノイズ除去を効果的に行えるが、そ
の一方で原稿画像中の全ての文字画像についていちいち
代表線幅を検出するといった膨大な処理が必要となり、
これがノイズ除去処理を大変複雑なものにすると共に処
理に長時間を要していた。
されたものであって、簡易な構成でありながらノイズを
極力除去させてより正確な原稿方向認識を行うことが可
能な画像認識装置を提供することを目的とする。
に本発明は、文字画像を含む原稿の方向を認識する装置
であって、原稿を読み取って画像データを生成する画像
読取手段と、前記画像データを記憶する画像データ記憶
手段と、前記画像データから文字画像のサイズを検出す
る文字サイズ検出手段と、前記検出された文字サイズに
応じて孤立点除去フィルタのフィルタサイズを決定する
フィルタサイズ決定手段と、前記決定されたフィルタサ
イズの孤立点除去フィルタを用いて、前記画像データ記
憶手段に記憶されている画像データ内の孤立点を除去す
る孤立点除去手段と、孤立点が除去された画像データに
基づき前記原稿の方向を認識する画像方向認識手段とを
備えることを特徴とする。
出された文字サイズが所定のサイズ以下の場合には、フ
ィルタサイズを第1のサイズに決定し、文字サイズが前
記所定のサイズよりも大きな場合には、フィルタサイズ
を前記第1のサイズよりも大きな第2のサイズに決定す
ることを特徴とする。また、前記文字サイズ検出手段
は、原稿の濃度分布を示すヒストグラムを前記画像デー
タから生成し、これに基づいて文字サイズを検出するこ
とを特徴とする。
れたヒストグラムに基づいて前記原稿の文字の線分の濃
度が地肌部の濃度よりも低い濃度で表現されている反転
原稿であるか否かを検出する反転原稿検出手段を備え、
当該反転原稿検出手段が前記原稿を前記反転原稿である
ことを検出すると、生成されたヒストグラムを反転させ
て再生成し、これに基づいて文字サイズを検出すること
を特徴とする。
度分布を示すヒストグラムを孤立点が除去された画像デ
ータから生成し、これに基づいて文字画像の方向を認識
することを特徴とする。
置の実施の形態を、デジタル複写機に適用した場合につ
いて説明する。 (1)デジタル複写機全体の構成 まず、デジタル複写機(以下、単に「複写機」とい
う。)の全体の構成を図1により説明する。
動搬送装置10と、画像読取部30と、プリンタ部50
と、給紙部70とからなる。原稿自動搬送装置10は、
原稿を自動的に画像読取部30に搬送する装置であっ
て、原稿給紙トレイ11に載置された原稿は、給紙ロー
ラ12、捌きローラ13により1枚ずつ分離されて下方
に送られ、搬送ベルト14によって、プラテンガラス3
1上の原稿読取位置まで搬送される。
取部30のスキャナ32によりスキャンされた後、再
び、搬送ベルト14により図の右方向に送られ、排紙ロ
ーラ15を経て原稿排紙トレイ16上に排出される。画
像読取部30は、上記プラテンガラス31の原稿読取位
置に搬送された原稿の画像を光学的に読み取るものであ
って、スキャナ32、CCDカラーイメージセンサ38
などから構成される。
露光ランプ33の照射による原稿からの反射光をプラテ
ンガラス31に平行な方向に光路変更するミラー34が
設置され、図の矢印方向に移動することによりプラテン
ガラス31上の原稿をスキャンする。原稿からの反射光
はミラー34に反射された後、さらにミラー35、36
および集光レンズ37を介してCCDカラーイメージセ
ンサ(以下、「CCDセンサ」という)38まで導か
れ、ここで電気信号に変換されて画像データが生成され
る。なお、本実施の形態のCCDセンサ38の解像度
は、400DPIとする。
信号前処理部110(図2参照)においてA/D変換さ
れてデジタル信号となり、さらにシェーディング補正や
濃度変換処理等を加えられた後、中間調処理部120へ
送られ、公知の誤差拡散処理を加えられた後、高解像度
画像メモリ130(同図2)に格納される。高解像度画
像メモリ130に格納された画像データは、後述するよ
うにCPU190でなされた原稿方向認識処理の結果に
応じて回転処理され、プリンタ部50のレーザダイオー
ド51の駆動信号となる。
より記録シート上に画像を形成するものであって、上記
駆動信号を受信するとレーザダイオード51を駆動して
レーザ光を出射させる。レーザ光は、所定の角速度で回
転するポリゴンミラー52側面のミラー面で反射され、
fθレンズ53、ミラー54、55を介して、感光体ド
ラム56の表面を露光走査する。
る前にクリーニング部57で感光体表面の残留トナーを
除去され、さらにイレーサランプ(図示せず)の照射を
受けて除電された後、帯電チャージャ58により一様に
帯電されており、このように一様に帯電した状態で上記
露光を受けると、感光体ドラム56表面に静電潜像が形
成される。
成された上記静電潜像を現像する。一方、給紙部70に
は、2つの用紙カセット71、72が設けられており、
上述の感光体ドラム56の露光および現像の動作と同期
して、必要なサイズの記録シートが、用紙カセット7
1、72のいずれかから、給紙ローラ711もしくは7
21の駆動により給紙される。給紙された記録シート
は、感光体ドラム56の下方で当該感光体ドラム56の
表面に接触し、転写チャージャ60の静電力により、感
光体ドラム56表面に形成されていたトナー像が当該記
録シート表面に転写される。
1の静電力によって感光体ドラム56の表面から引き剥
され、搬送ベルト62により定着部63に搬送される。
記録シートに転写されたトナー像は、定着部63におい
て内部にヒータを備えた定着ローラ64で加熱されなが
ら押圧されることにより定着される。定着後の記録シー
トは、排出ローラ65により排紙トレイ66上に排出さ
れる。
は、操作パネル90が設けられており、コピー枚数を入
力するテンキーやコピー開始を指示するスタートキー、
各種のコピーモードを設定するための設定キー、上記設
定キーなどにより設定されたモードをメッセージで表示
する表示部などが設けられている。 (2)制御部100の構成 次に、上記制御部100の構成を図2のブロック図を参
照して説明する。
信号前処理部110、中間調処理部120、高解像度画
像メモリ130、回転処理部140、LD駆動部15
0、解像度変換部160、単純2値化処理部170、低
解像度認識用メモリ180、CPU190、RAM19
1、ROM192から成る。画像信号前処理部110
は、A/Dコンバータ、シェーディング補正部、MTF
補正部、γ補正部などを備えており、400DPIの解
像度で入力された原稿の画像データは、A/Dコンバー
タでデジタルの多値信号、例えば256階調のデータ値
に変換され、シェーディング補正部でCCDセンサ38
の感度ムラが補正された後、MTF補正部でエッジ強調
などの画質改善のための処理を受け、γ補正部でγ補正
処理を加えられた後に、中間調処理部120および解像
度変換部160に送られる。
中間調の色を含む原稿の濃淡画像の階調再現処理を行う
ものであって、本実施の形態では公知の誤差拡散処理が
用いられる。画像信号前処理部110から送られてくる
画像データは、当該誤差拡散処理において2値化され
る。なお、画像データが2値化される際の閾値(2値化
レベル1)は、CPU190から設定されるようになっ
ており、本実施の形態では2値化レベル1=64が設定
され、誤差拡散処理後のデータ値が64を越える画素に
ついては黒色で、それ以下の画素については白色で再現
するように処理される。このようにして2値化された画
像データは、ページ単位で高解像度画像メモリ130に
格納される。
分に文字画像が形成されている原稿(以下、「新聞原
稿」という。)の画像データを中間調処理部120で2
値化した場合の画像201を図3(a)に示す。なお、
同図の画像201は、原稿画像の一部分を抜き出して示
したものである。図3(a)より、画像201の地肌部
分には微小な黒点が網点のように分散して形成されてい
るのがわかる。これにより人の目には地肌部分が原稿画
像と同様の濃淡で再現されているように見える。
をいかに再現するかで画質の善し悪しが決定されるの
で、上記2値化レベル1の値についても中間調の再現に
最適な値に決定される必要がある。図2に戻って、回転
処理部140は、CPU190からの指示により高解像
度画像メモリ130から目的のページの画像データを順
次読み出して後述する原稿方向認識処理の結果に基づき
必要に応じて回転処理した後、LD駆動部150に転送
する。なお、この回転処理は、画像データのメモリアド
レスを変更する公知の技術(例えば、特開昭60−12
6769号公報参照)によってなされる。
ータに基づいてレーザダイオード51の駆動信号を生成
し、レーザダイオード51を駆動させる。一方、解像度
変換部160は、画像信号前処理部110から送られて
くる画像データ(400DPI)を25DPIの低解像
度画像データに変換する。この解像度変換処理は、公知
の技術であって、例えば400DPIの画像データの中
から主走査方向と副走査方向にそれぞれ連続する16画
素×16画素のマトリクスを1ブロックとして抽出し、
この1ブロックの256画素の中で最も階調データの値
が高いものを取得して当該25DPIの1画素としての
階調データ値とし、これを画像データの全てについて行
い、25DPIの画像データを得るものである。
160において25DPIに解像度変換された低解像度
画像データを2値化して低解像度認識用メモリ180に
格納させる。その際の2値化手段は、内部に配されたコ
ンパレータで低解像度画像データの各画素毎の階調デー
タ値と2値化のための閾値(2値化レベル2)とを比較
することにより行われる。なお、この場合の2値化レベ
ル2は、上記2値化レベル1と同様にCPU190から
設定されるようになっており、2値化レベル2=200
が設定される。
から、例えば解像度変換部160から送られたきた画像
データに中間色(例えば灰色)のデータが含まれる場合
に、当該中間色のデータの階調値が256階調の中間の
128前後の値であったならば、これらは2値化レベル
2の値200よりも下回っているために、単純2値化処
理部170で全て白画素に変換される。
値化処理部170において2値化処理された後の画像2
02を図3(b)に示す。画像信号前処理部110から
送られてくる新聞原稿の画像データは、まず解像度変換
部160において低解像度画像データに変換されたため
に、文字の線幅が太くなり、その結果として線間に隙間
がなくなって文字部分が黒ベタとなって連結した柱状形
になっている。さらに地肌部分については、図3(a)
のような黒点がほとんど形成されていない。これは、画
像202における地肌部分が中間色であるためにデータ
の階調値が200よりも小さく、ほとんどの画素が単純
2値化処理部170で白色画素に変換されたからであ
る。
間色のデータを排除しているのは、低解像度データが後
述するように文字画像のサイズを検出する手段として用
いられるヒストグラムの生成に使用されるためであり、
文字画像以外のデータ(特に、中間色に相当するデー
タ)を極力除去しておくことが望ましいからである。そ
のため、本実施の形態では、2値化レベル2の値を2値
化レベル1(=64)よりもはるかに大きな値の200
に設定して、文字画像以外の中間色画像を極力除去する
ようにしている。2値化レベル2をこのように設定する
ことにより、より正確なヒストグラムを生成できるよう
になる。もちろん、2値化レベル2は、この値に限定さ
れることはなく、文字画像以外の中間色画像を極力除去
できる値であればよい。
を検出できればよいので、必ずしも400DPIといっ
た高解像度画像データから生成される必要はなく、本実
施の形態では25DPIの低解像度にデータ変換してデ
ータ量を削減し、処理の高速化を図っている。低解像度
認識用メモリ180は、2値化された低解像度画像デー
タをページ毎に格納する。
る後述するノイズ除去処理1あるいは2後の原稿画像デ
ータを記憶すると共に各種の制御変数などを一時記憶す
る。ROM192は、原稿自動搬送装置10における原
稿搬送動作や画像読取部30におけるスキャン動作やプ
リンタ部50における画像形成動作に関するプログラム
および画像データを回転処理させるためのプログラムな
どに加えて上述の2値化処理にて設定される2値化レベ
ル1と2値化レベル2の値および後述の孤立点判定条件
値が格納されている。
プログラムを読み出して、2値化レベル1および2の値
をそれぞれ設定し、あるいは後述する反転フラグを設定
し、または低解像度認識用メモリ180に格納されてい
る低解像度画像データを1ページ毎に読み出して後述す
るノイズ除去処理1あるいは2を行った後、ページ毎に
RAM191に格納し、このデータからヒストグラムを
生成し、これに基づいて文字の方向を認識して原稿方向
を認識し、適切な方向で画像データが出力されるように
回転処理部140に回転角信号を送出する原稿方向認識
処理を行う。さらに、原稿自動搬送装置10、画像読取
部30、プリンタ部50などの動作をタイミングを取り
ながら統一的に制御して円滑な複写動作を実行させる。
を図4のフローチャートにおいて、説明する。CPU1
90は、まずノイズ除去処理1として、低解像度認識用
メモリ180に格納されている低解像度画像データ内の
孤立点をノイズとみなしてノイズ除去フィルタ3×3を
用いて除去し、RAM191に格納させる(ステップS
1、S2)。そして、RAM191に格納された画像デ
ータから、原稿画像中の文字画像の濃度分布を示すヒス
トグラムを生成するヒストグラム生成処理(ステップS
3)を行う。続いて生成されたヒストグラムから原稿の
平均濃度を求め、これが所定の濃度を越える高濃度であ
るか否かを判断し(ステップS4)、所定濃度を越える
と判断した場合は、反転フラグを「1」に設定し(ステ
ップS5)、当該ヒストグラムを反転させてヒストグラ
ムを生成し直すヒストグラム反転処理(ステップS6)
を行う。
析することにより、原稿の文字画像のサイズを検出する
文字サイズ検出処理を行い(ステップS8)、その文字
サイズが所定のサイズよりも大きい場合には、ノイズ除
去処理2としてノイズ除去フィルタのサイズを3×3よ
りも大きな5×5に変更して低解像度認識用メモリ18
0に格納された画像データ内の孤立点を再度除去して、
これをRAM191に格納させ(ステップS9、S1
0)、上記ステップS3のヒストグラム生成処理と同様
の処理を行いヒストグラムを再生成する(ステップS1
1)。そして、反転フラグが「1」であるか否かを判断
し(ステップS12)、「1」の場合には、上記ステッ
プS6のヒストグラム反転処理と同様の処理を行い、ス
テップS11で生成されたヒストグラムを反転させる
(ステップS13)。反転フラグが「0」の場合には、
ステップS14に移る。なお、図示していないが、ステ
ップS13でヒストグラムの反転が行われた後に、上記
反転フラグは、「0」にリセットされる。
以下の場合には(ステップS8で「N」)、ステップS
9〜S13を行わずにステップS14に移る。これは、
ノイズ除去フィルタのサイズを3×3にして孤立点を除
去し、これに基づいてヒストグラムを生成するという処
理がステップS1〜S6の中ですでに行なわれているか
らである。従って、文字サイズが所定サイズ以下の場合
には、ステップS9〜S13がスキップされることによ
り、ステップS1〜S6と同じ処理が実質的に選択され
て行なわれたことになる。
で生成されたヒストグラム、あるいはステップS6もし
くはS13で反転されたヒストグラムに基づいて、原稿
方向を1ページ毎に認識し、この認識結果に基づいて原
稿の回転角度を設定する(ステップS14、S15)。
この認識処理と回転角度設定処理は、公知の技術、例え
ば特開平9−9040号公報に開示されている技術によ
り行う。
用いてより具体的に説明する。 (ノイズ除去処理1)図5(a)は、ノイズ除去処理1
において用いられるノイズ除去フィルタ3×3(以下、
「フィルタ3×3」という。)により、孤立点が除去さ
れる様子を示したものである。
つの画素(注目画素)が黒色画素であって、かつその注
目画素を取り囲む周辺画素が全て白色画素である場合
に、その注目画素を白色画素に変更させることにより、
孤立点を除去するものである。ノイズ除去処理1では、
フィルタ3×3の中心部に各画素が位置するようにフィ
ルタ3×3を順次移動させることにより、画像データ内
の孤立点を除去する。本実施の形態では、原稿画像が2
5DPIの解像度に画素分割されているので、1画素の
大きさは、約1mm(縦)×約1mm(横)となる。従
って、このフィルタ3×3を用いることにより、約1m
m×約1mmの大きさの孤立点を除去できることにな
る。
ヒストグラム生成処理により得られたヒストグラムの一
例を示す図である。ヒストグラムは、ノイズ除去処理1
において孤立点の除去された、原稿1枚分の画像データ
D1の文字部分の黒画素数を主走査方向および副走査方
向のそれぞれについて計数することにより生成される。
同図に示す通常原稿(地肌部が白色で文字画像が黒色の
もの)についてヒストグラムを生成すると、ヒストグラ
ムH1およびヒストグラムH2のような分布図となる。
グラムH1およびH2から文字列の方向を検出する。こ
れは、ヒストグラムH1の分布を見れば分かるように、
ヒストグラムの谷の部分が行間を、山の部分が文字部を
それぞれ示しており、これにより文字列の方向を得るこ
とができる。従って、ヒストグラムH1の山の部分の幅
方向(副走査方向)を形成する画素数を計数すれば、容
易に文字の高さを求めることができ、この文字の高さか
ら文字サイズを検出することができる。
は、検出された文字サイズが所定のサイズ、本実施の形
態では12ポイントよりも大きい場合に、ノイズ除去処
理1で用いたフィルタ3×3よりも大きなサイズのノイ
ズ除去フィルタ5×5(以下、「フィルタ5×5」とい
う。)に変更して画像データ内の孤立点を再度除去す
る。
点が除去される様子を示した図である。フィルタ5×5
は、縦5画素×横5画素の平方領域における中央の9画
素内(太線内)に、孤立点判定条件として設定される値
(本実施の形態では4)以下の数の黒画素が存在してい
る場合に、これを孤立点として除去する処理を行う。従
って、フィルタ5×5では、フィルタ3×3では除去で
きなかった大きさの孤立点、例えば黒画素が2×2個連
結しているものであっても除去できることになる。
中に存在する孤立点を除去するのに際し、文字サイズが
12ポイント以下の場合に、フィルタ3×3を用い、1
2ポイントを越える場合にフィルタ5×5を用いるよう
にしている。これは、ノイズとみなせる孤立点の大きさ
と文字サイズの大きさとを相対的な関係として捉えたか
らである。すなわち、文字のサイズが大きくなれば、ノ
イズとみなせる孤立点の大きさもそれに合わせて大きい
ものになると考えられるからである。原稿画像内に存在
するノイズは、大きさがまちまちであり、文字と同程度
の大きさのものもあれば、1画素程度の微小なものもあ
るが、上述したようにここでのノイズ除去処理は、文字
画像から正確なヒストグラムを生成するために行うもの
なので、上記従来技術のような複雑な処理を用いてまで
全てのノイズを除去する必要はなく、文字画像から離間
している孤立点を極力除去できれば足りる。
像かノイズかを判断できなければ、文字画像から離間し
ている孤立点を除去することができない。そこで、文字
サイズを検出することにより、その大きさに相当する画
像が文字を構成する画像であると判断すると共に、文字
サイズよりもある程度小さな孤立点については、文字画
像の構成部分とは考えにくいことから、これをノイズと
みなすようにした。具体的には、本実施の形態では文字
画像が12ポイント(文字高さが約4.2mm)以下で
あれば、その1/4程度の大きさ(高さが約1mm)の
孤立点を除去できるフィルタ3×3を使用し、12ポイ
ントを越える文字画像の場合には、最大2mm×2mm
までの孤立点を除去できるフィルタ5×5を使用すると
いうように、文字サイズに応じてフィルタを切り換える
ようにしている。
高さ約2.8mm)の文字原稿と18ポイント(文字高
さ約6.3mm)の文字原稿に同じ大きさの孤立点(ノ
イズ)が存在している様子を示す図である。なお、この
孤立点は、縦2mm×横2mmの大きさである。この文
字原稿に対して本実施の形態の原稿方向認識処理を行う
と、まず8ポイント文字原稿については、ノイズ除去処
理1のフィルタ3×3により孤立点除去処理が行われ
る。ところが、1mm×1mmの大きさの孤立点を除去
するフィルタ3×3では、このノイズを除去できない。
上述したように、文字サイズの半分以上の大きさの孤立
点をノイズとみなすことはできず、逆にこれを除去しよ
うとして、フィルタサイズを大きくすれば、文字画像の
一部も除去されることになり不都合が生じるからであ
る。
最大2mm×2mmまでの大きさの孤立点を除去できる
フィルタ5×5を用いたノイズ除去処理2が行われるの
で、このノイズは除去されることになる。このように、
ノイズとみなす孤立点を文字サイズに応じて設定し、こ
れを除去するフィルタを文字サイズに応じて切り換えて
用いることにより、一定サイズのフィルタを用いるだけ
では除去できない孤立点が的確に除去されるようにな
り、これによりヒストグラムが正確に生成されてより正
確な原稿方向認識を行うことができる。
の切り換えは、2段階(12ポイント以下の場合にはフ
ィルタ3×3、12ポイントよりも大きな場合にはフィ
ルタサイズ5×5)に限定されないことはいうまでもな
く、文字サイズに応じてノイズとみなせる孤立点を除去
できるフィルタサイズを設定すればよいので、例えばポ
イント毎に異なるサイズのフィルタを準備しておいてそ
れぞれを適宜切り換えるようにしてもよいし、ポイント
毎に上記孤立点判定条件を異なる値(1〜9まで設定可
能)に設定するようにしてもよい。このようにすれば、
さらに孤立点除去を的確に行える。
画像データに対して、フィルタサイズを3×3と5×5
を用いているが、例えば画像データが高解像度(400
DPI)であれば、1画素の大きさが約63μm×63
μmと小さくなるので、フィルタ3×3や5×5で除去
できる孤立点の大きさもそれに合わせて小さくなる。こ
のように解像度が変われば1画素の大きさが変わり、除
去する孤立点の大きさに対応する画素数(例えば1mm
平方の大きさの孤立点を考える場合、25DPIでは約
1画素分に相当するが、400DPIでは、縦16×横
16画素の領域に相当する)も変わるので、フィルタサ
イズは、孤立点の大きさに対応する画素数に応じて設定
される必要がある。
点を文字サイズの1/4程度の大きさのものとしている
が、もちろんこの値に限定されることはなく、例えば文
字サイズの1/6程度や1/3程度の値などに設定する
ようにしてもよい。但し、この値が小さすぎるとノイズ
除去精度が低下するし、大きすぎると文字画像の一部を
もノイズとみなされて除去されることが考えられるの
で、実験等により最適な値に設定されることが好まし
い。
転処理では、生成されたヒストグラムH1およびH2か
ら平均濃度を算出し、これが高濃度であるか否かを判断
することにより、原稿の文字が図7(a)に示す通常原
稿か、図7(b)に示す反転原稿(文字部分が白色で、
地肌部が黒色のもの)であるか否かを判断している。
も、通常原稿と反転原稿では、生成されるヒストグラム
の形状が全く異なるものとなるからである。すなわち、
通常原稿からヒストグラムを生成すると同図のH1およ
びH2のようになり、反転原稿から生成されるヒストグ
ラムの形状は、H3およびH4のように、ヒストグラム
H1およびH2がそれぞれ反転した状態となっている。
上述したように生成されたヒストグラムから行われる公
知のものであり、例えば前述した特開平9−9040号
公報に開示されている技術によると、図7(a)の主走
査方向と副走査方向に黒画素を計数することで生成され
た各ヒストグラムH1、H2の内、一方のヒストグラム
H1からまず行方向を求め、そして他方のヒストグラム
H2から立ち上がりエッジの数(1個)と立ち下がりエ
ッジの数(5個)をそれぞれカウントし、当該ヒストグ
ラムH2のエッジを文頭側から見た場合に、立ち下がり
エッジの数が多くなる傾向があることを利用して行頭を
判断している。すなわち、同図の上側が、原稿の天とな
ることが判断できる。
は、図7(a)の通常原稿と行頭が同一位置であるにも
かかわらず、エッジを計数するためのヒストグラムH2
とH4の形状が反転しているために、双方のエッジ数の
カウント値が全く異なってしまう(立ち上がりエッジ数
6個、立ち下がりエッジ数2個)。これでは、行頭が逆
方向に認識されて、その結果として原稿の天地が逆方向
に認識されてしまい問題となる。
均濃度から文字原稿が通常原稿か反転原稿のいずれであ
るかを判別し、反転原稿の場合には、生成されたヒスト
グラムを反転させるようにしている。原稿画像の平均濃
度を算出するのは、ヒストグラムで得られた図形の面積
(黒画素の総数)を求め、これの原稿1ページ分に相当
する面積(全画素数)における割合を求めることで行え
る。
景白抜き文字原稿203と通常の文字原稿204に基づ
いてそれぞれ生成されたヒストグラムの一例を示す図で
ある。高濃度背景白抜き文字原稿203の場合には、原
稿全体が高濃度化するので、生成されたヒストグラムH
5の山の部分は、通常の文字原稿204から生成された
ヒストグラムH6に比べて、ピークが高くなると共に面
積が大変広くなる。従って、ヒストグラムで得られた図
形の面積を求めることにより原稿画像の平均濃度が分か
り、その結果から原稿が通常の文字原稿であるか、高濃
度背景白抜き文字原稿であるかを判断できる。これは、
図7(a)の通常原稿と図7(b)の反転原稿について
も同様である。
濃度であると判断した場合は、文字原稿が高濃度背景白
抜き文字(反転原稿)であると判断して、生成したヒス
トグラムを反転させる。このヒストグラムを反転させる
とは、具体的には、図8のヒストグラムH5をヒストグ
ラムH6の形状に生成し直すことをいう。これは、ヒス
トグラムH5の最大カウント値Dmaxから副走査方向
における各地点のカウント値を差し引いた値を算出し、
これに基づいて図形を形成しなおせば容易に行える。同
様に、図7(b)のヒストグラムH3、H4を反転させ
れば、それぞれ図7(a)のヒストグラムH1、H2に
なる。
て、これが高濃度であった場合にヒストグラムを反転さ
せる処理を行うことにより、たとえ原稿が反転原稿(高
濃度背景白抜き文字原稿)であっても、通常原稿の場合
と同様のヒストグラムを生成できるようになり、原稿方
向を誤認識することがなくなるという効果を奏する。も
ちろん、この効果は、ヒストグラムを用いた原稿方向認
識方法であれば、上記公報の方法以外の方法であっても
享受できる。
は、低解像度認識用メモリ180に格納されている2値
化された画像データの値を画素毎に反転(黒から白色、
白から黒色)させた後に上記のノイズ除去処理を行うよ
うにしてもよい。 (3)変形例 なお、本発明は、上記実施の形態に限定されないのは言
うまでもなく、以下のような変形例を考えることができ
る。
のデジタル複写機に本発明に係る画像認識装置を適用し
た例を説明したが、本発明の画像認識装置は、フルカラ
ーデジタル複写機にも適用可能である。その際、有彩色
のカラーデータを予めキャンセルする回路を組み込んで
おく必要がある。フルカラー原稿であっても文字画像は
一般に黒色が大半であり、この黒色の文字画像に基づい
てヒストグラムを生成し原稿方向の認識が行われるから
である。なお、カラーデータキャンセル回路は公知であ
るので、ここでの説明は省略する。
係る画像認識装置をデジタル複写機に適用した例を説明
したが、その他の原稿の読取りが必要な装置、例えばフ
ァクシミリ装置やイメージリーダにおける画像認識装置
としても適用される。また、他のイメージリーダなどの
画像入力装置から得られた原稿の画像データに基づいて
原稿の方向を認識するようにしてもよい。
ば、文字サイズ検出手段により文字画像のサイズを検出
し、この検出された文字サイズに応じて孤立点除去フィ
ルタのフィルタサイズが決定されるようにしたので、従
来のように全文字画像を切り出して、当該文字画像毎に
代表線幅を検出し、この線幅により形成される画像の外
接矩形を求め、この外接矩形よりも外に位置する画像を
ノイズとして除去するという複雑な処理に比べて簡易な
処理で済み、かつノイズとみなす孤立点の大きさを文字
サイズに応じて設定するので、一定サイズのフィルタを
用いるだけでは除去できない孤立点が的確に除去できる
ようになり、その結果としてより正確な原稿方向認識を
行うことができるようになる。
ズ以下の場合には、フィルタサイズを第1のサイズに決
定し、文字サイズが当該所定のサイズよりも大きな場合
には、フィルタサイズを前記第1のサイズよりも大きな
第2のサイズに決定するという2段階切り換えの簡易な
処理でありながら、孤立点が的確に除去できるようにな
り、より正確な原稿方向認識を行うことができる。
布を示すヒストグラムを生成することにより行われるの
で、簡易な処理で済ますことができる。また、前記文字
サイズ検出手段は、生成されたヒストグラムに基づいて
原稿の文字の線分の濃度が地肌部の濃度よりも低い濃度
で表現されている反転原稿であるか否かを検出する反転
原稿検出手段を備え、当該反転原稿検出手段が前記原稿
を前記反転原稿であると検出すると、生成されたヒスト
グラムを反転させて再生成し、これに基づいて文字サイ
ズを検出するので、原稿が反転原稿であっても、正確に
文字サイズを検出することができるようになる。
を孤立点が除去された画像データから生成し、これに基
づいて文字画像の方向を認識するようにしたので、文字
画像を切り出して、その結果から文字画像の方向の認識
を行う方法に比べて、簡易な処理で済ますことができ
る。
体の構成を示す図である。
ある。
されている原稿の画像データが中間調処理部で2値化処
理された場合の画像を示す図であり、(b)は、(a)
と同一の原稿の画像データが単純2値化処理部において
2値化処理された後の画像を示す図である。
ャートである。
立点が除去される様子を示した図であり、(b)は、ノ
イズ除去フィルタ5×5により孤立点が除去される様子
を示した図である。
(b)は、18ポイントの文字原稿の例をそれぞれ示す
図であって、双方の文字原稿に同じ大きさの孤立点(ノ
イズ)が存在している様子を示した図である。
トグラムの一例を示す図であり、(b)は、反転原稿に
基づいて生成されたヒストグラムの一例を示す図であ
る。
基づいてそれぞれ生成されたヒストグラムの一例を示す
図である。
Claims (5)
- 【請求項1】 文字画像を含む原稿の方向を認識する装
置であって、 原稿を読み取って画像データを生成する画像読取手段
と、 前記画像データを記憶する画像データ記憶手段と、 前記画像データから文字画像のサイズを検出する文字サ
イズ検出手段と、 前記検出された文字サイズに応じて孤立点除去フィルタ
のフィルタサイズを決定するフィルタサイズ決定手段
と、 前記決定されたフィルタサイズの孤立点除去フィルタを
用いて、前記画像データ記憶手段に記憶されている画像
データ内の孤立点を除去する孤立点除去手段と、 孤立点が除去された画像データに基づき前記原稿の方向
を認識する画像方向認識手段とを備えることを特徴とす
る画像認識装置。 - 【請求項2】 前記フィルタサイズ決定手段は、検出さ
れた文字サイズが所定のサイズ以下の場合には、フィル
タサイズを第1のサイズに決定し、文字サイズが前記所
定のサイズよりも大きな場合には、フィルタサイズを前
記第1のサイズよりも大きな第2のサイズに決定するこ
とを特徴とする請求項1に記載の画像認識装置。 - 【請求項3】 前記文字サイズ検出手段は、原稿の濃度
分布を示すヒストグラムを前記画像データから生成し、
これに基づいて文字サイズを検出することを特徴とする
請求項1もしくは2に記載の画像認識装置。 - 【請求項4】 前記文字サイズ検出手段は、生成された
ヒストグラムに基づいて前記原稿の文字の線分の濃度が
地肌部の濃度よりも低い濃度で表現されている反転原稿
であるか否かを検出する反転原稿検出手段を備え、当該
反転原稿検出手段が前記原稿を前記反転原稿であること
を検出すると、生成されたヒストグラムを反転させて再
生成し、これに基づいて文字サイズを検出することを特
徴とする請求項3に記載の画像認識装置。 - 【請求項5】 前記画像方向認識手段は、原稿の濃度分
布を示すヒストグラムを孤立点が除去された画像データ
から生成し、これに基づいて文字画像の方向を認識する
ことを特徴とする請求項1ないし4のいずれかに記載の
画像認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19067298A JP3629959B2 (ja) | 1998-07-06 | 1998-07-06 | 画像認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19067298A JP3629959B2 (ja) | 1998-07-06 | 1998-07-06 | 画像認識装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000022899A true JP2000022899A (ja) | 2000-01-21 |
JP3629959B2 JP3629959B2 (ja) | 2005-03-16 |
Family
ID=16261981
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19067298A Expired - Fee Related JP3629959B2 (ja) | 1998-07-06 | 1998-07-06 | 画像認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3629959B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100367298C (zh) * | 2004-03-04 | 2008-02-06 | 复旦大学 | 一种通用的用于符号识别的特征描述方法 |
JP2010134704A (ja) * | 2008-12-04 | 2010-06-17 | Canon Inc | 画像処理装置、画像処理方法、及びコンピュータプログラム |
JP2010271987A (ja) * | 2009-05-22 | 2010-12-02 | Mitsubishi Electric Corp | 領域分類装置、画質改善装置、映像表示装置、およびそれらの方法 |
-
1998
- 1998-07-06 JP JP19067298A patent/JP3629959B2/ja not_active Expired - Fee Related
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100367298C (zh) * | 2004-03-04 | 2008-02-06 | 复旦大学 | 一种通用的用于符号识别的特征描述方法 |
JP2010134704A (ja) * | 2008-12-04 | 2010-06-17 | Canon Inc | 画像処理装置、画像処理方法、及びコンピュータプログラム |
JP2010271987A (ja) * | 2009-05-22 | 2010-12-02 | Mitsubishi Electric Corp | 領域分類装置、画質改善装置、映像表示装置、およびそれらの方法 |
Also Published As
Publication number | Publication date |
---|---|
JP3629959B2 (ja) | 2005-03-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3695163B2 (ja) | 画像形成装置 | |
JP2005210559A (ja) | 原稿読み取り装置および画像形成装置 | |
US9571693B2 (en) | Image processing apparatus, image processing method, and program | |
JP3622994B2 (ja) | バーコード記録装置 | |
JP3671682B2 (ja) | 画像認識装置 | |
JPH06103410A (ja) | 画像処理装置 | |
JP3629959B2 (ja) | 画像認識装置 | |
JP4050371B2 (ja) | 画像処理装置 | |
JPH07245682A (ja) | 画像読取装置及びそれを組み込んだ複写機 | |
EP0876052B1 (en) | An image forming apparatus and an image forming method thereof | |
JP3629962B2 (ja) | 画像認識装置 | |
JP3675181B2 (ja) | 画像認識装置 | |
JP3974700B2 (ja) | 画像形成装置および画像処理方法 | |
JP3629969B2 (ja) | 画像認識装置 | |
JP3135240B2 (ja) | 画像処理装置 | |
JP3961090B2 (ja) | スムージング処理機能を備えた画像処理装置 | |
JP4132473B2 (ja) | 画像処理装置及び画像形成装置 | |
JPH0296885A (ja) | 画像処理装置 | |
JPH09307751A (ja) | 画像形成装置 | |
JP2005102052A (ja) | 画像処理装置 | |
JP3857448B2 (ja) | 画像形成装置 | |
JP2003134304A (ja) | 画像読取装置、画像処理装置、ごみ検知方法、記憶媒体、及びプログラム | |
JP2001057633A (ja) | 像域分離処理を用いる画像デ−タ処理装置 | |
JP2005027017A (ja) | 画像処理装置 | |
JP2000059602A (ja) | 画像認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071224 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121224 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |