JP3416058B2 - 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 - Google Patents
濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体Info
- Publication number
- JP3416058B2 JP3416058B2 JP21225898A JP21225898A JP3416058B2 JP 3416058 B2 JP3416058 B2 JP 3416058B2 JP 21225898 A JP21225898 A JP 21225898A JP 21225898 A JP21225898 A JP 21225898A JP 3416058 B2 JP3416058 B2 JP 3416058B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- variance
- value
- region
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Image Analysis (AREA)
- Character Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
字認識技術の一つと位置づけられ、分割された各部分領
域の濃度分布およびその方向性に着目して文字領域と背
景領域とを分離し、文字存在領域のみを認識して文字を
抽出する濃淡画像の文字抽出方法及びそのプログラムを
記録した記録媒体に関するものである。
や鋳物に打刻された刻印文字の認識や照合の前処理(マ
スクの自動生成など)として利用可能である。
み取り・認識は、製品の識別や分類の自動化を行う上で
も必要不可欠な技術である。以下、従来用いられてきた
濃淡画像の文字読み取り技術について説明する。
るテンプレート画像を文字の種類数だけ用意しておき、
これらの規準画像群と比較して最もよく合致する規準画
像を特定することによって行うテンプレートマッチング
がある。この方法は、処理対象の文字画像が鮮明であれ
ば高精度で認識可能であるが、背景部分のノイズに起因
する画像的な差異がテンプレート画像との合致を妨げ、
文字の認識精度が低下するという問題点があった。
では2値化処理による背景雑音の除去技法、あるいは種
々のエッジ抽出技法によって、濃度変化の急峻な文字境
界を抽出する方法が用いられてきた。
2値化処理方式では文字部分と背景部分とのコントラス
トが十分とれていないと2値化のための閾値決定が困難
である。また、後者のエッジ抽出方式は、その微分処理
によって文字境界以外の背景部分においても濃度変化が
急峻なところでは文字境界の類似画像が生じてしまうと
いう課題を抱えている。いずれの方法に関しても、文字
以外の雑音性画像が残り、その背景雑音がテンプレート
画像とのマッチングにおいて照合対象領域に含まれてし
まうことが、後の認識・照合処理の精度低下を招く主た
る原因となっている。
例を示す。図8(a)は理想的な文字パターン例である
が、実際に得られる画像は、図8(b)、図8(c)の
ように、部品表面の微妙な凹凸と照明条件とに起因する
濃度むらや背景雑音の影響を受けた画像となってしま
い、部品表面の加工具合や刻印打刻位置によっては同一
文字の構成線分であっても、背景領域と比較して文字部
分が明るくなる場合と暗くなる場合が混在した画像とな
る事象が発生し、背景領域からの濃度変化に基づく文字
領域の抽出を困難なものにしている。
下においても刻印文字の高精度な認識が要求されるが、
文字画像の濃度分布や輪郭線が不安定となり易く、背景
部の雑音性パターンの影響を受けて、実際に明瞭な画像
を取得することが容易ではない。
を含む濃淡画像から文字を構成する線分を含む部分領域
のみを特定・抽出し分離精度を向上させることによっ
て、文字を含まない部分領域をあらかじめ除去し、また
文字を含む限定された部分領域に対して種々の画像処理
や文字照合を行うことによって文字読み取り・認識の精
度向上をもたらすようにすることを目的としている。
に、本発明では、処理の対象となる文字画像を含む濃淡
画像を部分領域に分割し、各部分領域ごとに当該部分領
域が文字を含む領域か文字を含まない背景領域かの判定
を行い、当該画像全域から背景領域を除去して文字領域
のみを抽出する濃淡画像の文字抽出方法であって、処理
の対象となる濃淡画像を部分領域に分割し、当該部分領
域に属する画素の濃度値に対して算出した該平均値と該
標準偏差に基づいて文字候補部分領域を特定する第1の
判定処理と、各部分領域に対して個々の回転角度方向の
射影値分散値の、該角度変化に関する回転角度依存性に
着目して文字候補部分領域を特定する第2の判定処理
と、を組み合わせ実行し、 次いで、上記第1の判定処理
に基づく判別結果と、上記第2の判定処理に基づく判別
結果との論理積をとって文字領域を確定する総合判定処
理を実行し、 次いで、上記総合判定処理によって上記文
字領域として抽出された各領域のみに対して、画素の濃
度値の微分強度を算出して文字境界となるエッジを抽出
する処理を実行することを特徴とする。
いう画像的性質に着眼し、前記射影値算出により画像中
からの線分の方向性を抽出することを特徴の1つとして
おり、従来の技術とは、処理対象の画像から文字領域を
分離・抽出する方法が大きく異なる。
出に適用した場合を例にとって、図面に基づき詳細に説
明する。
を用いて、工業部品の刻印文字濃淡画像から文字線分の
存在領域のみを抽出する処理の一実施例を示す。本実施
例は第1から第4までの処理段階を有する。ここで、文
字線を含む部分領域を文字ブロック、それ以外の背景や
濃度むらを無視して一様とみなす部分領域を背景ブロッ
クと呼ぶこととする。
部分領域の濃度値をもとに前述の分散量を計算し当該値
の0との大小比較によって、当該部分領域が文字ブロッ
クか背景ブロックかを判定する。
ついて回転を行い、当該各方向の射影値分布から前述の
分散値を計算し、その値の大小で当該部分領域が文字ブ
ロックか背景ブロックかを判定する。
定処理に基づく判別結果、ならびに上記第2の判定処理
に基づく判別結果の論理積をとることにより、当該部分
領域が文字領域か背景領域かを総合的に判定し、最終的
に文字領域を確定させる。
像から特定された文字を含む部分領域に限定して、例え
ば判別分析法などの2値化処理によって、文字領域のみ
を抽出する。あるいは、いわゆるエッジ抽出技法を用い
て濃度変化の急峻な文字境界形状を抽出する。
たものである。301は領域分割処理、302は分散量
算出と第1のブロック判定処理、303は回転画像生成
処理、304は射影分布算出と分散データ算出判定処
理、305は第2のブロック判定処理、306は文字領
域/背景領域の総合判定処理、307はエッジ抽出処理
である。以下では、上記実施例による各処理について具
体的に説明する。
分割処理301で、あらかじめ与えられた大きさ(例え
ば、16×16画素)の部分領域に分割する。図3は分
割態様を説明する図である。以降の説明のため、画像の
横方向にm番目、縦方向にn番目の部分領域番号を
(m,n)と記す。この分割処理は、必ずしも図3
(a)に示すような等分割である必要はなく、図3
(b),(c)に示すように互いの領域が重なり合って
いたり、離れていたりしても構わない。
2では、分割された部分領域(m,n)ごとに各部分領
域内の画素の濃度値の平均μmnと標準偏差σmnとを計算
し、当該平均と当該標準偏差とから文字ブロックと背景
ブロックとを判別する背景分離直線を設定する。この分
離直線を用いて当該部分領域が文字ブロック、背景ブロ
ックのいずれに属するかを判定する。すなわち、当該分
散量vmnは分離直線の傾きをc1 、切片をc2 として vmn=σmn−c1 μmn−c2 で与えられ、判定規則は以下のようになる。
(m,n)は文字ブロック ・ vmn<0 ならば 当該部分領域(m,n)は背景
ブロック 図4は、横軸に各部分領域の濃度の平均、縦軸に濃度の
標準偏差をプロットした典型的な点列データであるが、
このような場合は図示の背景分離直線で文字ブロックと
背景ブロックとを判別できる。
おいて、所定の角度(例えば、10度)ずつ回転させた
画像をアフィン変換により作成する処理である。射影分
布を求めるための前処理であり、その目的からすれば、
30度の回転方向と210度の回転方向は同じ向きとな
るため、例えば10度刻みの場合では、0度方向から1
70度方向まで計18枚の画像を生成すればよい。
04では、各部分領域において、各回転方向ごとに、各
画素列における垂直方向の射影値(各走査ライン上の画
素の濃度値を積算して求められる平均値)を算出し、当
該方向の射影値データの分散を算出する。すなわち、部
分領域の大きさが横P画素×縦Q画素で、180度をD
分割した場合、回転方向kの上記射影値データの分散d
k (k=0,…,D−1)は、
…,P−1)は画素列iにおける射影値を表す。第2の
ブロック判定処理305では、上記の分散データd
k (k=0,…,D−1)から、その分散値 var1 、ま
たは差分散(分散最大値と分散最小値の差)var2 を計
算し、その値の大小で各部分領域における文字線方向性
の有無を判定する。いいかえれば、 var1 あるいは var
2 に対して所定の閾値との大小比較によって、当該部分
領域が検出目的の文字を含む文字ブロックかそうでない
背景ブロックかを判別する。ここで、分散値 var1 、差
分散 var2 はそれぞれ次式で与えられる。
304と処理305との流れを概念的に図示したもので
ある。図示右上に示されている濃淡画像について、図示
の如き「部分領域原画像」を抽出する。そして当該抽出
された部分領域原画像について、図示の如く、例えば1
0度ずつ0度、10度…90度…160度、170度と
回転させ、夫々について縦方向に射像して射影分布を得
る。そして、夫々の射影分布毎に射影値の分散d0 ,d
1 …d9 …d16,d17を得ている。なお言うまでもなく
当該分散d0 ,d1 …は上述の分散データdk (k=
0,…,D−1)である。
は、上記第1のブロック判定処理による判別結果と上記
第2のブロック判定処理とによる判別結果、両者の論理
積をとって、最終的に全部分領域を文字ブロック領域と
背景ブロック領域とに分離する処理である。
判定処理によって文字ブロック領域と決定された部分領
域のみに限定して行う。ここでは、原画像に例えば代表
的なSobel オペレータを適用して画素の濃度値の微分強
度を算出し、それを閾値処理して文字境界となるエッジ
を抽出する。他にエッジ抽出技法としては、Prewittオ
ペレータや濃度断面の2次微分のゼロクロス点を算出す
るCanny の方法などがあり、それらを使っても構わな
い。
示す。図6(a)は鋳物に打刻された刻印文字の原画像
(サイズ500×120画素)であり、図6(b)は文
字ブロックと決定されたすべての部分領域について当該
外枠を原画像に重畳表示した図であり、図6(c)は当
該文字領域に限定して、Sobel オペレータを適用して算
出した微分強度画像を閾値処理(閾値は25)してエッ
ジを抽出した処理結果の画像である。ここで、部分領域
のサイズとして12×12画素を与え、前記第2の判定
処理では射影値分散データの各回転角度について分散値
( var1 )を用いた。比較として、従来の代表的技術で
広く用いられている判別分析法により2値化処理した画
像を図7(a)に、Sobel オペレータを適用して算出し
た微分強度画像を閾値処理して得られたエッジ抽出画像
を図7(b)に示す。これらの図を見れば明らかなよう
に、本発明による方法では、文字領域が限定され鮮明な
文字形状を抽出できている。
し、各部分領域においてその回転角度を変化させながら
濃度値の積算により垂直方向への射影値を算出し、その
射影値を回転方向角度について比較し、射影値の角度依
存性から当該部分領域が線分画像を含むか否かを判定す
る。この各部分領域についての判定結果に基づいて、文
字を含む領域以外の領域を原画像から除去することによ
り、処理対象となる文字画像から背景の模様や濃度む
ら、雑音性画像に左右されることなく文字を含む部分領
域のみを分離・抽出することができる。
ついて説明したが、当該濃淡画像の文字抽出方法をデー
タ処理装置が実行できるプログラムの形で保持すること
ができる。このことから、本願発明は当該プログラムを
記録した記録媒体をも発明の対象としており、本願明細
書の特許請求の範囲に記述されている。
文字そのものの形状情報を保存しつつ、処理対象の画像
から文字を含む部分領域のみを抽出・特定し、当該部分
領域に限定して画像処理や文字照合を行うことにより、
原画像の背景領域に存在する濃度むら、雑音性パターン
に影響されにくい文字読み取り・認識が可能となる。
抽出する一実施例を示した図である。
チャートである。
の平均、横軸に濃度の標準偏差をプロットして得られる
典型的な点列データの一例である。
前記305との大まかな流れを示した図である。
は文字ブロックと決定された部分領域の外枠を表示した
図であり、図(c)はSobel オペレータを適用して算出
された微分強度画像を閾値処理してエッジを抽出した処
理結果の画像である。
法を適用して得られた処理結果の2値画像であり、図
(b)は前記の処理307と同様に、Sobel オペレータ
を適用してエッジ抽出を行った処理結果の画像である。
を示した図である。
Claims (4)
- 【請求項1】 処理の対象となる文字画像を含む濃淡画
像を部分領域に分割し、各部分領域ごとに当該部分領域
が文字を含む領域か文字を含まない背景領域かの判定を
行い、当該画像全域から背景領域を除去して文字領域の
みを抽出する濃淡画像の文字抽出方法であって、 処理の対象となる濃淡画像を部分領域に分割し、当該部
分領域に属する画素の濃度値に対して算出した該平均値
と該標準偏差に基づいて文字候補部分領域を特定する第
1の判定処理と、 各部分領域に対して個々の回転角度方向の射影値分散値
の、該角度変化に関する回転角度依存性に着目して文字
候補部分領域を特定する第2の判定処理と、 を組み合わせ実行し、 次いで、 上記第1の判定処理に基づく判別結果と、上記
第2の判定処理に基づく判別結果との論理積をとって文
字領域を確定する総合判定処理を実行し、 次いで、上記総合判定処理によって上記文字領域として
抽出された各領域のみに対して、画素の濃度値の微分強
度を算出して文字境界となるエッジを抽出する処理を実
行する ことを特徴とする濃淡画像の文字抽出方法。 - 【請求項2】 請求項1記載の濃淡画像の文字抽出方法
であって、 上記第2の判定処理は、 各部分領域に対し、所定の角度ずつ回転させた画像を生
成し、各回転角において一方の方向の画素列の濃度値を
積算することにより平均値を計算して射影値を得る第1
の過程と、 各部分領域において、各回転角ごとに、各画素列の射影
値の他方の方向分布についての分散を算出する第2の過
程と、 各部分領域において、上記第2の過程で算出された個々
の回転角の射影値分散値の、回転角度変化についての分
散値あるいは分散最大値と分散最小値との差である差分
散算出する第3の過程と、 前記第3の過程で得られた分散値あるいは差分散が、あ
らかじめ与えた閾値との比較により大小判定によって、
当該部分領域が検出目的の文字を含む部分領域候補であ
るか否かを判定する第4の過程と、 を含むことを特徴とする濃淡画像の文字抽出方法。 - 【請求項3】 処理の対象となる文字画像を含む濃淡画
像を部分領域に分割し、各部分領域ごとに当該部分領域
が文字を含む領域か文字を含まない背景領域かの判定を
行い、当該画像全域から背景領域を除去して文字領域の
みを抽出する濃淡画像の文字抽出プログラムを記録して
なる記録媒体であって、 処理の対象となる濃淡画像を部分領域に分割し、当該部
分領域に属する画素の濃度値に対して算出した該平均値
と該標準偏差に基づいて文字候補部分領域を特定する第
1の判定処理と、 各部分領域に対して個々の回転角度方向の射影値分散値
の、該角度変化に関する回転角度依存性に着目して文字
候補部分領域を特定する第2の判定処理と、 を組み合わせ実行し、 次いで、上記第1の判定処理に基づく判別結果と、上記
第2の判定処理に基づく判別結果との論理積をとって文
字領域を確定する総合判定処理を実行し、 次いで、上記総合判定処理によって上記文字領域として
抽出された各領域のみに対して、画素の濃度値の微分強
度を算出して文字境界となるエッジを抽出する処理を実
行する データ処理装置が実行できるようにしたプログラ
ムを記録してなる濃淡画像の文字抽出プログラムを記録
した記録媒体。 - 【請求項4】 請求項3記載の記録媒体であって、 上記第2の判定処理は、 各部分領域に対し、所定の角度ずつ回転させた画像を生
成し、各回転角において一方の方向の画素列の濃度値を
積算することにより平均値を計算して射影値を得る第1
の過程と、 各部分領域において、各回転角ごとに、各画素列の射影
値の他方の方向分布についての分散を算出する第2の過
程と、 各部分領域において、上記第2の過程で算出された個々
の回転角の射影値分散値の、回転角度変化についての分
散値あるいは分散最大値と分散最小値との差である差分
散算出する第3の過程と、 前記第3の過程で得られた分散値あるいは差分散が、あ
らかじめ与えた閾値との比較により大小判定によって、
当該部分領域が検出目的の文字を含む部分領域候補であ
るか否かを判定する第4の過程と、 を含むことを特徴とする濃淡画像の文字抽出プログラム
を記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21225898A JP3416058B2 (ja) | 1998-07-28 | 1998-07-28 | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21225898A JP3416058B2 (ja) | 1998-07-28 | 1998-07-28 | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000048120A JP2000048120A (ja) | 2000-02-18 |
JP3416058B2 true JP3416058B2 (ja) | 2003-06-16 |
Family
ID=16619604
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP21225898A Expired - Fee Related JP3416058B2 (ja) | 1998-07-28 | 1998-07-28 | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3416058B2 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4118749B2 (ja) | 2002-09-05 | 2008-07-16 | 株式会社リコー | 画像処理装置、画像処理プログラムおよび記憶媒体 |
KR100943595B1 (ko) | 2003-01-30 | 2010-02-24 | 삼성전자주식회사 | 영상신호의 블러링 판단장치 및 방법 |
US8223395B2 (en) | 2007-07-20 | 2012-07-17 | Sharp Laboratories Of America, Inc. | Methods and systems for refining text color in a digital image |
JP5229050B2 (ja) * | 2009-03-30 | 2013-07-03 | 富士通株式会社 | 画像からの文書領域抽出装置、方法、及びプログラム |
JP4947136B2 (ja) * | 2009-12-25 | 2012-06-06 | カシオ計算機株式会社 | 画像処理装置、画像処理方法及びプログラム |
US11373388B2 (en) * | 2017-07-24 | 2022-06-28 | United States Postal Service | Persistent feature based image rotation and candidate region of interest |
CN108289193A (zh) * | 2017-11-15 | 2018-07-17 | 秦广民 | 监控型收音机数据存储系统 |
CN110596746B (zh) * | 2019-10-17 | 2024-03-01 | 中国测试技术研究院辐射研究所 | 使用剂量当量仪自动测试/校准/检定装置的方法 |
CN111401142A (zh) * | 2020-02-25 | 2020-07-10 | 杭州测质成科技有限公司 | 基于深度学习的航空发动机叶片金属表面蚀刻字符识别方法 |
CN112364871B (zh) * | 2020-10-27 | 2024-06-25 | 重庆大学 | 基于改进投影算法的零件喷码字符分割方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS62284485A (ja) * | 1986-06-02 | 1987-12-10 | Komatsu Ltd | 線状パタ−ン認識方法 |
JPS63205783A (ja) * | 1987-02-23 | 1988-08-25 | Canon Inc | 画調識別装置 |
-
1998
- 1998-07-28 JP JP21225898A patent/JP3416058B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2000048120A (ja) | 2000-02-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Raghunandan et al. | Riesz fractional based model for enhancing license plate detection and recognition | |
Lee et al. | Automatic extraction of characters in complex scene images | |
US5120940A (en) | Detection of barcodes in binary images with arbitrary orientation | |
CN111382704A (zh) | 基于深度学习的车辆压线违章判断方法、装置及存储介质 | |
CN108921813B (zh) | 一种基于机器视觉的无人机检测桥梁结构裂缝识别方法 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JPS63262778A (ja) | 濃淡画像からのパタ−ン認識方法及び装置 | |
CN108985305B (zh) | 一种激光蚀刻工业雷管编码图像定位及校正方法 | |
CN113221861B (zh) | 一种多车道线检测方法、装置及检测设备 | |
JP3416058B2 (ja) | 濃淡画像の文字抽出方法及びそのプログラムを記録した記録媒体 | |
JP2002228423A (ja) | タイヤ検出方法および装置 | |
CN115980095A (zh) | 一种基于机器视觉的芯片外观检测方法及系统 | |
CN112818983B (zh) | 一种利用图片相识度判断字符倒置的方法 | |
KR20230101531A (ko) | 3d 레이저 프로파일러를 이용한 타이어 양각 문자 인식 방법 | |
CN114241463A (zh) | 签名验证方法、装置、计算机设备和存储介质 | |
Al-Mahadeen et al. | Signature region of interest using auto cropping | |
Ueda et al. | Automatic verification system for seal imprints on Japanese bankchecks | |
CN115410191B (zh) | 文本图像识别方法、装置、设备和存储介质 | |
Ramadhan et al. | Text detection in natural image by connected component labeling | |
JPH0256688A (ja) | 文字切出し装置 | |
Deb et al. | Optical Recognition of Vehicle license plates | |
Akoum et al. | A new algorithmic approach for detection and identification of vehicle plate numbers | |
CN109934215B (zh) | 一种身份证识别方法 | |
CN113128500A (zh) | 一种基于Mask-RCNN的非机动车车牌识别方法及系统 | |
JP3150762B2 (ja) | グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090404 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090404 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100404 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110404 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120404 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130404 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |