JPS6139172A - 文字検出切出方式 - Google Patents
文字検出切出方式Info
- Publication number
- JPS6139172A JPS6139172A JP16055784A JP16055784A JPS6139172A JP S6139172 A JPS6139172 A JP S6139172A JP 16055784 A JP16055784 A JP 16055784A JP 16055784 A JP16055784 A JP 16055784A JP S6139172 A JPS6139172 A JP S6139172A
- Authority
- JP
- Japan
- Prior art keywords
- character
- block
- cutting
- width
- projection
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[発明の技術分野]
本発明は、特に光学的文字読取装置に使用される文字検
出切出方式に関する。
出切出方式に関する。
[発明の技術的背景とその問題点]
タイプライタ等で印字される英文字等には、セリフ(s
erif)と称する飾りが付加された文字がある。この
ような文字からなる文書では、隣接文字がセリフで接続
されている文章が作成されることがある。このため、上
記のような文書を光学的文字読取装置(OCR)で読取
る場合、セリフで接続された文字の検出切出動作には特
別の処理が必要となる。
erif)と称する飾りが付加された文字がある。この
ような文字からなる文書では、隣接文字がセリフで接続
されている文章が作成されることがある。このため、上
記のような文書を光学的文字読取装置(OCR)で読取
る場合、セリフで接続された文字の検出切出動作には特
別の処理が必要となる。
従来の検出切出方式では、例えば第4図(a)に示す文
字ブロック(複数の文字列)に対して、左端位置し1を
基準として横方向(行方向)の一定距離dの位置が設定
される。この設定位置を中心としだ幅Wの範囲について
、縦方向(列方向)の射影ヒストグラム40が作成され
る。作成された射影ヒストグラム40が最小となる位置
が、第1文字の右端R1に設定される。即ち、Ll、R
1が第1文字の検出切出位置となる。次の文字の検出切
出位置は、位置R1を基準として文字ピッチP(通常2
.54mm又は2.12mm)の距離をもった位置が設
定される。そして、上記と同様に、設定位置を中心とす
る幅Wの範囲について、列方向の射影ヒストグラムが作
成される。この射影ヒストグラムに基づいて、第2文字
の右端の位置が決定される。
字ブロック(複数の文字列)に対して、左端位置し1を
基準として横方向(行方向)の一定距離dの位置が設定
される。この設定位置を中心としだ幅Wの範囲について
、縦方向(列方向)の射影ヒストグラム40が作成され
る。作成された射影ヒストグラム40が最小となる位置
が、第1文字の右端R1に設定される。即ち、Ll、R
1が第1文字の検出切出位置となる。次の文字の検出切
出位置は、位置R1を基準として文字ピッチP(通常2
.54mm又は2.12mm)の距離をもった位置が設
定される。そして、上記と同様に、設定位置を中心とす
る幅Wの範囲について、列方向の射影ヒストグラムが作
成される。この射影ヒストグラムに基づいて、第2文字
の右端の位置が決定される。
このようにして、各文字の検出切出位置が決定され、1
文字毎の検出切出処理が行われることになる。しかしな
がら、上記のような方式では、例えば第4図(b)に示
すように、文字ブロックの左端の文字幅が一定距離dよ
り小さい場合や印字ずれなどにより、第1文字の検出切
出位置(R2)が誤って設定されることがある。このた
め、次の文字からの検出切出位置の設定もミスすること
になり、OCRの読取動作が不可能になる問題があった
。
文字毎の検出切出処理が行われることになる。しかしな
がら、上記のような方式では、例えば第4図(b)に示
すように、文字ブロックの左端の文字幅が一定距離dよ
り小さい場合や印字ずれなどにより、第1文字の検出切
出位置(R2)が誤って設定されることがある。このた
め、次の文字からの検出切出位置の設定もミスすること
になり、OCRの読取動作が不可能になる問題があった
。
[発明の目的]
本発明は上記の点に鑑みてなされたもので、その目的は
、隣接文字間で接続された文字群に対して、1文字毎の
検出切出位置を正確に設定できるようにして、文字の検
出切出処理を確実に実行できる文字検出切出方式を提供
することにある。
、隣接文字間で接続された文字群に対して、1文字毎の
検出切出位置を正確に設定できるようにして、文字の検
出切出処理を確実に実行できる文字検出切出方式を提供
することにある。
[発明の概要]
本発明は、行方向に接続された文字ブロックに対して、
その文字ブロック幅を検出する文字ブロック検出手段を
備えている。この文字ブロック検出手段により検出され
た文字ブロック幅及び予め決定される文字ピッチに基づ
いて、文字ブロックの1文字毎の仮想切出位置が設定さ
れる。射影作成手段は、仮想切出位置を中心とする行方
向の所定幅の文字ブロックに対して列方向の射影データ
を作成する。この射影作成手段により作成された射影デ
ータで列方向の位置毎の射影値の総和を求め、その総和
に基づいて文字ブロックから1文字毎の文字切出を実行
する際の切出位置を設定するように構成されている。
その文字ブロック幅を検出する文字ブロック検出手段を
備えている。この文字ブロック検出手段により検出され
た文字ブロック幅及び予め決定される文字ピッチに基づ
いて、文字ブロックの1文字毎の仮想切出位置が設定さ
れる。射影作成手段は、仮想切出位置を中心とする行方
向の所定幅の文字ブロックに対して列方向の射影データ
を作成する。この射影作成手段により作成された射影デ
ータで列方向の位置毎の射影値の総和を求め、その総和
に基づいて文字ブロックから1文字毎の文字切出を実行
する際の切出位置を設定するように構成されている。
このような構成により、セリフを有する文字が隣接間で
接続された文字ブロック等の場合でも、文字ブロックか
ら1文字毎の文字検出切出処理を確実に実行することが
できる。
接続された文字ブロック等の場合でも、文字ブロックか
ら1文字毎の文字検出切出処理を確実に実行することが
できる。
[発明の実施例]
以下図面を参照して本発明の一実施例を説明する。第1
図は一実施例に係わる構成を示すブロック図である。第
1図において、10はラインバッファで、光電変換され
て送られる文字パターンを例えば1行分格納するメモリ
である。マイクロプロセッサ(以下CPUと称す)11
は、予め記憶したプログラムに基づいて、ラインバッフ
ァ10に格納された複数の文字パターン(文字ブロック
)から1文字毎の検出切出処理を実行する。メモリ制御
回路12は、CP U 11の制御に応じてラインバッ
ファ10のデータの読出し、書込み動作を制御する。
図は一実施例に係わる構成を示すブロック図である。第
1図において、10はラインバッファで、光電変換され
て送られる文字パターンを例えば1行分格納するメモリ
である。マイクロプロセッサ(以下CPUと称す)11
は、予め記憶したプログラムに基づいて、ラインバッフ
ァ10に格納された複数の文字パターン(文字ブロック
)から1文字毎の検出切出処理を実行する。メモリ制御
回路12は、CP U 11の制御に応じてラインバッ
ファ10のデータの読出し、書込み動作を制御する。
このような構成において、一実施例に係わる動作を説明
する。先ず1、例えば第2図に示すようなタイプライタ
等で印字された文字群が、光電変換された後にラインバ
ッファ10に格納されたとする1c p u iiは、
ラインバッファ10に文字パターン群が格納されると、
文字検出切出処理を開始する。
する。先ず1、例えば第2図に示すようなタイプライタ
等で印字された文字群が、光電変換された後にラインバ
ッファ10に格納されたとする1c p u iiは、
ラインバッファ10に文字パターン群が格納されると、
文字検出切出処理を開始する。
CP U 11は、ラインバッファ10内の文字ブロッ
クに対して、行方向の文字ブロック幅WIを検出する。
クに対して、行方向の文字ブロック幅WIを検出する。
これは、ラインバッファ10内を行方向に走査し、文字
ブロックの左端と右端を検出することにより求められる
。この検出された文字ブロック幅WIに基づいて、CP
U11は文字ブロック内に含まれる文字数Nを下記式(
1)により算出する。
ブロックの左端と右端を検出することにより求められる
。この検出された文字ブロック幅WIに基づいて、CP
U11は文字ブロック内に含まれる文字数Nを下記式(
1)により算出する。
N= ((Wl−P/2)/P)+1・・・(1)ここ
で、Pは予め決定されている文字ピッチである。
で、Pは予め決定されている文字ピッチである。
次に、c p u iiは、上記のようにして算出した
文字ブロック幅WI及び文字数Nに基づいて、第2図に
示すような仮想切出位置A1〜D1を設定する。即ち、
文字ブロックの左端の第1文字の左端位置A1から一定
距離dの位置をその右端位置B1とする。この位置B1
を基準として、文字ピッチ1分の距離を有する位置を位
置C1とし、さらに位置C1を基準として位置D1を設
定する。
文字ブロック幅WI及び文字数Nに基づいて、第2図に
示すような仮想切出位置A1〜D1を設定する。即ち、
文字ブロックの左端の第1文字の左端位置A1から一定
距離dの位置をその右端位置B1とする。この位置B1
を基準として、文字ピッチ1分の距離を有する位置を位
置C1とし、さらに位置C1を基準として位置D1を設
定する。
このとき、一定距離dは、例えば文字ブロックの両端の
各文字幅がほぼ等しい場合、下記式(2)により求めら
れる。
各文字幅がほぼ等しい場合、下記式(2)により求めら
れる。
d= (WI−PX (N−2))/2・・・(2)こ
こで、第2図に示す位置A−Dは理想的な文字切出位置
である。
こで、第2図に示す位置A−Dは理想的な文字切出位置
である。
さらに、c p u iiは、第3図(a)に示すよう
に、仮想切出位置B1を座標Xとした場合、行方向に対
してX−P、X+P、X+2Pの各位置を設定する。こ
の各設定位置を中心として、範囲W内で列方向に走査す
る(第3図(b)〜(e))。
に、仮想切出位置B1を座標Xとした場合、行方向に対
してX−P、X+P、X+2Pの各位置を設定する。こ
の各設定位置を中心として、範囲W内で列方向に走査す
る(第3図(b)〜(e))。
この走査により、各走査線に含まれる黒ドツト数を計数
し、射影テーブルBK(1,J)を作成する。このとき
、I、Jはそれぞれ例゛えばO〜3である。そして、作
成された射影テーブルに基づいて、各位置において相対
的に距離P(即ち文字ピッチP)にある点の射影値の総
和T(−J)を下記式(3)により求める。
し、射影テーブルBK(1,J)を作成する。このとき
、I、Jはそれぞれ例゛えばO〜3である。そして、作
成された射影テーブルに基づいて、各位置において相対
的に距離P(即ち文字ピッチP)にある点の射影値の総
和T(−J)を下記式(3)により求める。
N ・
より算出した総和T(J’)において、最小値を与える
JをJmとした場合そのJmの位置を切出位置とする。
JをJmとした場合そのJmの位置を切出位置とする。
即ち、上記のような仮想切出位置X(B1)に対して、
下記式(4)で求められる×1が最終的切出位置となる
。
下記式(4)で求められる×1が最終的切出位置となる
。
Xl =X−w/2+Jm・ (4)
具体的には、第3図(C)に示すJmOの位置が切出位
置×1となる。
置×1となる。
次に他の切出位置は、文字ブロック幅が比較的小さい場
合には位置×1を基準として、xi+p。
合には位置×1を基準として、xi+p。
X1+2P、・・・となる位置が設定される。また、文
字ブロック幅が比較的大きい場合には、X1+P点を上
記のX点として上記と同様の処理が実行され、各最終的
切出位置が設定される。
字ブロック幅が比較的大きい場合には、X1+P点を上
記のX点として上記と同様の処理が実行され、各最終的
切出位置が設定される。
このようにして、先ず文字ブロックに対して、文字ピッ
チPに基づいて仮想切出位置A1〜D1を設定し、この
仮想切出位置A1〜D1のそれぞれを中心とする列方向
の射′影を求める。この射影値の総和の中で、最小値を
与える位置を最終的切出位置として設定する。この切出
位置に基づいて、ラインバッファ10から1文字毎の検
出切出が実行され、通常1文字分の文字パターンが文字
認識部へ送られる。
チPに基づいて仮想切出位置A1〜D1を設定し、この
仮想切出位置A1〜D1のそれぞれを中心とする列方向
の射′影を求める。この射影値の総和の中で、最小値を
与える位置を最終的切出位置として設定する。この切出
位置に基づいて、ラインバッファ10から1文字毎の検
出切出が実行され、通常1文字分の文字パターンが文字
認識部へ送られる。
したがって、第4図(b)に示すように、印字文字の幅
が比較的小さい場合または印字ずれが発生した場合でも
、従来の方式のように切出位置をR2に設定するなどの
誤りを防止できる。
が比較的小さい場合または印字ずれが発生した場合でも
、従来の方式のように切出位置をR2に設定するなどの
誤りを防止できる。
[発明の効果コ
以上詳述したように本発明によれば、例えばタイプライ
タで作成された文書トおいて、隣接文字間が接続された
文字群に対して正確に文字検出切出処理を行なうことが
できる。したがって、1文字毎の文字パターンをOCR
の文字認識部へ送ることができるため、結果的にOCR
の読取処理を確実に実行できるものである。
タで作成された文書トおいて、隣接文字間が接続された
文字群に対して正確に文字検出切出処理を行なうことが
できる。したがって、1文字毎の文字パターンをOCR
の文字認識部へ送ることができるため、結果的にOCR
の読取処理を確実に実行できるものである。
第1図は本発明の一実施例に係わる文字検出切出方式の
構成を示すブロック図、第2図及び第3図(a)〜(e
)はそれぞれ同実施例の動作を説明するための図、第4
図(a)、(b)はそれぞれ従来の文字検出切出方式の
動作を説明するための図である。 10・・・ラインバッファ10.11・・・マイクロプ
ロセッサ、12・・・メモリ制御回路。 出願入代、埋入 弁理士 鈴江武彦 第1図 第2図 AlBI CI Di 第3図 (a) ■:o123 X−P X X、P X、2P(b)
(c) (d) (e)(b)
構成を示すブロック図、第2図及び第3図(a)〜(e
)はそれぞれ同実施例の動作を説明するための図、第4
図(a)、(b)はそれぞれ従来の文字検出切出方式の
動作を説明するための図である。 10・・・ラインバッファ10.11・・・マイクロプ
ロセッサ、12・・・メモリ制御回路。 出願入代、埋入 弁理士 鈴江武彦 第1図 第2図 AlBI CI Di 第3図 (a) ■:o123 X−P X X、P X、2P(b)
(c) (d) (e)(b)
Claims (1)
- 用紙上に記録された文字を光電変換して得られる複数の
文字パターンを格納するメモリ手段と、このメモリ手段
に格納された上記複数の文字パターンからなる行方向の
文字ブロック幅を検出する文字ブロック検出手段と、こ
の文字ブロック検出手段により検出された文字ブロック
幅及び予め決定される文字ピッチに基づいて上記複数の
文字パターンに対する仮想切出位置を設定する仮想切出
位置検出手段と、上記仮想切出位置を中心とする行方向
の所定幅の文字ブロックに対して列方向の射影データを
作成する射影作成手段と、この射影作成手段により作成
された射影データで列方向の位置毎の射影値の総和を求
めその総和に基づいて上記メモリ手段から1文字毎の文
字切出を実行する際の切出位置を設定する切出位置設定
手段とを具備したことを特徴とする文字検出切出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16055784A JPS6139172A (ja) | 1984-07-31 | 1984-07-31 | 文字検出切出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP16055784A JPS6139172A (ja) | 1984-07-31 | 1984-07-31 | 文字検出切出方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPS6139172A true JPS6139172A (ja) | 1986-02-25 |
Family
ID=15717564
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP16055784A Pending JPS6139172A (ja) | 1984-07-31 | 1984-07-31 | 文字検出切出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPS6139172A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6172373A (ja) * | 1984-09-17 | 1986-04-14 | Fujitsu Ltd | 認識装置 |
JPH01195010A (ja) * | 1988-01-29 | 1989-08-04 | Hashimoto Forming Ind Co Ltd | モールディングの製造方法 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5750076A (en) * | 1980-09-10 | 1982-03-24 | Toshiba Corp | Character reader |
-
1984
- 1984-07-31 JP JP16055784A patent/JPS6139172A/ja active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS5750076A (en) * | 1980-09-10 | 1982-03-24 | Toshiba Corp | Character reader |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6172373A (ja) * | 1984-09-17 | 1986-04-14 | Fujitsu Ltd | 認識装置 |
JPH01195010A (ja) * | 1988-01-29 | 1989-08-04 | Hashimoto Forming Ind Co Ltd | モールディングの製造方法 |
JPH0542935B2 (ja) * | 1988-01-29 | 1993-06-30 | Hashimoto Forming Kogyo Co |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2822189B2 (ja) | 文字認識装置及び方法 | |
US4941189A (en) | Optical character reader with skew recognition | |
KR920022125A (ko) | 문자 데이타 입력 시스템 | |
JPS6139172A (ja) | 文字検出切出方式 | |
JP5041775B2 (ja) | 文字切出方法及び文字認識装置 | |
US6885778B2 (en) | Image processing method and apparatus and storage medium | |
JP2915175B2 (ja) | 単語間スペース検出方法 | |
JPH0410087A (ja) | 基本ライン抽出方法 | |
JPH05159099A (ja) | 光学式文字認識装置における帳票の文字認識領域指定方法及び帳票 | |
JPH04352295A (ja) | 文字列方向判別装置 | |
JPH09237312A (ja) | 光学的文字読取装置 | |
JPS639270B2 (ja) | ||
JPH0782524B2 (ja) | 光学的文字読取装置 | |
JP2511131B2 (ja) | 文字認識装置 | |
JPH039506B2 (ja) | ||
JP2957740B2 (ja) | 行方向判定装置 | |
JP3071479B2 (ja) | 行間スペース検出方法 | |
JPH0727541B2 (ja) | 光学文字読取方法 | |
JP3356819B2 (ja) | マーク認識装置 | |
JP2957774B2 (ja) | 行方向判定装置 | |
JPH0562000A (ja) | 位置マーク判定マークシート入力方式 | |
JPH04139594A (ja) | 単語間スペース検出方法 | |
JPH0459670B2 (ja) | ||
JP2922356B2 (ja) | 文字認識処理装置 | |
JPH0340430B2 (ja) |