Nothing Special   »   [go: up one dir, main page]

JPH0562014A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0562014A
JPH0562014A JP3220770A JP22077091A JPH0562014A JP H0562014 A JPH0562014 A JP H0562014A JP 3220770 A JP3220770 A JP 3220770A JP 22077091 A JP22077091 A JP 22077091A JP H0562014 A JPH0562014 A JP H0562014A
Authority
JP
Japan
Prior art keywords
character
image
boundary
image information
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3220770A
Other languages
English (en)
Inventor
Hitomi Kumazaki
崎 ひとみ 熊
Akira Asami
見 彰 浅
Masahito Yokoyama
山 雅 人 横
Noriyasu Takeuchi
内 則 康 竹
Tomonori Tanaka
中 智 憲 田
Takaaki Tawada
和 田 高 明 多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3220770A priority Critical patent/JPH0562014A/ja
Publication of JPH0562014A publication Critical patent/JPH0562014A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 文章中に数式等の、文章中の主な文字と大き
さやピッチの異なる文字が含まれる原稿においても、安
定した文字認識を行う。 【構成】 ページメモリ404に記憶した画像情報から
黒画素数のヒストグラムを検出し、そのヒストグラムの
所定レベルより文字切り出しの行毎および1文字毎の境
界を認識する。そして、マーカにより指定された原稿画
像の領域内の黒画素を白画素および黒画素と区別される
画素に置き換え、認識された境界に基づいて、指定領域
外の画像情報から文字単位の画像情報を摘出し、摘出し
た画像情報の文字を認識する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、原稿を光学的に読み取
り、文字を認識する文字認識装置に関する。
【0002】
【従来の技術】文字認識装置において、文章中に数式等
の、文章中の主な文字と大きさやピッチの異なる文字が
含まれる原稿を光学的に読み取り文字を認識する場合、
文字の切り出し時に行間,文字間隔がはっきりしないた
め切り出しがうまくいかなったり、しきい値を上げて決
定した切り出し境界が大きさ,ピッチの異なる文字にま
たがり引き続く文字認識がうまくいかないという問題が
あった。
【0003】これに対して、1行中に含まれる文字間隔
が不定である原稿の場合、各文字の垂直方向(列方向)
の黒画素数をカウントし、その黒領域,白領域によって
切り出しを行うことが知られている(特開平1−112
388号公報)。また、異なる文字サイズが含まれてい
る原稿の場合、行の幅を広く設定することで安定した文
字切り出しを行うことも知られている(特開昭63−1
01983号公報)。
【0004】
【発明が解決しようとする課題】しかし、ピッチは行方
向にも不定になり得ることや、大きさの異なる文字が行
中にかなり小さな割合で含まれている場合には広くとっ
た行幅でも大きさの異なる文字の切り出しを失敗する可
能性がある。また行幅をかなり広くとって切り出しを行
っても、切り出した多くの文字に対しては空白部分が多
くできてしまうので、認識の際に多くとりすぎた空白部
分を切り捨てる処理を行う必要があり、処理に時間を要
する。更に、一般に、文字画像中に含まれる不定ピッチ
の文字は少なく、それらは数式であったり記号であった
りして切り出して認識を行う必要のないものが多い。
【0005】そこで本発明は、文章中に数式等の、文章
中の主な文字と大きさやピッチの異なる文字が含まれる
原稿においても、安定した文字認識を行うことを目的と
する。
【0006】
【課題を解決するための手段】本願の発明は、原稿画像
を読み取る画像読取手段(100);画像読取手段(1
00)が読み取った画像情報を記憶する画像記憶手段
(404);画像記憶手段(404)に記憶した画像情
報の黒画素数のヒストグラムを検出する画像密度検出手
段(401);検出したヒストグラムの所定レベルより
文字切り出しの境界を認識する境界認識手段(40
1);指定された原稿画像の領域を検出する領域検出手
段(401);領域検出手段(401)が検出した指定
領域内の黒画素を白画素および黒画素と区別される画素
に置き換える画素変換手段(401);境界認識手段
(401)が認識した境界に基づいて、領域検出手段
(401)が検出した指定領域外の画像情報から文字単
位の画像情報を摘出する文字切り出し手段(401);
文字切り出し手段(401)が切り出した画像情報の文
字を認識する文字認識手段(401);文字認識手段
(401)が認識した画像情報を出力画像メモリ(40
5)に書き込む出力画像作成手段(401);および、
出力画像メモリ(405)に記憶した画像情報を出力す
る出力手段(200);を備える。
【0007】また、本発明の好ましい実施態様によれ
ば、境界認識手段(401)が認識した境界上の文字の
有無を検出する文字検出手段(401);および、境界
上に文字があると文字切り出し手段(401)による文
字単位の画像情報の摘出を禁止し、境界上にある文字の
位置を原稿画像に表示する情報および原稿画像の該位置
を含む領域の指定を促す情報を出力手段(200)に出
力させる画像処理手段(401);を更に備える。な
お、カッコ内の記号は、図面に示し後述する実施例の対
応要素又は対応事項を示す。
【0008】
【作用】本願の発明によれば、画像密度検出手段(40
1)は、画像記憶手段(404)に記憶した画像情報の
行方向および列方向の黒画素数のヒストグラムを検出
し、境界認識手段(401)が検出したヒストグラムの
所定レベルより文字切り出しの行毎および1文字毎の境
界を認識する。次に、画素変換手段(401)は、指定
された原稿画像の領域を検出する領域検出手段(40
1)が検出した指定領域内の黒画素を白画素および黒画
素以外の画素、すなわち白画素および黒画素と区別され
る画素に置き換える。そして、文字切り出し手段(40
1)は、境界認識手段(401)が認識した境界に基づ
いて、領域検出手段(401)が検出した指定領域外の
画像情報から文字単位の画像情報を摘出する。
【0009】従って、例えば文章中に数式などの主な文
章中の文字と大きさやピッチの異なる文字を含む原稿に
対してオペレータが、それらの文字をフェルトペン等で
マークし、この原稿画像を読み取らせると、マーク内の
文字を無視して、マーク外の主な文章中の文字に対して
のみ文字の切り出しを実施しうるので、文字の切り出し
を特に時間をかけることなく、かつ正確に行える。ま
た、マーク内の文字とマーク外の文字に対し別処理を施
すこともできる。
【0010】次に、文字認識手段(401)は、文字切
り出し手段(401)が切り出した画像情報の文字を認
識し、認識した画像情報を出力画像作成手段(401)
が出力画像メモリ(405)に書き込み、出力手段(2
00)が出力画像メモリ(405)に記憶した画像情報
を出力する。
【0011】従って、文字認識処理も迅速かつ正確に実
施しうる。
【0012】また、本発明の好ましい実施態様によれ
ば、文字検出手段(401)が、境界認識手段(40
1)が認識した境界上に文字がかかっていることを検出
すると、画像処理手段(401)は、文字切り出し手段
(401)による文字単位の画像情報の摘出を禁止し、
境界上にある文字の位置を原稿画像に表示する情報およ
び原稿画像の該位置を含む領域の指定を促す情報を出力
手段(200)に出力させる。すなわち、文章中に数式
などの主な文章中の文字と大きさやピッチの異なる文字
を含む原稿に対してオペレータによるマーク付けがされ
ていない又は、マーク付けがされていても適切でない場
合でも、一度は切り出し処理を試み、切り出し境界上に
またがって文字が存在するかを判定し存在すれば、その
箇所に印を付けた文字画像出力とともに、それらにマー
クを付けてやり直すようにメッセージを出すことにより
適切なマーク付けを行わせ、オペレータがマークを付け
忘れた場合や初めはマーク付け箇所が分らなかった場合
などでも適切な文字の切り出し、その後の文字認識を行
える。
【0013】本発明の他の目的および特徴は、図面を参
照した以下の実施例の説明より明らかになろう。
【0014】
【実施例】
(第1実施例)図1に、本発明の一実施例である文字認
識の機能を有するデジタル複写機の構成概要を示す。こ
の複写機は、原稿画像を読み取るスキャナ部100,全
体の制御を行うCPU401,制御プログラムが格納さ
れているROM402,制御プログラムが一時的に使用
するRAM403,読み取った画像を一旦格納するペー
ジメモリ404,出力画像を格納する出力画像メモリ4
05,各装置間のデータのやりとりを行う内部システム
・バス406,インターフェースI/F407、40
8,アナログ信号をデジタル信号に変換するA/D変換
器409,出力画像メモリ405内に格納された画像を
出力するプリンタ部200,操作ボード300等で構成
されている。
【0015】図2に、スキャナ部100およびプリンタ
部200の内部機構の概要を示す。スキャナ部100
の、原稿(図示せず)を載置するためのコンタクトガラ
ス1は、光源2a,2bによって照明され、読取原稿か
らの反射光(原稿像)はミラー3,4,5,6,7,お
よびレンズ8を介してCCDイメージセンサ9の受光面
に結像される。光源2(2a,2b)およびミラー3
は、コンタクトガラス1の下面をコンタクトガラス1と
平行に副走査方向(図1において左右方向)に移動する
走行体10に搭載され、ミラー4,5はその走行体10
に連動して1/2の速度で副走査方向に移動する走行体
11に搭載されている。主走査方向は、CCDイメージ
センサ9の固体走査によって行われ、原稿画像はCCD
イメージセンサ9によって読み取られ、前述のような光
学系が移動することで原稿全面が走査されるようになっ
ている。なお、図中39は、原稿を押圧するための圧板
である。
【0016】プリンタ部200は、レーザ書込み系、画
像再生系ならびに給紙系により構成される。レーザ書込
み系は、レーザ出力ユニット21、結像レンズ22なら
びにミラー23を備えている。レーザ出力ユニット21
の内部には、レーザ光源であるレーザダイオード及び電
気モータによって高速で定速回転する多角形ミラー(ポ
リゴンミラー)が設けられている。レーザ書込み系から
出力されるレーザ光が、画像再生系の感光体ドラム24
に照射される。感光体ドラム24の周囲には、帯電チャ
ーシャ25、イレーサ26、現像ユニット27、転写チ
ャージャ28、分離チャージャ29、分離爪30、クリ
ーニングユニット31などが備わっている。なお、感光
体ドラム24の一端近傍でレーザビームが照射される位
置に主走査同期信号(MSYNC)を発生するビームセ
ンサ(図示せず)が配置されている。
【0017】このプリンタ部200における画像再生プ
ロセスを簡単に説明する。感光体ドラム24の周面は、
帯電チャージャ25によって一様に高電位に帯電され
る。その周面にレーザ光が照射されると、照射された部
分は電位が下がる。レーザ光は記録再生の黒/白に応じ
てオン/オフ制御されるので、レーザ光の照射によっ
て、感光体ドラム24の周面に記録画像に対応する電位
分布、すなわち静電潜像が形成される。静電潜像が形成
された部分が現像ユニット27を通ると、その電位の高
低に応じてトナーが付着し、静電潜像が可視化したトナ
ー像となる。トナー像が形成された部分に、所定のタイ
ミングで記録シート32がカセットから送り込まれ、ト
ナー像に重なる。このトナー像は転写チャージャ28に
よって記録シート32に転写し、その後分離チャージャ
29ならびに分離爪30によって、感光体ドラム24か
ら分離される。分離された記録シート32は、搬送ベル
ト34によって搬送され、ヒータを内蔵した定着ローラ
35によって加熱着された後、排紙トレイ36に排紙さ
れる。
【0018】本実施例では、レ−ザプリンタ200は給
紙系を2系統有している。一方の給紙系は、上段給紙カ
セット33aおよび手差し給紙台33cが備わってお
り、上段給紙カセット33aまたは手差し給紙台33c
にセットされた記録シート32aは、給紙ローラ37a
によって給紙される。もう一方の給紙系には下段給紙カ
セット33bが備わり、下段給紙カセット33b内の記
録シート32bは、給紙ローラ37bによって給紙され
る。そしていずれかの給紙ローラから給紙された記録シ
ート32は、レジストローラ38に当接した状態で一旦
停止し、記録プロセスの進行に同期したタイミングで感
光体ドラム24に送り込まれる。
【0019】図3および図4に、CPU401の処理動
作を示す。
【0020】図3を参照する。電源が投入されると、処
理モード等を初期状態に設定する(ステップ1:以下カ
ッコ内ではステップ又はサブルーチンという語を省略す
る)。次に、入力を読み込み(2)、操作ボード300
上のスタートスイッチ(図示しない)によりスタート指
示がされるまで待機し、スタート指示があると(3)、
オペレータにより文字認識の指示がされたか否かをチェ
ックする(4)。特に、文字認識の指示がない場合は通
常の複写動作を行い(5)、その後ステップ(2)に戻
る。
【0021】ステップ4で、文字認識の指示があると、
スキャナ部100で原稿を光学的に読み取り、読み取っ
た原稿画像をページメモリ404に格納する(6)。そ
して格納された原稿画像に別処理文字としてマーク付け
されている文字画像部分があるか否かを判断するマーク
認識を行う(7)。
【0022】マーク認識は、本出願人が特開平1−20
4192号公報として提案したと同様に、原稿の主走査
方向のサイズを検知する処理とマークエリアを検知する
処理で構成する。すなわち、図5の(a)に示す例の、
原稿画像から原稿サイズを検知し、図5の(b)に示す
ように、その幅にわたって各主走査毎に濃度を調べて地
肌濃度を検出し、黒レベル(最高濃度)との間を階調数
(例えば64階調)に応じて分割し、あるレベル以上
(例えば62)のものをマークとして検出する。そし
て、図6に示すように、各主走査線上で認識されたマー
カーとマーカーの間に、はさまれた部分を表領域の一部
として認識し、連続した走査線でその領域の一部分のつ
ながりを調べ、領域として決定する。つまり、連続した
主走査線上に存在する領域部分同士の副走査線方向の座
標区間に重なりがあれば、それら2つの部分領域は同じ
領域であると判断する。従って、図6の例では領域1と
領域2に分けられ、これらは互に異なることを示す。
【0023】なお、この領域認識については一旦読み込
んだ原稿画像をCRT等のディスプレイ装置に表示し、
その表示されたディスプレイ上で、カーソル,ライトペ
ン,マウスなどを用いて領域指定のマークをつける方法
や、複写機付属のデジタイザー上に原稿をおき、タッチ
ペンによって領域指定のマークをつける方法を用いても
よい。
【0024】そして原稿画像にマークがあれば(8)、
そのマーク内の文字については別処理を行う。すなわ
ち、マーク内にある画像の黒画素を、後述するステップ
11の処理でカウントされないように、かつ、領域内の
情報も失わないようにするため白・黒以外の画素に変換
する(9)。これは領域内を走査して黒画素があれば、
その情報を置き換える。すなわち、A/D変換器(図
1)でアナログ信号をデジタル化したときに、図7に示
すように、白を0,黒を1とした場合、マーク領域内の
黒画素は例えば2など、0と1以外にする。
【0025】次に、マーク内の文字をそれだけで処理し
切り出しを行う(10)。
【0026】なお、マーク内の文字については切り出し
処理,文字認識を行わずに出力するようにしてもよい。
これによればマーク内の不定ピッチや大きさの文字は無
視して切り出し処理は行わず、後述するマーク外の主の
文章中の文字に対してのみ切り出し処理を行うため、切
り出し処理は迅速かつ正確に行える。
【0027】ステップ8でマークがないか又はマーク処
理が終了すると、マーク以外の部分(マークのされてな
い場合も含む)の行方向又は、列方向に対して黒画素数
をカウントし、ヒストグラムを作成する(11,1
2)。黒画素数のカウントは、切り出しを行う方向にそ
って1つずつ画像情報をみていき、黒画素と判断された
場合にカウンターを1つ進めるようにして行う。黒画素
数のカウント結果を図7に示す。なお、マーク内の文字
を表す画素は、ステップ9の処理により黒画素ではない
ので、ここではカウントされない。つまり、以下に示す
行毎および1文字毎の切り出し処理は、マーク外の文字
画像についてのみのものである。
【0028】引き続いてあるしきい値によって得られた
ヒストグラムを区切ることにより文字画像を行毎に切り
出す際の境界線を検出する(13)。すなわち、図8に
示すように、カウントした黒画素数をあらかじめ決定し
ておいたしきい値よりも小さい部分は文字がないと判断
して、しきい値との上下関係が変化する位置をその境界
と認識する。そして、認識した境界線に基づいて全ての
行にわたって行毎の切り出しを行う(14,15)。
【0029】図4を参照する。次に、同じくヒストグラ
ムを区切ることにより文字画像を1文字毎に切り出す際
の境界線を検出し(16)、全ての文字にわたって1文
字毎の切り出しを行う(17,18)。なお、ステップ
10で行われるマーク内の文字画像の切り出し処理も同
様にマーク内の黒画素数のカウントからヒストグラムを
作成し、行毎,1文字毎の境界線を検出した後に切り出
しが行われる。マーク内の黒画素数のカウントは、切り
出しを行う方向にそって1つずつ画像情報をみていき、
ステップ9で変換された画素と判断された場合にカウン
ターを1つ進めるようにして行う。マーク内の黒画素数
のカウント結果を図7に示す。
【0030】そして、切り出された行に対して単語毎の
切り出しを行う単語抽出処理を行う(19)。単語毎の
切り出しは、文字毎の切り出しにより得られる文字の間
隔に基づいて実施する。これは、原稿画像にアルファベ
ット等を含む場合において有効である。次に、抽出した
単語を単語単位で認識し(20)、認識結果を出力画像
メモリ405に書き込む(21)。
【0031】切り出し処理されたマーク内・外の文字画
像は同じRAM403上に存在しているものであるの
で、例えば、切り出した文字のまわりの4点の座標を記
憶する。この際、同じRAM403内でマーク内・外で
異なる信号を用いて表現する。これにより、マーク内と
マーク外の別処理時にもとの画像との相対位置などを計
算して切り出し位置を決定する必要がなくなり、別処理
を意識せずに簡単に行える。
【0032】あるいは、引き続いて認識を1文字ずつ行
いその認識結果を別のメモリに書き込む際に、マーク位
置の文字画像中の座標位置を記憶してもよい。次に、出
力画像メモリ405に蓄えられた画像を出力して(2
2)、入力読込処理に戻る(2)。
【0033】図9に、大きさ,ピッチの異なる文字を含
むマーク付き原稿と、この原稿に対して上述した処理に
より切り出しを行い、文字画像の蓄えられているRAM
403と同じRAM内に結果の切り出し点をあわせて記
録した場合のRAM内情報を示す。ただし、この例では
マーク内の文字が切り出し処理されなかった場合を示し
ている。
【0034】(第2実施例)第2実施例は、第1実施例
のCPU401のフロチャートを示す図3および図4
を、図10および図11にかえたものであり、その他機
構部,電装部等の構成は第1実施例と同一である。
【0035】図10および図11の制御内容を説明す
る。なお、第1実施例と同じ処理を示す部分には同一記
号を附し、同一部分の説明は省略する。
【0036】図10は、ステップ13とステップ14の
間に新たにステップ13bおよびステップ13cを挿入
したものである。すなわち、行毎に切り出しを行うため
に必要な境界線が検出されると(13)、境界線上に文
字がかかっているか否かを判断する(13b)。この判
断方法は、図12に示すように、まず、プリンタ,メモ
リの記録密度より一般に用いられる文字の太さが出力さ
れるために必要な画素数nを見積り、境界上を走査して
いき黒画素数がn個以上続いた場合には、それは文字が
境界線上にかかっていると判断する。
【0037】そして、文字がかかっていなければ、マー
ク付けが正しくなされている又は、不定ピッチ・大きさ
の文字が原稿画像に含まれていないと判断して、境界線
を境界として行毎の切り出しを行う(14)。
【0038】一方、文字がかかっていれば、不定ピッチ
・大きさの文字が原稿画像に含まれており全くマーク付
けがされていない又は、マーク付けがされていても適切
でないと判断して、切り出し処理を中止して、図13の
(a)に示すように、それらの文字部分を適切にマーク
するように促すメッセージを出力し、同時に境界上で認
識したRAM上の文字位置に印(*)を付け、画像にメ
ッセージを合成しプリントアウトする(13c)。ま
た、図13の(b)に示すように、プリントアウトされ
る画像にはもとの原稿画像に印(*)を付けたものだけ
とし、メッセージは、操作ボード300上のLEDパネ
ル(図示しない)に出力するようにしてもよい。ステッ
プ13cの処理が終了すると、入力読込処理に戻る
(2)。
【0039】図11は、ステップ16とステップ17の
間に新たにステップ16bおよびステップ16cを挿入
したものである。すなわち、切り出された行から1文字
毎に切り出しを行うために必要な境界線が検出されると
(16)、ステップ13bと同様に、境界線上に文字が
かかっているか否かを判断する(16b)。
【0040】そして、文字がかかっていなければ、マー
ク付けが正しくなされている又は、不定ピッチ・大きさ
の文字が原稿画像に含まれていないと判断して、境界線
を境界として1文字毎の切り出しを行い(17)、一
方、文字がかかっていれば、不定ピッチ・大きさの文字
が原稿画像に含まれており全くマーク付けがされていな
い又は、マーク付けがされていても適切でないと判断し
て、切り出し処理を中止して、図13に示すような指示
をプリントアウトする(16c)。その後、入力読込処
理に戻る(2)。
【0041】
【発明の効果】以上説明したように本願の発明によれ
ば、例えば文章中に数式などの主な文章中の文字と大き
さやピッチの異なる文字を含む原稿に対してオペレータ
が、それらの文字をフェルトペン等でマークし、この原
稿画像を読み取らせると、マーク内の文字を無視して、
マーク外の主な文章中の文字に対してのみ文字の切り出
しを実施しうるので、文字の切り出しを迅速かつ正確に
行える。よって、安定した文字認識処理を実施しうる。
【0042】また、本発明の好ましい実施態様によれ
ば、文章中に数式などの主な文章中の文字と大きさやピ
ッチの異なる文字を含む原稿に対してオペレータによる
マーク付けがされていない又は、マーク付けがされてい
ても適切でない場合でも、一度は切り出し処理を試み、
切り出し境界上にまたがって文字が存在するかを判定し
存在すれば、その箇所に印を付けた文字画像出力ととも
に、それらにマークを付けてやり直すようにメッセージ
を出すことにより適切なマーク付けを行わせ、オペレー
タがマークを付け忘れた場合や初めはマーク付け箇所が
分らなかった場合などでも適切な文字の切り出し、その
後の文字認識を行える。
【図面の簡単な説明】
【図1】 本発明の一実施例の文字認識機能を有するデ
ジタル複写機の電装部の概要を示すブロック図である。
【図2】 図1に示すデジタル複写機の機構部の概要を
示すブロック図である。
【図3】 図1に示すCPU401の、第1実施例の、
処理動作の内容を示すフローチャートである。
【図4】 図1に示すCPU401の、第1実施例の、
処理動作の内容を示すフローチャートである。
【図5】 マーク部分の認識を示し、(a)は、マーク
の施された原稿画像を示す平面図であり、(b)は、濃
度検出を示すブロック図である。
【図6】 原稿画像の主走査線毎のマーク領域を示す平
面図である。
【図7】 マーク領域内外の黒画素の点在および黒画素
数を示すブロック図である。
【図8】 行毎の切り出しのための境界を検出する様子
を示すブロック図である。
【図9】 マーク付の原稿および切り出し処理後のRA
M内の画像データの一例を示す平面図である。
【図10】 図1に示すCPU401の、第2実施例
の、処理動作の内容を示すフローチャートである。
【図11】 図1に示すCPU401の、第2実施例
の、処理動作の内容を示すフローチャートである。
【図12】 境界線上の文字の有無の検出を示すブロッ
ク図である。
【図13】 メッセージの出力例を示し、(a)は、出
力画像にメッセージを載せた場合を示す平面図であり、
(b)は、出力画像とは別にメッセージを出力する場合
を示す平面図である。
【符号の説明】
100:スキャナ(画像読取手段) 200:プリンタ(出力手段) 300:操作ボード 401:CPU(画像密度検出手段,境界認識手段,領
域検出手段,画素変換手段,文字切り出し手段,文字認
識手段,出力画像作成手段,文字検出手段,画像処理手
段) 402:ROM 403:RAM 404:ページメモリ(画像記憶手段) 405:出力画像メモリ(出力画像メモリ) 406:システム・バス 407,408:I/F 409:A/D変換器
───────────────────────────────────────────────────── フロントページの続き (72)発明者 竹 内 則 康 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 田 中 智 憲 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 多 和 田 高 明 東京都大田区中馬込1丁目3番6号 株式 会社リコー内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】原稿画像を読み取る画像読取手段;画像読
    取手段が読み取った画像情報を記憶する画像記憶手段;
    画像記憶手段に記憶した画像情報の黒画素数のヒストグ
    ラムを検出する画像密度検出手段;検出したヒストグラ
    ムの所定レベルより文字切り出しの境界を認識する境界
    認識手段;指定された原稿画像の領域を検出する領域検
    出手段;領域検出手段が検出した指定領域内の黒画素を
    白画素および黒画素と区別される画素に置き換える画素
    変換手段;前記境界認識手段が認識した境界に基づい
    て、前記領域検出手段が検出した指定領域外の画像情報
    から文字単位の画像情報を摘出する文字切り出し手段;
    文字切り出し手段が切り出した画像情報の文字を認識す
    る文字認識手段;文字認識手段が認識した画像情報を出
    力画像メモリに書き込む出力画像作成手段;および、出
    力画像メモリに記憶した画像情報を出力する出力手段;
    を備える文字認識装置。
  2. 【請求項2】前記境界認識手段が認識した境界上の文字
    の有無を検出する文字検出手段;および、 境界上に文字があると前記文字切り出し手段による文字
    単位の画像情報の摘出を禁止し、境界上にある文字の位
    置を原稿画像に表示する情報および原稿画像の該位置を
    含む領域の指定を促す情報を前記出力手段に出力させる
    画像処理手段;を更に備える請求項1記載の文字認識装
    置。
JP3220770A 1991-08-31 1991-08-31 文字認識装置 Pending JPH0562014A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3220770A JPH0562014A (ja) 1991-08-31 1991-08-31 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3220770A JPH0562014A (ja) 1991-08-31 1991-08-31 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0562014A true JPH0562014A (ja) 1993-03-12

Family

ID=16756290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3220770A Pending JPH0562014A (ja) 1991-08-31 1991-08-31 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0562014A (ja)

Similar Documents

Publication Publication Date Title
JP3833735B2 (ja) 複製デバイス及び複製デバイスにおける媒体のテキスト行間スペーシング増分方法
US20060160054A1 (en) Automatic grading apparatus, method and storage medium of automatic grading
US5642473A (en) Paper saving reprographic device
US6163623A (en) Method and apparatus for recognizing images of documents and storing different types of information in different files
JP3622994B2 (ja) バーコード記録装置
KR100306063B1 (ko) 화상처리방법및장치
JP2002288636A (ja) 画像検査装置および画像形成装置
US5822082A (en) Image processing apparatus
US8228553B2 (en) Image processing apparatus, image processing method, and computer program product
JP3247723B2 (ja) 画像再配置複写機
JP2000036908A (ja) 画像認識装置
JPH0562014A (ja) 文字認識装置
JP3629969B2 (ja) 画像認識装置
JP3255676B2 (ja) デジタル複写機
JP3255675B2 (ja) 画像再配置機能付きデジタル複写機
EP0689166B1 (en) An automatic image quality controlling apparatus for use in an electronic copier
JP3142428B2 (ja) 画像形成装置
JP3629959B2 (ja) 画像認識装置
WO2022097408A1 (ja) 画像処理装置及び画像形成装置
JP3244768B2 (ja) 画像方向指定機能付き複写機
JPH09130516A (ja) 原稿画像の天地を認識できる画像処理装置
JP3489788B2 (ja) 原稿画像処理装置
JPH0554069A (ja) デジタル翻訳装置
JPH0554075A (ja) 翻訳装置
JPH0554188A (ja) 画像処理装置