JPH06333083A - 光学式文字読取装置 - Google Patents
光学式文字読取装置Info
- Publication number
- JPH06333083A JPH06333083A JP5146955A JP14695593A JPH06333083A JP H06333083 A JPH06333083 A JP H06333083A JP 5146955 A JP5146955 A JP 5146955A JP 14695593 A JP14695593 A JP 14695593A JP H06333083 A JPH06333083 A JP H06333083A
- Authority
- JP
- Japan
- Prior art keywords
- character
- recognition
- additional
- unit
- recognized
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 認識対象の文字を迅速に追加し、認識率を向
上させる。 【構成】 スキャナ部2で読み取られた帳票1に記載さ
れた各文字を文字認識部3で認識する。この際、文字認
識部3では、スキャナ部2で読み取られた文字イメージ
を認識辞書に格納された文字イメージと比較し、最も近
似したものを出力する。認識辞書に認識対象の文字が格
納されていないため、表示部6に誤った認識結果が表示
されるときは、キーボード部7を介して追加文字テーブ
ル4−1に文字認識結果として出力したい文字を追加す
る。単語照合部4では、文字認識部3の認識結果である
文字に対し、追加文字テーブル4−1に追加された文字
があるときは、認識結果及び追加文字のうち、使用頻度
の高い方の文字を含む単語を出力する。
上させる。 【構成】 スキャナ部2で読み取られた帳票1に記載さ
れた各文字を文字認識部3で認識する。この際、文字認
識部3では、スキャナ部2で読み取られた文字イメージ
を認識辞書に格納された文字イメージと比較し、最も近
似したものを出力する。認識辞書に認識対象の文字が格
納されていないため、表示部6に誤った認識結果が表示
されるときは、キーボード部7を介して追加文字テーブ
ル4−1に文字認識結果として出力したい文字を追加す
る。単語照合部4では、文字認識部3の認識結果である
文字に対し、追加文字テーブル4−1に追加された文字
があるときは、認識結果及び追加文字のうち、使用頻度
の高い方の文字を含む単語を出力する。
Description
【0001】
【産業上の利用分野】本発明は、文字認識の対象となる
文字の追加を容易に行なえるようにした光学式文字読取
装置に関するものである。
文字の追加を容易に行なえるようにした光学式文字読取
装置に関するものである。
【0002】
【従来の技術】一般に、光学式文字読取装置では、手書
き文字等をイメージセンサ等により光学的に読み取っ
て、読み取ったイメージを文字として認識してその結果
を文字コードとして出力する。
き文字等をイメージセンサ等により光学的に読み取っ
て、読み取ったイメージを文字として認識してその結果
を文字コードとして出力する。
【0003】図2は、従来の光学式文字読取装置の一例
を示すブロック図である。図2において、帳票21は、
スキャナ部22により光学的に読み取られる。帳票21
には、文字や数字、記号等の読取対象が記載されてい
る。スキャナ部22は、周知のように、光源、イメージ
センサ、走査装置等から成る。即ち、光源からの光を帳
票21に照射し、帳票21からの反射光をイメージセン
サで受け取る。イメージセンサは、通常はラインセンサ
から成り、主走査方向には電気的に走査され、副走査方
向には走査装置により機械的に走査される。
を示すブロック図である。図2において、帳票21は、
スキャナ部22により光学的に読み取られる。帳票21
には、文字や数字、記号等の読取対象が記載されてい
る。スキャナ部22は、周知のように、光源、イメージ
センサ、走査装置等から成る。即ち、光源からの光を帳
票21に照射し、帳票21からの反射光をイメージセン
サで受け取る。イメージセンサは、通常はラインセンサ
から成り、主走査方向には電気的に走査され、副走査方
向には走査装置により機械的に走査される。
【0004】文字認識部23は、認識対象となる文字を
標準的なイメージを格納した認識辞書を備えている。こ
れにより、文字認識部23は、スキャナ部22から出力
されたイメージデータから1文字毎のイメージを切り出
し、その1文字毎のイメージを認識辞書に格納された標
準の文字イメージと比較する。そして、最も近似した文
字イメージを捜し出し、その文字イメージに対応して格
納されている文字コードを認識結果として出力する。こ
の場合、最も近似したものを第1候補として出力すると
ともに、それに続いて近似するものを順次第2、第3候
補として出力する。単語照合部24は、意味をなす文字
の配列である単語を格納した単語辞書を備えている。こ
れにより、単語照合部24は、文字認識部23により認
識された複数の文字の各候補文字を組み合せて複数の候
補単語を作成し、それらの候補単語のうちから単語辞書
に格納された単語と一致する1つの単語を選択して出力
する。
標準的なイメージを格納した認識辞書を備えている。こ
れにより、文字認識部23は、スキャナ部22から出力
されたイメージデータから1文字毎のイメージを切り出
し、その1文字毎のイメージを認識辞書に格納された標
準の文字イメージと比較する。そして、最も近似した文
字イメージを捜し出し、その文字イメージに対応して格
納されている文字コードを認識結果として出力する。こ
の場合、最も近似したものを第1候補として出力すると
ともに、それに続いて近似するものを順次第2、第3候
補として出力する。単語照合部24は、意味をなす文字
の配列である単語を格納した単語辞書を備えている。こ
れにより、単語照合部24は、文字認識部23により認
識された複数の文字の各候補文字を組み合せて複数の候
補単語を作成し、それらの候補単語のうちから単語辞書
に格納された単語と一致する1つの単語を選択して出力
する。
【0005】制御部25は、スキャナ部22、文字認識
部23、及び単語照合部24の各動作を制御し、単語照
合部24で照合された文字を表示部26に表示する制御
を行なう。表示部26は、CRT又は液晶表示装置等か
ら成り、単語照合部24で照合された文字を表示すると
ともに、キーボード部27から入力された文字を表示す
る。キーボード部27は、オペレータにより文字認識の
指示操作や、認識結果として表示された文字に誤りが含
まれている場合にその修正を行なうためのものである。
部23、及び単語照合部24の各動作を制御し、単語照
合部24で照合された文字を表示部26に表示する制御
を行なう。表示部26は、CRT又は液晶表示装置等か
ら成り、単語照合部24で照合された文字を表示すると
ともに、キーボード部27から入力された文字を表示す
る。キーボード部27は、オペレータにより文字認識の
指示操作や、認識結果として表示された文字に誤りが含
まれている場合にその修正を行なうためのものである。
【0006】図3は、従来の文字認識手順の説明図であ
る。この図3により、具体的な文字認識の例について説
明する。図3の例では、帳票21に書かれた「渡邉」と
いう文字(姓)を認識する。ここで、「渡」は、文字認
識部23の認識対象の文字であるが、「邉」は、そのよ
うな認識対象の文字として認識辞書に含まれていないと
する。図3(a)に示すように、帳票21の文字フィー
ルドの各文字枠内に「渡」及び「邉」の各文字が手書き
等により記入されている。これらの文字は、文字認識部
23により図3(b)に示すように認識される。
る。この図3により、具体的な文字認識の例について説
明する。図3の例では、帳票21に書かれた「渡邉」と
いう文字(姓)を認識する。ここで、「渡」は、文字認
識部23の認識対象の文字であるが、「邉」は、そのよ
うな認識対象の文字として認識辞書に含まれていないと
する。図3(a)に示すように、帳票21の文字フィー
ルドの各文字枠内に「渡」及び「邉」の各文字が手書き
等により記入されている。これらの文字は、文字認識部
23により図3(b)に示すように認識される。
【0007】図3(b)に示すように、「渡」の文字に
ついての認識結果としては、第1候補として「漢」、第
2候補として「渡」、第3候補として「涯」がそれぞれ
出力される。このように、「渡」の認識結果の第1候補
として必ずしも「渡」が出力されるとは限らない。この
ような現象は、手書きによる文字が丁寧に書かれていな
い場合等に生じる。一方、「邉」の文字についての認識
結果としては、第1候補として「邊」、第2候補として
「還」、第3候補として「達」がそれぞれ出力される。
このように、「邉」の文字は、文字候補として挙がって
こない。即ち、「邉」の文字をいかに丁寧に書いたとし
ても、文字認識部23の認識辞書に「邉」が含まれてい
ないので、文字候補として挙がることはなく、必ず
「邉」以外の文字が挙がる。そして、図3(c)に示す
ように、これらの候補文字を組み合わせて候補単語が作
成される。
ついての認識結果としては、第1候補として「漢」、第
2候補として「渡」、第3候補として「涯」がそれぞれ
出力される。このように、「渡」の認識結果の第1候補
として必ずしも「渡」が出力されるとは限らない。この
ような現象は、手書きによる文字が丁寧に書かれていな
い場合等に生じる。一方、「邉」の文字についての認識
結果としては、第1候補として「邊」、第2候補として
「還」、第3候補として「達」がそれぞれ出力される。
このように、「邉」の文字は、文字候補として挙がって
こない。即ち、「邉」の文字をいかに丁寧に書いたとし
ても、文字認識部23の認識辞書に「邉」が含まれてい
ないので、文字候補として挙がることはなく、必ず
「邉」以外の文字が挙がる。そして、図3(c)に示す
ように、これらの候補文字を組み合わせて候補単語が作
成される。
【0008】図3(c)に示すように、「渡」及び
「邉」についての第1候補から第3候補までの各候補文
字の組合せは、全部で9通りとなる。ところが、これら
のすべてが姓をなすのではない。図3(d)に示すよう
に、単語照合部24の単語辞書内には、姓をなす単語が
格納されている。例えば、「渡辺」、「渡部」、「渡
邊」、「渡邉」、「安達」等が格納されている。このよ
うに、文字認識部23で「邉」を認識できない場合に、
単語照合部24の単語辞書内に「渡邉」が格納されてい
ることもある。これらの姓をなす単語のうち、「渡邊」
のみが図3(c)で挙げられた候補単語に一致するの
で、文字認識結果として「渡邊」が出力され、表示部2
6に表示される。
「邉」についての第1候補から第3候補までの各候補文
字の組合せは、全部で9通りとなる。ところが、これら
のすべてが姓をなすのではない。図3(d)に示すよう
に、単語照合部24の単語辞書内には、姓をなす単語が
格納されている。例えば、「渡辺」、「渡部」、「渡
邊」、「渡邉」、「安達」等が格納されている。このよ
うに、文字認識部23で「邉」を認識できない場合に、
単語照合部24の単語辞書内に「渡邉」が格納されてい
ることもある。これらの姓をなす単語のうち、「渡邊」
のみが図3(c)で挙げられた候補単語に一致するの
で、文字認識結果として「渡邊」が出力され、表示部2
6に表示される。
【0009】そして、オペレータは、表示部26に表示
された「渡邊」の文字を見て、「邊」が「邉」の誤読で
あることに気付いた場合には、キーボード部27により
かな漢字変換等の入力方法を使って入力する。
された「渡邊」の文字を見て、「邊」が「邉」の誤読で
あることに気付いた場合には、キーボード部27により
かな漢字変換等の入力方法を使って入力する。
【0010】
【発明が解決しようとする課題】しかしながら、上述し
た従来の技術には、次のような問題があった。即ち、例
えば、「邉」の文字が文字認識部23の認識対象になっ
ていない場合には、この文字に類似した文字「邊」と誤
認識してしまう。このような誤認識を避けるには、文字
認識部23の認識辞書に「邉」を追加しなければならな
い。ところが、文字認識部23の認識辞書は、専用の辞
書作成システムで作られるものであり、多量の変形文字
パターンを集めたデータベースから統計的な手法を用い
て作られるので、新しい文字を追加することは容易に行
なえなかった。
た従来の技術には、次のような問題があった。即ち、例
えば、「邉」の文字が文字認識部23の認識対象になっ
ていない場合には、この文字に類似した文字「邊」と誤
認識してしまう。このような誤認識を避けるには、文字
認識部23の認識辞書に「邉」を追加しなければならな
い。ところが、文字認識部23の認識辞書は、専用の辞
書作成システムで作られるものであり、多量の変形文字
パターンを集めたデータベースから統計的な手法を用い
て作られるので、新しい文字を追加することは容易に行
なえなかった。
【0011】従って、例えば、「邉」の文字が認識対象
となっていないことが判明し、その時点ですぐに認識対
象に含めたいときでも、迅速に追加することができない
という問題があった。本発明は、以上の点に着目してな
されたもので、認識対象外の文字が見つかった場合に認
識辞書の作成を待たずに認識の対象に含めたい文字を迅
速に追加できるようにした光学式文字読取装置を提供す
ることを目的とするものである。
となっていないことが判明し、その時点ですぐに認識対
象に含めたいときでも、迅速に追加することができない
という問題があった。本発明は、以上の点に着目してな
されたもので、認識対象外の文字が見つかった場合に認
識辞書の作成を待たずに認識の対象に含めたい文字を迅
速に追加できるようにした光学式文字読取装置を提供す
ることを目的とするものである。
【0012】
【課題を解決するための手段】第1発明の光学式文字読
取装置は、光学的に読み取られた文字を認識する文字認
識部と、当該文字認識部が出力し得る各認識対象文字に
対応した追加文字を格納する追加文字テーブルと、前記
文字認識部により認識された文字に対応した追加文字が
前記追加文字テーブルに格納されているときは、当該追
加文字を前記文字認識部により認識された文字に含めて
単語を作成し、単語辞書と照合する単語照合部とから成
ることを特徴とするものである。
取装置は、光学的に読み取られた文字を認識する文字認
識部と、当該文字認識部が出力し得る各認識対象文字に
対応した追加文字を格納する追加文字テーブルと、前記
文字認識部により認識された文字に対応した追加文字が
前記追加文字テーブルに格納されているときは、当該追
加文字を前記文字認識部により認識された文字に含めて
単語を作成し、単語辞書と照合する単語照合部とから成
ることを特徴とするものである。
【0013】第2発明の光学式文字読取装置は、光学的
に読み取られた文字を認識する文字認識部と、当該文字
認識部が出力し得る各認識対象文字に対応した追加文字
を格納するとともに、当該認識対象文字及び追加文字の
使用頻度を格納する追加文字テーブルと、前記文字認識
部により認識された文字に対応した追加文字が前記追加
文字テーブルに格納されているときは、当該追加文字を
前記文字認識部により認識された文字に含めて単語を作
成して単語辞書と照合し、照合された複数の単語のうち
前記使用頻度の高い文字を含む単語を出力する単語照合
部とから成ることを特徴とするものである。
に読み取られた文字を認識する文字認識部と、当該文字
認識部が出力し得る各認識対象文字に対応した追加文字
を格納するとともに、当該認識対象文字及び追加文字の
使用頻度を格納する追加文字テーブルと、前記文字認識
部により認識された文字に対応した追加文字が前記追加
文字テーブルに格納されているときは、当該追加文字を
前記文字認識部により認識された文字に含めて単語を作
成して単語辞書と照合し、照合された複数の単語のうち
前記使用頻度の高い文字を含む単語を出力する単語照合
部とから成ることを特徴とするものである。
【0014】
【作用】本発明の光学式文字読取装置においては、スキ
ャナ部で読み取られた帳票に記載された各文字を文字認
識部で認識する。この際、文字認識部では、スキャナ部
で読み取られた文字イメージを認識辞書に格納された文
字イメージと比較し、最も近似したものを出力する。認
識辞書に認識対象の文字が格納されていないため、表示
部に誤った認識結果が表示されるときは、キーボード等
を介して追加文字テーブルに文字認識結果として出力し
たい文字を追加する。単語照合部では、第1の発明につ
いては、文字認識部の認識結果である文字に対し、追加
文字テーブルに追加された文字があるときは、認識結果
及び追加文字のうち、一般的に使用頻度の高い方の文字
を含む単語を出力する。
ャナ部で読み取られた帳票に記載された各文字を文字認
識部で認識する。この際、文字認識部では、スキャナ部
で読み取られた文字イメージを認識辞書に格納された文
字イメージと比較し、最も近似したものを出力する。認
識辞書に認識対象の文字が格納されていないため、表示
部に誤った認識結果が表示されるときは、キーボード等
を介して追加文字テーブルに文字認識結果として出力し
たい文字を追加する。単語照合部では、第1の発明につ
いては、文字認識部の認識結果である文字に対し、追加
文字テーブルに追加された文字があるときは、認識結果
及び追加文字のうち、一般的に使用頻度の高い方の文字
を含む単語を出力する。
【0015】第2発明では、追加文字テーブルに文字認
識部の認識結果と追加文字との各使用回数を格納してお
く。そして、文字認識部の認識結果である文字に対し、
追加文字テーブルに追加された文字があるときは、単語
照合部で使用回数が多い方の文字を出力する。
識部の認識結果と追加文字との各使用回数を格納してお
く。そして、文字認識部の認識結果である文字に対し、
追加文字テーブルに追加された文字があるときは、単語
照合部で使用回数が多い方の文字を出力する。
【0016】
【実施例】以下、本発明の実施例を図面を参照して詳細
に説明する。 (第1発明)図1は、本発明の光学式文字読取装置の一
実施例のブロック図である。図1において、帳票1は、
スキャナ部2により光学的に読み取られる。帳票1に
は、文字や数字、記号等の読取対象が記載されている。
スキャナ部2は、周知のように、光源、イメージセン
サ、走査装置等から成る。即ち、光源からの光を帳票1
に照射し、帳票1からの反射光をイメージセンサで受け
取る。イメージセンサは、通常はラインセンサから成
り、主走査方向には電気的に走査され、副走査方向には
走査装置により機械的に走査される。
に説明する。 (第1発明)図1は、本発明の光学式文字読取装置の一
実施例のブロック図である。図1において、帳票1は、
スキャナ部2により光学的に読み取られる。帳票1に
は、文字や数字、記号等の読取対象が記載されている。
スキャナ部2は、周知のように、光源、イメージセン
サ、走査装置等から成る。即ち、光源からの光を帳票1
に照射し、帳票1からの反射光をイメージセンサで受け
取る。イメージセンサは、通常はラインセンサから成
り、主走査方向には電気的に走査され、副走査方向には
走査装置により機械的に走査される。
【0017】文字認識部3は、認識対象となる文字の標
準的なイメージを格納した認識辞書を備えている。これ
により、文字認識部3は、スキャナ部2から出力された
イメージデータから1文字毎のイメージを切り出し、そ
の1文字毎のイメージを認識辞書に格納された標準の文
字イメージと比較する。そして、最も近似した文字イメ
ージを捜し出し、その文字イメージに対応して格納され
ている文字コードを認識結果として出力する。この場
合、最も近似したものを第1候補として出力するととも
に、それに続いて近似したものを順次第2、第3候補と
して出力する。単語照合部4は、意味をなす文字の配列
である単語を格納した単語辞書を備えている。また、こ
の単語照合部4は、追加文字テーブル4−1を備えてい
る。
準的なイメージを格納した認識辞書を備えている。これ
により、文字認識部3は、スキャナ部2から出力された
イメージデータから1文字毎のイメージを切り出し、そ
の1文字毎のイメージを認識辞書に格納された標準の文
字イメージと比較する。そして、最も近似した文字イメ
ージを捜し出し、その文字イメージに対応して格納され
ている文字コードを認識結果として出力する。この場
合、最も近似したものを第1候補として出力するととも
に、それに続いて近似したものを順次第2、第3候補と
して出力する。単語照合部4は、意味をなす文字の配列
である単語を格納した単語辞書を備えている。また、こ
の単語照合部4は、追加文字テーブル4−1を備えてい
る。
【0018】図4は、本発明に係る追加文字テーブルの
一例の説明図である。図4に示すように、追加文字テー
ブルには、文字認識部3の認識対象である文字のコード
が格納されている。例えば、「亜」のコード“302
1”、「唖」のコード“3022”、「娃」のコード
“3023”等が格納されている。そして、これらの各
文字コードに対応して追加文字の文字コードを格納する
ことができる。例えば、「娃」のコード“3023”に
対応して「蛙」のコード“333F”を格納することが
できる。また、「邊」のコード“6E34”に対応して
「邉」のコード“6E35”を格納することができる。
この追加文字テーブル4−1により、図示のように追加
文字を追加した場合は、「娃」や「邊」が認識されたと
きに、それぞれ「蛙」や「邉」も同時に認識されたもの
として単語照合を行なう。
一例の説明図である。図4に示すように、追加文字テー
ブルには、文字認識部3の認識対象である文字のコード
が格納されている。例えば、「亜」のコード“302
1”、「唖」のコード“3022”、「娃」のコード
“3023”等が格納されている。そして、これらの各
文字コードに対応して追加文字の文字コードを格納する
ことができる。例えば、「娃」のコード“3023”に
対応して「蛙」のコード“333F”を格納することが
できる。また、「邊」のコード“6E34”に対応して
「邉」のコード“6E35”を格納することができる。
この追加文字テーブル4−1により、図示のように追加
文字を追加した場合は、「娃」や「邊」が認識されたと
きに、それぞれ「蛙」や「邉」も同時に認識されたもの
として単語照合を行なう。
【0019】これにより、単語照合部4は、文字認識部
3により認識された複数の文字及び追加文字テーブルに
格納された追加文字を各候補文字とし、これらの候補文
字を組み合せて複数の候補単語を作成する。そして、そ
れらの候補単語のうちから単語辞書に格納された単語と
一致する1つの単語を選択して出力する。尚、追加文字
テーブル4−1は、図1に示すように単語照合部4内に
設ける場合に限らず、文字認識部3内に設けるようにし
てもよく、また、文字認識部3と単語照合部4との間に
設けるようにしてもよい。
3により認識された複数の文字及び追加文字テーブルに
格納された追加文字を各候補文字とし、これらの候補文
字を組み合せて複数の候補単語を作成する。そして、そ
れらの候補単語のうちから単語辞書に格納された単語と
一致する1つの単語を選択して出力する。尚、追加文字
テーブル4−1は、図1に示すように単語照合部4内に
設ける場合に限らず、文字認識部3内に設けるようにし
てもよく、また、文字認識部3と単語照合部4との間に
設けるようにしてもよい。
【0020】制御部5は、スキャナ部2、文字認識部
3、及び単語照合部4の各動作を制御し、単語照合部4
で照合された文字を表示部6に表示する制御を行なう。
表示部6は、CRT又は液晶表示装置等から成り、単語
照合部4で照合された文字を表示するとともに、キーボ
ード部7から入力された文字を表示する。キーボード部
7は、オペレータにより文字認識の指示操作及び追加文
字テーブル4−1への文字コードの追加を行なうための
ものである。
3、及び単語照合部4の各動作を制御し、単語照合部4
で照合された文字を表示部6に表示する制御を行なう。
表示部6は、CRT又は液晶表示装置等から成り、単語
照合部4で照合された文字を表示するとともに、キーボ
ード部7から入力された文字を表示する。キーボード部
7は、オペレータにより文字認識の指示操作及び追加文
字テーブル4−1への文字コードの追加を行なうための
ものである。
【0021】図5は、本発明に係る文字認識手順の説明
図である。この図5により、具体的な文字認識の例につ
いて説明する。図5の例では、帳票1に書かれた「渡
邉」という文字(姓)を認識する。ここで、「渡」は、
文字認識部3の認識対象の文字であるが、「邉」は、そ
のような認識対象の文字ではなく、認識辞書に含まれて
いないとする。図5(a)に示すように、帳票1の文字
フィールドの各文字枠内に「渡」及び「邉」の各文字が
手書き等により記入されている。これらの文字は、文字
認識部3により図5(b)に示すように認識される。
図である。この図5により、具体的な文字認識の例につ
いて説明する。図5の例では、帳票1に書かれた「渡
邉」という文字(姓)を認識する。ここで、「渡」は、
文字認識部3の認識対象の文字であるが、「邉」は、そ
のような認識対象の文字ではなく、認識辞書に含まれて
いないとする。図5(a)に示すように、帳票1の文字
フィールドの各文字枠内に「渡」及び「邉」の各文字が
手書き等により記入されている。これらの文字は、文字
認識部3により図5(b)に示すように認識される。
【0022】図5(b)に示すように、「渡」の文字に
ついての認識結果としては、第1候補として「漢」、第
2候補として「渡」、第3候補として「涯」がそれぞれ
出力される。一方、「邉」の文字についての認識結果と
しては、第1候補として「邊」、第2候補として
「還」、第3候補として「達」がそれぞれ出力される。
このように、「邉」の文字は、文字候補として挙がって
こない。即ち、「邉」の文字をいかに丁寧に書いたとし
ても、文字認識部3の認識辞書に「邉」が含まれていな
いので、文字候補として挙がることはなく、必ず「邉」
以外の文字が挙がる。この結果、追加文字テーブルに
「邉」を格納していない初期状態では、従来と同様に
「渡邊」が文字認識結果となり、これが表示部6に表示
される。
ついての認識結果としては、第1候補として「漢」、第
2候補として「渡」、第3候補として「涯」がそれぞれ
出力される。一方、「邉」の文字についての認識結果と
しては、第1候補として「邊」、第2候補として
「還」、第3候補として「達」がそれぞれ出力される。
このように、「邉」の文字は、文字候補として挙がって
こない。即ち、「邉」の文字をいかに丁寧に書いたとし
ても、文字認識部3の認識辞書に「邉」が含まれていな
いので、文字候補として挙がることはなく、必ず「邉」
以外の文字が挙がる。この結果、追加文字テーブルに
「邉」を格納していない初期状態では、従来と同様に
「渡邊」が文字認識結果となり、これが表示部6に表示
される。
【0023】オペレータが図6に示すような表示部6の
表示を見て誤認識に気付くと、キーボード部7により誤
読された文字「邊」の部分にカーソル61を設定する。
そして、従来と同様に「邊」の部分を「邉」に修正する
ことができる。オペレータが追加文字テーブルに「邉」
を追加したいときは、所定のコマンドを入力することに
より図4に示す追加文字テーブルを表示部6に表示させ
る。そして、キーボード部7により「邊」の追加文字と
して「邊」をかな漢字変換又はコード入力により入力す
る。尚、オペレータが文字認識の結果の「邊」の部分を
「邉」に修正するに伴ない、追加文字テーブルの「邊」
の追加文字の欄に自動的に「邉」を追加することも可能
である。この結果、次回の文字認識では、図5(c)に
示すように、これらの候補文字を組み合わせて合計12
個の候補単語が作成される。この場合の追加文字テーブ
ルの使用手順を詳細に説明すると、以下のようになる。
表示を見て誤認識に気付くと、キーボード部7により誤
読された文字「邊」の部分にカーソル61を設定する。
そして、従来と同様に「邊」の部分を「邉」に修正する
ことができる。オペレータが追加文字テーブルに「邉」
を追加したいときは、所定のコマンドを入力することに
より図4に示す追加文字テーブルを表示部6に表示させ
る。そして、キーボード部7により「邊」の追加文字と
して「邊」をかな漢字変換又はコード入力により入力す
る。尚、オペレータが文字認識の結果の「邊」の部分を
「邉」に修正するに伴ない、追加文字テーブルの「邊」
の追加文字の欄に自動的に「邉」を追加することも可能
である。この結果、次回の文字認識では、図5(c)に
示すように、これらの候補文字を組み合わせて合計12
個の候補単語が作成される。この場合の追加文字テーブ
ルの使用手順を詳細に説明すると、以下のようになる。
【0024】単語照合部4では、まず、一番目の認識文
字「渡」について、文字認識部3で挙げられた候補文字
「漢」、「渡」、「涯」のコード“3441”、“45
4F”、“3336”を、図4に示す追加文字テーブル
の認識対象文字の各コードと比較する。そして、一致し
たコードに対応する追加文字の欄にコードが格納されて
いるときは、これを候補文字に追加する。例えば、コー
ド“3441”の「漢」に対応する追加文字の欄は、空
白となっているので、この候補文字に追加される文字は
ない。同様に、コード“454F”、“3336”の
「渡」、「涯」に対応する追加文字の欄も、空白となっ
ているので、これらの候補文字に追加される文字はな
い。
字「渡」について、文字認識部3で挙げられた候補文字
「漢」、「渡」、「涯」のコード“3441”、“45
4F”、“3336”を、図4に示す追加文字テーブル
の認識対象文字の各コードと比較する。そして、一致し
たコードに対応する追加文字の欄にコードが格納されて
いるときは、これを候補文字に追加する。例えば、コー
ド“3441”の「漢」に対応する追加文字の欄は、空
白となっているので、この候補文字に追加される文字は
ない。同様に、コード“454F”、“3336”の
「渡」、「涯」に対応する追加文字の欄も、空白となっ
ているので、これらの候補文字に追加される文字はな
い。
【0025】次に、二番目の認識文字「邉」について、
文字認識部3で挙げられた候補文字「邊」、「還」、
「達」のコード“6E34”、“3454”、“432
3”を、図4に示す追加文字テーブルの認識対象文字の
各コードと比較する。そして、一致したコードに対応す
る追加文字の欄にコードが格納されているときは、これ
を候補文字に追加する。例えば、コード“6E34”の
「邊」に対応する追加文字の欄には、コード“6E3
5”が格納されているので、このコードの文字「邉」が
候補文字に追加される。一方、コード“3454”、
“4323”の「還」、「達」に対応する追加文字の欄
は、空白となっているので、これらの候補文字に追加さ
れる文字はない。以上のようにして第1候補から第3候
補までの各候補文字が挙げられる。
文字認識部3で挙げられた候補文字「邊」、「還」、
「達」のコード“6E34”、“3454”、“432
3”を、図4に示す追加文字テーブルの認識対象文字の
各コードと比較する。そして、一致したコードに対応す
る追加文字の欄にコードが格納されているときは、これ
を候補文字に追加する。例えば、コード“6E34”の
「邊」に対応する追加文字の欄には、コード“6E3
5”が格納されているので、このコードの文字「邉」が
候補文字に追加される。一方、コード“3454”、
“4323”の「還」、「達」に対応する追加文字の欄
は、空白となっているので、これらの候補文字に追加さ
れる文字はない。以上のようにして第1候補から第3候
補までの各候補文字が挙げられる。
【0026】図5(c)に示すように、「渡」及び
「邉」についての第1候補から第3候補までの各候補文
字の組合せは、追加文字が1つ追加された結果、全部で
12通りとなる。ところが、これらのすべてが姓をなす
のではない。図5(d)に示すように、単語照合部4の
単語辞書内には、姓をなす単語が格納されている。例え
ば、「渡辺」、「渡部」、「渡邊」、「渡邉」、「安
達」、「田邉」等が格納されている。これらの姓をなす
単語のうち、「渡邊」及び「渡邉」のみが図5(c)で
挙げられた候補単語に一致するので、文字認識結果とし
て「渡邊」及び「渡邉」が出力される。図5(d)に示
す単語辞書には、「渡邊」及び「渡邉」のうち、いずれ
が姓として一般的に用いられるかについての情報が記憶
されており、この情報により選択される単語が表示部6
に表示される。例えば、「渡邊」及び「渡邉」のうち
「渡邉」の方が一般的であるときは、「渡邉」が表示部
6に表示される。
「邉」についての第1候補から第3候補までの各候補文
字の組合せは、追加文字が1つ追加された結果、全部で
12通りとなる。ところが、これらのすべてが姓をなす
のではない。図5(d)に示すように、単語照合部4の
単語辞書内には、姓をなす単語が格納されている。例え
ば、「渡辺」、「渡部」、「渡邊」、「渡邉」、「安
達」、「田邉」等が格納されている。これらの姓をなす
単語のうち、「渡邊」及び「渡邉」のみが図5(c)で
挙げられた候補単語に一致するので、文字認識結果とし
て「渡邊」及び「渡邉」が出力される。図5(d)に示
す単語辞書には、「渡邊」及び「渡邉」のうち、いずれ
が姓として一般的に用いられるかについての情報が記憶
されており、この情報により選択される単語が表示部6
に表示される。例えば、「渡邊」及び「渡邉」のうち
「渡邉」の方が一般的であるときは、「渡邉」が表示部
6に表示される。
【0027】以上のようにして、文字認識部3で「邉」
という文字を認識することができない場合でも、「渡
邉」という正しい認識結果を得て、その結果を表示部6
に表示することができる。従って、オペレータの修正作
業は不要となる。
という文字を認識することができない場合でも、「渡
邉」という正しい認識結果を得て、その結果を表示部6
に表示することができる。従って、オペレータの修正作
業は不要となる。
【0028】(第2発明)第2発明では、図4に示す追
加文字テーブルの代わりに以下のような追加文字テーブ
ルを用いる。図7に、本発明に係る追加文字テーブルの
他の例の説明図を示す。図7に示す追加文字テーブルで
は、文字認識部3の認識対象文字の文字コード及び追加
文字の文字コードにそれぞれ頻度の情報を格納する。こ
の頻度の情報は、例えば、認識対象文字及び追加文字の
使用回数である。この使用回数は、文字認識の結果の出
力の都度、出力した文字の使用回数について“1”を加
算する。
加文字テーブルの代わりに以下のような追加文字テーブ
ルを用いる。図7に、本発明に係る追加文字テーブルの
他の例の説明図を示す。図7に示す追加文字テーブルで
は、文字認識部3の認識対象文字の文字コード及び追加
文字の文字コードにそれぞれ頻度の情報を格納する。こ
の頻度の情報は、例えば、認識対象文字及び追加文字の
使用回数である。この使用回数は、文字認識の結果の出
力の都度、出力した文字の使用回数について“1”を加
算する。
【0029】即ち、第2発明によれば、単語照合部4で
追加文字テーブル4−1に格納された使用回数(頻度)
を参照してこの使用回数が多い方の文字を出力する。こ
れにより、例えば、「渡邊」と「渡邉」のうち、一般的
に使用頻度の高い方の文字というだけでなく、現時点で
使用頻度の高い方の文字を出力することができる。以上
のようにして、文字認識率の向上を図ることができ、オ
ペレータの修正作業を極力抑えることができる。
追加文字テーブル4−1に格納された使用回数(頻度)
を参照してこの使用回数が多い方の文字を出力する。こ
れにより、例えば、「渡邊」と「渡邉」のうち、一般的
に使用頻度の高い方の文字というだけでなく、現時点で
使用頻度の高い方の文字を出力することができる。以上
のようにして、文字認識率の向上を図ることができ、オ
ペレータの修正作業を極力抑えることができる。
【0030】尚、上述した実施例においては、追加文字
テーブルへの文字の追加をキーボード等により入力して
行なう場合について説明したが、本発明はこれに限定さ
れるものではなく、フロッピディスク等を交換すること
により行なうようにしてもよい。また、漢字について認
識する場合について説明したが、英字、カタカナ、平仮
名、記号等、言語、文字、図形を問わずいずれの認識を
行なう場合にも適用することができることはいうまでも
ない。
テーブルへの文字の追加をキーボード等により入力して
行なう場合について説明したが、本発明はこれに限定さ
れるものではなく、フロッピディスク等を交換すること
により行なうようにしてもよい。また、漢字について認
識する場合について説明したが、英字、カタカナ、平仮
名、記号等、言語、文字、図形を問わずいずれの認識を
行なう場合にも適用することができることはいうまでも
ない。
【0031】
【発明の効果】以上説明したように、本発明の光学式文
字読取装置によれば、文字認識部で認識された文字とと
もに、追加文字テーブルに追加された文字を出力できる
ようにしたので、次のような効果がある。 (1)認識対象外の文字が見つかった場合に認識辞書の
作成を待たずに認識の対象に含めたい文字を迅速に追加
することができ、文字認識率の向上を図ることができ
る。 (2)追加文字テーブルに認識対象の文字と追加文字と
の使用回数を格納しておくことにより、現時点で使用頻
度が高い方の文字を出力することができる。
字読取装置によれば、文字認識部で認識された文字とと
もに、追加文字テーブルに追加された文字を出力できる
ようにしたので、次のような効果がある。 (1)認識対象外の文字が見つかった場合に認識辞書の
作成を待たずに認識の対象に含めたい文字を迅速に追加
することができ、文字認識率の向上を図ることができ
る。 (2)追加文字テーブルに認識対象の文字と追加文字と
の使用回数を格納しておくことにより、現時点で使用頻
度が高い方の文字を出力することができる。
【図1】本発明の光学式文字読取装置の一実施例のブロ
ック図である。
ック図である。
【図2】従来の光学式文字読取装置の一例を示すブロッ
ク図である。
ク図である。
【図3】従来の文字認識手順の説明図である。
【図4】本発明に係る追加文字テーブルの一例の説明図
である。
である。
【図5】本発明に係る文字認識手順の説明図である。
【図6】表示部の表示例の説明図である。
【図7】本発明に係る追加文字テーブルの他の例の説明
図である。
図である。
1 帳票 2 スキャナ 3 文字認識部 4 単語照合部 4−1 追加文字テーブル 5 制御部 6 表示部 7 キーボード部
Claims (2)
- 【請求項1】 光学的に読み取られた文字を認識する文
字認識部と、 当該文字認識部が出力し得る各認識対象文字に対応した
追加文字を格納する追加文字テーブルと、 前記文字認識部により認識された文字に対応した追加文
字が前記追加文字テーブルに格納されているときは、当
該追加文字を前記文字認識部により認識された文字に含
めて単語を作成し、単語辞書と照合する単語照合部とか
ら成ることを特徴とする光学式文字読取装置。 - 【請求項2】 光学的に読み取られた文字を認識する文
字認識部と、 当該文字認識部が出力し得る各認識対象文字に対応した
追加文字を格納するとともに、当該認識対象文字及び追
加文字の使用頻度を格納する追加文字テーブルと、 前記文字認識部により認識された文字に対応した追加文
字が前記追加文字テーブルに格納されているときは、当
該追加文字を前記文字認識部により認識された文字に含
めて単語を作成して単語辞書と照合し、照合された複数
の単語のうち前記使用頻度の高い文字を含む単語を出力
する単語照合部とから成ることを特徴とする光学式文字
読取装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5146955A JPH06333083A (ja) | 1993-05-26 | 1993-05-26 | 光学式文字読取装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5146955A JPH06333083A (ja) | 1993-05-26 | 1993-05-26 | 光学式文字読取装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH06333083A true JPH06333083A (ja) | 1994-12-02 |
Family
ID=15419363
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5146955A Pending JPH06333083A (ja) | 1993-05-26 | 1993-05-26 | 光学式文字読取装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH06333083A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002042057A (ja) * | 2000-07-21 | 2002-02-08 | Toshiba Corp | 読取装置、読取方法、区分装置、及び区分方法 |
JP2010067179A (ja) * | 2008-09-12 | 2010-03-25 | Casio Comput Co Ltd | 辞書機能を備えた電子機器およびプログラム |
JP2015045984A (ja) * | 2013-08-28 | 2015-03-12 | 富士通株式会社 | 情報処理装置、文字認識方法、及びプログラム |
-
1993
- 1993-05-26 JP JP5146955A patent/JPH06333083A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002042057A (ja) * | 2000-07-21 | 2002-02-08 | Toshiba Corp | 読取装置、読取方法、区分装置、及び区分方法 |
JP2010067179A (ja) * | 2008-09-12 | 2010-03-25 | Casio Comput Co Ltd | 辞書機能を備えた電子機器およびプログラム |
JP2015045984A (ja) * | 2013-08-28 | 2015-03-12 | 富士通株式会社 | 情報処理装置、文字認識方法、及びプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5022081A (en) | Information recognition system | |
EP1365349B1 (en) | Natural input recognition tool | |
US5233672A (en) | Character reader and recognizer with a specialized editing function | |
JPH06333083A (ja) | 光学式文字読取装置 | |
JP3979288B2 (ja) | 文書検索装置および文書検索プログラム | |
JP3457376B2 (ja) | 光学式読み取り装置における文字修正方法 | |
JP3782467B2 (ja) | 文字入力方法及び装置 | |
JP2004046388A (ja) | 情報処理システムおよび文字修正方法 | |
JPS60217483A (ja) | 文字認識装置 | |
JPH06223221A (ja) | 文字認識装置 | |
JPH06290308A (ja) | 文字認識装置 | |
JP2829186B2 (ja) | 光学的文字読取装置 | |
JPH05120472A (ja) | 文字認識装置 | |
JPH06251187A (ja) | 文字認識誤り修正方法及び装置 | |
JPH09231310A (ja) | 情報処理装置 | |
JPH11120294A (ja) | 文字認識装置および媒体 | |
JPH05120471A (ja) | 文字認識装置 | |
JPH053631B2 (ja) | ||
JPH09138835A (ja) | 文字認識装置 | |
JPH04293185A (ja) | ファイリング装置 | |
JPH11282965A (ja) | 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
JPH0458381A (ja) | 光学的文字読取装置 | |
JPH11143993A (ja) | 認識文字修正装置およびその方法 | |
JPH08202811A (ja) | 文字読取装置 | |
JPS61226883A (ja) | 文字認識装置 |