JPH0981684A - パターン認識装置及び文字切り出し方式 - Google Patents
パターン認識装置及び文字切り出し方式Info
- Publication number
- JPH0981684A JPH0981684A JP7234982A JP23498295A JPH0981684A JP H0981684 A JPH0981684 A JP H0981684A JP 7234982 A JP7234982 A JP 7234982A JP 23498295 A JP23498295 A JP 23498295A JP H0981684 A JPH0981684 A JP H0981684A
- Authority
- JP
- Japan
- Prior art keywords
- pattern
- character
- cutout
- reliability
- circumscribing rectangle
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000005520 cutting process Methods 0.000 title claims description 95
- 238000000034 method Methods 0.000 title claims description 73
- 238000003909 pattern recognition Methods 0.000 title claims description 12
- 238000012545 processing Methods 0.000 claims abstract description 90
- 238000004364 calculation method Methods 0.000 claims abstract description 55
- 238000000605 extraction Methods 0.000 claims abstract description 29
- 230000011218 segmentation Effects 0.000 claims abstract description 22
- 238000001514 detection method Methods 0.000 claims abstract description 8
- 238000009826 distribution Methods 0.000 claims description 119
- 230000010354 integration Effects 0.000 claims description 13
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000000630 rising effect Effects 0.000 claims description 8
- 239000006185 dispersion Substances 0.000 claims description 3
- 230000005484 gravity Effects 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 238000000513 principal component analysis Methods 0.000 claims 3
- 238000011002 quantification Methods 0.000 claims 2
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 238000003786 synthesis reaction Methods 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 13
- 238000002372 labelling Methods 0.000 description 9
- 230000006870 function Effects 0.000 description 7
- 239000000284 extract Substances 0.000 description 5
- 239000007787 solid Substances 0.000 description 3
- 238000012937 correction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000000491 multivariate analysis Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012847 principal component analysis method Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
速度を向上させる。 【解決手段】 連結パターン抽出手段1により入力パタ
ーンから連結パターンを求め、分離文字検出部2及び濁
点検出部3により分離文字や濁点を抽出し、統計的信頼
度算出部5及び非統計的信頼度算出部6により切り出し
文字の切り出し信頼度を求め、認識信頼度算出手段8に
より切り出し文字の認識信頼度を求め、切り出し決定手
段9により切り出し信頼度と認識信頼度とを統合して切
り出し文字を決定する。
Description
及び文字切り出し方式に関し、手書き用文字認識装置、
印刷文字認識装置、図面認識における文字の切り出し装
置などにおける、フリーピッチ領域の文字のセグメンテ
ーションに適用して好適なものである。
手書き文字認識装置OCRの需要が増加している。そし
て、個々の文字の高い認識率を実現するためには、文字
認識の前段階である文字の切り出し処理が文字認識を正
確に行う際に重要になる。これまで、帳票などの文書に
対して、1文字ずつ分離されて書かれた文字については
かなり高い確率で文字を自動認識することができた。
平6−348896号公報に記載されているように、文
字を構成する部分パターンの位置、傾き、サイズなどの
特性値に基づいて、部分パターンをその左右のパターン
に統合するようにしていた。すなわち、文字を構成する
部分パターンの位置、傾き、サイズなどの特性値と予め
設定したそれぞれの特性値に対する閾値とを比較し、そ
の比較結果に基づいて統合判定処理を行っていた。
点や分離文字などを構成するパターンを検出し、文字な
どを構成するパターンの位置、傾き、サイズ、隣接する
パターンとの距離などの特性値に基づいて、濁点や分離
文字などを構成するパターンを統合する方法も行われて
いた。
ピッチ領域に書かれる手書きの文字列の場合、文字と文
字の間隔が均等でなかったり、文字サイズが一定でない
場合が頻繁に起こる。そして、この文字枠のないフリー
ピッチ領域に書かれた文字列については、1文字ずつ正
確に切り出す技術が確立していないために認識率の低下
するという問題があった。
置、傾き、サイズなどの特性値の閾値の設定を、経験的
知識を用いてヒューリスティクに行っていたため、その
閾値が妥当かどうかを客観的に判断することが困難であ
った。また、部分パターンをその左右のパターンに統合
する際に用いる特性値が、文字の切り出しに有効かどう
かの判断も困難であった。
切り出しの修正を行う方法が欠落していたため、一度切
り出しを誤ると文字認識も必然的に誤るという問題もあ
った。
出し精度及び切り出し処理の速度を向上させることがで
きるパターン認識装置及び文字切り出し方式を提供する
ことである。
ために、請求項1の発明によれば、パターンの特徴を示
す複数の特性値を、互いに無相関ないくつかの総合特性
値に合成し、この総合特性値に基づいて、切り出しパタ
ーンを決定する。このことにより、ヒューリスティック
に選んだ複数の特性値に基づいて、切り出しパターンの
決定に最も適した新たな特性値を統計的に得ることがで
き、この統計的に得られる新たな特性値を用いてパター
ンの切り出しを行うことにより、パターンの切り出し精
度を向上することができる。
失が最小になるように複数の特性値を合成する。このこ
とにより、パターンの切り出し精度を向上することがで
きる。
性値の線形結合の持つ分散を最大とするように合成す
る。このことにより、パターンの切り出し精度を向上す
ることができる。
の特徴を示す複数の特性値からなるサンプルデータを、
切り出し成功を示す第1の群と切り出し失敗を示す第2
の群とに分類し、前記第1の群と前記第2の群の各重心
から等距離となるように構成された判別関数に基づい
て、切り出しパターンを決定する。このことにより、切
り出しを行うパターンの特性値を判別関数に代入するだ
けで、切り出し成功であるか切り出し失敗であるかを統
計的に決定することができ、パターンの切り出しを精度
良く、且つ、高速に行うことができる。
の特徴を示す複数の特性値からなるサンプルデータを、
切り出し成功を示す第1の群と切り出し失敗を示す第2
の群とに分類し、前記第1の群と前記第2の群との間の
群間変動の群内変動に対する比を最大にするように特性
値の線形結合を求め、この特性値の線形結合に基づい
て、切り出しパターンを決定する。このことにより、切
り出し成功であるか切り出し失敗であるかの決定を簡単
な演算により統計的に行うことができ、パターンの切り
出しを精度良く、且つ、高速に行うことができる。
ての切り出し位置の確からしさを示す切り出し信頼度に
基づいて、連結パターンを統合する。このことにより、
文字の書かれた状態に応じて、切り出し信頼度を調節す
ることができ、文字の切り出し精度を向上することがで
きる。
り出しの確からしさを示す切り出し信頼度に基づいて、
文字認識を行うかどうかを決定する。このことにより、
切り出し信頼度の高い部分は文字認識を行わずに切り出
し文字として確定し、切り出し信頼度の低い部分につい
てのみ文字認識を行って切り出し文字を確定することが
でき、文字の切り出し速度を向上できる。
り出しの確からしさを示す切り出し信頼度と文字として
の認識信頼度とに基づいて、切り出し文字を決定する。
このことにより、その文字単独の特徴のみだけでなく、
その文字の文字列全体に対する位置関係なども考慮する
ことができ、文字の切り出し精度を向上することができ
る。
状を有するパターンに対する処理を分けて行う。このこ
とにより、所定の形状を有するパターンに対しては、そ
のパターン独自の最適な処理を用いることができ、文字
の切り出し精度を向上することができる。
外接矩形と第1の外接矩形の右隣に隣接する第2の外接
矩形とを選択し、第1の外接矩形の右枠と第2の外接矩
形の左枠との距離、第1の外接矩形の左枠と第2の外接
矩形の右枠との距離、第1の外接矩形の右枠と第2の外
接矩形の左枠との距離と第1の外接矩形の左枠と第2の
外接矩形の右枠との距離との比、第1の外接矩形の左枠
と第2の外接矩形の右枠との距離と外接矩形平均幅との
比、第1の外接矩形の下枠と第1の外接矩形の下枠の中
点から第2の外接矩形の下枠の中点へ至る直線とのなす
角度、第1の外接矩形の下枠と第1の外接矩形の右下の
頂点から第2の外接矩形の左下の頂点へ至る直線とのな
す角度、第1の外接矩形と第2の外接矩形とが重なって
いる場合、第1の外接矩形の右枠と第2の外接矩形の左
枠との距離と第1の外接矩形の左枠と第2の外接矩形の
右枠との距離との比に基づいて、パラメータを算出す
る。このことにより、切り出し文字の特徴を精度良く抽
出することができる。
字の処理と濁点処理とを分けて行う。分離文字と濁点と
を精度良く抽出することができ、文字の切り出し精度を
向上することができる。
りとなっている第1パターン、第1パターンの右隣に隣
接し、右下がりとなっている第2パターン、第1パター
ンの右隣に隣接し、直角方向に線密度を探索した場合に
交差する回数が2となる第3パターンを検出し、第1パ
ターンの外接矩形の右枠と第2パターン又は第3パター
ンの外接矩形の左枠との距離と第1パターンの外接矩形
の左枠と第2パターン又は第3パターンの外接矩形の右
枠との距離との比、第1パターンの外接矩形の左枠と第
2パターン又は第3パターンの外接矩形の右枠との距離
と外接矩形平均幅との比、第1パターンの外接矩形の面
積と第2パターン又は第3パターンの外接矩形の面積と
の積と外接矩形平均幅と外接矩形平均高さとの積の平方
との比に基づいて、パラメータを算出する。このことに
より、分離文字の特徴を精度良く抽出することができ
る。
補となる第1パターン、第1パターンの左隣に隣接する
第2のパターンを検出し、第1パターンの外接矩形の右
枠と第2パターンの外接矩形の左枠との距離と第1パタ
ーンの外接矩形の左枠と第2パターンの外接矩形の右枠
との距離との比、第1パターンの外接矩形の左枠と第2
パターンの外接矩形の右枠との距離と外接矩形平均幅と
の比、第1パターンの外接矩形の面積と第2パターンの
外接矩形の面積との積と外接矩形平均幅と外接矩形平均
高さとの積の平方との比に基づいて、パラメータを算出
する。このことにより、濁点候補パターンの識別を精度
良く行うことができる。
ンの特徴を示すP個の特性値からなるサンプルデータ
を、切り出し成功を示す第1の群と切り出し失敗を示す
第2の群とに分類し、第1の群と第2の群との判別面を
P次元空間において生成し、その判別面に対するP個の
特性値の位置に基づいて、切り出し文字の切り出し信頼
度を算出する。このことにより、切り出しを行う文字の
特性値が、P次元空間内の判別面に対してどの位置に存
在するかを判別するだけで、切り出し成功であるか切り
出し失敗であるかを決定することができ、文字の切り出
しを高速に行うことができる。
を判別分析法により求める。このことにより、切り出し
成功であるか切り出し失敗であるかを決定する判別面を
統計的に求めることができ、切り出し信頼度の精度を高
めることができるので、文字の切り出しを精度良く、且
つ、高速に行うことができる。
特性値のP次元空間における分布形状に基づいて、判別
面の算出方法を複数個使い分けるようにしている。この
ことにより、分布形状毎に最適な判別面を生成すること
ができ、文字の切り出しを精度を向上できる。
群と第2の群との主軸のなす角が所定の角度以上である
場合、主軸に対するサンプルデータのばらつきの大きい
方の群の垂直方向に判別面を算出し、主軸のなす角が所
定の角度以上でない場合、判別分析法により判別面を算
出する。このことにより、文字の切り出しを精度を向上
できる。
からのP個の特性値の距離に基づいて、切り出し文字の
切り出し信頼度を算出する。このことにより、文字の切
り出しを高速に行うことができる。
からの距離に基づいてP個の特性値からなるサンプルデ
ータの度数分布を生成し、第1の群に対応して生成され
た度数分布と第2の群に対応して生成された度数分布と
の重なり領域を算出し、P個の特性値の重なり領域から
の距離と度数分布の分散値とに基づいて切り出し信頼度
を算出する。このことにより、度数分布を正規分布に近
似して重なり領域を算出することができ、特性値の数が
少ない場合でも精度よく重なり領域を算出することがで
きるので、文字の切り出しを精度良く行うことができ
る。
布の正規分布に対する適合度及び度数分布の分散値に基
づいて重なり領域を算出する。このことにより、度数分
布の正規分布に対する誤差を考慮して重なり領域を算出
することができ、特性値の数が少ない場合でも適応的に
重なり領域を算出することができる。
布の平均値と分散値とを算出し、その度数分布の平均値
と分散値とに基づいて正規分布を生成し、度数分布と正
規分布との2乗誤差の総和と正規分布の面積との比に基
づいて適合度を算出し、適合度と分散値の平方根との積
に基づいて度数分布の両端位置を求めて重なり領域を算
出する。このことにより、度数分布の正規分布に対する
誤差を考慮して重なり領域を算出することができ、特性
値の数が少ない場合でも適応的に重なり領域を算出する
ことができる。
ンの特徴を示すP個の特性値が度数分布の重なり領域に
含まれる場合、P個の特性値の位置に基づいて切り出し
信頼度を算出し、P個の特性値が度数分布の切り出し成
功を示す領域に含まれる場合、切り出し信頼度を100
%と判定し、P個の特性値が度数分布の切り出し失敗を
示す領域に含まれる場合、切り出し信頼度を0%と判定
する。このことにより、より精度の高い文字の切り出し
を行うことができる。
ターン認識装置について図面を参照しながら説明する。
このパターン認識装置は、文字の切り出しに用いる特性
値としてのパラメータについて、文字の統合判定を行う
の際の閾値をヒューリスティクに決定するのではなく、
統計的に妥当な値を設定するようにしたものである。具
体的には、各パラメータ毎に、パラメータ値とそのパラ
メータ値に対する文字の統合の成功又は失敗に関する統
計データをとる。そして、各パラメータを個別に評価す
るのではなく、全てのパラメータを多次元空間上の1点
として捉え、多変量解析の手法を用いて、統合が成功し
た場合と統合が失敗した場合との2群を分離する判別面
を上記多次元空間内で求めるようにする。
認識装置の構成を示すブロック図である。図1におい
て、連結パターン抽出手段1は、入力パターンから連結
パターンをラベリングにより求める。
段1により抽出された連結パターンから“ハ”や“ル”
などの分離文字を検出する。濁点検出部3は、連結パタ
ーン抽出手段1により抽出された連結パターンから濁点
を検出する。
ン抽出手段1により抽出された連結パターンを統合して
切り出し文字の複数の候補を生成し、生成した各候補に
ついて切り出しの確からしさを示す切り出し信頼度を算
出する。
信頼度算出部5及び非統計的信頼度算出部6を備えてい
る。統計的信頼度算出部5は、連結パターン抽出手段1
により求められた連結パターンに対する統計的処理にお
いて用いられる切り出しパラメータに基づいて、切り出
しの確からしさを示す切り出し信頼度を算出する。この
統計的処理では、連結パターンの外接矩形の位置、縦横
比、平均文字サイズに対するサイズ比、隣接する連結パ
ターン同士の距離、隣接する連結パターンを統合したと
きのサイズ、隣接する連結パターン同士の重なり幅、文
字列の粗密度などを切り出しパラメータとして用いる。
に対する非統計的処理において用いられる切り出しパラ
メータに基づいて、切り出しの確からしさを示す切り出
し信頼度を算出する。この非統計的処理では、分離文字
や濁点などのような特殊な形状のパターンが処理の対象
となる。濁点処理では、濁点候補パターンに着目し、そ
のパターンとそれの隣接パターンとを統合したときのサ
イズ、これら両パターン間の距離、及びそれらのパター
ンと平均文字サイズとの比などを切り出しパターンとし
て用いる。また、分離文字に対する処理では、連結パタ
ーンの傾き、連結パターンの線密度、隣接する連結パタ
ーン同士を統合したときのサイズ、隣接する連結パター
ン同士の距離などを切り出しパラメータとして用いる。
統計的信頼度算出部5及び非統計的信頼度算出部6
は、それぞれ判別面生成部5a、6a、度数分布生成部
5b、6b、重なり領域算出部5c、6c、切り出し信
頼度算出部5d、6dを備えている。
徴を示すP個の特性値からなるサンプルデータを、切り
出し成功を示す第1の群と切り出し失敗を示す第2の群
とに分類し、第1の群と第2の群との判別面をP次元空
間において生成するものである。
求めることができる。すなわち、判別面を線形な判別関
数により構成する場合、その判別関数の係数ベクトル
は、 Σ-1(μ1 −μ2 ) ・・・(1) で与えられる。
記第1の群と前記第2の群の各重心から等距離となるよ
うに構成される。なお、この判別関数の係数ベクトル
は、第1の群と第2の群との間の群間変動の群内変動に
対する比を最大にするという基準に基づいて、算出する
こともできる。
部5a、6aで生成された判別面からの距離に基づい
て、P個の特性値からなるサンプルデータの度数分布を
生成する。
生成部5b、6bにより生成された第1の群の度数分布
と第2の群の度数分布との重なり領域を算出する。切り
出し信頼度算出部5d、6dは、連結パターン抽出手段
1により抽出された連結パターンを統合して生成された
切り出し文字の候補に対し、そのP個の特性値が、重な
り領域算出部5c、6cにより算出された重なり領域に
含まれる場合、重なり領域におけるP個の特性値の位置
に基づいて、切り出し信頼度を算出する。切り出し文字
の候補のP個の特性値が重なり領域に含まれず、且つ、
第1の群の度数分布に含まれる場合、切り出し信頼度を
100%と判定する。切り出し文字の候補のP個の特性
値が重なり領域に含まれず、且つ、第2の群の度数分布
に含まれる場合、切り出し信頼度を0%と判定する。
で求めた切り出し信頼度及び非統計的信頼度算出部6で
求めた切り出し信頼度を統合する。認識信頼度算出手段
8は、連結パターン抽出手段1により抽出された連結パ
ターンを統合して生成された切り出し文字の候補に対
し、認識処理を行う。
出手段4で算出した切り出し信頼度と認識信頼度算出手
段8で算出した認識信頼度とを統合し、その統合した信
頼度が最も大きい切り出し文字の候補を選択して切り出
し文字を決定する。
識装置の動作について説明する。図2は、本発明の一実
施例によるパターン認識装置の処理の流れを示すフロー
チャートである。この処理は、個々の文字サイズの変動
や文字間隔の変動のある手書き文字列から1文字ずつを
切り出すものである。なお、ここで対象となるパターン
は、極端な傾きや回転の補正を行い、雑音を除去し、か
すれの穴埋め等の前処理を行った後の2値画像である。
また文字同士のオーバーハングはあっても、文字同士の
接触、続け字はないものとする。
は、実際に文字の切り出しを行う前に事前に行われる統
計パラメータの算出処理の流れを示す。また、破線の矢
印で示された処理の流れは、実際に文字の切り出しを行
う処理の流れを示す。
いて説明する。まず、ステップS1で、フリーピッチ領
域に書かれた手書き文字列の複数の学習データをイメー
ジ入力により読み込む。
区別するために、連結パターン抽出手段1で8連結でつ
ながっているパターンをラベリングにより抽出する。こ
のとき、ラベリングで得られた各パターンのサイズが後
で問題となるので、パターンの外接矩形の座標値(左上
と右下)もラベリングと同時に求めている。ここで、パ
ターンとは、ラベリングにより分別された黒画素のまと
まりを示す。なお、上記ラベリング処理の詳細について
は、「“画像処理の基本技法(技術入門編)(Image Pr
ocessing on Personal Computer )”,第1部画像処理
の基礎、第3章画像処理の基本アルゴリズム、ii)連
結成分処理、ラベリング、長谷川純一、興水大和、中
山晶、横中茂樹著、技術評論社、昭和61年8月10日
刊」に詳しい。
文字を切り出す処理を、その処理をパターン外接矩形の
位置、サイズ、並びなどからパターン同士を統合してい
く統計的処理と、文字列中の濁点、分離文字などを処理
するためにパターン形状に着目する非統計的処理に分け
て実行し、ステップS5で、上記統計的処理と上記非統
計的処理の際に用いられた切り出しパラメータの値を算
出する。なお、切り出し処理においては、連結パターン
抽出手段1で抽出されたパターン同士が統合される。
の外接矩形の位置、縦横比、平均文字サイズに対するサ
イズ比、隣接するパターン同士の距離、統合したときの
サイズ、パターン同士の重なり幅、文字列の粗密度など
を切り出しパラメータとして用いる。
の右枠と外接矩形12の左枠との距離a、外接矩形11
の左枠と外接矩形12の右枠との距離b、外接矩形11
の右枠と外接矩形12の左枠との距離aと外接矩形11
の左枠と外接矩形12の右枠との距離bとの比c、外接
矩形11の左枠と外接矩形12の右枠との距離bと外接
矩形平均幅MXとの比d、外接矩形13の下枠と外接矩
形13の下枠の中点から外接矩形14の下枠の中点とを
結ぶ直線とのなす角度e、外接矩形13の下枠と外接矩
形13の右下の頂点から外接矩形14の左下の頂点とを
結ぶ直線とのなす角度f、外接矩形15と外接矩形16
とが重なっている場合、外接矩形15の右枠と外接矩形
16の左枠との距離pと外接矩形15の左枠と外接矩形
16の右枠との距離qとの比gを切り出しパラメータと
して用いる。
を参照しながら説明する。まず、ステップS11に示す
ように、連結パターン抽出手段1により抽出された連結
パターンの外接矩形を取り出す。
ップS11で取り出した外接矩形の右隣に他の外接矩形
があるかどうか調べる。そして、ステップS11で取り
出した外接矩形の右隣に他の外接矩形がない場合、ステ
ップS11で取り出した外接矩形を統計的処理の対象か
らはずす。
S11で取り出した外接矩形の右隣に他の外接矩形があ
ると判断された場合、ステップS14に進む。また、ス
テップS13に示すように、文字列の外接矩形の平均文
字サイズを算出する。ここで、文字列の外接矩形の平均
文字サイズを算出する場合、まだ1文字ずつが切り出さ
れていないので、厳密には、正確な平均文字サイズを算
出することができない。そこで、例えば、連結パターン
抽出手段1により抽出された連結パターンの外接矩形を
仮統合することにより、暫定的に平均文字サイズを算出
する。仮統合の方法として、近接する連結パターンを統
合した際の縦横比Pが、例えば、 N(=0.8)<P<M(=1.2) を満たす場合、仮統合を行う。そして、仮統合を行った
後の平均文字サイズを算出する。 なお、文字列の外接
矩形の平均文字サイズは、外接矩形のサイズ別の頻度ヒ
ストグラムを生成して求めるようにしてもよい。
のパラメータa〜gを算出する。ステップS4の非統計
的処理では、文字列中の濁点や分離文字などを対象にし
ており、図5に示すように、分離文字処理と濁点処理と
に分ける。
き、線密度、隣接するパターン同士を統合したときのサ
イズ、パターン同士の距離を切り出しパラメータとして
用いる。
の右枠と外接矩形22の左枠との距離aと外接矩形21
の左枠と外接矩形22の右枠との距離bとの比p、外接
矩形21の左枠と外接矩形22の右枠との距離bと外接
矩形平均幅MXとの比q、外接矩形21の面積cと外接
矩形22の面積dとの積と外接矩形平均幅MXと外接矩
形平均高さMYとの積の平方との比rを切り出しパラメ
ータとして用いる。
トを参照しながら説明する。この分離文字処理は、例え
ば、“ハ”又は“ル”などのように2つ以上の連結パタ
ーンから構成される分離文字を検出するものである。
パターン抽出手段1により抽出された連結パターンのう
ち、右上がりとなっているパターンがあるかどうか判断
する。そして、右上がりとなっているパターンがない場
合、分離文字処理の対象からはずす。
となっているパターンであると判断された場合、ステッ
プS22に進み、右上がりとなっているパターンの右隣
に隣接し、且つ右下がりとなっているパターン、すなわ
ち、例えば、“ハ”に対応するパターン、又は、右上が
りとなっているパターンの右隣に隣接し、且つ直角方向
に探索した場合のパターンと交差する回数(直角線密
度)が2となるパターン、すなわち、例えば、“ル”に
対応するパターンがあるかどうか判断する。そして、こ
れらの“ハ”又は“ル”などのような形状のパターンで
なければ、分離文字処理の対象からはずす。
は“ル”などのような形状のパターンであると判断した
場合、ステップS24に進む。また、上記ステップS2
1,S22とは別に、ステップS23で、文字列の外接
矩形の平均文字サイズを算出する。
後、ステップS24で、図6に示されたパラメータp〜
rの値を算出する。また、濁点処理では、濁点候補パタ
ーンに着目し、例えば、そのパターンとその隣接パター
ンを統合したときのサイズ、両パターン間の距離、及び
それらと平均文字サイズとの比を、切り出しパラメータ
として用いる。
1の右枠と外接矩形32の左枠との距離aと外接矩形3
1の左枠と外接矩形32の右枠との距離bとの比p、外
接矩形31の左枠と外接矩形32の右枠との距離bと外
接矩形平均幅MXとの比q、外接矩形31の面積cと外
接矩形32の面積dとの積と外接矩形平均幅MXと外接
矩形平均高さMYとの積の平方との比rを、切り出しパ
ラメータとして用いる。
(7)式と同様に表すことができる。次に、濁点処理を
図9のフローチャートを参照しながら、説明する。
パターンを抽出する。すなわち、例えば、連結パターン
抽出手段1により抽出された連結パターンが2つ隣接し
て存在する場合で、且つそれらを統合した時のサイズと
文字列の外接矩形の平均文字サイズとの比が所定のしき
い値以下、例えば、1/4以下である場合、濁点候補と
なるパターンとして抽出する。
候補となるパターンの左隣に隣接する外接矩形があるか
どうかを調べる。そして、濁点候補となるパターンの左
隣に隣接する外接矩形がない場合、濁点候補となるパタ
ーンを濁点処理の対象からはずす。
となるパターンの左隣に隣接する外接矩形があると判断
された場合、ステップS34に進む。また、上記ステッ
プS31,S32とは別に、ステップS33で、文字列
の外接矩形の平均文字サイズを算出する。そして、上記
ステップS32,S33の処理が終了した後、ステップ
S34で、図8に示されたパラメータp〜rの値を算出
する。
る。上記ステップS1〜S5の処理が終了すると、次
に、ステップS6で、文字の切り出し処理を実行する。
この場合、従来のように、複数の各切り出しパラメータ
に対して、事前に閾値を設定してパターン同士の統合を
判断しながら、文字を切り出すのではなく、学習データ
について閾値を設定せずに文字の切り出しを行い、切り
出しの正否と上記ステップS5で算出されたそのときの
切り出しパラメータの値を統計データとして記録する。
り出しが成功した群と切り出しが失敗した群との2群を
n次元の空間上に得ることができる。そして、この2群
を判別する判別面を算出する。この2群を判別する判別
面の算出法としては、(1)式を用いる判別分析法や主
成分分析法など使用することができる。
法を示すフローチャートである。図10において、ま
ず、ステップS41で、事前に集めた学習データに対し
て、着目する外接矩形とそれに隣接する外接矩形とを統
合して1文字になるかどうかを目視により判断する。学
習データとしては、例えば、図11に示すような12種
類の文字列35〜46を複数の人に書いてもらいたもの
を用いる。そして、着目する外接矩形とそれに隣接する
外接矩形とを統合して1文字になる場合、ステップS4
2に進み、着目する外接矩形とそれに隣接する外接矩形
とを統合して1文字にならない場合、ステップS43に
進む。
それに隣接する外接矩形とを統合して1文字になる統合
成功の場合について、その着目する外接矩形とそれに隣
接する外接矩形におけるパラメータの値を記録する。こ
こで、着目する外接矩形とそれに隣接する外接矩形にお
けるパラメータは、統計的処理の場合、図3のパラメー
タa〜gを用いることができ、非統計的処理の場合、図
6、8のパラメータp〜rを用いることができる。
矩形とそれに隣接する外接矩形とを統合して1文字にな
らない統合失敗の場合について、その着目する外接矩形
とそれに隣接する外接矩形におけるパラメータの値を記
録する。
ートである。まず、ステップS51で、学習データに対
して、図10のフローチャートに示す処理を実行して、
切り出し成功と切り出し失敗を示す2群のデータを統計
・記録する。
を算出する。次に、ステップS53で、上記各群の主軸
のなす角度θを調べ、その角度θが70度以上である場
合はステップS54に進み、主軸のなす角度θが70度
以上でない場合はステップS55に進む。
きの大きい方の群に対して垂直となる判別面を算出す
る。一方、ステップS55では判別分析法により判別面
を算出する。
切り出し成功を示すパラメータの値の分布領域51の主
軸53と切り出し失敗を示すパラメータの値の分布領域
52の主軸54のなす角度θは70度以上である。そし
て、切り出し成功を示すパラメータの値の分布領域51
の主軸53に対するばらつきと、切り出し失敗を示すパ
ラメータの値の分布領域52の主軸54に対するばらつ
きとを比べると、切り出し成功を示すパラメータの値の
分布領域51の主軸53に対するばらつきの方が大き
い。したがって、図12の右下方に太い直線で示すよう
に、切り出し成功を示すパラメータの値の分布領域51
の主軸53に対して垂直となる判別面59を算出する。
り出し成功を示すパラメータの値の分布領域55の主軸
57と切り出し失敗を示すパラメータの値の分布領域5
6主軸58のなす角度θは70度に満たない。したがっ
て、この場合には、図12の右下方に太い直線で示すよ
うに、判別分析法を用いて判別面60を算出する。
のステップS1〜S6の処理により、学習データを用い
て、未知の手書き文字列に対する文字の切り出しの信頼
度を算出するための判別面が設定される。
す処理を説明する。未知の手書き文字列の入力イメージ
が入力された場合、図2のフローチャートの全てのステ
ップの処理が実行される。
が入力されると、上記ステップS1〜S5の処理が実行
され、統計的処理における切り出しパラメータと非統計
的処理における切り出しパラメータの値が算出される。
同士を統合するかどうかを判定するために、上記ステッ
プS5で算出された複数の特徴量パラメータの値によっ
て定まる多次元空間上の点の上記既に得られている判別
面からの距離を求め、これを切り出しの信頼度として定
量化する。
図13に示すように、2群を判別する判別面をH、判別
面Hの単位法線ベクトルを 外1 とし、あるパラメー
タの
メータの値に対応する3次元空間内の点pの判別面から
の距離hは、
空間内の原点Oから3次元空間内の点
面Hからの距離hが正をとるか負をとるかで、パラメー
タの値がどちらの群、すなわち、切り出しが成功した方
の群または切り出しが失敗した方の群のいづれの群に属
するか、また、パラメータの値が判別面Hからどの程度
離れているかが分かる。
の学習データの全パラメータに対して、判別面Hからの
距離を基にして切り出し成功のヒストグラム分布71と
切り出し失敗のヒストグラム分布72をとる。一般的
に、このヒストグラム分布71、72は正規分布になる
ので、ヒストグラム分布71、72を正規分布で近似す
る。これらの正規分布は、一般に、一部、重なる領域が
生ずる。本実施例では、この重なる領域に位置する切り
出しパラメータを有する隣接パターンについて切り出し
の信頼度に加え、文字認識の信頼度を加味してそれらを
統合するか否かを判定する。
フローチャートを参照しながら説明する。まず、ステッ
プS61で、上記ステップS5で得られた複数のパラメ
ータの値によって定まる点の判別面からの距離を、前記
(8)式により算出する。
り得られた複数のパラメータの値のヒストグラム分布を
正規分布で近似する。すなわち、例えば、図16に示す
ように、切り出し成功のヒストグラム分布を正規分布8
1で近似し、切り出し失敗のヒストグラム分布を正規分
布82で近似する。
域を算出する。例えば、図16に示すように、切り出し
成功の正規分布81と切り出し失敗の正規分布82とが
重なる領域84を2群の重なり領域として算出する。ま
た、このとき、切り出し成功の正規分布81の内、上記
2群の重なり領域84以外の領域83を切り出し成功領
域と設定する。さらに、切り出し失敗の正規分布82の
内、上記2群の重なり領域84以外の領域85を切り出
し失敗領域と設定する。
字の切り出し処理を高速化するために、上記統計パラメ
ータ算出処理時に、判別面の設定が終了した後に、予め
行っておくのが望ましい。
パラメータの値のヒストグラム分布上での位置を判定す
る。次に、ステップS65に示すように、入力パラメー
タの値のヒストグラム分布上での位置を判定した結果、
入力パラメータの値が2群の重なり領域84に含まれる
場合、ステップS66に進む。そして、2群の重なり領
域84での入力パラメータの値の位置に基づいて、切り
出し信頼度を算出する。
メータの値が2群の重なり領域84に含まれないと判断
された場合、ステップS66に進み、入力パラメータの
値が切り出し成功領域83に含まれるかどうかを判断す
る。そして、入力パラメータの値が切り出し成功領域8
3に含まれると判断された場合、ステップS68に進
み、切り出し信頼度を”1”とし、入力パラメータの値
が切り出し成功領域83に含まれないと判断された場
合、ステップS69に進み、切り出し信頼度を”0”と
する。
の値の判別面からの距離を算出した結果、入力パラメー
タの値の判別面からの距離が重なり領域84に含まれる
場合、入力パラメータの値の判別面からの距離に基づい
て、切り出し信頼度を算出する。また、入力パラメータ
の値の判別面からの距離が切り出し成功領域83に含ま
れる場合、その切り出し信頼度を”1”とする。また、
入力パラメータの値の判別面からの距離が切り出し失敗
領域85に含まれる場合、その切り出し信頼度を”0”
に設定する。
7のフローチャートを参照しながら説明する。まず、ス
テップS71で、学習データから得られた各群(切り出
し成功のヒストグラム分布群と切り出し失敗のヒストグ
ラム分布群)ヒストグラム91の平均値mと分散値vと
を算出する。
て、正規分布曲線92とヒストグラム値91との2乗誤
差の総和dを算出する。次に、ステップS73で、適合
度Tを下記の(9)式により算出する。
テップS74で、正規分布曲線92の中心から端までの
距離Lを下記の(10)式により算出する。
3 は、標準偏差に等しい。
3の右端97から正規分布曲線94の左端96までの間
の領域を、2群の重なり領域95として設定する。再
び、図2のフローチャートの説明に戻る。
補に対し、その切り出し信頼度に基づいて認識処理を行
うかどうかを決定する。この場合、例えば、切り出し信
頼度が高い切り出し文字の候補に対しては認識処理を行
わず、切り出し信頼度が低い切り出し文字の候補に対し
のみ認識処理を行うようにする。
識処理を行うすべきであると判断された切り出し文字の
候補に対し、認識処理を行う。次に、ステップS10
で、複数の切り出し文字の候補に対して、それらに対す
る認識の信頼度だけでなく、切り出しの信頼度も考慮し
て切り出し文字を決定する。このことにより、部分的に
見ると文字のように見えるが、文字列全体から見ると間
違っているような候補文字を、切り出し文字から除外す
ることができる。
定部の切り出し信頼度をαi 、認識信頼度をβi 、重み
係数をjとすると、全体の信頼度Rは、 R=Σ(j・αi +βi ) ・・・(11) と表せる。
ら全体の信頼度Rが最も大きいものを、最終的な切り出
し文字として選択する。次に、本発明の一実施例による
文字の切り出し方式を、“ベタ”という文字列から文字
を切り出す場合の実験例を説明する。
タ”という文字列の切り出しの成功又は失敗を判定する
ためのパラメータとして、図3のパラメータc、e、f
を用いた。また、学習データとして、図11に示す12
の文字列35〜46を、実際に30人に書いてもらっ
た。この結果、判別面の式として、 0.84x0+0.43x1+0.33x2−145.25=0・・(12) が得られた。
成功を示すヒストグラム分布の平均値mは128.94
2、標準偏差は34.77となり、適合度Tは(9)式
より0.12となった。また、比例定数kを2とする
と、分布中心から端までの距離Lは(10)式より7
7.8となった また、図11に示す学習データの切り出し失敗を示すヒ
ストグラム分布の平均値mは71.129、標準偏差は
36.26となり、適合度Tは(9)式より0.35と
なった。。また、比例定数kを2とすると、分布中心か
ら端までの距離Lは(10)式より92.2と成った。
で、イメージ入力により入力パターンを読み込む。次
に、ステップS82で、ラベリングにより連結パターン
を抽出し、抽出された各連結パターンに対してラベル番
号〜を付す。
る連結パターンを統合した場合の切り出し信頼度を、パ
ラメータc、e、fの値を有する点の判別面からの距離
hに基づいて算出する。例えば、切り出し信頼度αは、 α=(h−w1 )/(w2 −w1 )×100 ・・・(13) で表すことができる。
とラベル番号のパターンとを統合した場合の切り出し
信頼度は80、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度は10、
ラベル番号のパターンとラベル番号のパターンとを
統合した場合の切り出し信頼度は60、ラベル番号の
パターンとラベル番号のパターンとを統合した場合の
切り出し信頼度は85となる。
122におけるラベル番号のパターンとを統合し、外
接矩形121を生成する。ここで、切り出しを確定する
条件として、例えば、切り出し信頼度が所定のしきい値
(例えば、90)より大きいか、又は、切り出し信頼度
が所定のしきい値(例えば、70)より大きく、且つそ
の隣の切り出しパターンの切り出し信頼度との比が所定
の値(例えば、5)より大きい場合とする。
(例えば、8)より小さい場合は切り出しを行わない。
すなわち、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は80で、そ
の隣のラベル番号のパターンに対する切り出し信頼度
の比は、80/10=8であるので、ラベル番号のパ
ターンとラベル番号のパターンとを統合する。また、
ラベル番号のパターンとラベル番号のパターンとを
統合した場合の切り出し信頼度は10であり、ラベル番
号のパターンとラベル番号のパターンとを統合しな
い。また、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は60であ
り、ラベル番号のパターンとラベル番号のパターン
とを統合しない。また、ラベル番号のパターンとラベ
ル番号のパターンとを統合した場合の切り出し信頼度
は85であり、且つその隣のラベル番号のパターンに
対する切り出し信頼度の比は、85/60=1.4であ
るので、ラベル番号のパターンとラベル番号のパタ
ーンとを統合しない。
122とラベル番号のパターンとの切り出し信頼度を
算出する。ここで、切り出し確定部122とラベル番号
のパターンとの切り出し信頼度は、例えば、83とな
る。
によるパターンの統合が終了した時点で、図18に示す
切り出し候補1〜4を抽出する。そして、切り出し候補
1〜4のそれぞれの文字に対して認識処理を行い、切り
出し候補1〜4における文字内の切り出し信頼度αと認
識信頼度βとをそれぞれの文字について求め、切り出し
信頼度αと認識信頼度βとの総和を、全体の信頼度Rと
する。
示す外接矩形121、123、124を切り出した場
合、外接矩形121内のパターンに対して文字認識を行
った場合の文字認識部122の認識信頼度βは70とな
り、外接矩形123内のパターンに対して文字認識を行
った場合の文字認識部125の認識信頼度βは90とな
り、外接矩形124内のパターンに対して文字認識を行
った場合の文字認識部126の認識信頼度βは40とな
る。また、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度αは60であ
るので、全体の信頼度Rは、重み係数jを1とすると、
(11)式により、260となる。
27、128を切り出した場合、外接矩形127内のパ
ターンに対して文字認識を行った場合の文字認識部12
9の認識信頼度βは90となり、外接矩形128内のパ
ターンに対して文字認識を行った場合の文字認識部13
0の認識信頼度βは95となる。また、切り出し確定部
122とラベル番号のパターンとの切り出し信頼度α
は83であり、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度αは85
であるので、全体の信頼度Rは353となる。
31、124を切り出した場合、外接矩形131内のパ
ターンに対して文字認識を行った場合の文字認識部13
2の認識信頼度βは30となり、外接矩形124内のパ
ターンに対して文字認識を行った場合の文字認識部12
6の認識信頼度βは40となる。また、切り出し確定部
122とラベル番号のパターンとの切り出し信頼度α
は83であり、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度αは60
であるので、全体の信頼度Rは213となる。
21、133を切り出した場合、外接矩形121内のパ
ターンに対して文字認識を行った場合の文字認識部12
2の認識信頼度βは70となり、外接矩形133内のパ
ターンに対して文字認識を行った場合の文字認識部13
4の認識信頼度βは20となる。また、ラベル番号の
パターンとラベル番号のパターンとを統合した場合の
切り出し信頼度αは60であり、ラベル番号のパター
ンとラベル番号のパターンとを統合した場合の切り出
し信頼度αは85であるので、全体の信頼度Rは235
となる。
〜4のうち、全体の信頼度Rが最も大きい切り出し候補
2を切り出し成功の文字として選択する。このことによ
り、“ベタ”という文字列の入力パターンから”べ”
と”タ”の文字を正確に切り出すことができた。
出し方式を、統計的処理と非統計的処理とに分けて行う
場合の処理を、図19に示す。図19には、“グンマ”
という文字列から文字を切り出す実験結果も示してい
る。この場合、“グンマ”という文字列の切り出しを行
うのに先立ち、学習データを用いて、統計的処理と非統
計的処理とに対する判別面とヒストグラム値の正規分布
曲線を、それぞれ、個別に求めたまず、ステップS91
で、イメージ入力により入力パターンを読み込む。
り連結パターンを抽出し、抽出された各連結パターンに
対して図19に示すようにラベル番号〜を付す。次
に、ステップS95で、互いに隣接する連結パターンを
統合した場合の切り出し信頼度を算出する。ここで、切
り出し信頼度を算出する場合、ステップS93で統計的
処理を、ステップS94で非統計的処理を行う。
ば、ラベル番号のパターンとラベル番号のパターン
とを統合した場合の切り出し信頼度は80、ラベル番号
のパターンとラベル番号のパターンとを統合した場
合の切り出し信頼度は12、ラベル番号のパターンと
ラベル番号のパターンとを統合した場合の切り出し信
頼度は28、ラベル番号のパターンとラベル番号の
パターンとを統合した場合の切り出し信頼度は92、ラ
ベル番号のパターンとラベル番号のパターンとを統
合した場合の切り出し信頼度は5となったまた、ステッ
プS94の非統計的処理では、ラベル番号のパターン
と、ラベル番号のパターンとラベル番号のパターン
とからなる切り出し確定部141の濁点パターンとを統
合した場合の切り出し信頼度は85となった。
における切り出し信頼度の算出方法を図20に示す。ま
ず、ステップS101で、濁点候補となるパターン14
2を抽出する。例えば、連結パターンが2つ隣接して存
在する場合で、且つ、それらを統合した時のサイズと文
字列の外接矩形の平均文字サイズとの比が所定のしきい
値以下である場合、濁点候補となるパターンとする。
るパターン142の左隣に隣接する外接矩形151があ
るかどうかを調べ、濁点候補となるパターン142の左
隣に隣接する外接矩形151があると判断された場合、
ステップS103に進み、図8のパラメータp〜rの値
を算出する。
距離 b:外接矩形151の左枠と外接矩形142の右枠との
距離 c:外接矩形151の面積 d:外接矩形142の面積 MX:外接矩形平均幅 MY:外接矩形平均高さ である次に、ステップS104に示すように、パラメー
タp〜rの値の判別面163からの距離を算出する。
からの距離を算出するために、学習パターンに基づいて
判別面163を算出しておく。この判別面163は、例
えば、学習パターンの文字列の切り出しの成功を示すヒ
ストグラム分布161及び失敗を示すヒストグラム分布
162に基づいて、(1)式により求めることができ、
濁点抽出のパラメータp〜rを用いた場合の判別面16
3の式は、例えば、 0.17x0+0.75x1+0.64x2+30.4=0・・(17) で表され、3次元空間内の平面の方程式となる。
(14)〜(16)の値を(17)式に代入して、 h=0.17×0.1−0.75×1.3+0.64×0.3+30.4 =29.6 ・・・(18) となる。
ストグラム分布162の平均値mは38、標準偏差は2
5となり、適合度Tは(9)式より0.2となり、学習
データの切り出し失敗を示すヒストグラム分布161の
平均値mは−34、標準偏差は28となり、適合度Tは
(9)式より0.3となる。
ストグラム分布162の左端w1 は、比例定数kを2と
すると、(10)式より、 w1 =38−2×(1+0.2)×25=−22 ・・・(19) となり、学習データの切り出し失敗を示すヒストグラム
分布161の右端w2 は、比例定数kを2とすると、
(10)式より、 w2 =−34+2×(1+0.3)×28=38.8 ・・・(20) となる。
面からの距離が−22〜38.8の領域となる。次に、
ステップS105で、切り出し信頼度αを求める。この
切り出し信頼度αは、(18)〜(20)の値を(1
3)式に代入して、 α=(29.6−(−22))/(38.8−(−22))×100 =85 ・・・(21) となる。
とが統合されて切り出し確定部141となる。次に、図
19のステップS96で、統計的処理と非統計的処理の
信頼度を合成する。このとき、切り出し確定部があれ
ば、それを優先する。したがって、切り出し確定部14
1の信頼度が優先して合成される。
出し確定部141のパターンとを統合した場合の切り出
し信頼度は85、切り出し確定部141のパターンとラ
ベル番号のパターンとを統合した場合の切り出し信頼
度は30、ラベル番号のパターンとラベル番号のパ
ターンとを統合した場合の切り出し信頼度は92、ラベ
ル番号のパターンとラベル番号のパターンとを統合
した場合の切り出し信頼度は5となる。
しきい値(例えば、90)より大きいか又は、切り出し
信頼度が所定のしきい値(例えば、70)より大きく且
つ、その隣の切り出しパターンの切り出し信頼度との比
が所定の値(例えば、5)より大きい場合、パターンの
統合を行う。
(例えば、8)より小さい場合、パターンの統合を行わ
ない。例えば、ラベル番号のパターンと切り出し確定
部141のパターンとを統合した場合の切り出し信頼度
は85で、その隣のラベル番号のパターンに対する切
り出し信頼度の比は、85/30=2.8であるので、
ラベル番号のパターンと切り出し確定部141のパタ
ーンとを統合しない。また、切り出し確定部141のパ
ターンとラベル番号のパターンとを統合した場合の切
り出し信頼度は30であり、切り出し確定部141のパ
ターンとラベル番号のパターンとを統合しない。ま
た、ラベル番号のパターンとラベル番号のパターン
とを統合した場合の切り出し信頼度は92であるので、
ラベル番号のパターンとラベル番号のパターンとを
統合する。また、ラベル番号のパターンとラベル番号
のパターンとを統合した場合の切り出し信頼度は5で
あり、ラベル番号のパターンとラベル番号のパター
ンとを統合しない。
ベル番号のパターンとを統合した切り出し確定部14
3に対応する外接矩形145、ラベル番号のパターン
に対応する外接矩形146が生成される。
43のパターンと切り出し確定部141のパターンとを
統合した場合の切り出し信頼度を求める。この切り出し
信頼度は、図19の例では、60となる。
出し信頼度によるパターンの統合が終了した時点で、切
り出し候補1、2を抽出する。そして、切り出し候補
1、2のそれぞれの文字に対して認識処理を行い、切り
出し候補1、2における文字内の切り出し信頼度αと認
識信頼度βとをそれぞれの文字について求め、切り出し
信頼度αと認識信頼度βとの総和をとったものを全体の
信頼度Rとする。
145、146、148を切り出した場合、外接矩形1
48内のパターンに対して文字認識を行った場合の文字
認識部147の認識信頼度βは80となり、外接矩形1
45内のパターンに対して文字認識を行った場合の文字
認識部143の認識信頼度βは90となり、外接矩形1
46内のパターンに対して文字認識を行った場合の文字
認識部153の認識信頼度βは85となる。また、ラベ
ル番号のパターンと切り出し確定部141のパターン
とを統合した場合の切り出し信頼度αは85であるの
で、全体の信頼度Rは、重み係数jを1とすると、(1
1)式により、345となる。
46、151、152を切り出した場合、外接矩形15
1内のパターンに対して文字認識を行った場合の文字認
識部149の認識信頼度βは83となり、外接矩形15
2内のパターンに対して文字認識を行った場合の文字認
識部150の認識信頼度βは55となり、外接矩形14
6内のパターンに対して文字認識を行った場合の文字認
識部153の認識信頼度βは85となる。また、切り出
し確定部141のパターンと切り出し確定部143のパ
ターンとを統合した場合の切り出し信頼度αは60であ
り、全体の信頼度Rは283となる。
1、2のうち、全体の信頼度Rが最も大きい切り出し候
補1を切り出し成功の文字候補として選択する。この結
果、“グンマ”という文字列から、”グ”、”ン”、”
マ”の各文字を正しく切り出すことができた。
よるパターン認識装置によれば、文字の切り出しに文字
認識処理を用いているため切り出し精度が高く、複数の
切り出し候補から1つの候補を選別する際、認識の信頼
度だけでなく切り出しの信頼度も考慮することで、その
候補文字単独の特徴だけでなく、その文字の文字列全体
に対する位置関係なども考慮されるため、より精度の高
い候補文字抽出が可能となる。
用いる部分を限定するため、高速に処理を行うことが可
能である。また、切り出し処理を統計的処理と非統計的
処理に分けて考えることで、より精度の高い切り出しが
可能である。
リスティクに閾値設定するのではなく、切り出しの成功
/失敗の統計的データをとり、さらに複数のパラメータ
を多次元空間上で2群判別しているため、認識処理を用
いる部分を少なくすることができ、高速に処理を行うこ
とが可能である。
いて2群の重なり領域を決定しているため、評価データ
数が少ない場合でも、精度よく重なり領域を決定するこ
とができ、同時に切り出し信頼度を正確に算出すること
が可能である。
き、判別面算出法を適応的に変えることで、2群の重な
り領域を小さくすることができ、処理の高速化を図るこ
とが可能である。
よれば、ヒューリスティックに選んだ複数の特性値を総
合した新たな特性値を用いてパターンの切り出しを行う
ことにより、パターンの切り出し精度を向上することが
できる。
失が最小になるように複数の特性値を合成することによ
り、パターンの切り出し精度を向上することができる。
また、請求項3の発明によれば、複数の特性値の線形結
合の持つ分散を最大とするように合成することにより、
パターンの切り出し精度を向上することができる。
成功を示す第1の群と切り出し失敗を示す第2の群との
重心間の距離を最大にするように構成された判別関数に
基づいて、切り出しパターンを決定することにより、切
り出し成功であるか切り出し失敗であるかを統計的に決
定することができ、パターンの切り出しを精度良く、且
つ、高速に行うことができる。
成功を示す第1の群と切り出し失敗を示す第2の群との
間の群間変動の群内変動に対する比を最大にするように
特性値の線形結合を求め、この特性値の線形結合に基づ
いて切り出しパターンを決定することにより、切り出し
成功であるか切り出し失敗であるかの決定を簡単な演算
により統計的に行うことができ、パターンの切り出しを
精度良く、且つ、高速に行うことができる。
ての切り出し位置の確からさを示す切り出し信頼度に基
づいて連結パターンを統合することにより、文字の書か
れた状態に応じて、切り出し信頼度を調節することがで
き、文字の切り出し精度を向上することができる。
信頼度の高い部分は文字認識を行わずに切り出し文字と
して確定し、切り出し信頼度の低い部分についてのみ文
字認識を行って切り出し文字を確定することにより、文
字の切り出し速度を向上できる。
の特徴のみだけでなく、その文字の文字列全体に対する
位置関係なども考慮することにより、文字の切り出し精
度を向上することができる。
状を有するパターンに対しては、そのパターン独自の最
適な処理を用いることにより、文字の切り出し精度を向
上することができる。 また、請求項10の発明によれ
ば、第1の外接矩形と第1の外接矩形の右隣に隣接する
第2の外接矩形との位置関係や大きさをパラメータとす
ることにより、切り出し文字の特徴を精度良く抽出する
ことができる。
字の処理と濁点処理とを分けて行うことにより、分離文
字と濁点とを精度良く抽出することができ、文字の切り
出し精度を向上することができる。
りとなっている第1パターン、第1パターンの右隣に隣
接し、右下がりとなっている第2パターン、第1パター
ンの右隣に隣接し、直角方向に探索した場合のパターン
と交差する回数が2となる第3パターンを検出し、それ
らの位置関係や大きさをパラメータとすることにより、
分離文字の特徴を精度良く抽出することができる。
補となる第1パターン、第1パターンの左隣に隣接する
第2のパターンを検出し、それらの位置関係や大きさを
パラメータとすることにより、濁点の特徴を精度良く抽
出することができる。
し成功を示す第1の群と切り出し失敗を示す第2の群と
の判別面をP次元空間において生成し、切り出しを行う
文字の特性値のP次元空間内の判別面に対する位置を判
別することにより、切り出し成功であるか切り出し失敗
であるかを決定することができ、文字の切り出しを高速
に行うことができる。
を判別分析法により求めることにより、切り出し成功で
あるか切り出し失敗であるかを決定する判別面を統計的
に求めることができ、切り出し信頼度の精度を高めるこ
とができるので、文字の切り出しを精度良く、且つ、高
速に行うことができる。
特性値のP次元空間における分布形状に基づいて、判別
面の算出方法を複数個使い分けることにより、分布形状
毎に最適な判別面を生成することができ、文字の切り出
しを精度を向上できる。
群と第2の群との主軸のなす角が所定の角度以上である
場合、主軸に対するサンプルデータのばらつきの大きい
方の群の垂直方向に判別面を算出し、主軸のなす角が所
定の角度以上でない場合、判別分析法により判別面を算
出することにより、文字の切り出しを精度を向上でき
る。
からのP個の特性値の距離に基づいて、切り出し文字の
切り出し信頼度を算出することにより、文字の切り出し
を高速に行うことができる。
布を正規分布に近似して重なり領域を算出することによ
り、特性値の数が少ない場合でも精度よく重なり領域を
算出することができ、文字の切り出しを精度良く行うこ
とができる。
布の正規分布に対する誤差を考慮して重なり領域を算出
することにより、特性値の数が少ない場合でも適応的に
重なり領域を算出することができる。
布と正規分布との2乗誤差の総和と正規分布の面積との
比に基づいて適合度を算出し、適合度に基づいて重なり
領域を算出することにより、特性値の数が少ない場合で
も適応的に重なり領域を算出することができる。
ンの特徴を示すP個の特性値が度数分布の重なり領域に
含まれる場合、P個の特性値の位置に基づいて切り出し
信頼度を算出し、P個の特性値が度数分布の切り出し成
功を示す領域に含まれる場合、切り出し信頼度を100
%と判定し、P個の特性値が度数分布の切り出し失敗を
示す領域に含まれる場合、切り出し信頼度を0%と判定
することにより、より精度の高い文字の切り出しを行う
ことができる。
の概略構成を示すブロック図である。
の処理の流れを示すフローチャートである。
の統計的処理におけるパラメータの図形的意味を示す図
である。
の統計的処理を示すフローチャートである。
の非統計的処理を示す図である。
の分離文字処理におけるパラメータの図形的意味を示す
図である。
の分離文字処理を示すフローチャートである。
の濁点処理におけるパラメータの図形的意味を示す図で
ある。
の濁点処理を示すフローチャートである。
置における切り出しの成否の算出処理を示すフローチャ
ートである。
置における切り出しの成否を算出する学習データの例を
示す図である。
置における判別面算出法を示すフローチャートである。
置における切り出し信頼度の定量化方法を示す図であ
る。
置における度数分布の生成方法を示す図である。
置における切り出し信頼度算出法を示すフローチャート
である。
置におけるヒストグラム分布の例を示す図である。
置における2群の重なり領域算出法を示すフローチャー
トである。
置における文字の切り出し処理の流れを示す図である。
置における文字の切り出し処理の流れを示す図である。
置における非統計的処理の流れを示す図である。
3、124、127、128、131、133、14
2、145、146、148、151、152 外接矩
形 35〜46 学習データ 51、52、55、56 分布領域 53、54、57、58 主軸 62、65、163 判別面 71、72、81、82、161、162 ヒストグラ
ム分布 83 切り出し成功領域 84、95、164 重なり領域 85 切り出し失敗領域 91 ヒストグラム値 92、93、94 正規分布曲線 122、141、143、144 切り出し確定部 125、126、129、130、132、134、1
47、149、150、153 文字認識部
Claims (22)
- 【請求項1】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 パターンの特徴を示す複数の特性値を、互いに無相関な
いくつかの総合特性値に合成する主成分分析手段と、 前記総合特性値に基づいて、前記連結パターンから切り
出しパターンを決定するパターン切り出し手段とを備え
ることを特徴とするパターン認識装置。 - 【請求項2】 前記主成分分析手段は、情報の損失が最
小になるように前記複数の特性値を合成することを特徴
とする請求項1に記載のパターン認識装置。 - 【請求項3】 前記主成分分析手段は、前記特性値の線
形結合の持つ分散を最大とするように合成することを特
徴とする請求項1に記載のパターン認識装置。 - 【請求項4】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 パターンの特徴を示す複数の特性値からなるサンプルデ
ータを、切り出し成功を示す第1の群と切り出し失敗を
示す第2の群とに分類し、前記第1の群と前記第2の群
の各重心から等距離となるように構成された判別関数を
生成する判別関数生成手段と、 前記判別関数に基づいて、前記連結パターンから切り出
しパターンを決定するパターン切り出し手段とを備える
ことを特徴とするパターン認識装置。 - 【請求項5】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 パターンの特徴を示す複数の特性値からなるサンプルデ
ータを、切り出し成功を示す第1の群と切り出し失敗を
示す第2の群とに分類し、前記第1の群と前記第2の群
との間の群間変動の群内変動に対する比を最大にするよ
うに、前記特性値の線形結合を求める判別関数生成手段
と、 前記特性値の線形結合に基づいて、前記連結パターンか
ら切り出しパターンを決定するパターン切り出し手段と
を備えることを特徴とするパターン認識装置。 - 【請求項6】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 前記連結パターンを統合した場合、文字としての切り出
しの確からしさを示す信頼度を算出する切り出し信頼度
算出手段と、 前記切り出し信頼度が所定の値より大きい場合、前記連
結パターンを統合する統合手段とを備えることを特徴と
する文字切り出し方式。 - 【請求項7】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 前記連結パターンを統合して切り出し文字の複数の候補
を生成し、前記各候補について切り出しの確からしさを
示す切り出し信頼度を算出する切り出し信頼度算出手段
と、 前記切り出し信頼度に基づいて、前記各候補の文字認識
を行うかどうかを決定する認識処理決定手段と、 前記認識処理決定手段により文字認識を行う決定がなさ
れた候補の場合、文字認識処理により前記複数の候補か
ら1つを選択して切り出し文字を決定し、前記認識処理
決定手段により文字認識を行わない決定がなされた候補
の場合、前記切り出し信頼度により前記複数の候補から
1つを選択して切り出し文字を決定する切り出し決定手
段とを備えることを特徴とする文字切り出し方式。 - 【請求項8】 入力パターンから連結パターンを求める
連結パターン抽出手段と、 前記連結パターンを統合して切り出し文字の複数の候補
を生成し、前記各候補について切り出しの確からしさを
示す切り出し信頼度を算出する切り出し信頼度算出手段
と、 前記各候補の文字認識を行い、文字としての認識信頼度
を算出する認識信頼度算出手段と、 前記切り出し信頼度と前記認識信頼度とに基づいて、前
記複数の候補から1つを選択して、切り出し文字を決定
する切り出し決定手段とを備えることを特徴とする文字
切り出し方式。 - 【請求項9】 前記切り出し信頼度算出手段は、 前記連結パターンから所定の形状を有するパターンを検
出する検出部と、 前記検出部により検出された所定の形状を有するパター
ンにおける切り出しの確からしさを示す切り出し信頼度
を算出する非統計的信頼度算出部と、 前記連結パターン抽出手段により求められた連結パター
ンの外接矩形に基づく切り出しの確からしさを示す切り
出し信頼度を算出する統計的信頼度算出部と、 前記非統計的信頼度算出部により算出された切り出し信
頼度と、前記統計的信頼度算出部により算出された切り
出し信頼度とを統合する信頼度統合部とを備えることを
特徴とする請求項6〜8のいずれか1項に記載の文字切
り出し方式。 - 【請求項10】 前記統計的信頼度算出部は、 第1の外接矩形と前記第1の外接矩形の右隣に隣接する
第2の外接矩形とを選択する外接矩形選択部と、 前記第1の外接矩形の右枠と前記第2の外接矩形の左枠
との距離を第1パラメータとして算出する第1パラメー
タ生成部と、 前記第1の外接矩形の左枠と前記第2の外接矩形の右枠
との距離を第2パラメータとして算出する第2パラメー
タ生成部と、 前記第1パラメータと前記第2パラメータとの比を第3
パラメータとして算出する第3パラメータ生成部と、 前記第2パラメータと外接矩形平均幅との比を第4パラ
メータとして算出する第4パラメータ生成部と、 前記第1の外接矩形の下枠と、前記第1の外接矩形の下
枠の中点から前記第2の外接矩形の下枠の中点へ至る直
線とのなす角度を第5パラメータとして算出する第5パ
ラメータ生成部と、 前記第1の外接矩形の下枠と、前記第1の外接矩形の右
下の頂点から前記第2の外接矩形の左下の頂点へ至る直
線とのなす角度を第6パラメータとして算出する第6パ
ラメータ生成部と、 前記第1の外接矩形と前記第2の外接矩形とが重なって
いる場合、前記第1の外接矩形の右枠と前記第2の外接
矩形の左枠との距離と、前記第1の外接矩形の左枠と前
記第2の外接矩形の右枠との距離との比を第7パラメー
タとして算出する第7パラメータ生成部とを備えること
を特徴とする請求項9に記載の文字切り出し方式。 - 【請求項11】 前記非統計的信頼度算出部は、 分離文字の処理を行う分離文字処理部と、 文字の濁点処理を行う濁点処理部とを備えることを特徴
とする請求項9に記載のパターン切り出し方式。、 - 【請求項12】 前記分離文字処理部は、 右上がりとなっている第1パターンを検出する右上がり
検出手段と、 前記第1パターンの右隣に隣接し、右下がりとなってい
る第2パターンを検出する右下がり検出手段と、 前記第1パターンの右隣に隣接し、直角方向に線密度を
探索した場合に交差する回数が2となる第3パターンを
検出する交差回数検出手段と、 前記第1パターンの外接矩形の右枠と前記第2パターン
又は前記第3パターンの外接矩形の左枠との距離と、前
記第1パターンの外接矩形の左枠と前記第2パターン又
は前記第3パターンの外接矩形の右枠との距離との比を
第1パラメータとして算出する第1パラメータ生成部
と、 前記第1パターンの外接矩形の左枠と前記第2パターン
又は前記第3パターンの外接矩形の右枠との距離と外接
矩形平均幅との比を第2パラメータとして算出する第2
パラメータ生成部と、 前記第1パターンの外接矩形の面積と前記第2パターン
又は前記第3パターンの外接矩形の面積との積と、外接
矩形平均幅と外接矩形平均高さとの積の平方との比を第
3パラメータとして算出する第3パラメータ生成部とを
備えることを特徴とする請求項9に記載の文字切り出し
方式。 - 【請求項13】 前記濁点処理部は、 濁点候補となる第1パターンを抽出する濁点候補抽出手
段と、 前記第1パターンの左隣に隣接する第2のパターンを検
出する左隣検出手段と、 前記第1パターンの外接矩形の右枠と前記第2パターン
の外接矩形の左枠との距離と、前記第1パターンの外接
矩形の左枠と前記第2パターンの外接矩形の右枠との距
離との比を第1パラメータとして算出する第1パラメー
タ生成部と、 前記第1パターンの外接矩形の左枠と前記第2パターン
の外接矩形の右枠との距離と外接矩形平均幅との比を第
2パラメータとして算出する第2パラメータ生成部と、 前記第1パターンの外接矩形の面積と前記第2パターン
の外接矩形の面積との積と、外接矩形平均幅と外接矩形
平均高さとの積の平方との比を第3パラメータとして算
出する第3パラメータ生成部とを備えることを特徴とす
る請求項9に記載の文字切り出し方式。 - 【請求項14】 入力パターンから連結パターンを求め
る連結パターン抽出手段と、 パターンの特徴を示すP個の特性値からなるサンプルデ
ータを、切り出し成功を示す第1の群と切り出し失敗を
示す第2の群とに分類し、前記第1の群と前記第2の群
との判別面をP次元空間において生成する判別面生成手
段と、 前記判別面に対する前記P個の特性値の位置に基づい
て、前記切り出し文字の切り出し信頼度を定量化する切
り出し信頼度定量化手段と、 前記切り出し信頼度に基づいて、前記連結パターンから
切り出し文字を決定する切り出し決定手段とを備えるこ
とを特徴とする文字切り出し方式。 - 【請求項15】 前記判別面生成手段は、前記判別面を
判別分析法により求めることを特徴とする請求項14に
記載の文字切り出し方式。 - 【請求項16】 前記判別面生成手段は、前記P個の特
性値のP次元空間における分布形状に基づいて、判別面
の算出方法を複数個使い分けることを特徴とする請求項
14に記載の文字切り出し方式。 - 【請求項17】 前記判別面生成手段は、 前記第1の群と前記第2の群との主軸を算出する主軸算
出部と、 前記主軸のなす角が所定の角度以上である場合、前記サ
ンプルデータの主軸に対するばらつきの大きい方の群の
主軸に垂直方向に判別面を算出する第1判別面算出部
と、 前記主軸のなす角が所定の角度以上でない場合、判別分
析法により判別面を算出する第2判別面算出部とを備え
ることを特徴とする請求項14に記載の文字切り出し方
式。 - 【請求項18】 前記切り出し信頼度定量化手段は、前
記判別面からの前記P個の特性値の距離に基づいて、前
記切り出し文字の切り出し信頼度を定量化することを特
徴とする請求項14に記載の文字切り出し方式。 - 【請求項19】 前記切り出し信頼度定量化手段は、 前記判別面からの距離に基づいて、P個の特性値からな
るサンプルデータの度数分布を生成する度数分布生成部
と、 前記第1の群に対応して生成された度数分布と前記第2
の群に対応して生成された度数分布との重なり領域を算
出する重なり領域算出部と、 前記P個の特性値の前記重なり領域からの距離と前記度
数分布の分散値とに基づいて、切り出し信頼度を算出す
る切り出し信頼度算出部とを備えることを特徴とする請
求項14に記載の文字切り出し方式。 - 【請求項20】 前記重なり領域算出部は、度数分布の
正規分布に対する適合度及び度数分布の分散値に基づい
て、前記重なり領域を算出することを特徴とする請求項
19に記載の文字切り出し方式。 - 【請求項21】 前記重なり領域算出部は、 前記度数分布の平均値を算出する平均値算出部と、 前記度数分布の分散値を算出する分散値算出部と、 前記平均値と前記分散値に基づいて、正規分布を生成す
る正規分布生成部と、 前記度数分布と前記正規分布との2乗誤差の総和を算出
する2乗誤差総和算出部と、 前記2乗誤差の総和と前記正規分布の面積との比に基づ
いて、適合度を算出する適合度算出部と、 前記適合度と前記分散値の平方根との積に基づいて、前
記度数分布の両端位置を算出する両端位置算出部と、 前記度数分布の両端位置に基づいて、前記重なり領域を
算出する重なり領域算出部とを備えることを特徴とする
請求項19に記載の文字切り出し方式。 - 【請求項22】 前記切り出し信頼度定量化手段は、 前記判別面からの距離に基づいて、P個の特性値からな
るサンプルデータの度数分布を生成する度数分布生成部
と、 前記第1の群に対応して生成された度数分布と前記第2
の群に対応して生成された度数分布との重なり領域を算
出する重なり領域算出部と、 前記P個の特性値が前記重なり領域に含まれる場合、前
記重なり領域における前記P個の特性値の位置に基づい
て、切り出し信頼度を算出する切り出し信頼度算出部
と、 前記P個の特性値が前記重なり領域に含まれず、且つ、
前記第1の群に対応する度数分布に含まれる場合、切り
出し信頼度を100%と判定し、前記P個の特性値が前
記重なり領域に含まれず、且つ、前記第2の群に対応す
る度数分布に含まれる場合、切り出し信頼度を0%と判
定する切り出し信頼度判定部とを備えることを特徴とす
る請求項14に記載の文字切り出し方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23498295A JP3415342B2 (ja) | 1995-09-13 | 1995-09-13 | 文字切り出し方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP23498295A JP3415342B2 (ja) | 1995-09-13 | 1995-09-13 | 文字切り出し方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH0981684A true JPH0981684A (ja) | 1997-03-28 |
JP3415342B2 JP3415342B2 (ja) | 2003-06-09 |
Family
ID=16979297
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP23498295A Expired - Fee Related JP3415342B2 (ja) | 1995-09-13 | 1995-09-13 | 文字切り出し方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3415342B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
JP2006090872A (ja) * | 2004-09-24 | 2006-04-06 | Aisin Aw Co Ltd | ナビゲーションシステム |
JP2009211432A (ja) * | 2008-03-04 | 2009-09-17 | Fujitsu Ltd | 文書認識プログラム、文書認識装置、および文書認識方法 |
CN101930545A (zh) * | 2009-06-24 | 2010-12-29 | 夏普株式会社 | 手写识别方法和设备 |
JP2021179743A (ja) * | 2020-05-12 | 2021-11-18 | 株式会社ミラボ | 情報処理装置、及びプログラム |
-
1995
- 1995-09-13 JP JP23498295A patent/JP3415342B2/ja not_active Expired - Fee Related
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006072839A (ja) * | 2004-09-03 | 2006-03-16 | Ricoh Co Ltd | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 |
JP2006090872A (ja) * | 2004-09-24 | 2006-04-06 | Aisin Aw Co Ltd | ナビゲーションシステム |
JP4501619B2 (ja) * | 2004-09-24 | 2010-07-14 | アイシン・エィ・ダブリュ株式会社 | ナビゲーションシステム |
JP2009211432A (ja) * | 2008-03-04 | 2009-09-17 | Fujitsu Ltd | 文書認識プログラム、文書認識装置、および文書認識方法 |
CN101930545A (zh) * | 2009-06-24 | 2010-12-29 | 夏普株式会社 | 手写识别方法和设备 |
WO2010150916A1 (en) * | 2009-06-24 | 2010-12-29 | Sharp Kabushiki Kaisha | Handwriting recognition method and device |
JP2012520492A (ja) * | 2009-06-24 | 2012-09-06 | シャープ株式会社 | 手書き文字認識方法および手書き文字認識装置 |
JP2021179743A (ja) * | 2020-05-12 | 2021-11-18 | 株式会社ミラボ | 情報処理装置、及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP3415342B2 (ja) | 2003-06-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6249605B1 (en) | Key character extraction and lexicon reduction for cursive text recognition | |
US6970601B1 (en) | Form search apparatus and method | |
US20060050962A1 (en) | System, process and software arrangement for recognizing handwritten characters | |
US6128410A (en) | Pattern matching apparatus and method that considers distance and direction | |
US20070047822A1 (en) | Learning method for classifiers, apparatus, and program for discriminating targets | |
US6338062B1 (en) | Retrieval system, retrieval method and computer readable recording medium that records retrieval program | |
CN114820625B (zh) | 一种汽车顶块缺陷检测方法 | |
Srihari et al. | Biometric and forensic aspects of digital document processing | |
Pham et al. | Offline handwritten signature verification using local and global features | |
CN113205081B (zh) | 一种基于显著性检测的svm模型工人疲劳精准判别方法 | |
JP4749884B2 (ja) | 顔判別装置の学習方法、顔判別方法および装置並びにプログラム | |
JPH0981684A (ja) | パターン認識装置及び文字切り出し方式 | |
KR100718139B1 (ko) | 영상에 포함된 문자 인식장치 및 방법 | |
CN111104869A (zh) | 一种可识别小字符内容的工尺谱数字化方法 | |
JP4176175B2 (ja) | パターン認識装置 | |
Chanda et al. | Script identification–a han and roman script perspective | |
Muñoz | Mathematical expression recognition based on probabilistic grammars | |
Saidi et al. | Recognition of offline handwritten Arabic words using a few structural features | |
JP3344062B2 (ja) | カタカナ手書き文字切り出し回路 | |
KR101408345B1 (ko) | 데이터 분류를 위한 데이터 처리 장치 및 방법, 상기 방법을 기록한 기록 매체 | |
JP3374762B2 (ja) | 文字認識方法及びその装置 | |
JPH11184976A (ja) | 辞書学習方式および文字認識装置 | |
JP2008071214A (ja) | 文字認識辞書作成方法及びその装置及び文字認識方法及びその装置及びプログラムを格納した記憶媒体 | |
JPH0749926A (ja) | 文字認識装置 | |
CN117765059A (zh) | 一种基于YOLOv5的钢材厚度检测识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030318 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080404 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090404 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090404 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100404 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110404 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110404 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120404 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130404 Year of fee payment: 10 |
|
LAPS | Cancellation because of no payment of annual fees |