Nothing Special   »   [go: up one dir, main page]

JPH06103402A - 名刺認識装置 - Google Patents

名刺認識装置

Info

Publication number
JPH06103402A
JPH06103402A JP4275241A JP27524192A JPH06103402A JP H06103402 A JPH06103402 A JP H06103402A JP 4275241 A JP4275241 A JP 4275241A JP 27524192 A JP27524192 A JP 27524192A JP H06103402 A JPH06103402 A JP H06103402A
Authority
JP
Japan
Prior art keywords
character string
business card
character
attribute
flag
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4275241A
Other languages
English (en)
Inventor
Hitoshi Sato
仁 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP4275241A priority Critical patent/JPH06103402A/ja
Publication of JPH06103402A publication Critical patent/JPH06103402A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 名刺の文字列の属性をより正確に判定するこ
とができるようにする。 【構成】 名刺のイメージが読み取られ、名刺の文字列
および名刺のレイアウトが認識され、名刺のレイアウト
に基づいて、名刺の文字列の属性がまず判定される。そ
して、ステップS3において、名刺の文字列の長さ、ま
たは文字列に含まれる数字の割合に基づいて、名刺の文
字列の属性がさらに判定される。また、ステップS5,
S6、およびS8乃至S11において、キーワードと、
名刺の文字列とがマッチングされ、そのマッチング結果
に対応して、名刺の文字列の属性がさらに判定される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、名刺の文字を認識する
場合に用いて好適な名刺認識装置に関する。
【0002】
【従来の技術】従来の名刺認識装置においては、名刺の
イメージを読み取り、そのイメージを文字認識し、名刺
から、認識された文字列を切り出して、各文字列に、例
えば名前、住所、または電話番号などの属性を付加する
ようになっている。
【0003】そして、各文字列とともに、その属性が、
例えばディスクなどの記録媒体に記録され、データベー
ス化されることにより、必要に応じて電話番号などの検
索ができるようになっている。
【0004】
【発明が解決しようとする課題】ところで、このような
名刺認識装置では、例えば各文字列から、所定のキーワ
ードを検出し、その属性を判定するようになっている。
即ち、文字列から、例えばキーワード「県」や「群」が
検出された場合、その文字列の属性が住所であると判定
されるようになっている。
【0005】しかしながら、このようにキーワードだけ
で名刺の文字列の属性を判定する場合、ある程度までは
判定誤り率を低下させることができるが、それ以上に誤
り率を低下させることは困難であった。
【0006】即ち、例えば名刺の氏名に文字「県」や
「市」、「都」などが含まれている場合、氏名としての
文字列が、住所であると判定され、判定誤りが生じる課
題があった。
【0007】本発明は、このような状況に鑑みてなされ
たものであり、名刺の文字列の属性を、より正確に判定
することができるようにするものである。
【0008】
【課題を解決するための手段】請求項1に記載の名刺認
識装置は、名刺のイメージを読み取る読取手段としての
イメージスキャナ5と、イメージスキャナ5により読み
取られた名刺のイメージから、名刺の文字列および名刺
のレイアウトを認識し、名刺のレイアウトに基づいて、
名刺の文字列の属性を判定する認識判定手段としての文
字認識装置6とを備えることを特徴とする。
【0009】請求項2に記載の名刺認識装置は、文字認
識装置6により認識された名刺の文字列の長さ、または
文字列に含まれる数字の割合に基づいて、名刺の文字列
の属性を判定する第1の判定手段としてのプログラムの
処理ステップS3をさらに備えることを特徴とする。
【0010】請求項3に記載の名刺認識装置は、キーワ
ードを記憶している記憶手段としてのRAM13と、R
AM13に記憶されているキーワードと、文字認識装置
6により認識された名刺の文字列とをマッチングするマ
ッチング手段としてのプログラムの処理ステップS5,
S6およびS8乃至S11と、プログラムの処理ステッ
プS5,S6およびS8乃至S11のマッチング結果に
対応して、名刺の文字列の属性を判定する第2の判定手
段としてのプログラムの処理ステップS13とをさらに
備えることを特徴とする。
【0011】
【作用】上記構成の名刺認識装置においては、名刺のイ
メージを読み取り、名刺の文字列および名刺のレイアウ
トを認識し、名刺のレイアウトに基づいて、名刺の文字
列の属性を判定する。そして、名刺の文字列の長さ、ま
たは文字列に含まれる数字の割合に基づいて、名刺の文
字列の属性をさらに判定する。また、RAM13に記憶
されているキーワードと、名刺の文字列とをマッチング
し、そのマッチング結果に対応して、名刺の文字列の属
性をさらに判定する。従って、名刺の文字列の属性を、
より正確に判定することができる。
【0012】
【実施例】図1は、本発明の名刺認識装置の一実施例の
構成を示すブロック図であり、図2は、その全体図であ
る。WS(ワークステーション)1は、CPU11、R
OM12、およびRAM13から構成され、インターフ
ェイス14およびイメージボード15が、その拡張スロ
ット(図示せず)に挿入されている。CPU11は、装
置全体を制御するとともに、ROM12に記憶されてい
るシステムプログラム、またはRAM13に記憶された
ユーザプログラムを読み出して実行する。
【0013】ROM12には、システムプログラムが記
憶されている。RAM13は、ユーザプログラムを記憶
する他、装置の動作上必要なデータを記憶する。さら
に、RAM13には、名刺に印刷された文字(文字列)
とマッチングするためのキーワード辞書(後述する)が
記憶されている。
【0014】インターフェイス14は、CPU11に代
わって文字認識装置6(インターフェイス22)との入
出力を管理する。イメージボード15は、CPU11に
代わってイメージスキャナ5またはプリンタ7との入出
力を管理する。
【0015】ディスプレイ2は、WS1より供給される
文字データやグラフィックデータを表示する。キーボー
ド3またはマウス4は、例えばコマンドや装置の動作上
必要なデータを入力する場合に操作される。
【0016】イメージスキャナ5は、そこにセットされ
た名刺のイメージを読み取り、イメージデータをWS1
(インターフェイス14)に出力する。
【0017】文字認識装置6は、OCR(Optical Char
acter Reader)ボード21およびインターフェイス22
から構成される。OCRボード21は、WS1(RAM
13)より供給される、イメージスキャナ5で読み取ら
れた名刺のイメージから、名刺の文字列および名刺のレ
イアウトを認識し、名刺のレイアウトに基づいて、名刺
の文字列の属性を判定する。インターフェイス22は、
文字認識装置6へのデータの入力、またはそこからのデ
ータの出力を管理する。
【0018】ここで、名刺の文字列の属性は、大きく分
けて名前群、会社名群、および住所群の3つがある。さ
らに名前群は、名前または役職(肩書き)に分類され、
会社名群は、会社名または所属名に分類される。また、
住所群は、住所、電話番号、FAX番号、または郵便番
号に分類され、従って名刺の文字列の属性は、合計8つ
に分類される。
【0019】プリンタ7は、WS1より供給されるプリ
ントデータにしたがって、文字またはグラフィックをプ
リントアウトする。
【0020】次に、その動作について説明する。まず、
イメージスキャナ5に名刺がセットされ、そのイメージ
が読み取られてイメージデータが生成される。この名刺
のイメージデータは、イメージボード15を介してWS
1のRAM13に記憶された後、インターフェイス14
を介して文字認識装置6に供給される。
【0021】文字認識装置6(OCRボード21)にお
いて、その内蔵するメモリ(図示せず)に記憶された辞
書が参照され、WS1(RAM13)より供給された名
刺のイメージデータが文字認識される。さらに、文字認
識装置6において、名刺のイメージデータから、名刺の
レイアウトが認識され、この名刺のレイアウトに基づい
て、文字認識された文字からなる名刺の文字列の属性が
判定される。
【0022】即ち、文字認識装置6において、例えば図
3に示すように、名刺のレイアウトが認識された場合、
文字列Aは、名刺の右上部分に大きくレイアウトされて
いるので、その属性が会社名であると判定され、文字列
Bは、名刺の右上部分に小さくレイアウトされているの
で、その属性が役職であると判定される。
【0023】さらに、文字列Cは、名刺の中央に大きく
レイアウトされているので、その属性が名前であると判
定され、文字列Dは、属性が名前であると判定された文
字列Cのすぐ左にレイアウトされているので、その属性
が住所であると判定される。また、文字列Eは、名刺の
左下部分に小さくレイアウトされているので、その属性
が電話番号またはFAX番号のいずれかであると判定さ
れる。
【0024】また、文字認識装置6において、名刺にお
ける文字列の数、各文字列の文字数(文字列の長さ)、
各文字列に含まれる数字の割合、および文字列の各文字
に対する候補文字が検出され、文字列の属性とともに、
インフォメーションファイルとしてファイル化される。
さらに、文字列はテキストファイルとしてファイル化さ
れ、インフォメーションファイルとともにWS1に供給
される。
【0025】ここで、候補文字とは、文字認識装置6で
認識された文字に対してあらかじめ割り当てられた、そ
の文字に類似した文字である。例えば文字「S」に対し
ては、「3」、「8」、「s」、「S」、「5」、
「p」、「6」、「P」、「6」、および「0」などの
計10個の候補文字が割り当てられている(図7または
図8)。
【0026】WS1では、まず前処理として、テキスト
ファイルにおける文字列のうち、例えば1文字だけから
なるものなどの不必要な文字列が削除される。そして、
テキストファイルとインフォメーションファイルとから
データが読み出され、図4に示すフォーマットのデータ
が生成される。
【0027】なお、図4において、最大200バイトの
変数ST1には、テキストファイルにおける文字列がセ
ットされる。さらに、1バイトのポインタPには、変数
ST1にセットされた文字列の各文字に対する候補文字
の、インフォメーションファイルにおける先頭アドレス
がセットされ、2バイトの変数AT1には、文字認識装
置6で判定された属性に対する属性値がセットされる。
最大200バイトの変数ST2、または2バイトの変数
AT2は、ともにワークエリアである。
【0028】ここで、属性「名前」、「会社名」、「所
属」、「役職」、「郵便番号」、「住所」、「電話番
号」、または「FAX番号」には、例えば属性値0乃至
7がそれぞれ割り当てられている。
【0029】また、2バイトのフラグSには、文字列の
属性の判定が最終的に終了した場合に、0または1のう
ちの、例えば1がセットされ、文字列の属性の判定が最
終的に終了していない場合に、0または1のうちの、例
えば0がセットされる。2バイトのフラグTには、変数
ST1にセットされた文字列が分割された場合(後述す
る)、0または1のうちの、例えば1がセットされ、変
数ST1にセットされた文字列が分割されていない場
合、0または1のうちの、例えば0がセットされる。
【0030】図4に示すフォーマットのデータが生成さ
れた後、各文字列の属性をカウントするためのカウンタ
(変数)が、変数AT1に対応して1だけインクリメン
トされる。
【0031】即ち、この装置においては、文字列の属性
が判定されるたびに、その判定回数をカウントする名前
フラグn_flag、役職フラグr_flag、会社名
フラグc_flag、所属フラグd_flag、郵便番
号z_フラグflag、住所フラグa_flag、電話
番号フラグt_flag、およびFAX番号フラグf_
flagの8つのカウンタ(変数)が、RAM13の所
定の領域に確保されている。
【0032】そして、文字列の属性が、例えば名前であ
ると、文字認識装置6において判定された場合、名前フ
ラグn_flagが1だけインクリメントされるように
なっている。
【0033】以上の処理の後、図5に示すフローチャー
トのステップS1において、図4に示すフォーマットの
データが、RAM13に読み込まれ、ステップS2に進
み、変数AT1にセットされた属性が、名前群、即ち名
前または役職であるか否かが判定される。
【0034】ステップS2において、変数AT1にセッ
トされた属性が名前または役職であると判定された場
合、ステップS15に進み、変数ST1にセットされた
文字列の属性が変数AT1にセットされた属性に決定さ
れ、処理を終了する。
【0035】ステップS2において、変数AT1にセッ
トされた属性が名前または役職、即ち名前群でないと判
定された場合、ステップS3に進み、スタイル判定が行
われる。
【0036】即ち、ステップS3では、まず変数ST1
にセットされた文字列の長さ(文字数)が、例えば2以
上6以下であり、且つ、その文字列における数字の割合
が、例えば0.16以下である場合、その文字列の属性
は、住所群における住所であると判定され、文字列の住
所フラグa_flagが1だけインクリメントされる。
【0037】さらに、変数ST1にセットされた文字列
の長さ(文字数)が、例えば2以上10以下であり、且
つその文字列における数字の割合が、例えば0.16以
下である場合、その文字列の属性は、名前群における役
職であると判定され、文字列の役職フラグr_flag
が1だけインクリメントされる。
【0038】変数ST1にセットされた文字列の長さ
(文字数)が、例えば4以上であり、且つその文字列に
おける数字の割合が、例えば0.16以下である場合、
その文字列の属性は、会社名群における会社名または所
属名であると判定され、文字列の会社名フラグc_fl
agまたは所属フラグd_flagが1だけインクリメ
ントされる。
【0039】変数ST1にセットされた文字列の長さ
(文字数)が、例えば8以上であり、且つその文字列に
おける数字の割合が、例えば0.30以上である場合、
その文字列の属性は、住所群における電話番号またはF
AX番号であると判定され、文字列の電話番号フラグt
_flagまたはFAX番号フラグf_flagが1だ
けインクリメントされる。
【0040】変数ST1にセットされた文字列の長さ
(文字数)が、例えば12以上であり、且つその文字列
における数字の割合が、例えば0.16より大きく、
0.30未満である場合、その文字列の属性は、住所群
における住所であると判定され、文字列の住所フラグa
_flagが1だけインクリメントされる。
【0041】変数ST1にセットされた文字列の長さ
(文字数)が、例えば3以上10以下であり、且つその
文字列における数字の割合が、例えば0.16より大き
い場合、その文字列の属性は、住所群における郵便番号
であると判定され、文字列の郵便番号z_フラグfla
gが1だけインクリメントされる。
【0042】また、ステップS3では、変数ST1にセ
ットされた文字列の長さ(文字数)、またはその文字列
における数字の割合が、上述した場合のいずれでもない
場合、その文字列の属性は、名前群における名前である
と判定され、文字列の名前フラグn_flagが1だけ
インクリメントされる。
【0043】ステップS3における処理の後、ステップ
S4に進み、ステップS3で文字列の属性が住所群であ
ると判定されたか否かが判定される。ステップS4にお
いて、ステップS3で文字列の属性が住所群であると判
定されていないと判定された場合、ステップS5に進
み、RAM13に記憶されているキーワード辞書の、属
性「会社名群」(「会社名」または「所属名」)に割り
当てられたキーワードと、変数ST1にセットされた文
字列、またはその候補文字列とが、それぞれ2次パター
ンマッチングされる。
【0044】ここで、RAM13には、図6に示すよう
な8つのブロックから構成されるキーワード辞書が記憶
されている。即ち、キーワード辞書には、属性の分類を
示す属性名、その属性に関連するキーワードが記憶され
ているRAM13の先頭アドレスを指すキーワードポイ
ンタ、属性に対応付けられた属性値、および次のブロッ
クの先頭アドレスを指すネキストポインタからなるブロ
ックが、属性「名前」、「会社名」、「所属」、「役
職」、「郵便番号」、「住所」、「電話番号」、または
「FAX番号」ごとに登録されている。
【0045】なお、矢印PAは、キーワード辞書の先頭
ブロックへのポインタを示す。さらに、属性「名前」、
「会社名」、「所属」、「役職」、「郵便番号」、「住
所」、「電話番号」、または「FAX番号」に関連する
キーワードとは、その属性を表現する文字列を意味し、
例えば図6(b)に示すようなものが、RAM13にそ
れぞれ記憶されている。
【0046】また、ステップS5における2次パターン
マッチングとは、m文字からなるキーワードpat
[1]乃至pat[m]と、n文字からなる文字列te
xt[1]乃至text[n]のうちの文字列text
[i]乃至text[i+m−1]とを、変数iを1乃
至n−m+1の範囲で変えてマッチングすることである
(m≦n)。
【0047】従って、変数ST1に、例えば文字列「S
ONY社式会社」(SONYは商標)がセットされてい
る場合、ステップS5において、属性「会社名群」、即
ち「会社名」または「所属名」に関連するキーワードの
うちの、例えば「株式会社」と、変数ST1にセットさ
れた文字列「SONY社式会社」とが、2次パターンマ
ッチングされるときには、まずキーワードの1文字目の
文字「株」と、文字列「SONY社式会社」の1文字目
の文字「S」、またはその候補文字「3」、「8」、
「s」、「S」、「5」、「p」、「6」、「P」、
「6」、もしくは「0」(図7(b))とがそれぞれパ
ターンマッチングされる。
【0048】キーワードの1文字目の文字「株」と、文
字列「SONY社式会社」の1文字目の文字「S」、ま
たはその候補文字「3」、「8」、「s」、「S」、
「5」、「p」、「6」、「P」、「6」、もしくは
「0」(図7(b))とが、いずれもマッチングしなか
った場合、キーワードの1文字目「株」と、文字列「S
ONY社式会社」における文字「S」の次の文字、即ち
文字列「SONY社式会社」の2文字目の文字「O」、
またはその候補文字「0」、「O」、「o」、「8」、
「ロ」、「目」、「ロ」、「D」、「D」、もしくは
「@」(図7(b))とがそれぞれマッチングされ、以
下キーワードの1文字目の文字「株」と、文字列「SO
NY社式会社」を構成する文字、またはその候補文字の
いずれかとがマッチングするまで、上述した処理が繰り
返される。
【0049】そして、図7に示すように、キーワードの
1文字目の文字「株」と、文字列「SONY社式会社」
の5文字目の文字「社」の候補文字「株」とがマッチン
グした場合、文字列「SONY社式会社」におけるその
次の文字、即ち文字列「SONY社式会社」の6文字目
の文字「式」、またはその候補文字「式」、「武」、
「式」、「武」、「武」、「式」、「式」、「式」、
「式」、もしくは「式」(図8(b)において、影を付
してある)と、キーワードの2文字目の文字「式」とが
それぞれマッチングされる。
【0050】以上のような処理を繰り返し、キーワード
「株式会社」を構成する各文字「株」、「式」、
「会」、もしくは「社」と、変数ST1にセットされた
文字列「SONY社式会社」を構成する文字、またはそ
の候補文字とが連続してマッチングした場合、ステップ
S5において、文字列「SONY社式会社」がキーワー
ド「株式会社」を含むと判定される。
【0051】なお、キーワードの1文字目の文字と、文
字列「SONY社式会社」の5文字目の文字「社」の候
補文字「株」とがマッチングした後、文字列「SONY
社式会社」の6文字目の文字「式」、またはその候補文
字と、キーワードの2文字目の文字とがいずれもマッチ
ングしなかった場合、再びキーワードの1文字目の文字
が、文字列「SONY社式会社」の6文字目の文字
「式」、またはその候補文字とマッチングされる。
【0052】ステップS5では、以上のようにして「会
社名群」(「会社名」または「所属名」)に割り当てら
れたすべてのキーワードと、変数ST1にセットされた
文字列、またはその候補文字列とが、それぞれ2次パタ
ーンマッチングされ、その文字列が、キーワードを含む
か否かが判定される。
【0053】そして、ステップ6に進み、RAM13に
記憶されているキーワード辞書の、属性「住所群」
(「住所」、「電話番号」、「FAX番号」、または
「郵便番号」)に割り当てられたキーワードと、変数S
1にセットされた文字列のみとが、2次パターンマッ
チングされる。
【0054】ここで、ステップS6では、キーワード
と、変数ST1にセットされた文字列の候補文字列との
パターンマッチングは行われない。即ち、変数ST
1に、例えば文字列「SONY株式会社」がセットされ
ており、キーワード「株式会社」とパターンマッチング
する場合、ステップS6では、キーワードの1文字目の
文字「株」が、文字列「SONY株式会社」と、その1
文字目の文字「S」から順次パターンマッチングされる
(図9)。
【0055】そして、キーワードの1文字目の文字
「株」と、文字列「SONY株式会社」を構成する文字
のいずれかとがマッチングした場合、即ち、例えばキー
ワードの1文字目の文字「株」と、文字列「SONY株
式会社」の5文字目の文字「株」とがマッチングした場
合、文字列「SONY株式会社」におけるその次の文
字、即ち文字列「SONY株式会社」の6文字目の文字
「式」と、キーワードの2文字目の文字「式」とがパタ
ーンマッチングされる(図9)。
【0056】以上のような処理を繰り返し、キーワード
「株式会社」を構成する各文字「株」、「式」、
「会」、もしくは「社」と、変数ST1にセットされた
文字列「SONY株式会社」を構成する文字とが連続し
てマッチングした場合、ステップS6において、文字列
「SONY株式会社」がキーワード「株式会社」を含む
と判定される。
【0057】なお、キーワードの1文字目の文字と、文
字列「SONY株式会社」の5文字目の文字「株」とが
マッチングした後、文字列「SONY株式会社」の6文
字目の文字と、キーワードの2文字目の文字とがマッチ
ングしなかった場合、再びキーワードの1文字目の文字
が、文字列「SONY株式会社」の6文字目の文字
「式」とマッチングされる。
【0058】ステップS6では、以上のようにして「住
所群」(「住所」、「電話番号」、「FAX番号」、ま
たは「郵便番号」)に割り当てられたすべてのキーワー
ドと、変数ST1にセットされた文字列のみとが2次パ
ターンマッチングされ、その文字列が、キーワードを含
むか否かが判定され、ステップS12に進む。
【0059】一方、ステップS4において、変数ST1
にセットされた文字列の属性が、住所群であるとステッ
プS3で判定されたと判定された場合、ステップS7に
進み、その文字列の属性が、住所群であると文字認識装
置6で認識されたか否かが判定される。
【0060】ステップS7において、変数ST1にセッ
トされた文字列の属性が、住所群であると文字認識装置
6で認識されていないと判定された場合、ステップS8
またはS9に順次進み、上述したステップS5またはS
6における処理とそれぞれ同一の処理が行われ、ステッ
プS12に進む。
【0061】ステップS7において、変数ST1にセッ
トされた文字列の属性が、住所群であると文字認識装置
6で認識されたと判定された場合、ステップS10に進
み、ステップS5における場合と同様にして、属性「住
所群」(「住所」、「電話番号」、「FAX番号」、ま
たは「郵便番号」)に割り当てられたすべてのキーワー
ドと、変数ST1にセットされた文字列、またはその候
補文字列とが、それぞれ2次パターンマッチングされ、
その文字列が、キーワードを含むか否かが判定されてス
テップS11に進む。
【0062】ステップS11において、ステップS6に
おける場合と同様にして、属性「名前群」(「会社名」
または「所属名」)に割り当てられたすべてのキーワー
ドと、変数ST1にセットされた文字列とが2次パター
ンマッチングされ、その文字列が、キーワードを含むか
否かが判定されてステップS12に進む。
【0063】ステップS12において、ステップS5,
S6、またはステップS8乃至S11で、変数ST1
セットされた文字列に含まれると判定されたキーワード
を有する属性のカウンタとしての名前フラグn_fla
g、役職フラグr_flag、会社名フラグc_fla
g、所属フラグd_flag、郵便番号z_フラグfl
ag、住所フラグa_flag、電話番号フラグt_f
lag、またはFAX番号フラグf_flagが、そこ
で、変数ST1にセットされた文字列にキーワードが含
まれると判定された回数に応じてそれぞれカウントアッ
プされ、ステップS13に進む。
【0064】ステップS13において、名前フラグn_
flag、役職フラグr_flag、会社名フラグc_
flag、所属フラグd_flag、郵便番号z_フラ
グflag、住所フラグa_flag、電話番号フラグ
t_flag、またはFAX番号フラグf_flagの
うち、最大値がセットされたものが検出され、ステップ
S14に進み、ステップS13で検出されたカウンタ
(名前フラグn_flag、役職フラグr_flag、
会社名フラグc_flag、所属フラグd_flag、
郵便番号z_フラグflag、住所フラグa_fla
g、電話番号フラグt_flag、またはFAX番号フ
ラグf_flagのいずれか)が示す属性が、変数ST
1にセットされた文字列の属性として決定され、処理を
終了する。
【0065】ここで、電話番号フラグt_flagとF
AX番号フラグf_flag、住所フラグa_flag
と電話番号フラグt_flag、住所フラグa_fla
gとFAX番号フラグf_flag、または郵便番号z
_フラグflagと住所フラグa_flagが、ともに
同じ値で、最大値となった場合、それぞれの属性に対す
るキーワードが、変数ST1にセットされた文字列から
検出され、このキーワードを基にして、文字列が2つに
分割される。そして、分割された2つの文字列に対し
て、ステップS3乃至S14の処理が施される。
【0066】そして、分割された2つの文字列に対し
て、ステップS3乃至S14の処理が施された後、どち
らかが属性判定不能(後述する)であるか、またはどち
らも同じ属性になった場合、それらが再び1つの文字列
に復元され、属性判定不能でない方の属性、または同じ
になった属性がそれぞれ出力される。また、分割された
2つの文字列が、異なる属性である場合には、分割され
たそれぞれの文字列に対して、その各属性が出力され
る。
【0067】なお、文字列からキーワードを検出するこ
とができなかったときには、その文字列は、属性判定不
能なものとして破棄され、処理を終了する。
【0068】さらに、上述した以外のカウンタどうしが
同じ値で、最大値となった場合、変数ST1にセットさ
れた文字列の、より後部から検出されたキーワードを有
する属性が、その文字列の属性として出力される。
【0069】以上のようにして決定された属性は、文字
列とともに、例えば磁気ディスク(図示せず)などに記
録され、データベースとして利用される。
【0070】なお、本実施例においては、図5のステッ
プS6,S9、またはS11において、キーワードと、
変数ST1にセットされた文字列のみとを2次パターン
マッチングするようにしたが、ステップS5,S8、ま
たはS10における場合のように、キーワードと、変数
ST1にセットされた文字列、またはその候補文字列と
をそれぞれ2次パターンマッチングするようにすること
ができる。
【0071】
【発明の効果】以上のように、本発明の名刺認識装置に
よれば、名刺のイメージを読み取り、名刺の文字列およ
び名刺のレイアウトを認識し、名刺のレイアウトに基づ
いて、名刺の文字列の属性を判定する。そして、名刺の
文字列の長さ、または文字列に含まれる数字の割合に基
づいて、名刺の文字列の属性をさらに判定する。また、
記憶手段に記憶されているキーワードと、名刺の文字列
とをマッチングし、そのマッチング結果に対応して、名
刺の文字列の属性をさらに判定する。従って、名刺の文
字列の属性を、より正確に判定することができる。
【図面の簡単な説明】
【図1】本発明の名刺認識装置の一実施例の構成を示す
ブロック図である。
【図2】図1の実施例の全体図である。
【図3】名刺のレイアウトを示す図である。
【図4】WS1において、文字認識装置6から出力され
たデータから生成されるデータのフォーマットを示す図
である。
【図5】図1の実施例の動作を説明するためのフローチ
ャートである。
【図6】RAM13に記憶されているキーワード辞書を
説明するための図である。
【図7】図5のフローチャートのステップS5,S8、
またはS10における2次パターンマッチングを説明す
るための図である。
【図8】図5のフローチャートのステップS5,S8、
またはS10における2次パターンマッチングを説明す
るための図である。
【図9】図5のフローチャートのステップS6,S9、
またはS11における2次パターンマッチングを説明す
るための図である。
【符号の説明】
1 WS(ワークステーション) 2 ディスプレイ 3 キーボード 4 マウス 5 イメージスキャナ 6 文字認識装置 7 プリンタ 11 CPU 12 ROM 13 RAM 14 インターフェイス 15 イメージボード 21 OCR(Optical Character Reader)ボード 22 インターフェイス

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 名刺のイメージを読み取る読取手段と、 前記読取手段により読み取られた名刺のイメージから、
    前記名刺の文字列および前記名刺のレイアウトを認識
    し、前記名刺のレイアウトに基づいて、前記名刺の文字
    列の属性を判定する認識判定手段とを備えることを特徴
    とする名刺認識装置。
  2. 【請求項2】 前記認識判定手段により認識された前記
    名刺の文字列の長さ、または前記文字列に含まれる数字
    の割合に基づいて、前記名刺の文字列の属性を判定する
    第1の判定手段をさらに備えることを特徴とする請求項
    1に記載の名刺認識装置。
  3. 【請求項3】 キーワードを記憶している記憶手段と、 前記記憶手段に記憶されているキーワードと、前記認識
    判定手段により認識された前記名刺の文字列とをマッチ
    ングするマッチング手段と、 前記マッチング手段のマッチング結果に対応して、前記
    名刺の文字列の属性を判定する第2の判定手段とをさら
    に備えることを特徴とする請求項1または2のいずれか
    に記載の名刺認識装置。
JP4275241A 1992-09-18 1992-09-18 名刺認識装置 Pending JPH06103402A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4275241A JPH06103402A (ja) 1992-09-18 1992-09-18 名刺認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4275241A JPH06103402A (ja) 1992-09-18 1992-09-18 名刺認識装置

Publications (1)

Publication Number Publication Date
JPH06103402A true JPH06103402A (ja) 1994-04-15

Family

ID=17552668

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4275241A Pending JPH06103402A (ja) 1992-09-18 1992-09-18 名刺認識装置

Country Status (1)

Country Link
JP (1) JPH06103402A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962794A (ja) * 1995-08-24 1997-03-07 Fujitsu Ltd 文書認識装置
JPH09134406A (ja) * 1995-09-06 1997-05-20 Fujitsu Ltd 文書画像からのタイトル抽出装置および方法
US6721451B1 (en) 2000-05-31 2004-04-13 Kabushiki Kaisha Toshiba Apparatus and method for reading a document image
JP2008084186A (ja) * 2006-09-28 2008-04-10 Fuji Xerox Co Ltd 画像処理システム及び画像処理プログラム
JP2019204399A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0962794A (ja) * 1995-08-24 1997-03-07 Fujitsu Ltd 文書認識装置
JPH09134406A (ja) * 1995-09-06 1997-05-20 Fujitsu Ltd 文書画像からのタイトル抽出装置および方法
US6721451B1 (en) 2000-05-31 2004-04-13 Kabushiki Kaisha Toshiba Apparatus and method for reading a document image
JP2008084186A (ja) * 2006-09-28 2008-04-10 Fuji Xerox Co Ltd 画像処理システム及び画像処理プログラム
JP2019204399A (ja) * 2018-05-25 2019-11-28 富士ゼロックス株式会社 情報処理装置及びプログラム
US11361572B2 (en) 2018-05-25 2022-06-14 Fujifilm Business Innovation Corp. Information processing apparatus and non-transitory computer readable medium

Similar Documents

Publication Publication Date Title
JP3425408B2 (ja) 文書読取装置
JP2726568B2 (ja) 文字認識方法及び装置
KR100412317B1 (ko) 문자인식/수정방법및장치
JPH1153402A (ja) 情報検索装置
JP3422924B2 (ja) 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JPH1011531A (ja) 帳票読取装置
JP2006065477A (ja) 文字認識装置
JPH06103402A (ja) 名刺認識装置
JP6856916B1 (ja) 情報処理装置、情報処理方法及び情報処理プログラム
JP3727422B2 (ja) 文字認識装置及びその方法
JPH08263587A (ja) 文書入力方法および文書入力装置
JP4054453B2 (ja) 文字認識装置およびプログラム記録媒体
WO2019194029A1 (ja) 画像処理装置、画像処理方法、及びプログラムを記憶する記憶媒体
US20040034836A1 (en) Information partitioning apparatus, information partitioning method, information partitioning program, and recording medium on which information partitioning program has been recorded
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JPH10187751A (ja) 認識データ処理装置およびそのプログラム記録媒体
JPH10198688A (ja) 定型文書読み取り装置
JP3210842B2 (ja) 情報処理装置
JP2000090192A (ja) 住所および郵便番号の文字列修正方法
JP2784004B2 (ja) 文字認識装置
JP3720405B2 (ja) 領域識別装置及び方法
JPS63282586A (ja) 文字認識装置
JPH07152856A (ja) 光学的文字読取装置
JP3292595B2 (ja) 文字認識装置
JP3380850B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010816