JP2008083846A - Target area determination method and device - Google Patents
Target area determination method and device Download PDFInfo
- Publication number
- JP2008083846A JP2008083846A JP2006261271A JP2006261271A JP2008083846A JP 2008083846 A JP2008083846 A JP 2008083846A JP 2006261271 A JP2006261271 A JP 2006261271A JP 2006261271 A JP2006261271 A JP 2006261271A JP 2008083846 A JP2008083846 A JP 2008083846A
- Authority
- JP
- Japan
- Prior art keywords
- circumscribed rectangle
- recognition
- dictionary data
- recognition area
- scanned
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Input (AREA)
Abstract
Description
本発明は、文字認識装置などに適用して好適な文字の認識対象領域の決定方法及び装置に関するものである。 The present invention relates to a method and apparatus for determining a character recognition target region suitable for application to a character recognition device or the like.
従来、帳票の画像から認識対象領域を決定する方法として以下のものがある。例えば、帳票画像上の左右から2点の特徴部位座標を検出し、帳票端基準からの距離を予め定義した特徴部位座標と比較演算して画像ずれの要因を判別し、画像ずれ要因に応じた帳票端基準からの適切な座標補正値を算出して、領収印欄などの認識対象領域を判別している(例えば、特許文献1参照)。 Conventionally, there are the following methods for determining a recognition target area from a form image. For example, two feature part coordinates from the left and right on the form image are detected, and the distance from the form edge reference is compared with the predefined feature part coordinates to determine the cause of the image deviation, and the image deviation factor is determined. An appropriate coordinate correction value from the form edge reference is calculated to determine a recognition target area such as a receipt column (see, for example, Patent Document 1).
前述した従来の方法では、予め定義した特徴部位座標との比較演算により生じる画像ずれから要因を判別するようにしており、次いで、画像ずれ要因に応じた帳票端基準からの適切な座標補正値を算出しており、認識対象領域を判別するまでの処理が複雑になっている。 In the conventional method described above, the factor is determined from the image shift caused by the comparison calculation with the predefined characteristic part coordinates, and then an appropriate coordinate correction value from the form edge reference according to the image shift factor is obtained. The calculation and the process until the recognition target area is determined are complicated.
本発明に係る認識対象領域決定方法は、予め帳票内の表の外接矩形の横方向及び縦方向の各座標、その外接矩形内に存在する認識領域の横方向及び縦方向の各座標が辞書データとして帳票の種類毎にそれぞれ設定され、スキャナ部によりスキャニングされた帳票画像から対応する帳票の辞書データを検索し、スキャニングされた帳票画像から表の外接矩形を検出し、検出された表の外接矩形と検索された辞書データとからその外接矩形内の認識領域を認識し、これを文字の認識対象領域のデータとして抽出する。 In the recognition target area determining method according to the present invention, the horizontal and vertical coordinates of the circumscribed rectangle of the table in the form, and the horizontal and vertical coordinates of the recognition area existing in the circumscribed rectangle are dictionary data. Is set for each form type, and the dictionary data of the corresponding form is retrieved from the form image scanned by the scanner unit, the circumscribed rectangle of the table is detected from the scanned form image, and the detected circumscribed rectangle of the table is detected. Then, the recognition area in the circumscribed rectangle is recognized from the retrieved dictionary data, and this is extracted as data of the character recognition target area.
本発明においては、スキャナ部によりスキャニングされた帳票画像から対応する帳票の辞書データを検索し、スキャニングされた帳票画像から表の外接矩形を検出し、検出された表の外接矩形と検索された辞書データとからその外接矩形内の認識領域を認識し、これを文字の認識対象領域のデータとして抽出するようにしたので、認識領域が辞書データ側の認識領域よりもずれていても補正をすることなく、容易に認識領域内の文字を認識することができる。 In the present invention, the dictionary data of the corresponding form is searched from the form image scanned by the scanner unit, the circumscribed rectangle of the table is detected from the scanned form image, and the detected circumscribed rectangle of the table is searched. Since the recognition area in the circumscribed rectangle is recognized from the data and this is extracted as the data of the character recognition target area, correction is made even if the recognition area is shifted from the recognition area on the dictionary data side. And the characters in the recognition area can be easily recognized.
図1は本発明の実施の形態に係る認識対象領域決定装置を備えた文字認識装置の概略構成を示すブロック図、図2は実施の形態における辞書データを系統化して示す図である。
図中に示す文字認識装置10は、帳票の画像データを読み取るための画像データ入力装置70が接続され、認識対象領域決定装置20と、文字認識部40と、認識対象領域決定装置20及び文字認識部40をそれぞれ制御するCPU50と、例えばハードディスクなどからなるメモリ60とを備えている。認識対象領域決定装置20は、辞書データ記憶手段21と、帳票識別手段22と、表外接矩形検出手段23と、認識領域抽出手段24とを備えている。前記の画像データ入力装置70は、帳票をスキャニングするスキャナ部71と、スキャナ部71によりスキャニングされた帳票画像を格納するための帳票イメージメモリ72とで構成されている。
FIG. 1 is a block diagram showing a schematic configuration of a character recognition device provided with a recognition target area determination device according to an embodiment of the present invention, and FIG. 2 is a diagram showing systematized dictionary data in the embodiment.
The
辞書データ記憶手段21は、例えば図2に示すように、帳票の種類を識別するための帳票ID、帳票毎の表の種別、各表の外接矩形の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標、外接矩形内に存在する認識領域の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標が辞書データとして登録されている。帳票識別手段22は、帳票イメージメモリ72から帳票画像を読み出して帳票IDを認識し、これを検索キーとして辞書データ記憶手段21から同じ帳票IDを有する登録画像(帳票)の辞書データを取り出して認識領域抽出手段24に転送し、かつ帳票画像を表外接矩形検出手段23に転送する。
For example, as shown in FIG. 2, the dictionary data storage means 21 includes a form ID for identifying the form type, the table type for each form, the horizontal left and right coordinates of the circumscribed rectangle of each table, and the vertical The coordinates of the upper and lower ends in the direction, the left and right coordinates in the horizontal direction and the upper and lower coordinates in the vertical direction of the recognition area existing in the circumscribed rectangle are registered as dictionary data. The form identifying means 22 reads out the form image from the
表外接矩形検出手段23は、帳票画像から横方向及び縦方向の罫線を全て検出し、交差しているものをグループ化して表の外接矩形を検出し、かつ、その外接矩形の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標をそれぞれ認識して、後段の認識領域抽出手段24に送出する。
The front circumscribing rectangle detecting means 23 detects all ruled lines in the horizontal and vertical directions from the form image, groups the intersecting rectangles to detect the circumscribed rectangle of the front, and the left end of the circumscribed rectangle in the horizontal direction. And the coordinates at the right end and the coordinates at the upper and lower ends in the vertical direction are recognized and sent to the recognition
認識領域抽出手段24は、帳票識別手段22により取り出された登録画像の辞書データと、表外接矩形検出手段23により検出された外接矩形の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標とから、帳票画像の外接矩形内に存在する認識領域の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標を算出し、認識領域データとして抽出しメモリ60に格納する。
The recognition
文字認識部40は、認識対象領域決定装置20で決定され、メモリ60に格納された認識領域データ内に記入されている文字を認識する。文字の認識は、例えば、認識領域の文字列から文字を切り出し、切り出した文字の特徴を抽出する。そして、抽出した認識対象の文字の特徴を、予め用意された辞書(図示せず)に登録された各文字の特徴と照合して、候補文字を決定する。
The
次に、本実施の形態の動作について図3及び図4を用いて説明する。図3は実施の形態に係る文字認識装置の動作を示すフローチャート、図4は帳票の認識領域の抽出を説明するための一例図である。
まず、認識対象領域決定装置20の帳票識別手段22が、帳票イメージメモリ72に格納された帳票画像を読み出して帳票IDを認識し、これを検索キーとして辞書データ記憶手段21から同じ帳票IDを有する帳票を識別する(301)。そして、その帳票の登録画像の辞書データを取り出して認識領域抽出手段24に転送すると共に、帳票画像を表外接矩形検出手段23に転送する。表外接矩形検出手段23は、帳票画像が転送されてくると、その帳票画像から横方向及び縦方向の罫線を全て検出し、交差しているものをグループ化して表の外接矩形を検出し、かつ、その外接矩形の横方向の左端と右端の各座標及び縦方向の上端と下端の各座標をそれぞれ認識して、後段の認識領域抽出手段24に送出する(302)。認識領域抽出手段24は、帳票識別手段22により取り出された登録画像の辞書データと表外接矩形検出手段23により検出された表の外接矩形とから、その外接矩形に存在する認識領域を抽出する(303)。
Next, the operation of this embodiment will be described with reference to FIGS. FIG. 3 is a flowchart showing the operation of the character recognition apparatus according to the embodiment, and FIG. 4 is an example for explaining the extraction of the recognition area of the form.
First, the
ここで、外接矩形内の認識領域の抽出について図4を参照しながら説明する。図中(a)は帳票識別手段22により検索された辞書データに基づく帳票の登録画像の例を示す。この登録画像は、その辞書データである表1の外接矩形の横方向の左端と右端の各座標iXa、iXd及び縦方向の上端と下端の各座標iYa、iYd、外接矩形内に存在する認識領域の横方向の左端と右端の各座標iXb、iXc及び縦方向の上端と下端の各座標iYb、iYcによるものである。
Here, extraction of the recognition area in the circumscribed rectangle will be described with reference to FIG. In the figure, (a) shows an example of a registered image of a form based on the dictionary data searched by the
また、(b)は帳票識別手段22により取り出された前記の辞書データと、表外接矩形検出手段23により検出された表1の外接矩形の横方向の左端と右端の各座標oXa、oXd及び縦方向の上端と下端の各座標oYa、oYdとから、帳票画像の外接矩形内に存在する認識領域を表した図で、下記に示す演算式によって認識領域が決定される。この認識領域の算出は認識領域抽出手段24によって行われる。
Further, (b) shows the dictionary data extracted by the
認識領域の横方向の左端と右端の各座標oXb、oXcは、
oXb=oXa+(iXb−iXa)×(oXd−oXa)/(iXd−iXa)
oXc=oXa+(iXc−iXa)×(oXd−oXa)/(iXd−iXa)
から求められ、
また、認識領域の縦方向の上端と下端の各座標oYb、oYcは、
oYb=oYa+(iYb−iYa)×(oYd−oYa)/(iYd−iYa)
oYc=oYa+(iYc−iYa)×(oYd−oYa)/(iYd−iYa)
から求められる。なお、前記の演算式のうち(oXd−oXa)/(iXd−iXa)及び(oYd−oYa)/(iYd−iYa)は、登録画像側の認識領域に対する帳票画像側の認識領域のサイズ(横方向及び縦方向)を補正するための式である。
The coordinates oXb, oXc of the left and right edges in the horizontal direction of the recognition area are
oXb = oXa + (iXb−iXa) × (oXd−oXa) / (iXd−iXa)
oXc = oXa + (iXc−iXa) × (oXd−oXa) / (iXd−iXa)
Sought from
In addition, the coordinates oYb and oYc of the upper end and the lower end in the vertical direction of the recognition area are
oYb = oYa + (iYb−iYa) × (oYd−oYa) / (iYd−iYa)
oYc = oYa + (iYc−iYa) × (oYd−oYa) / (iYd−iYa)
It is requested from. Of the above arithmetic expressions, (oXd−oXa) / (iXd−iXa) and (oYd−oYa) / (iYd−iYa) are the size (horizontal) of the recognition area on the form image side relative to the recognition area on the registered image side. This is an equation for correcting the direction and the vertical direction.
前記の演算式から求められた認識領域の横方向の左端と右端の各座標oXb、oXc及び縦方向の上端と下端の各座標oYb、oYcは、認識領域データとしてメモリ60に格納される。一方、文字認識部40は、メモリ60に格納された認識領域データ(oXb、oXc、oYb、oYc)に基づいて帳票画像上の認識領域を認識する。そして、この認識領域に記入された文字を前述したように切り出し、切り出した文字の特徴を抽出して、その特徴を辞書に登録された各文字の特徴と照合し候補文字を決定する。なお、表2についても前記の演算式を用いて認識領域を決定する。
The horizontal left and right coordinates oXb and oXc and the vertical top and bottom coordinates oYb and oYc of the recognition area obtained from the above arithmetic expression are stored in the
以上のように実施の形態によれば、帳票画像から横方向及び縦方向の罫線を全て検出し、交差しているものをグループ化して表の外接矩形を検出し、そして、その帳票画像に対応する登録画像の辞書データとからその外接矩形に存在する認識領域を抽出するようにしたので、スキャニングされた帳票画像の認識領域が登録画像側の認識領域よりもずれていても補正をすることなく、容易に認識領域内の文字を認識することができる。 As described above, according to the embodiment, all the horizontal and vertical ruled lines are detected from the form image, the intersections are grouped to detect the circumscribed rectangle of the table, and the form image is supported. Since the recognition area existing in the circumscribed rectangle is extracted from the dictionary data of the registered image to be registered, it is not corrected even if the recognition area of the scanned form image is deviated from the recognition area on the registered image side. The character in the recognition area can be easily recognized.
10 文字認識装置、20 認識対象領域決定装置、60 メモリ、70 画像データ入力装置。 10 character recognition device, 20 recognition target area determination device, 60 memory, 70 image data input device.
Claims (4)
スキャニングされた帳票画像から表の外接矩形を検出し、
検出された表の外接矩形と検索された辞書データとからその外接矩形内の認識領域を認識し、これを文字の認識対象領域のデータとして抽出することを特徴とする認識対象領域決定方法。 The horizontal and vertical coordinates of the circumscribed rectangle of the table in the form in advance, and the horizontal and vertical coordinates of the recognition area existing in the circumscribed rectangle are set as dictionary data for each type of form, respectively. Search the corresponding form dictionary data from the form image scanned by the department,
Detect the bounding rectangle of the table from the scanned form image,
A recognition target area determination method, comprising: recognizing a recognition area in a circumscribed rectangle from the detected circumscribed rectangle of the table and searched dictionary data, and extracting the recognition area as data of a character recognition target area.
スキャナ部によりスキャニングされた帳票画像から対応する帳票を認識し、かつ、その帳票の辞書データを前記辞書データ記憶手段から検索する帳票識別手段と、
スキャニングされた帳票画像から表の外接矩形を検出する表外接矩形検出手段と、
該表外接矩形検出手段により検出された表の外接矩形と前記帳票識別手段により検索された辞書データとからその外接矩形内の認識領域を認識し、これを文字の認識対象領域のデータとして抽出する認識領域抽出手段と
を備えたことを特徴とする認識対象領域決定装置。 A dictionary in which the horizontal and vertical coordinates of the circumscribed rectangle of the table in the form and the horizontal and vertical coordinates of the recognition area existing in the circumscribed rectangle are stored as dictionary data for each type of form. Data storage means;
A form identifying means for recognizing a corresponding form from the form image scanned by the scanner unit, and retrieving dictionary data of the form from the dictionary data storage means;
A circumscribed rectangle detecting means for detecting a circumscribed rectangle of the table from the scanned form image;
The recognition area in the circumscribed rectangle is recognized from the circumscribed rectangle of the table detected by the outer circumscribed rectangle detecting means and the dictionary data searched by the form identifying means, and this is extracted as data of the character recognition target area. A recognition target area determining apparatus comprising a recognition area extracting unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261271A JP2008083846A (en) | 2006-09-26 | 2006-09-26 | Target area determination method and device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006261271A JP2008083846A (en) | 2006-09-26 | 2006-09-26 | Target area determination method and device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008083846A true JP2008083846A (en) | 2008-04-10 |
Family
ID=39354694
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006261271A Pending JP2008083846A (en) | 2006-09-26 | 2006-09-26 | Target area determination method and device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008083846A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467739A (en) * | 2010-10-29 | 2012-05-23 | 夏普株式会社 | Image judgment device, image extraction device and image judgment method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05159099A (en) * | 1991-12-05 | 1993-06-25 | Hitachi Ltd | Slip character recognition area specification method and slip in optical character recognition device |
JPH07220023A (en) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | Method and device for table recognition |
JPH07282193A (en) * | 1994-04-15 | 1995-10-27 | Mitsubishi Electric Corp | Processor for form including table |
JPH0877294A (en) * | 1994-09-06 | 1996-03-22 | Toshiba Corp | Image processor for document |
JPH10320488A (en) * | 1997-05-21 | 1998-12-04 | Hitachi Ltd | Method and device for entering data |
-
2006
- 2006-09-26 JP JP2006261271A patent/JP2008083846A/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05159099A (en) * | 1991-12-05 | 1993-06-25 | Hitachi Ltd | Slip character recognition area specification method and slip in optical character recognition device |
JPH07220023A (en) * | 1994-01-31 | 1995-08-18 | Hitachi Ltd | Method and device for table recognition |
JPH07282193A (en) * | 1994-04-15 | 1995-10-27 | Mitsubishi Electric Corp | Processor for form including table |
JPH0877294A (en) * | 1994-09-06 | 1996-03-22 | Toshiba Corp | Image processor for document |
JPH10320488A (en) * | 1997-05-21 | 1998-12-04 | Hitachi Ltd | Method and device for entering data |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102467739A (en) * | 2010-10-29 | 2012-05-23 | 夏普株式会社 | Image judgment device, image extraction device and image judgment method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9262699B2 (en) | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR | |
JPH1166105A (en) | Indexing method for word in handwritten document and microprocessor-based system | |
JP6900164B2 (en) | Information processing equipment, information processing methods and programs | |
US11475688B2 (en) | Information processing apparatus and information processing method for extracting information from document image | |
JP2006031546A (en) | Character direction identifying device, character processing device, program and storage medium | |
JP2008077454A (en) | Title extraction device, image reading device, title extraction method, and title extraction program | |
JP5661549B2 (en) | Character recognition device for recognizing characters on a form, mask processing method, and mask processing program | |
JP6247103B2 (en) | Form item recognition method, form item recognition apparatus, and form item recognition program | |
JP2005266907A (en) | Bar code detection cutout method, device therefor and computer-readable recording medium storing program | |
JP2009093305A (en) | Business form recognition system | |
JP6222541B2 (en) | Image processing apparatus and program | |
JP2008083846A (en) | Target area determination method and device | |
JP2019036146A (en) | Image analysis device and image analysis program | |
CN109101973B (en) | Character recognition method, electronic device and storage medium | |
JP6432179B2 (en) | Document file generation apparatus and document file generation method | |
JP5964078B2 (en) | Character recognition device, character recognition method and program | |
JP4866184B2 (en) | Image processing apparatus, image direction determination method, and image direction determination program | |
JPH0728935A (en) | Document image processor | |
JP4810853B2 (en) | Character image cutting device, character image cutting method and program | |
JP3709991B2 (en) | Score recognition device | |
JP5277750B2 (en) | Image processing program, image processing apparatus, and image processing system | |
JP2004005761A (en) | Keyword extraction/search system | |
JP2006072524A (en) | Information processing apparatus and method | |
JP2005242825A (en) | Business form reading device and business form direction determination method by business form reading device | |
JP2004133841A (en) | Pattern recognition device and pattern recognition method, program, and storage medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20090609 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110419 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110816 |