JP2022038985A - Business form job assist method, business form job assist device, and business form job assist system - Google Patents
Business form job assist method, business form job assist device, and business form job assist system Download PDFInfo
- Publication number
- JP2022038985A JP2022038985A JP2020143740A JP2020143740A JP2022038985A JP 2022038985 A JP2022038985 A JP 2022038985A JP 2020143740 A JP2020143740 A JP 2020143740A JP 2020143740 A JP2020143740 A JP 2020143740A JP 2022038985 A JP2022038985 A JP 2022038985A
- Authority
- JP
- Japan
- Prior art keywords
- image
- item
- unified
- business form
- type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 230000008569 process Effects 0.000 claims abstract description 68
- 238000012545 processing Methods 0.000 claims description 26
- 230000010365 information processing Effects 0.000 claims description 10
- 230000004931 aggregating effect Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000001514 detection method Methods 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 230000029305 taxis Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000009415 formwork Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000033001 locomotion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007639 printing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
本発明は、帳票業務支援方法、帳票業務支援装置、および帳票業務支援システムに関する。 The present invention relates to a form business support method, a form business support device, and a form business support system.
業務効率の改善等を目指し、幅広い分野で業務の電子化が進められている。その一方で、従来から今に至るまで、様々な業種、業務において、紙の帳票を処理媒体として使用する状況は大きく変わっていない。
そうした業務の担当者らは、紙の帳票上のデータをシステムに入力し確認することに多くの手間と労力を要している。そこで、紙の帳票を使用する形態は残しつつも、帳票認識を種々の手法で自動化し、全体として業務効率を向上させる動きがある。
With the aim of improving operational efficiency, digitization of operations is being promoted in a wide range of fields. On the other hand, the situation of using paper forms as a processing medium has not changed significantly in various industries and businesses from the past to the present.
Persons in charge of such operations require a lot of labor and effort to input and confirm the data on the paper form into the system. Therefore, while leaving the form of using paper forms, there is a movement to automate form recognition by various methods and improve work efficiency as a whole.
このような技術としては、例えば、或るアプリケーションから別のアプリケーションに対してOCR処理等を依頼する場合において、スキャン画像内の適切な位置にOCR結果等を配置した電子文書を生成することが可能な技術を提供することを課題とした、電子文書生成支援(特許文献1参照)などが提案されている。 As such a technique, for example, when requesting OCR processing or the like from one application to another application, it is possible to generate an electronic document in which the OCR result or the like is arranged at an appropriate position in the scanned image. Electronic document generation support (see Patent Document 1) has been proposed with the task of providing various technologies.
この電子文書生成システムは、原稿のスキャン画像を生成する画像形成装置と、第1のアプリケーションを実行することによって、前記画像形成装置から受信した前記スキャン画像に基づき電子文書を生成する外部端末と、を備え、前記外部端末は、前記画像形成装置で生成された前記スキャン画像を取得する取得手段と、前記スキャン画像の文字領域から複数の部分領域を抽出する抽出手段と、前記スキャン画像内における前記複数の部分領域の位置をそれぞれ検出する検出手段と、電子文書生成に関連する少なくとも1つの処理を前記複数の部分領域のそれぞれに関して行うべき旨の指示と前記複数の部分領域のそれぞれに関する画像データとを、前記第1のアプリケーションから第2のアプリケーションに送出する指示送出手段と、前記複数の部分領域のそれぞれに関する前記少なくとも1つの処理の各処理結果を前記第2のアプリケーションから受け取る受取手段と、前記各処理結果に係るテキスト情報を、前記各処理結果にそれぞれ対応する部分領域の検出位置に配置して、前記電子文書を生成する生成手段と、を有するものとなっている。 This electronic document generation system includes an image forming apparatus that generates a scanned image of a document, an external terminal that generates an electronic document based on the scanned image received from the image forming apparatus by executing a first application, and an external terminal. The external terminal comprises an acquisition means for acquiring the scan image generated by the image forming apparatus, an extraction means for extracting a plurality of partial regions from a character region of the scan image, and the scan image in the scan image. A detection means for detecting the position of each of the plurality of subregions, an instruction to indicate that at least one process related to electronic document generation should be performed for each of the plurality of subregions, and image data for each of the plurality of subregions. An instruction sending means for sending the data from the first application to the second application, a receiving means for receiving each processing result of the at least one processing for each of the plurality of partial regions from the second application, and the above. It has a generation means for generating an electronic document by arranging text information related to each processing result at a detection position in a partial region corresponding to each processing result.
上述のような帳票認識の業務効率改善の施策例として、当該業務の実行主体となる事業者自らのリソースではなく、外部組織が提供するOCRエンジンをネットワーク経由で適宜に利用する運用形態が存在する。そうした運用形態を採用すれば、事業者自らが各種の帳票それぞれに対応するOCR機能を開発、実装することが不要となり、相応の業務効率改善が望める。
一方、例えば、金融機関が遂行する帳票業務において、処理対象となる帳票種別は事案により様々である。そのため、それら全ての帳票に対する文字認識処理を上述のOCRエンジンで行う運用とする場合、各OCRエンジンにおいて、帳票種類ごとの全ての認識レイアウト定義を用意する必要がある。
As an example of measures to improve the work efficiency of form recognition as described above, there is an operation mode in which the OCR engine provided by an external organization is appropriately used via the network instead of the resources of the business operator that is the execution body of the work. .. If such an operation mode is adopted, it is not necessary for the business operator to develop and implement the OCR function corresponding to each of various forms, and a corresponding improvement in business efficiency can be expected.
On the other hand, for example, in the form business performed by a financial institution, the types of forms to be processed vary depending on the case. Therefore, when the character recognition process for all the forms is performed by the above-mentioned OCR engine, it is necessary to prepare all the recognition layout definitions for each form type in each OCR engine.
一般的に、OCRエンジン上の認識レイアウト定義は、(金融機関側の又はその委託を
受けたベンダーの)エンジニアが実施する業務であり、上記運用形態に対応する場合、状況によっては大きなコスト高を招く可能性もある。
Generally, the recognition layout definition on the OCR engine is a task carried out by an engineer (on the financial institution side or the vendor entrusted with it), and when corresponding to the above operation mode, a large cost increase may occur depending on the situation. There is also the possibility of inviting.
他方、網羅的に認識レイアウト定義を作成、適用しなければ、認識不可/誤認識といった事態が頻発する可能性もあり、結局のところ、OCRエンジンを文字認識処理に使用する目的(業務効率化)を達成できない恐れもある。そればかりか、業務遅延や業務ミスに伴う、顧客満足度や業務効率の低下懸念もある。 On the other hand, if the recognition layout definition is not comprehensively created and applied, situations such as unrecognizable / erroneous recognition may occur frequently, and after all, the purpose of using the OCR engine for character recognition processing (improvement of business efficiency). May not be achieved. Not only that, there is also a concern that customer satisfaction and business efficiency will decline due to business delays and business mistakes.
そこで本発明の目的は、帳票認識業務を外部のOCRエンジンで遂行する業務運用に際し、当該OCRエンジンの設定業務に要する負荷を抑制しつつ、帳票認識業務の効率や精度を適宜なものとする技術を提供することにある。 Therefore, an object of the present invention is a technique for appropriately improving the efficiency and accuracy of the form recognition work while suppressing the load required for the setting work of the OCR engine when the form recognition work is performed by an external OCR engine. Is to provide.
上記課題を解決する本発明の帳票業務支援方法は、情報処理装置が、帳票種類ごとに定義された各項目の位置情報を記憶装置で保持し、帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにおける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、を実行することを特徴とする。
また、本発明の帳票業務支援装置は、帳票種類ごとに定義された各項目の位置情報を保持する記憶装置と、帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにおける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、を実行する演算装置と、を備えることを特徴とする。
In the form business support method of the present invention that solves the above problems, the information processing device holds the position information of each item defined for each form type in the storage device, and the form type specified by the form reading process and the form concerned. Based on the position information held in the storage device, the process of extracting the image of each item from each position in the read image of the form and the unified format for extracting the image of each extracted item across the forms. Each item is the result of the process of generating a unified form image by setting it at the corresponding position of the item in the above and the process of distributing the unified form image to the OCR engine to execute the character recognition process. It is characterized by the process of acquiring the character information of and the execution of.
Further, the form business support device of the present invention has a storage device that holds the position information of each item defined for each form type, the form type specified by the form reading process, and the storage device that holds the form. Based on the position information, the process of extracting the image of each item from each position in the read image of the form and the image of each extracted item are set to the corresponding positions of the item in the unified format straddling the forms. And the process of generating the unified form image, and the process of distributing the unified form image to the OCR engine to execute the character recognition process and acquiring the character information of each item which is the result of the character recognition process. It is characterized by comprising an arithmetic unit for executing.
また、本発明の帳票業務支援システムは、帳票種類ごとに定義された各項目の位置情報を保持する記憶装置と、帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにおける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、を実行する演算装置と、を備える帳票業務支援装置を含むことを特徴とする。 Further, the form business support system of the present invention has a storage device that holds the position information of each item defined for each form type, the form type specified by the form reading process, and the storage device that holds the form. Based on the position information, the process of extracting the image of each item from each position in the read image of the form and the image of each extracted item are set to the corresponding positions of the item in the unified format straddling the forms. And the process of generating the unified form image, and the process of distributing the unified form image to the OCR engine to execute the character recognition process and acquiring the character information of each item which is the result of the character recognition process. It is characterized by including an arithmetic unit for executing, and a form business support device including.
本発明によれば、帳票認識業務を外部のOCRエンジンで遂行する業務運用に際し、当該OCRエンジンの設定業務に要する負荷を抑制しつつ、帳票認識業務の効率や精度を適宜なものとすることが可能となる。 According to the present invention, when the form recognition work is performed by an external OCR engine, the efficiency and accuracy of the form recognition work can be appropriately adjusted while suppressing the load required for the setting work of the OCR engine. It will be possible.
<ネットワーク構成>
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の帳票業務支援システム10を含むネットワーク構成図である。図1に示す帳票業務支援システム10は、帳票認識業務を外部のOCRエンジンで遂行する業務運用に際し、当該OCRエンジンの設定業務に要する負荷を抑制しつつ、帳票認識業務の効率や精度を適宜なものとするコンピュータシステムである。
<Network configuration>
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. FIG. 1 is a network configuration diagram including the form
帳票業務支援システム10は、少なくとも帳票業務支援装置100を含み、この帳票業務支援装置100とネットワーク1で結ばれた複数のサービス提供システム200をさらに含みうる構成を想定する。
It is assumed that the form
このうち帳票業務支援装置100は、銀行などの金融機関で運用される装置であって、テラーが操作する窓口端末50と連携する情報処理装置である。当該金融機関の営業店を訪れた顧客が、テラーに対して紙の帳票を提示して所定の金融手続等を要求した場合、テラーは、窓口端末50で当該業務に対応する業務アプリケーションを利用しつつ、帳票業務支援装置100の帳票スキャナー108に当該帳票をセットして読み込み動作を実行させる。
Of these, the form
この帳票業務支援装置100は、上記読み込み動作で得た、帳票種類、および当該帳票に関して項目位置DB125(詳細後述。帳票種類ごとに定義された各項目の位置情報)で保持する位置情報に基づき、当該帳票の読取りイメージにおける各位置から、各項目の画像を抽出する。
The form
また、帳票業務支援装置100は、上述のように抽出した各項目の画像を、帳票間を跨がる統一フォーマット126における当該項目の対応位置にセットして統一帳票イメージを生成し、これをサービス提供システム200(のうち予め規定のもの)のOCRエンジン210に配信して文字認識処理を実行させる。
Further, the form
このサービス提供システム200は、例えば、手書き文字や数字、活字など、所定の形態の文字や数字の文字認識に優れたOCRエンジン210を実装し、ネットワーク経由で文字認識処理サービスを提供するシステムである。
This
従来であれば、こうした各OCRエンジンにおいて、金融機関で取り扱う帳票種類ごとの全ての認識レイアウト定義を網羅的に用意する必要があった。ところが本発明の帳票業務支援装置100は、種々の帳票から得る各項目の画像を統一フォーマットに設定し、これをOCRエンジン210に入力するため、OCRエンジン210側では、帳票種類ごとの認識レイアウト定義を網羅する必要がない。
Conventionally, in each of these OCR engines, it has been necessary to comprehensively prepare all recognition layout definitions for each form type handled by a financial institution. However, in the form
なお、サービス提供システム200は、金融機関とは別組織の事業者が運用するものである。
The
帳票業務支援装置100は、こうしたサービス提供システム200から、その文字認識処理の結果である、上述の各項目の文字情報を取得することとなる。また、帳票業務支援装置100は、サービス提供システム200から得た文字情報を、窓口端末50の業務処理アプリケーションに連携させ、帳票認識結果としてテラー向けに提示することとなる。<ハードウェア構成>
また、本実施形態における帳票業務支援装置100のハードウェア構成は、図2に例示する如くとなる。すなわち、帳票業務支援装置100は、記憶装置101、メモリ103、演算装置104、入力装置105、出力装置106、通信装置107、および帳票スキャナー108を備えている。
The form
Further, the hardware configuration of the form
このうち記憶装置101は、SSD(Solid State Drive)やハードディスクドライブなど適宜な不揮発性記憶素子で構成される。
Of these, the
また、メモリ103は、RAMなど揮発性記憶素子で構成される。
Further, the
また、演算装置104は、記憶装置101に保持されるプログラム102をメモリ103に読み出すなどして実行し装置自体の統括制御を行なうとともに各種判定、演算及び制御処理を行なうCPUである。
Further, the
また、入力装置105は、テラーからのキー入力や音声入力を受け付ける、キーボードやマウス、マイクなどの装置である。
Further, the
また、出力装置106は、演算装置104での処理データの表示を行うディスプレイ、スピーカー等の装置である。
Further, the
また、通信装置107は、ネットワーク1と接続して、サービス提供システム200との通信処理を担うネットワークインターフェイスカードである。
Further, the
また、帳票スキャナー108は、紙の帳票を受け入れて光学系に搬送するソーター、搬送されてきた帳票の表面を撮影してイメージデータを取得する光学系、当該イメージデータを適宜に加工して所定のファイル形式にし、これを帳票業務支援装置100に転送するデータ処理ユニットといった構成を備える。こうした帳票スキャナー108は、既存のものを適宜に採用すればよい。
Further, the
また、記憶装置101内には、本実施形態の帳票業務支援装置として必要な機能を実装する為のプログラム102に加えて、項目位置DB125および統一フォーマット126が少なくとも記憶されている。この項目位置DB125および統一フォーマット126の詳細については後述する。
<データ構造例>
続いて、本実施形態の帳票業務支援システム10において利用される情報について説明
する。図3に、本実施形態における項目位置DB125の構成例を示す。
Further, in the
<Example of data structure>
Subsequently, the information used in the form
この項目位置DB125は、例えば各自治体における各種税やインフラ利用料の納付、などといった各業務に対応する紙の帳票種類ごとに定義された各項目の位置情報を格納したデータベースである。こうした紙の帳票種類ごとの項目位置情報は、すでに金融機関で管理しているものを利用すればよい。
This
そのデータ構造は、帳票種類をキーとして、当該帳票の発行者、当該帳票における各項目、および当該項目の位置情報といったデータから成るレコードの集合体である。位置情報は、例えば、当該帳票の紙面上の所定位置を原点とした二次元平面における、当該項目に関する矩形表記欄の頂点座標の値、などを想定できる。 The data structure is a collection of records composed of data such as the issuer of the form, each item in the form, and the position information of the item, using the form type as a key. As the position information, for example, the value of the vertex coordinates of the rectangular notation column for the item in the two-dimensional plane having the predetermined position on the paper surface of the form as the origin can be assumed.
図4に、本実施形態における統一フォーマット126の構成例を示す。この統一フォーマット126は、帳票業務支援装置100が取り扱う各種の帳票を跨がった、すなわち形式を共通化した帳票イメージである。
FIG. 4 shows a configuration example of the
したがって、例えば各自治体における各種税やインフラ利用料の納付、などといった各業務に対応する紙の帳票種類を跨がり、当該帳票の使用者の住所、氏名、処理金額、といった各項目のイメージを配置した、いわばユニバーサル帳票イメージとも言える。 Therefore, for example, across the types of paper forms corresponding to each business such as payment of various taxes and infrastructure usage fees in each local government, images of each item such as the address, name, processing amount of the user of the form are arranged. It can be said that it is a universal form image.
図5に、本実施形態の認識レイアウト定義225の構成例を示す。本実施形態の認識レイアウト定義225は、サービス提供システム200のOCRエンジン210が保持する情報であり、当該OCRエンジン210が文字認識処理を実行する際に、対象となる帳票画像のうち、どこが当該帳票における各項目にあたるかを定義したものである。
FIG. 5 shows a configuration example of the
その情報は、図4で例示するように、市民税通知帳票といった帳票の種類ごとに、住所、氏名、金額、といった帳票上の記載項目それぞれの配置を規定した情報となっている。<フロー例>
以下、本実施形態における帳票業務支援方法の実際手順について図に基づき説明する。以下で説明する帳票業務支援方法に対応する各種動作は、帳票業務支援システム10を構成する各装置らがメモリ等に読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
As illustrated in FIG. 4, the information is information that defines the arrangement of the items to be described on the form such as the address, name, and amount for each type of form such as the municipal tax notification form. <Flow example>
Hereinafter, the actual procedure of the form business support method in this embodiment will be described with reference to the figure. Various operations corresponding to the form business support method described below are realized by a program read into a memory or the like by each device constituting the form
図6は、本実施形態における帳票業務支援方法のフロー例を示す図である。ここでは、例えば、金融機関の営業店を顧客が訪れ、窓口のテラーに対して納税用の帳票を提示した状況を想定する。 FIG. 6 is a diagram showing a flow example of the form business support method in the present embodiment. Here, for example, it is assumed that a customer visits a branch office of a financial institution and presents a tax payment form to the teller at the counter.
図1に関して述べたように、この場合の当該テラーは、窓口端末50を操作し、帳票による納税処理に対応する機能を呼び出して実行する。また、テラーは、顧客から受領した帳票を帳票スキャナー108にセットし読取り指示を行う。
As described with respect to FIG. 1, the teller in this case operates the
ここでは、例えば、A市に居住する顧客から、A市の市民税通知票(図7の帳票600)を受領し、帳票スキャナー108での読取りが実行されたとする。なお、図8の帳票700、図9の帳票800でも例示するように、市民税通知票の形式は自治体によって異なるものである。
Here, for example, it is assumed that a city A municipal tax report card (
一方、帳票業務支援装置100は、上述の帳票スキャナー108による帳票の読み取り処理結果である帳票種類の情報(例:“市民税通知票(A市)”)に基づき、項目位置DB125において、当該帳票種類に関して保持する、氏名、住所、および金額といった各
項目の位置情報を取得する(s10)。
On the other hand, the form
続いて、帳票業務支援装置100は、s10で得た位置情報に基づき、上述の読取りで帳票スキャナー108から得ている読取りイメージにおける各位置から、各項目の画像を抽出する(s11)。つまり、氏名、住所、および金額の記載・印字がある各項目の画像を、帳票全体の読取りイメージから切り出す。
Subsequently, the form
続いて、帳票業務支援装置100は、s11で抽出した各項目の画像を、統一フォーマット(図4参照)における当該項目の対応位置(図4の例であれば、住所、氏名、および金額の各表記の右欄1261~1263)にセットして統一帳票イメージ(図10の市民税通知票900)を生成する(s12)。
Subsequently, the form
勿論、図8、図9で例示した他市の市民税通知票であっても、形式としては全く同一の統一帳票イメージ(図11の市民税通知票1000、図12の市民税通知票11100)が生成できる。
Of course, even in the case of the municipal tax report cards of other cities illustrated in FIGS. 8 and 9, the unified form image is exactly the same (the municipal
なお、s12での統一帳票イメージの生成に際し、統一フォーマットにおける各項目の画像の配置欄のサイズよりも、帳票から抽出した画像のサイズが大きい場合又は著しく小さい場合、すなわち画像サイズが不適合(文字認識処理に支障がでるほど大きい/小さい)である場合、帳票業務支援装置100は、統一フォーマットにおける配置欄のサイズにあわせ、帳票から抽出した画像を縮小または拡大するものとする。
When the unified form image is generated in s12, the size of the image extracted from the form is larger or significantly smaller than the size of the image arrangement column of each item in the unified format, that is, the image size is incompatible (character recognition). If it is large / small enough to interfere with processing), the form
続いて、帳票業務支援装置100は、s12で生成した統一帳票イメージを、サービス提供システム200のOCRエンジン210に配信し、文字認識処理を実行させ、その文字認識処理の結果である、各項目の文字情報を取得する(s13)。
Subsequently, the form
例えば、上述の各市(A市~C市)の市民税通知票、すなわち計3枚の帳票に関して上述の各処理を一定時間内に連続して実行した場合、OCRエンジン210からは、各帳票の読取り結果を連続して得られる。
For example, when the above-mentioned processing is continuously executed within a certain period of time for the above-mentioned municipal tax report cards of each city (city A to C), that is, a total of three forms, the
帳票業務支援装置100は、こうして帳票ごとに得られる読取り結果を、所定の業務システムに格納するとともに、図13に示すように、各帳票の読取り結果を集約して、1つの処理結果1200として生成し、これを窓口端末50にて表示させる(s14)。
The form
勿論、1枚の帳票に関してのみ一連の処理を実行すれば、1枚の帳票のみの読取り結果が得られる。 Of course, if a series of processes are executed only for one form, a reading result of only one form can be obtained.
なお、帳票業務支援装置100は、上述までの形態とは異なり、帳票からの画像の抽出(s10)、及び統一帳票イメージの生成(s11)の各処理について、OCRエンジン210を利用する際と同様に、対応する外部サービスをネットワーク1を介して呼び出して実行するとしてもよい。或いは、統一帳票イメージの生成についても、当該機能を提供する外部サービスを呼び出して実装するとしてもよい。
<その他の形態>
続いて、帳票業務支援装置100が、OCRエンジン210の特性に応じた、複数種の統一フォーマットを記憶装置101で保持し、これを利用する形態について説明する。
The form
<Other forms>
Subsequently, a mode in which the form
このOCRエンジン210の特性とは、例えば、文字認識処理の精度や効率が良好とされる、数値(金額等)、手書き文字、活字、といった文字の種類や形態を意図する。換言すれば、OCRエンジン210が、文字認識処理における得意分野ごとに用意され、帳票業務支援装置100はそれらを適宜に利用出来る状況に対応する。
The characteristics of the
図14は、本実施形態における帳票業務支援方法のフロー例を示す図である。この場合、帳票業務支援装置100は、顧客の帳票から抽出した各項目の画像(s11で得たもの)を、当該画像の種類であって、上述のOCRエンジン210の特性に対応したものごとに分類する(s20)。
FIG. 14 is a diagram showing a flow example of the form business support method in the present embodiment. In this case, the form
上述の分類は、帳票業務支援装置100が、例えば、帳票の各項目における文字種の規定を予め情報として保持しておき、各項目に関して得ている画像は、当該項目における文字種の画像であると判定する形態などを想定できる。
In the above classification, the form
続いて、帳票業務支援装置100は、s20での分類を経た各画像に、当該画像の抽出元となった帳票の識別情報として適宜な帳票IDを付与する(s21)。帳票IDの付与は、例えば、帳票スキャナー108で帳票を読み取るごとに、所定の初期値をインクリメントして生成し、これを画像データの名称やプロパティ情報に設定する、といった運用を想定できる。
Subsequently, the form
また、帳票業務支援装置100は、s21で帳票IDを付与した各画像を、対応する種類の統一フォーマット(図15~図17参照)にそれぞれセットし、種類別の統一帳票イメージ(図18)を生成する(s22)。図18で例示する統一帳票イメージ1800は、各帳票の氏名欄の手書き氏名の画像を抽出し、これらに帳票IDを付与しセットしたものを示している。
Further, the form
こうした統一フォーマットおよび統一帳票イメージの形態であれば、例えば、1つの統一帳票イメージには、異なる帳票からそれぞれ得た画像がセットされているが、1つの帳票のうち1つの項目のみ抽出されセットされているため、当該帳票イメージだけ見ても、個人や取引内容は特定困難である。 In the form of such a unified format and unified form image, for example, one unified form image is set with images obtained from different forms, but only one item in one form is extracted and set. Therefore, it is difficult to identify an individual or transaction details by looking only at the form image.
ただし、各統一帳票イメージの各画像には、画像抽出元の帳票が同じなら、同一の帳票IDが紐付いており、後に文字認識処理結果を帳票IDで名寄せして集約することが可能となっている。 However, if the form of the image extraction source is the same, the same form ID is associated with each image of each unified form image, and it is possible to identify and aggregate the character recognition processing results later by the form ID. There is.
続いて、帳票業務支援装置100は、s22で得た、特性別の統一帳票イメージを、対応する特性を有するOCRエンジン210に配信して文字認識処理それぞれを実行させ、当該文字認識処理の結果(図19~図21)である文字情報を取得する(s23)。
Subsequently, the form
また、帳票業務支援装置100は、s23で、各特性のOCRエンジンからそれぞれ得た文字情報を、当該文字情報の元となる画像の帳票IDごとに集約し、統合的な文字認識結果(図22)を生成し、これを窓口端末50に出力する(s24)。
Further, the form
このように、OCRエンジン210の特性を踏まえて、かつセキュアに、文字認識処理を分散化し、その後に処理結果を統合する運用とすれば、文字認識処理の効率や精度がさらに向上することが期待出来る。
In this way, it is expected that the efficiency and accuracy of the character recognition processing will be further improved if the operation is to decentralize the character recognition processing and then integrate the processing results in a secure manner based on the characteristics of the
以上、本発明を実施するための最良の形態などについて具体的に説明したが、本発明はこれに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。 Although the best mode for carrying out the present invention has been specifically described above, the present invention is not limited to this, and various modifications can be made without departing from the gist thereof.
こうした本実施形態によれば、帳票認識業務を外部のOCRエンジンで遂行する業務運用に際し、当該OCRエンジンの設定業務に要する負荷を抑制しつつ、帳票認識業務の効率や精度を適宜なものとすることが可能となる。 According to this embodiment, when the form recognition work is performed by an external OCR engine, the efficiency and accuracy of the form recognition work are appropriately adjusted while suppressing the load required for the setting work of the OCR engine. Is possible.
本明細書の記載により、少なくとも次のことが明らかにされる。すなわち、本実施形態の帳票業務支援システムにおいて、前記情報処理装置が、前記OCRエンジンの特性に応じた、複数種の統一フォーマットを記憶装置で保持し、前記帳票から抽出した各項目の前記画像を、当該画像の種類であって前記特性に対応したものごとに分類する処理と、前記分類を経た各画像に帳票IDを付与した上で、当該各画像を対応する種類の統一フォーマットにそれぞれセットし、種類別の統一帳票イメージを生成する処理と、前記種類別の統一帳票イメージを、当該種類に対応する特性のOCRエンジンに配信して文字認識処理それぞれを実行させ、当該文字認識処理の結果である文字情報を取得する処理と、前記種類に対応する特性の各OCRエンジンから得た文字情報を、当該文字情報の元となる前記画像の帳票IDごとに集約する処理と、をさらに実行するとしてもよい。 The description herein reveals at least the following: That is, in the form business support system of the present embodiment, the information processing device holds a plurality of types of unified formats according to the characteristics of the OCR engine in the storage device, and the image of each item extracted from the form is stored. , The process of classifying the types of images according to the characteristics, and after assigning a form ID to each image that has undergone the classification, each image is set in the corresponding unified format. , The process of generating a unified form image for each type and the unified form image for each type are delivered to the OCR engine with the characteristics corresponding to the type to execute the character recognition process, and the result of the character recognition process is used. Assuming that the process of acquiring certain character information and the process of aggregating the character information obtained from each OCR engine having the characteristics corresponding to the type for each form ID of the image that is the source of the character information are further executed. May be good.
これによれば、帳票認識業務を外部のOCRエンジンで遂行する業務運用に際し、当該OCRエンジンの設定業務に要する負荷を抑制しつつ、帳票認識業務の効率や精度を適宜なものとすることが可能となる。 According to this, when the form recognition work is performed by an external OCR engine, it is possible to appropriately improve the efficiency and accuracy of the form recognition work while suppressing the load required for the setting work of the OCR engine. Will be.
また、本実施形態の帳票業務支援方法において、前記情報処理装置が、前記統一フォーマットにおける規定サイズと、前記帳票から抽出した画像のサイズとが適合しない場合、前記統一フォーマットにおける規定サイズにあわせて前記画像を拡大または縮小する処理をさらに実行する、としてもよい。 Further, in the form business support method of the present embodiment, when the information processing apparatus does not match the specified size in the unified format with the size of the image extracted from the form, the information processing device is adjusted to the specified size in the unified format. Further processing for enlarging or reducing the image may be performed.
これによれば、OCRエンジンにおける画像認識の精度、効率を良好に維持することが期待出来る。 According to this, it can be expected that the accuracy and efficiency of image recognition in the OCR engine can be maintained well.
また、本実施形態の帳票業務支援方法において、前記情報処理装置が、前記画像の抽出、及び前記統一帳票イメージの生成の各処理について、対応する外部サービスを呼び出して実行する、としてもよい。 Further, in the form business support method of the present embodiment, the information processing apparatus may call and execute the corresponding external service for each process of extracting the image and generating the unified form image.
これによれば、各処理をさらにアウトソーシングする形態となり、金融機関等における業務負担やシステム開発負担が低減可能となりうる。 According to this, each process is further outsourced, and it is possible to reduce the work burden and system development burden at financial institutions and the like.
1 ネットワーク
10 帳票業務支援システム
50 窓口端末
100 帳票業務支援装置
101 記憶装置
102 プログラム
103 メモリ
104 演算装置
105 入力装置
106 出力装置
107 通信装置
108 帳票スキャナー
125 項目位置DB
126 統一フォーマット
150 帳票スキャナー
200 サービス提供システム
210 OCRエンジン
225 認識レイアウト定義
1
126 Unified format 150
Claims (6)
帳票種類ごとに定義された各項目の位置情報を記憶装置で保持し、
帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、
前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにおける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、
前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、
を実行する帳票業務支援方法。 Information processing equipment
The location information of each item defined for each form type is stored in the storage device,
A process of extracting an image of each item from each position in the read image of the form based on the form type specified in the form reading process and the position information held in the storage device for the form.
A process of setting the image of each extracted item at the corresponding position of the item in the unified format straddling the forms to generate a unified form image.
The unified form image is distributed to the OCR engine to execute the character recognition process, and the character information of each item, which is the result of the character recognition process, is acquired.
Form business support method to execute.
前記OCRエンジンの特性に応じた、複数種の統一フォーマットを記憶装置で保持し、
前記帳票から抽出した各項目の前記画像を、当該画像の種類であって前記特性に対応したものごとに分類する処理と、
前記分類を経た各画像に帳票IDを付与した上で、当該各画像を対応する種類の統一フォーマットにそれぞれセットし、種類別の統一帳票イメージを生成する処理と、
前記種類別の統一帳票イメージを、当該種類に対応する特性のOCRエンジンに配信して文字認識処理それぞれを実行させ、当該文字認識処理の結果である文字情報を取得する処理と、
前記種類に対応する特性の各OCRエンジンから得た文字情報を、当該文字情報の元となる前記画像の帳票IDごとに集約する処理と、
をさらに実行することを特徴とする請求項1に記載の帳票業務支援方法。 The information processing device
A storage device holds a plurality of unified formats according to the characteristics of the OCR engine.
A process of classifying the image of each item extracted from the form according to the type of the image corresponding to the characteristic.
After assigning a form ID to each image that has undergone the above classification, each image is set in the corresponding unified format, and a unified form image for each type is generated.
A process of distributing the unified form image for each type to an OCR engine having characteristics corresponding to the type, executing each character recognition process, and acquiring character information as a result of the character recognition process.
A process of aggregating character information obtained from each OCR engine having characteristics corresponding to the type for each form ID of the image that is the source of the character information.
The form business support method according to claim 1, wherein the method is further executed.
前記統一フォーマットにおける規定サイズと、前記帳票から抽出した画像のサイズとが適合しない場合、前記統一フォーマットにおける規定サイズにあわせて前記画像を拡大または縮小する処理をさらに実行する、
ことを特徴とする請求項1に記載の帳票業務支援方法。 The information processing device
If the specified size in the unified format and the size of the image extracted from the form do not match, a process of enlarging or reducing the image according to the specified size in the unified format is further executed.
The form business support method according to claim 1, characterized in that.
前記画像の抽出、及び前記統一帳票イメージの生成の各処理について、対応する外部サービスを呼び出して実行する、
ことを特徴とする請求項1に記載の帳票業務支援方法。 The information processing device
Call and execute the corresponding external service for each process of extracting the image and generating the unified form image.
The form business support method according to claim 1, characterized in that.
帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにおける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、を実行する演算装置と、
を備えることを特徴とする帳票業務支援装置。 A storage device that holds the location information of each item defined for each form type,
Based on the form type specified in the form reading process and the position information held in the storage device for the form, a process of extracting an image of each item from each position in the read image of the form and a process of extracting each item. Image is set to the corresponding position of the item in the unified format that straddles the forms to generate a unified form image, and the unified form image is distributed to the OCR engine to execute character recognition processing. An arithmetic unit that executes the process of acquiring the character information of each item, which is the result of the character recognition process, and
A form business support device characterized by being equipped with.
帳票の読み取り処理で特定した帳票種類および当該帳票に関して前記記憶装置で保持する前記位置情報に基づき、前記帳票の読取りイメージにおける各位置から、各項目の画像を抽出する処理と、前記抽出した各項目の画像を、帳票間を跨がる統一フォーマットにお
ける当該項目の対応位置にセットして統一帳票イメージを生成する処理と、前記統一帳票イメージを、OCRエンジンに配信して文字認識処理を実行させ、当該文字認識処理の結果である、前記各項目の文字情報を取得する処理と、を実行する演算装置と、
を備える帳票業務支援装置を含むことを特徴とする帳票業務支援システム。 A storage device that holds the location information of each item defined for each form type,
Based on the form type specified in the form reading process and the position information held in the storage device for the form, a process of extracting an image of each item from each position in the read image of the form and a process of extracting each item. Image is set to the corresponding position of the item in the unified format that straddles the forms to generate a unified form image, and the unified form image is distributed to the OCR engine to execute character recognition processing. An arithmetic unit that executes the process of acquiring the character information of each item, which is the result of the character recognition process, and
A form business support system characterized by including a form business support device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020143740A JP7336422B2 (en) | 2020-08-27 | 2020-08-27 | Form work support method, form work support device, and form work support system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020143740A JP7336422B2 (en) | 2020-08-27 | 2020-08-27 | Form work support method, form work support device, and form work support system |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022038985A true JP2022038985A (en) | 2022-03-10 |
JP7336422B2 JP7336422B2 (en) | 2023-08-31 |
Family
ID=80498203
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020143740A Active JP7336422B2 (en) | 2020-08-27 | 2020-08-27 | Form work support method, form work support device, and form work support system |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7336422B2 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344556A (en) * | 2000-06-01 | 2001-12-14 | Ricoh Co Ltd | System and method for managing information |
JP2008234586A (en) * | 2007-03-23 | 2008-10-02 | Nomura Research Institute Ltd | Consumption information acquiring terminal, consumption information acquiring server and household account book management device |
JP2009129253A (en) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | Pattern recognition apparatus, pattern recognition program and pattern recognition method |
JP2010033605A (en) * | 2009-11-10 | 2010-02-12 | Ricoh Co Ltd | Information processor and information processing program |
JP2015204015A (en) * | 2014-04-15 | 2015-11-16 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, communication terminal, and program |
-
2020
- 2020-08-27 JP JP2020143740A patent/JP7336422B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001344556A (en) * | 2000-06-01 | 2001-12-14 | Ricoh Co Ltd | System and method for managing information |
JP2008234586A (en) * | 2007-03-23 | 2008-10-02 | Nomura Research Institute Ltd | Consumption information acquiring terminal, consumption information acquiring server and household account book management device |
JP2009129253A (en) * | 2007-11-26 | 2009-06-11 | Toshiba Corp | Pattern recognition apparatus, pattern recognition program and pattern recognition method |
JP2010033605A (en) * | 2009-11-10 | 2010-02-12 | Ricoh Co Ltd | Information processor and information processing program |
JP2015204015A (en) * | 2014-04-15 | 2015-11-16 | コニカミノルタ株式会社 | Electronic document creation system, image forming apparatus, communication terminal, and program |
Also Published As
Publication number | Publication date |
---|---|
JP7336422B2 (en) | 2023-08-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10366123B1 (en) | Template-free extraction of data from documents | |
JP6719063B2 (en) | Accounting input system, terminal device, server device, method and program | |
US10339373B1 (en) | Optical character recognition utilizing hashed templates | |
JP6357621B1 (en) | Accounting processing apparatus, accounting processing system, accounting processing method and program | |
CN102968282A (en) | Method for achieving electronization of any bill and receipt by intercepting print data | |
US9785831B2 (en) | Personal information collection system, personal information collection method and program | |
JP5385349B2 (en) | Receipt definition data creation device and program thereof | |
US9824288B1 (en) | Programmable overlay for negotiable instrument electronic image processing | |
US20110166934A1 (en) | Targeted advertising based on remote receipt analysis | |
US20150120563A1 (en) | Check data lift for ach transactions | |
CN112487859A (en) | Information processing apparatus, information processing method, and computer readable medium | |
US20150063653A1 (en) | Method and system for providing efficient feedback regarding captured optical image quality | |
CN108897729B (en) | Transaction template sharing method and device, electronic equipment and storage medium | |
JP2010244227A (en) | Accounting input storage device | |
JP2014175978A (en) | Information processing apparatus, control method of the same, and program | |
JP7336422B2 (en) | Form work support method, form work support device, and form work support system | |
JP7266083B2 (en) | Data display device, data display method and data display program | |
JP6993200B2 (en) | Data display device, data display method and data display program | |
US10614068B2 (en) | Transaction slip search method, information processing apparatus, and computer product | |
CN113407748A (en) | Important blank certificate management method and device | |
CN113792570A (en) | Claims data processing method and device, electronic equipment and readable medium | |
JP2022086407A (en) | Construction industry business accounting apparatus, construction industry business accounting method, and construction industry business accounting program | |
JP7173842B2 (en) | Journal writing device, journal writing method and journal writing program | |
KR102500127B1 (en) | System for automatically determining year and exact calculation and method performing the same | |
WO2023047570A1 (en) | Information processing device, information processing method, and information processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220826 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230815 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230821 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7336422 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |