JP7124859B2 - data output system, information processing system, data output method, program - Google Patents
data output system, information processing system, data output method, program Download PDFInfo
- Publication number
- JP7124859B2 JP7124859B2 JP2020217752A JP2020217752A JP7124859B2 JP 7124859 B2 JP7124859 B2 JP 7124859B2 JP 2020217752 A JP2020217752 A JP 2020217752A JP 2020217752 A JP2020217752 A JP 2020217752A JP 7124859 B2 JP7124859 B2 JP 7124859B2
- Authority
- JP
- Japan
- Prior art keywords
- area
- information
- data
- unit
- application
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Facsimiles In General (AREA)
- Editing Of Facsimile Originals (AREA)
Description
本発明は、データ出力システム、情報処理システム、データ出力方法、及び、プログラムに関する。 The present invention relates to a data output system, an information processing system, a data output method, and a program.
企業や団体など組織の日常業務では、経費精算書、請求書又は注文書などの帳票の処理が発生する場合が多い。組織内の担当者は、帳票から、取り扱い日付、案件番号、又は金額などを抽出したり、集計したりする業務を日々行っている。 2. Description of the Related Art In the daily work of an organization such as a company or an organization, there are many cases where the processing of forms such as expense reports, invoices, or order forms occurs. A person in charge in an organization performs daily tasks such as extracting and aggregating handling dates, case numbers, amounts, etc. from forms.
このような帳票の電子化に関する技術が考案されている(例えば、特許文献1参照。)。特許文献1には、ユーザがマスクすべき領域をマーキングした帳票を複合機がスキャンし、基幹システム等に領域がマスクされた帳票を登録する画像読込み装置が開示されている。 Techniques related to the digitization of such forms have been devised (see, for example, Patent Document 1). Japanese Patent Application Laid-Open No. 2002-200001 discloses an image reading device that scans a form on which a user has marked an area to be masked with a multifunction machine and registers the form with the masked area in a core system or the like.
しかしながら、従来の技術では、画像データのうち所定の領域へのOCR処理の結果を出力することができないという問題があった。例えば、組織内のユーザは経費を精算する場合、経費精算書に経費を記入して庶務などに提出する。この帳票を複合機が読み取って画像データに電子化したとしても、担当者は各ユーザからの全ての画像データの決まった領域から日付や費用などのデータを読み取ってファイルに記録するなどの作業が必要である。 However, the conventional technique has a problem that it is impossible to output the result of OCR processing to a predetermined area of the image data. For example, when reimbursing expenses, a user in an organization fills in the expenses in an expense reimbursement form and submits it to the general affairs department. Even if this form is read by a multifunction device and converted into image data, the person in charge will not be able to read data such as dates and expenses from a predetermined area of all the image data from each user and record it in a file. is necessary.
本発明は、上記課題に鑑み、画像データのうち所定の領域へのOCR処理の結果を出力することができるデータ出力システムを提供することを目的とする。 SUMMARY OF THE INVENTION An object of the present invention is to provide a data output system capable of outputting the result of OCR processing on a predetermined area of image data.
上記課題に鑑み、本発明は、機器と情報処理システムとが通信できるデータ出力システムであって、前記機器から画像データを受信する通信部と、第一画像データから予め定められた情報が検出された領域を検出する領域検出部と、前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力する第一出力部と、前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報に基づいて第二画像データからOCR領域を特定する領域特定部と、特定された前記OCR領域と前記第二画像データとに基づいて、前記OCR領域に対してOCR処理が行われたデータを出力する第二出力部と、を有することを特徴とする。 In view of the above problems, the present invention provides a data output system in which a device and an information processing system can communicate, wherein a communication unit receives image data from the device and predetermined information is detected from the first image data. a first output unit for outputting to a setting file information about the area in which the predetermined information detected by the area detecting unit is detected; and the predetermined information included in the setting file. an area identifying unit that identifies an OCR area from second image data based on information about an area where predetermined information is detected; and an OCR area based on the identified OCR area and the second image data . and a second output unit for outputting data on which OCR processing has been performed.
画像データのうち所定の領域へのOCR処理の結果を出力することができるデータ出力システムを提供することができる。 It is possible to provide a data output system capable of outputting the result of OCR processing on a predetermined area of image data.
以下、本発明を実施するための形態の一例として、データ出力システムと、データ出力システムが行うデータ出力方法について説明する。 A data output system and a data output method performed by the data output system will be described below as an example of a mode for carrying out the present invention.
<処理又は動作の概略>
企業や団体などの組織では、経費精算書、請求書又は注文書などの帳票の処理が発生する場合が多い。組織内の担当者は、帳票から日付、案件番号又は金額などを抽出したり、集計したりする業務を日々行っている。処理された帳票はファイリングの後、保管されるが、その保管スペースにもコストがかかる。徐々に帳票の電子化が進められているが、帳票のファイルに自動で付与されたファイル名を担当者がリネームする作業などにも手間がかかる。
<Outline of processing or operation>
2. Description of the Related Art Organizations such as companies and organizations often have to process forms such as expense reports, invoices, or order forms. A person in charge in an organization performs tasks such as extracting dates, project numbers, amounts, and the like from forms and totaling them on a daily basis. The processed forms are stored after filing, but the storage space is also costly. The digitization of forms is gradually progressing, but it takes time and effort for the person in charge to rename the file name automatically given to the file of the form.
請求処理や受発注を自動化するシステムやサービスは存在するが、高価なものが多いため、これらに投資できる中小企業は多くない。このため、やむを得ず人手を介してこの帳票の処理を行っているという現状がある。 There are systems and services that automate billing and ordering, but they are often expensive, so not many SMEs can afford to invest in them. For this reason, there is a current situation in which there is no choice but to process this form manually.
本実施形態では、領域がマーキングされた帳票により事前に登録された領域情報に基づいて、情報処理システムが、日々発生する帳票の領域からデータを取得し、電子的なファイルとして出力することができる。 In this embodiment, the information processing system can acquire data from the areas of the form that occur daily based on the area information registered in advance from the form with the areas marked, and can output it as an electronic file. .
図1を参照して、データ出力システムが行う処理又は動作の概略を説明する。図1は、データ出力システム100が帳票から取得したデータでファイルを作成する処理又は動作を説明する図である。図1(a)は帳票における領域情報の設定を、図1(b)は領域情報を使用した帳票からのデータの取得を、それぞれ説明する図である。
The outline of the processing or operation performed by the data output system will be described with reference to FIG. FIG. 1 is a diagram for explaining the process or operation of creating a file from data acquired from a form by the
(1) データ出力システム100は外部サービスシステム40と連携することができる。データ出力システム100はアプリを介して外部サービスシステム40と連携する。データ出力システム100で動作するアプリを単に「アプリ」、外部サービスシステム40で動作するアプリを連携先アプリと呼ばれてもよく、この場合、アプリと連携先アプリの互いのアプリIDを対応付け、対応関係をデータ出力システム100は記憶する。
(1) The
(2) データ出力システム100の管理者8は、組織内のユーザが日常的に使う帳票7を使用して、帳票7のどの領域のデータを取得すべきかを指定する。例えば、マーカーペンで帳票7の領域を塗り潰したり、囲んだりすればよい。機器20は領域がマーキングされた帳票7を読み取って生成した画像データを情報処理システム10へ送信する。なお、マーキングされる帳票7には項目に対し文字などが記入されていてもよいし、項目のみでもよいし、白紙でもよい。
(2) The
(3) 情報処理システム10はマーカーペンで指定される領域の領域情報を設定ファイルに保存する。領域情報は、画像データにおける例えば矩形の領域の対角頂点の座標である。情報処理システム10は設定ファイルを外部サービスシステム40に保存する。
(3) The
(4)-1 管理者は、端末装置30を外部サービスシステム40に接続させ、設定ファイルをダウンロードし、設定ファイルに帳票の言語や日時のフォーマットを補完する。
(4)-1 The administrator connects the
(4)-2 また、管理者は端末装置30を情報処理システム10に接続させ、アプリのアプリIDと設定ファイルを対応づける操作を行う。管理者は任意の数のアプリIDと設定ファイルとを対応付けることができる。これにより、アプリの選択を受け付けるアイコンと画像処理が行われる領域情報が対応づけられる。
(4)-2 Further, the administrator connects the
(5) 組織内のユーザ6が費用の精算などのために帳票7を組織に提出する場合、この帳票7に対応したアプリのアイコンを機器20で押下する。複数の帳票名などからアプリを簡単に選べるようになっている。ユーザは必要事項を手書きした帳票、又は、プリントアウトした帳票を機器20に読み取らせる。機器20はアプリのアプリIDと帳票を読み取って生成した画像データ(例えばPDFファイル)を情報処理システム10へ送信する。
(5) When the
(6) 情報処理システム10はアプリIDで設定ファイルを特定し、外部サービスシステム40から取得した設定ファイルが有する領域情報の領域を画像データから取得する(例えば切り出す)。したがって、管理者が登録した帳票の領域が取得される。
(6) The
(7) 情報処理システム10はこの領域にのみOCR(Optical Character Reader)処理を行い、データ化する。すなわち、領域に記載されたデータ(文字などの文字コード)が得られる。
(7) The
(8) 情報処理システム10はデータを電子的なファイル(例えばCSV(Comma Separated Value)ファイル)に出力して、ファイルと画像データを、外部サービスシステム40に送信する。なお、情報処理システム10が連携先アプリのアプリIDを指定した場合は、連携先アプリを指定してファイルと画像データを送信できる。
(8) The
(9) 外部サービスシステム40は管理者が指定したフォルダ(又はディレクトリ)に画像データとファイルを登録する。ファイルには精算に必要な情報が含まれているので、担当者は精算処理することができる。
(9) The
以上説明したように、本実施形態のデータ出力システムは、領域がマーキングされた帳票を機器20が読み取り、帳票ごとに領域情報を記憶する。そして、情報処理システム10は機器から送信された帳票の画像データから領域のみを取得してOCR処理を行い、OCR処理結果であるデータをファイルに出力する。これによって、任意の数のアイコンそれぞれに画像処理の領域を対応付けることが可能となり、ユーザは例えば帳票の種類に応じてアイコンを選択するだけで、スキャンで生成された画像データの所望の領域に画像処理(例えば、OCR処理)を行わせることができる。
As described above, in the data output system of the present embodiment, the
<用語について>
管理者とはデータ出力システムの顧客側のシステム管理者等であり、一般ユーザのためにデータ出力システムに関する設定を行う者である。ユーザとは、顧客側の一般ユーザである。一般ユーザが管理者の作業を行ってもよいので、両者を区別しなくてもよい。
<Terms>
The administrator is a system administrator or the like on the customer side of the data output system, and is a person who sets up the data output system for general users. A user is a general user on the customer side. Since a general user may perform the work of an administrator, there is no need to distinguish between the two.
OCR(Optical Character Recognition/Reader)とは、手書き文字又はプリントアウトされた文字の形を感光素子によって電気信号に変換することによって、コンピュータが利用できるデジタルの文字コードに変換する技術をいう。文字認識処理、文字変換処理、電子化、などと称される場合もある。OCR処理で得られるデータは日本語、英語、数字、記号、図形など様々である。 OCR (Optical Character Recognition/Reader) is a technology that converts handwritten characters or printed characters into electrical signals using photosensitive elements, thereby converting them into digital character codes that can be used by computers. It may also be called character recognition processing, character conversion processing, digitization, or the like. The data obtained by OCR processing is various, such as Japanese, English, numerals, symbols, and figures.
帳票とは帳簿や伝票などの総称である。ユーザが記入するための空欄を設けた事務用紙ともいう。本実施形態では主に帳票について説明するが、機器20が読み取り可能なら原稿であればその名称は問わない。例えば、文書、書類、書面、レポート、新聞、雑誌などでも対象となる。なお、帳票は紙媒体にプリントアウトされない場合もある(機器20が帳票を読み取る必要がない場合がある)。
A ledger is a general term for a ledger, slip, and the like. It is also called office paper with blanks for the user to fill in. In the present embodiment, a form will be mainly described, but any document can be named as long as it can be read by the
OCR処理の対象となる画像データの種類はどのようなものでもよいが、PDF、JPEG、PNG、TIFF、BMP、などがある。 Any type of image data can be used for OCR processing, including PDF, JPEG, PNG, TIFF, BMP, and the like.
OCR領域に関する情報は、情報処理システム10がOCR領域を特定するための情報である。本実施形態では領域情報という用語で説明される。
Information about the OCR area is information for the
本実施形態では「設定ファイル」は領域情報が設定されるファイルであり、「ファイル」はデータが出力されたファイルである。ファイルとは、コンピュータで管理されるデータの基本単位となる、データのまとまりである。 In this embodiment, a "setting file" is a file in which area information is set, and a "file" is a file in which data is output. A file is a group of data that is a basic unit of data managed by a computer.
データを出力するとは、ユーザがデータを視覚で確認できるようにすることをいう。本実施形態では、例えばファイルに出力される。 Outputting data means enabling the user to visually check the data. In this embodiment, it is output to a file, for example.
アイコンとは、コンピュータに与える指示・命令や文書ファイルなどをわかりやすく記号化した図形である。ボタンとは、マウスでクリックして、ソフトウェアに命令を与える図形である。アイコンとボタンのいずれも操作内容や命令の内容が記されていてよい。 An icon is a graphic symbolized in an easy-to-understand manner, such as an instruction or command given to a computer, a document file, or the like. A button is a graphic that you click with the mouse to give a command to the software. Both the icon and the button may have the content of the operation or the content of the instruction written on them.
<システム構成例>
まず、本実施形態に係るデータ出力システム100のシステム構成について、図2を参照しながら説明する。図2は、本実施形態に係るデータ出力システム100の一例のシステム構成を示す図である。
<System configuration example>
First, the system configuration of the
図2に示すデータ出力システム100は、情報処理システム10と、機器20と、を含み、インターネット等の広域的なネットワークN1を介して通信可能に接続されている。データ出力システム100は外部システムである外部サービスシステム40と通信する。また、任意の端末装置30がネットワークN1,N2を介して、情報処理システム10と通信できる。
A
情報処理システム10は、一台以上の情報処理装置で実現され、ネットワークN1を介して、クラウドサービス等の外部サービスシステム40と連携した一連の処理により実現される各種のサービスを提供する。本実施形態に係る情報処理システム10が提供するサービスの具体例については後述する。情報処理システム10は、クラウドコンピューティングにより実現されてもよいし、単一の情報処理装置によって実現されてもよい。クラウドコンピューティングとは、特定ハードウェア資源が意識されずにネットワーク上のリソースが利用される利用形態をいう。情報処理システム10は、インターネット上に存在しても、オンプレミスに存在してもよい。なお、一連の処理は1つのアプリにより提供され、一連の処理を「処理フロー」「ワークフロー」ともいう。
The
機器20は、ユーザが使用する各種の電子機器である。機器20は、例えば、MFP(Multifunction Peripheral)等の画像処理装置、画像形成装置、PC(パーソナルコンピュータ)、プロジェクタ、電子黒板、デジタルカメラ等である。機器20はネットワークN2に接続されている。ユーザは、機器20を用いて、情報処理システム10又は外部サービスシステム40の少なくとも一方が提供する各種のサービスを利用することができる。
The
なお、以降では、複数の機器20について、各々を区別するときは、「機器201」、「機器202」等と添え字を用いて記載する。
In addition, hereinafter, a plurality of
端末装置30は、例えば、管理者又はユーザが使用するデスクトップPC(パーソナルコンピュータ)、ノート型PC、スマートフォン、タブレット端末等である。この他、端末装置30はWebブラウザが動作可能な装置であればよい。端末装置30はネットワークN2に接続されている。管理者又はユーザは端末装置30を操作して、情報処理システム10又は外部サービスシステム40が提供する各種のサービスを利用することができ、更に、連携先アプリ又はアプリの設定を行うことができる。
The
なお、説明の便宜上機器20と端末装置30を分けて説明するが、機器20及び端末装置30を含めて機器と呼ばれてもよい。
For convenience of explanation, the
また、以降では、複数の端末装置30について、各々を区別するときは、「端末装置301」、「端末装置302」等と添え字を用いて記載する。
In addition, hereinafter, when distinguishing between a plurality of
外部サービスシステム40は、ネットワークN1を介して連携先アプリの実行によるサービスを提供する一台以上の情報処理装置である。連携先アプリの実行によりデータの管理又は処理が行われ、データそのものや処理結果がサービスとなる。
The
外部サービスシステム40の一例には、例えば、クラウドサービス、ASP(Application Service Provider)等があり、ネットワークを介して提供される各種の外部サービスが含まれてよい。本実施形態ではサービスの一例としてストレージサービスについて説明する。外部サービスシステム40は、インターネット上に存在しても、オンプレミスに存在してもよい。
Examples of the
なお、以降では、複数の外部サービスシステム40について、各々を区別するときは、図示されている「外部サービスシステム401」を外部サービスシステム40A、「外部サービスシステム402」を外部サービスシステム40B等と、記載する。
In the following, when distinguishing among the plurality of
<ハードウェア構成例>
図3を参照して、本実施形態に係るデータ出力システム100に含まれる情報処理システム10及び端末装置30のハードウェア構成について説明する。
<Hardware configuration example>
Hardware configurations of the
<<情報処理システム及び端末装置>>
図3は、本実施形態に係る情報処理システム10及び端末装置30の一例のハードウェア構成を示す図である。図3に示されているように、情報処理システム10及び端末装置30はコンピュータによって構築されており、CPU501、ROM502、RAM503、HD504、HDD(Hard Disk Drive)コントローラ505、ディスプレイ506、外部機器接続I/F(Interface)508、ネットワークI/F509、バスライン510、キーボード511、ポインティングデバイス512、DVD-RW(Digital Versatile Disk Rewritable)ドライブ514、メディアI/F516を備えている。
<<information processing system and terminal device>>
FIG. 3 is a diagram showing an example hardware configuration of the
これらのうち、CPU501は、情報処理システム10及び端末装置30全体の動作を制御する。ROM502は、IPL等のCPU501の駆動に用いられるプログラムを記憶する。RAM503は、CPU501のワークエリアとして使用される。HD504は、プログラム等の各種データを記憶する。HDDコントローラ505は、CPU501の制御にしたがってHD504に対する各種データの読み出し又は書き込みを制御する。ディスプレイ506は、カーソル、メニュー、ウィンドウ、文字、又は画像などの各種情報を表示する。外部機器接続I/F508は、各種の外部機器を接続するためのインターフェースである。この場合の外部機器は、例えば、USB(Universal Serial Bus)メモリやプリンタ等である。ネットワークI/F509は、ネットワークN2を利用してデータ通信をするためのインターフェースである。バスライン510は、図3に示されているCPU501等の各構成要素を電気的に接続するためのアドレスバスやデータバス等である。
Among them, the
また、キーボード511は、文字、数値、各種指示などの入力のための複数のキーを備えた入力手段の一種である。ポインティングデバイス512は、各種指示の選択や実行、処理対象の選択、カーソルの移動などを行う入力手段の一種である。DVD-RWドライブ514は、着脱可能な記録媒体の一例としてのDVD-RW513に対する各種データの読み出し又は書き込みを制御する。なお、DVD-RWに限らず、DVD-R等であってもよい。メディアI/F516は、フラッシュメモリ等の記録メディア515に対するデータの読み出し又は書き込み(記憶)を制御する。
Also, the
<<機器>>
図4は、機器20の一例である画像形成装置のハードウェア構成図である。図4に示されているように、画像形成装置は、コントローラ910、近距離通信回路920、エンジン制御部930、操作パネル940、ネットワークI/F950を備えている。
<<Equipment>>
FIG. 4 is a hardware configuration diagram of an image forming apparatus, which is an example of the
これらのうち、コントローラ910は、コンピュータの主要部であるCPU901、システムメモリ(MEM-P)902、ノースブリッジ(NB)903、サウスブリッジ(SB)904、ASIC(Application Specific Integrated Circuit)906、記憶部であるローカルメモリ(MEM-C)907、HDDコントローラ908、及び、記憶部であるHD909を有し、NB903とASIC906との間をAGP(Accelerated Graphics Port)バス921で接続した構成となっている。
Among these, the controller 910 includes a
これらのうち、CPU901は、画像形成装置の全体制御を行う制御部である。NB903は、CPU901と、MEM-P902、SB904、及びAGPバス921とを接続するためのブリッジであり、MEM-P902に対する読み書きなどを制御するメモリコントローラと、PCI(Peripheral Component Interconnect)マスタ及びAGPターゲットとを有する。
Among them, the
MEM-P902は、コントローラ910の各機能を実現させるプログラムやデータの格納用メモリであるROM902a、プログラムやデータの展開、及びメモリ印刷時の描画用メモリなどとして用いるRAM902bとからなる。なお、RAM902bに記憶されているプログラムは、インストール可能な形式又は実行可能な形式のファイルでCD-ROM、CD-R、DVD等のコンピュータで読み取り可能な記録媒体に記録して提供するように構成してもよい。
The MEM-
SB904は、NB903とPCIデバイス、周辺デバイスとを接続するためのブリッジである。ASIC906は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)であり、AGPバス921、PCIバス922、HDDコントローラ908及びMEM-C907をそれぞれ接続するブリッジの役割を有する。このASIC906は、PCIターゲット及びAGPマスタ、ASIC906の中核をなすアービタ(ARB)、MEM-C907を制御するメモリコントローラ、ハードウェアロジックなどにより画像データの回転などを行う複数のDMAC(Direct Memory Access Controller)、並びに、スキャナ部931、プリンタ部932、及びファクシミリ部との間でPCIバス922を介したデータ転送を行うPCIユニットとからなる。なお、ASIC906には、USB(Universal Serial Bus)のインターフェースや、IEEE1394(Institute of Electrical and Electronics Engineers 1394)のインターフェースを接続するようにしてもよい。
MEM-C907は、コピー用画像バッファ及び符号バッファとして用いるローカルメモリである。HD909は、画像データの蓄積、印刷時に用いるフォントデータの蓄積、フォームの蓄積を行うためのストレージである。HD909は、CPU901の制御にしたがってHD909に対するデータの読出又は書込を制御する。AGPバス921は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレータカード用のバスインタフェースであり、MEM-P902に高スループットで直接アクセスすることにより、グラフィックスアクセラレータカードを高速にすることができる。
MEM-
また、近距離通信回路920には、近距離通信回路のアンテナ920aが備わっている。近距離通信回路920は、NFC、Bluetooth(登録商標)等の通信回路である。
Also, the near
更に、エンジン制御部930は、スキャナ部931、プリンタ部932及びファクシミリ部933を有している。また、操作パネル940は、現在の設定値や選択画面等を表示させ、操作者からの入力を受け付けるタッチパネル等のパネル表示部940a、並びに、濃度の設定条件などの画像形成に関する条件の設定値を受け付けるテンキー及びコピー開始指示を受け付けるスタートキー等からなるハードキー940bを備えている。コントローラ910は、画像形成装置全体の制御を行い、例えば、描画、通信、操作パネル940からの入力等を制御する。スキャナ部931又はプリンタ部932には、誤差拡散やガンマ変換などの画像処理部分が含まれている。
Furthermore, the
なお、画像形成装置は、操作パネル940のアプリケーション切り替えキーにより、ドキュメントボックス機能、コピー機能、プリンタ機能、及びファクシミリ機能を順次に切り替えて選択することが可能となる。ドキュメントボックス機能の選択時にはドキュメントボックスモードとなり、コピー機能の選択時にはコピーモードとなり、プリンタ機能の選択時にはプリンタモードとなり、ファクシミリモードの選択時にはファクシミリモードとなる。
Note that the image forming apparatus can switch and select the document box function, the copy function, the printer function, and the facsimile function in sequence using an application switching key on the
また、ネットワークI/F950は、ネットワークN2を利用してデータ通信をするためのインターフェースである。近距離通信回路920及びネットワークI/F950は、PCIバス922を介して、ASIC906に電気的に接続されている。
A network I/
<機能について>
次に、本実施形態に係るデータ出力システム100の機能構成について、図5を参照しながら説明する。図5は、本実施形態に係る機器20、端末装置30、及び、情報処理システム10の一例の機能構成を示す図である。
<About functions>
Next, the functional configuration of the
<<機器>>
まず、機器20は、第二通信部21と、表示制御部22と、操作受付部23と、画像データ生成部24と、ファクシミリ処理部25と、電子メール処理部26とを有する。これら各機能部は、機器20にインストールされた1以上のプログラムに含まれる命令をCPU901が実行することで実現される機能又は手段である。例えば、第二通信部21、表示制御部22及び操作受付部23はWebブラウザにより実現され、その他は個別のアプリケーション(ネイティブアプリ)により実現される。
<<Equipment>>
First, the
第二通信部21は、情報処理システム10との間で各種の情報を送受信する。本実施形態ではアプリ一覧画面の画面情報等を情報処理システム10から受信し、帳票の画像データやアプリID等を情報処理システム10に送信する。
The
表示制御部22は各種の画面の画面情報を解釈してパネル表示部940aに表示する。操作受付部23は、パネル表示部940aに表示された各種画面におけるユーザの各種操作を受け付ける。
The
画像データ生成部24は、操作受付部23が選択を受け付けたアプリが画像データを生成するものである場合、スキャナ部931で原稿をスキャンして画像データを生成する。画像データ生成部24はスキャン機能である。画像データ生成部24は、画像データをPDFファイルに変換する。変換せずに画像データ(JPEG、TIFF、PNGなど)のままでもよい。ファクシミリ処理部25は、ファクシミリ部933によるファクシミリの受信及び送信に関する処理を行い、ファクシミリを受信した場合に予め対応付けられているアプリの実行を情報処理システム10に要求する。なお、ファクシミリの送信元(FAX番号)に対応したアプリを要求してもよい。
When the application selected by the
電子メール処理部26は電子メールの送受信に関する処理を行い、電子メールを受信した場合に予め対応付けられているアプリの実行を情報処理システム10に要求する。なお、電子メールの送信元(メールアドレス)に対応したアプリを要求してもよい。
The
<<端末装置>>
端末装置30は、第一通信部31と、表示制御部32と、操作受付部33とを有する。これら各機能部は、端末装置30にインストールされた1以上のプログラムに含まれる命令をCPU501が実行することで実現される機能又は手段である。なお、このプログラムはWebブラウザでもよいし、情報処理システム10と通信するための専用のソフトウェアでもよい。
<<Terminal device>>
The
第一通信部31は、情報処理システム10又は外部サービスシステム40との間で各種の情報を送受信する(第二の通信部の一例)。本実施形態では各種の画面情報等を情報処理システム10又は外部サービスシステム40から受信し、管理者又はユーザが設定した情報を情報処理システム10又は外部サービスシステム40に送信する。
The
表示制御部32は各種の画面の画面情報を解釈してディスプレイ506に表示する。操作受付部33は、ディスプレイ506に表示された各種画面におけるユーザの各種操作を受け付ける。
The
<<情報処理システム>>
情報処理システム10は、アプリデータサービス部11、設定受付部12、認証サービス部14、Webサービス処理部15、入出力サービス部16、コンポーネント18、及び、通信部19を有する。これら各機能部は、情報処理システム10にインストールされた1以上のプログラムに含まれる命令をCPU501が実行することで実現される機能又は手段である。なお、図5では作図の都合上、1つの情報処理システム10が各機能部を有しているが、各機能部は複数の情報処理装置に分散して配置されてもよい。
<<Information Processing System>>
The
通信部19は、端末装置30及び機器20との間で各種の情報を送受信する。設定受付部12は、端末装置30に設定サイトを提供し、設定サイトに対する設定を受け付ける。サイトとは、WebページやWebアプリをいう場合もあるし、端末装置30にWebページやWebアプリを提供するサーバ側のシステムをいう場合もある。設定受付部12は端末画面提供部42を有しており、端末画面提供部42はアプリの実行に必要な情報を管理者に設定させる初期画面、アプリ一覧画面、及び、対応付け画面等を提供する。なお、端末画面提供部42は、端末装置30からのHTTPリクエストに対しHTML、XML、CSS(Cascade Style Sheet)、及びJavaScript(登録商標)等により記述された画面情報を生成し、画面情報をHTTPレスポンスとして端末装置30に送信する。
The
アプリデータサービス部11はアプリデータ管理部41を有している。アプリデータ管理部41は、企業などの顧客により購入されたアプリのアプリデータ43を顧客ごとに管理する。アプリデータ43は、例えば、アプリと上記の領域情報を対応付ける。アプリデータ43はアプリデータ記憶部13に記憶される。なお、データ出力システム100から見た顧客などの組織をテナントという。
The application
Webサービス処理部15は機器20に対し画面情報を提供したり、機器20からアプリの実行を受け付けたりする。Webサービス処理部15はアプリ実行部46と機器画面提供部47を有している。アプリ実行部46は機器20からのアプリの実行を受け付け、入出力処理部48に対しアプリの実行を要求する。機器画面提供部47は画面情報54を使って、アプリ一覧画面やアプリ画面の画面情報を機器20に提供する。
The web
入出力サービス部16は認証サービス部14、アプリ処理情報記憶部17及びコンポーネント18を使用してデータの入出力を行う。入出力サービス部16は入出力処理部48とアプリ管理部49を有している。入出力処理部48はアプリ実行部46から要求されたアプリを実行する。実行時にはアプリ処理情報53を参照しアプリに含まれる各処理をコンポーネント18に要求する。アプリ管理部49は、アプリ処理情報記憶部17に記憶されている、アプリのアプリ処理情報53や画面情報54を管理する。アプリ処理情報53にはアプリがどの処理をどの順番で行うか(例えば、OCRの後に外部サービスシステム40に処理要求する等)が設定されている。画面情報54は各アプリのアイコン、アプリ一覧画面、及び各アプリ画面など、機器20が表示する画面の情報である。アプリ処理情報記憶部17にはアプリごとにアプリ処理情報53及び画面情報54が記憶されている。
The input/
認証サービス部14はユーザ(管理者を含む)、及び、機器20の認証に関する処理を行う。認証サービス部14はユーザ管理部44とデバイス管理部45を有している。ユーザ管理部44はユーザに関する情報を管理する。例えば、ユーザ名やパスワード等の認証情報を保持する。また、認証情報には情報処理システム10のものと外部サービスシステム40のものとがある。デバイス管理部45は、テナントに対応付けられている機器20を管理する。つまり、テナントの識別情報と機器20を対応付けて管理しており、機器20が特定されるとテナントも特定される。
The
コンポーネント18は各処理を実際に行う個別の機能の総称である。コンポーネント18内の1つのブロックが1つの処理に対応する。コンポーネント18は例えば、認証処理部61、外部サービス処理部62、判断部63、PDF処理部64、領域検出部65、ファイル出力部66、領域特定部67、OCR処理部68、及び、OCR補正部69を有している。認証処理部61は認証サービス部14に対して認証に関する処理を依頼するコンポーネント18である。外部サービス処理部62は、外部サービスシステム40に対して処理要求を依頼するコンポーネント18である。つまり、外部サービス処理部62は外部サービスシステム40と連携するための機能である。外部サービス処理部62は外部サービスシステム40の種類ごとに用意される。判断部63は各種の判断を行い、処理フローの分岐を制御する。PDF処理部64はPDFファイルに関する処理を行うものであり、例えばPDFファイルから画像データを取り出したり、透明テキスト付きのPDFファイルを作成したりする。機器20がPDFファイルの形式で画像データを送信するためである。領域検出部65は、画像データからマーカーペンなどでマーキングされた矩形領域を検出し、矩形領域の座標(領域情報)を作成する。ファイル出力部66は、領域情報を含む設定ファイルを作成し、また、OCR処理結果(帳票の領域から取得されたデータ)を含むファイルを出力する。領域特定部67は領域情報に基づいて、画像データから領域を特定する。領域特定部67は特定した領域を取得する(例えば切り出してよい)。OCR処理部68は、領域のみ及び画像データの全体にOCR処理を行う。OCR補正部69はOCR処理結果を補正する。なお、図示する以外に、翻訳等のコンポーネントを有していてよい。
The
表1は、アプリ処理情報記憶部17が保持するアプリ処理情報の一例を示す。アプリ処理情報記憶部17はテナントごとに購入されている(ライセンスがある)アプリのリストを記憶する。表1に示す情報はアプリ処理情報記憶部が記憶するリストに含まれるアプリうち、本実施形態で説明する受信した画像データの一部に画像処理を行うアプリの一覧で、アプリID、アプリ名、画面情報、アプリ処理情報、共有アプリ、及び、外部サービスシステム40の各項目を有している。アプリIDはアプリを識別する識別情報である。アプリ名は管理者が付与したアプリの名称である。また、アプリのアイコンや設定画面を機器20が表示する際に使用される画面情報54(HTML等で記述された)がアプリに対応付けられる。アプリには一連の処理の内容と順番(処理フロー)が定義されるので、各アプリにはアプリ処理情報53が対応付けられる。後述するように、複製されたアプリはフロー情報が同じになる。共有アプリとは、一般のアプリがユーザごとに利用権限が与えられるのに対し、共有アプリはテナントのユーザが共通に使えるアプリであることを示す。表1では経費精算書アプリが共有アプリである。各ユーザが共通に利用するためである。外部サービスシステム40の項目は各アプリが連携する外部サービスシステム40である。外部サービスシステム40と連携しないアプリも存在する。
Table 1 shows an example of application processing information held by the application processing information storage unit 17 . The application processing information storage unit 17 stores a list of applications purchased (licensed) for each tenant. The information shown in Table 1 is a list of applications included in the list stored in the application processing information storage unit, which perform image processing on part of the received image data described in this embodiment. It has items of screen information, application processing information, shared application, and
アプリ管理部49は、管理者又はユーザがログインすると、管理者又はユーザに利用権限が認められているアプリの一覧をアプリ処理情報記憶部17から取得して機器20に提供する。また、アプリ管理部49は、アプリの一覧からアプリが指定されると、アプリに対応付けられている画面情報とアプリ処理情報を特定する。
When an administrator or user logs in, the
表2はユーザ管理部44が管理するユーザに関する情報の一例を示す。表2(a)はユーザに関する情報として、情報処理システム10におけるユーザID、ユーザ名、メールアドレス、パスワード、利用できるアプリ、及び、外部サービスシステム情報の各項目を有している。このユーザには管理者も含まれる。ユーザID、ユーザ名又はメールアドレスの少なくとも1つとパスワードは、ユーザが情報処理システム10にログインするための認証情報である。利用できるアプリはこのユーザに利用権限が与えられているアプリである。利用権限は、利用人数などを指定してライセンスを購入したアプリを管理者が各ユーザに割り当てることで与えられる。利用できるアプリには個人アプリと共有アプリがある。個人アプリも共有アプリも複数のユーザに使用されるが、個人アプリは個人のユーザの外部サービスの認証情報を使用し、共有アプリは複数のユーザが外部サービスに対し管理者の認証情報を使用する。表2(a)では、U001~U003に共通のapp003が共有アプリである。その他は個人アプリである。個人アプリの場合、ユーザごとに外部サービスシステムの認証情報の登録が必要である。外部サービスシステム情報はユーザが連携設定済みの外部サービスシステム40である。
Table 2 shows an example of user-related information managed by the user management unit 44 . Table 2(a) has items of user ID, user name, e-mail address, password, usable application, and external service system information in the
なお、連携設定済みとは、ユーザが外部サービスシステム40との連携を希望し、外部サービスシステム40の認証情報でログインできることが確認できたことをいう。ユーザは設定サイトから外部サービスシステム40の認証情報を入力し、ログインできた場合に、表2(a)の外部サービスシステム情報に外部サービスシステムの識別情報が設定される。また、表2(b)に外部サービスシステム40の認証情報が登録される。
Note that "already set for cooperation" means that the user wishes to cooperate with the
表2(b)は、各ユーザの外部サービスシステムに関する情報であり、ユーザID、外部サービスシステム40、ユーザID、及び、パスワードの各項目を有している。表2(b)にはユーザが連携設定した外部サービスシステム40の認証情報が登録される。外部サービスシステム40の認証情報はユーザが外部サービスシステム40にログインするための認証情報である。U002のユーザのように、外部サービスシステム40ごとに認証情報が異なっている場合もある。このため、データ出力システム100のユーザごとに、外部サービスシステム40の認証情報が関連付けられている。情報処理システム10は、機器20から取得した情報処理システム10のユーザID、パスワード等の認証情報に応じて、連携先の外部サービスシステム40の認証情報を特定する。
Table 2(b) is information about each user's external service system, and has items of user ID,
また、認証情報は外部サービスシステム40の認証情報、又は、外部サービスシステム40と連携するために必要な認証情報であればよく、ユーザIDやパスワード以外に、外部サービスシステム40との連携設定時に外部サービスシステム40から取得したトークン等でも良い。
Also, the authentication information may be authentication information of the
表2(c)は、共有アプリ用の認証情報である。共有アプリの識別情報に外部サービスシステム40と認証情報が対応づけられている。共有アプリの認証情報は管理者のものが使用されるので、管理者の識別情報が登録されている。
Table 2(c) is the authentication information for the shared application. The identification information of the shared application is associated with the
表3は、アプリデータ記憶部13に記憶されているアプリデータ43の一例を示す。アプリデータ43は、アプリと設定ファイル(領域情報)を対応づける。対応付けは管理者が行う。
・applicationId…連携元のアプリIDである。
・applicationName…アプリのアプリ名である。
・fileId…情報処理システム10が作成した設定ファイルの識別情報である。
・fileName…情報処理システム10が作成した設定ファイルのファイル名である。設定ファイルは外部サービスシステム40に保存されるが、そのフォルダと共にファイル名が設定される。例えばURLでよい。
・アップロード先フォルダ…設定ファイルが保存される外部サービスシステム40とそのフォルダである。例えばURLでよい。管理者が設定する。
Table 3 shows an example of the
• applicationId: the application ID of the linking source.
・applicationName: The application name of the application.
• fileId: identification information of the setting file created by the
• fileName . . . file name of the setting file created by the
Upload destination folder: the
表4は、外部サービスシステム40に記憶されている設定ファイル9の一例を示す。設定ファイル9は、OCR処理の対象となる領域情報を有するファイルである。設定ファイルは表形式(例えばCSV形式)になっており、各セルの位置が列番号と行番号で指定される。以下、A列~L列の項目について説明する。なお、設定ファイルの1行目にある項目名は、設定ファイルの作成時に情報処理システム10により設定される。
・ID…領域情報の識別情報である。自動的に採番され、管理者やユーザが意識する必要はない。
・始点X座標、始点Y座標、終点X座標、終点Y座標…領域情報である。マーキングされた帳票の矩形領域の対角頂点を表す。1点の座標と幅と高さが指定されてもよい。座標の単位は例えばcm、ピクセルなどでよい。
Table 4 shows an example of the
ID: identification information of area information. It is automatically numbered, and administrators and users do not need to be aware of it.
• Start point X coordinate, start point Y coordinate, end point X coordinate, end point Y coordinate: area information. Represents the diagonal vertices of the rectangular area of the marked form. The coordinates, width and height of one point may be specified. Units of coordinates may be, for example, cm or pixel.
以上の情報が、情報処理システム10が自動的に設定する情報となる。以下の情報は、管理者が入力する。
・フォーマット…領域のデータ形式である。例えば、日付(YYYY/MM/DD)、数値(NUMERIC)などがある。データのフォーマットがわかるので、OCR処理部68がより高精度にOCR処理することができる。フォーマットはプルダウンメニューになっている。このように領域ごとにデータの種類が設定される。
・CSV列名…領域に付与された名称である。帳票の場合は、矩形枠のタイトルなどが入力されるが、管理者が任意の値を入力できる。CSV列名はデータと共にファイルに出力される。
・CSV位置(列)…領域から抽出されたデータを情報処理システム10がファイルのどの列に書き込むかを指定する。
・CSV位置(開始行)…領域から抽出されたデータを情報処理システム10がファイルのどの行に書き込むかを指定する。行番号は帳票の読み取りのたびに大きくなるため、ファイルに1つもデータが記載されていない場合の「開始行」が設定される。例えば、最初の帳票から取得されたデータは2行目に設定されるが、2枚目の帳票から取得されたデータは3行目に設定される。これに対し列位置は固定でよい。
・OCR言語…領域がどの言語で記述されているかが設定される。言語がわかるので、OCR処理部68がより高精度にOCR処理することができる。OCR言語はプルダウンメニューになっている。このように領域ごとにデータの種類が設定される。
・ファイル名に使う順序…本実施形態では領域から取得されたデータが出力されるファイルのファイル名に使用される。ファイル名に使う順序は、情報処理システム10が出力するファイルのファイル名に使用されるデータの順番である。例えば、「書類名」が1番、「申請日」が2番の場合、ファイル名は各領域から取得されたデータ(経費精算書、20201010)により、「経費精算書_20201010.csv」となる。
The above information is the information automatically set by the
• Format: the data format of the area. For example, there are date (YYYY/MM/DD), numerical value (NUMERIC), and the like. Since the format of the data is known, the OCR processing section 68 can perform OCR processing with higher precision. The format is a pull-down menu. In this way, the type of data is set for each area.
• CSV column name: name given to the area. In the case of a form, the title of the rectangular frame is entered, but the administrator can enter any value. The CSV column names are output to the file along with the data.
CSV position (column) . . . Specifies which column of the file the
• CSV position (starting line) . . . designates which line of the file the
- OCR language --- The language in which the area is described is set. Since the language is known, the OCR processing section 68 can perform OCR processing with higher accuracy. The OCR language is a pull-down menu. In this way, the type of data is set for each area.
• Order used for file name: In this embodiment, it is used for the file name of the file to which the data acquired from the area is output. The order used for the file names is the order of the data used for the file names of the files output by the
<アプリ処理情報>
次に、図6を用いて、アプリ処理情報の詳細について説明する。図6は、アプリ処理情報記憶部17に記憶されているアプリ処理情報53の一例を示す図である。
<Application processing information>
Next, details of the application processing information will be described with reference to FIG. FIG. 6 is a diagram showing an example of
図6に示すアプリ処理情報53は、機器20でスキャンして生成された画像データを「外部サービスシステムB」に処理要求するサービスを実現するための一連の処理に関する情報である。
The
アプリ処理情報53には、当該アプリ処理情報53の識別情報を示すフローID1201Aと、当該アプリ処理情報53の名称を示すフロー名1202Aと、一連の処理の処理内容を示すフロー詳細1203Aとが含まれる。フロー名1202Aはアプリの名称を兼ねている。
The
また、フロー詳細1203Aには、「外部サービスシステムB」に処理要求することを示す処理内容1223Aが含まれる。
The flow details 1203A also includes a
処理内容1223Aでは、「外部サービスシステムB」と連携した処理を実行するコンポーネント18のコンポーネントID「ExService_B」、及び、パラメータ「AppId」「Folder」が指定されている。「ExService_B」は外部サービスシステムBのための外部サービス処理部62に相当する。「AppId」には連携先アプリIDが格納され(アプリと連携先アプリの対応は予め決まっている)、「Folder」にはファイルの保存先のフォルダ(アップロード先フォルダ)が格納される(管理者が設定したアップロード先フォルダが設定される)。これにより、情報処理システム10はスキャンされた画像データを「外部サービスシステムB」に保存することができる。
In the
なお、また、連携先アプリと連携しないアプリの場合、「AppId」が省略される。図示したパラメータは一部であって、アプリ処理情報はより多くのパラメータを含みうる。 In addition, in the case of an application that does not cooperate with a cooperation destination application, "AppId" is omitted. The illustrated parameters are only a part, and application processing information may include more parameters.
図6では、説明を簡単にするため、1つのコンポーネントのみ指定されているが、アプリ処理情報53には、アプリが行う一連の処理内容1223Aが処理(コンポーネント)の数だけ登録されている。
In FIG. 6, only one component is specified for the sake of simplicity of explanation, but in the
図7は、アプリが行う一連の処理を模式的に示す図である。図7(a)は設定ファイルの作成を行うアプリ(例えば、OCR領域指定アプリ)の一連の処理を示す。1つのブロックが処理内容1223Aに対応する。各処理の詳細は図10にて説明する。
FIG. 7 is a diagram schematically showing a series of processes performed by an application. FIG. 7A shows a series of processes of an application (for example, an OCR area designation application) that creates a setting file. One block corresponds to the
図7(b)は帳票の領域からデータを出力するアプリ(例えば、経費精算書アプリ)の一連の処理を示す。1つのブロックが処理内容1223Aに対応する。各処理の詳細は図22にて説明する。
FIG. 7B shows a series of processes of an application (for example, an expense report application) that outputs data from a form area. One block corresponds to the
<領域の指定、領域の取得、設定ファイルの作成>
次に、図8~図11を参照して、管理者による領域の指定、領域の取得、及び、設定ファイルの作成について説明する。
<Specify area, get area, create configuration file>
Next, referring to FIGS. 8 to 11, the administrator's specification of areas, acquisition of areas, and creation of setting files will be described.
図8は、帳票における領域のマーキング方法を説明する図である。図8(a)では、白黒以外の(彩度がある)マーカーペンで色が付けられた色付着部601が形成されている。色付着部601の色は、予め決められた情報に相当する。すなわち、マーカーペンで塗られた色は予め定められている。
領域検出部65は白黒以外の画素を検出し、白黒以外の画素(色付着部601)の外接矩形を検出する。白黒以外のマーカーペンが使用されるのは、領域検出部65が領域を容易に検出できるようにするためであり、黒のマーカーペンが使用されてもよい。この場合、領域検出部65は、一定以上の高さと面積を有する黒画素の外接矩形を検出する。
FIG. 8 is a diagram for explaining a method of marking an area on a form. In FIG. 8A, a
The area detection unit 65 detects pixels other than black and white, and detects the circumscribing rectangle of the pixels other than black and white (color adhering portion 601). A non-black and white marker pen is used so that the area detection unit 65 can easily detect the area, and a black marker pen may be used. In this case, the region detection unit 65 detects a circumscribed rectangle of black pixels having a height and area equal to or greater than a certain level.
また、図8(b)では白黒以外のマーカーペンで領域を囲む枠線602が形成されている。領域検出部65は白黒以外の画素を検出し、白黒以外の画素(枠線602)の外接矩形を検出する。
Also, in FIG. 8B, a
なお、領域のマーキング方法は図8に示す方法には限られない。例えば、二重線で領域が指定されてもよいし、所定の記号(%、$、#、△等)で囲まれた範囲で領域が指定されてもよい。
上記の予め決められた情報は、マーカーペンで塗られた色の情報以外に、OCR領域を示すものであれば、マーカーではない黒ペンなどによる丸や四角等の図形の情報等でも良い。この場合、ユーザは黒ペンで丸や四角を描きOCR領域を囲む。また、OCR領域は、マーカーペンの色で囲われた領域以外に、マーカーペンで塗りつぶされた領域等でもよい。
Note that the method of marking the area is not limited to the method shown in FIG. For example, the area may be designated by double lines, or may be designated by a range surrounded by predetermined symbols (%, $, #, Δ, etc.).
The above-mentioned predetermined information may be information on figures such as circles and squares drawn by a black pen instead of a marker, as long as it indicates the OCR area, other than the information on the color drawn with the marker pen. In this case, the user draws a circle or square with a black pen to enclose the OCR area. Also, the OCR area may be an area filled with a marker pen, or the like, other than the area surrounded by the color of the marker pen.
図9は、領域情報の登録時に機器20が表示する領域登録画面610の一例である。管理者は機器20から情報処理システム10にログインしてOCR領域指定アプリを選択する。領域登録画面610は、「OCRしたい領域を枠線で囲った原稿をセットして「スタート」を押してください」というメッセージ611、読み取り設定欄612、及び、スタートボタン613を有している。ユーザは原稿(帳票)をコンタクトガラスにセットして、スタートボタン613を押下する。必要に応じて読み取り設定欄612で読み取り条件(カラー/白黒、片面/両面、向き、解像度等)を設定してもよい。なお、カラー/白黒に関してはユーザが誤って白黒に設定しないように、カラーに固定されているとよい。
FIG. 9 is an example of an
なお、図9の領域登録画面610から管理者が設定ファイルのファイル名を指定できるとよい。外部サービスシステム40から設定ファイルを探しやすくするためである。また、設定ファイルの保存先のフォルダをユーザが設定できるとよい。
It is preferable that the administrator can specify the file name of the setting file from the
図10は、管理者が領域をマーキングした帳票から情報処理システム10が領域情報を取得して、設定ファイルを作成する手順を示すシーケンス図の一例である。
FIG. 10 is an example of a sequence diagram showing a procedure for the
S1:管理者は機器20を操作して情報処理システム10にログインし、初期画面に表示されるアプリ一覧からOCR領域指定アプリを選択する。これにより、機器20の表示制御部22は領域登録画面610を表示する。管理者は領域をマーキングした帳票をコンタクトガラスに設置してスタートボタン613を押下する。画像データ生成部24は帳票の画像データを生成し、PDFファイルに変換する。
S1: The administrator operates the
S2:機器20の第二通信部21は、OCR領域指定アプリの実行要求と共にPDFファイルを情報処理システム10に送信する。
S2: The
S3:情報処理システム10の通信部19はPDFファイルを受信する。アプリ実行部46はOCR領域指定アプリのアプリIDを指定して実行を入出力処理部48に要求する。入出力処理部48はOCR領域指定アプリのアプリIDに対応づけられているアプリ処理情報53を参照して、アプリを実行する。まず、入出力処理部48はPDFファイルを指定してPDF処理部64に画像データの抽出を要求する。PDF処理部64はPDFファイルから帳票の画像データを抽出する。
S3: The
S4:次に、入出力処理部48は画像データと共に、領域の取得を領域検出部65に要求する。領域検出部65は、画像データの色情報に基づいて画像データから領域を取得する。
S4: Next, the input/
図11は画像データからの領域の検出を説明する図である。図11(a)に示すように、マーカーペンで指定された色付着部601のRGB値は、白黒でない値を有している。黒のRGBは(0,0,0)、白のRGBは(255,255,255)なので、領域検出部65は例えば、(1,1,1)~(254,254,254)のRGBを有する色付着部601を検出する。なお、マーカーペンの色が決まっている場合は、開発者はRGBの範囲を色に応じて狭めることができ、より精度よく色付着部601を検出できる。例えば、帳票がカラーの場合でも、帳票にはない色のマーカーペンが使用されると、カラーの帳票から領域検出部65が色付着部601を検出できる。
FIG. 11 is a diagram explaining detection of an area from image data. As shown in FIG. 11A, the RGB values of the
図11(b)は検出された色付着部601を示す。領域検出部65は検出した色付着部601の外接矩形620を設定する。そして、外接矩形620の上下左右にマージンを設定し、マージンを含む領域621を決定する。図11(b)では、左右にa〔mm〕、上下にb〔mm〕が設定されている。マージンを設定するのは、機器20が帳票を読み取る場合に位置ずれなどを起こすためである。図11(b)の左上コーナー622の座標が領域情報の始点X座標と始点Y座標であり、右下コーナー623の座標が領域情報の終点X座標と終点Y座標(領域情報)である。
FIG. 11(b) shows the detected
また、図11(c)に示すように、領域検出部65はRGBに基づいて検出された色付着部601の外側の枠線625を検出してもよい。領域検出部65は、色付着部601(外接矩形620)の垂直方向外側に向けて黒画素を探索し、黒画素が見つかった場合は黒画素をたどり、元の位置に戻った場合に、外側の枠線625を検出したと判断する。こうすることで、データが記入される最大の領域を検出でき、機器20が帳票を読み取る場合に位置ずれなどを起こしても領域特定部67がデータを特定しやすくなる。
なお、マーカーペンで特定される領域に対し領域検出部65がどのくらいマージンを設けるか等を、管理者が設定しておくことができる。図16の詳細は対応付け画面640-2にて説明する。領域検出部65は対応付け画面640-2の設定に基づいて領域情報を設定する。
Further, as shown in FIG. 11(c), the area detection unit 65 may detect a
The administrator can set, for example, how much margin the area detection unit 65 should provide for the area specified by the marker pen. The details of FIG. 16 will be explained in the association screen 640-2. The area detection unit 65 sets area information based on the settings on the association screen 640-2.
S5:次に、入出力処理部48は、マーカーペンで領域が指定された画像データを指定して外部サービス処理部62に外部サービスシステム40へのアップロードを要求する。
S5: Next, the input/
S6:外部サービス処理部62は、管理者の外部サービスシステム40における認証情報をユーザ管理部44から取得する。これにより、外部サービス処理部62は外部サービスシステム40にログインし、管理者のトップフォルダ(又は、管理者が指定したフォルダ)に画像データを保存する。領域登録画面610で管理者が設定ファイルのファイル名を指定した場合、外部サービス処理部62は同じファイル名を画像データのファイルに付与する。ファイル名が設定されていない場合、現在の日時などがファイル名となる。
S6: The external
S7:次に、入出力処理部48は、領域検出部65が検出した領域情報を指定し、ファイル出力部66に設定ファイルの作成を要求する。ファイル出力部66はIDを採番し、領域情報をCSVファイルの決まった列に配置して、設定ファイルを生成する。この時点では表4のA~E列に情報が入った状態となる。
S7: Next, the input/
S8:次に、入出力処理部48は、設定ファイルを指定して外部サービス処理部62に外部サービスシステム40へのアップロードを要求する。
S8: Next, the input/
S9:外部サービス処理部62は、外部サービスシステム40にログイン済みなので、管理者のトップフォルダ(又は、管理者が指定したフォルダ)に設定ファイルを保存する。領域登録画面610で管理者が設定ファイルのファイル名を指定した場合、外部サービス処理部62はこのファイル名を設定ファイルのファイルに付与する。ファイル名が設定されていない場合、現在の日時などがファイル名となる。画像データと設定ファイルのファイル名が同じなので、管理者は設定ファイルがどの画像データにより生成されたのかを容易に判断できる。
S9: Since the external
<設定ファイルへのその他の情報の登録>
図12、図13を参照して、設定ファイルへのF~K列への設定について説明する。図12は、管理者が設定ファイルのF~K列へ情報を設定する手順を示すシーケンス図の一例である。
<Registration of other information in the configuration file>
12 and 13, setting to the F to K columns in the setting file will be described. FIG. 12 is an example of a sequence diagram showing a procedure for the administrator to set information in the F to K columns of the setting file.
S11:外部サービスシステム40に設定ファイルを登録した後、管理者は端末装置30を操作して端末装置30を外部サービスシステム40に接続させる。管理者は自分の認証情報を入力して、外部サービスシステム40にログインする。
S<b>11 : After registering the setting file in the
S12:外部サービスシステム40はストレージサービスなので、管理者が登録したファイルの一覧を端末装置30に送信する。例えばトップフォルダにあるファイルの一覧が送信される。トップフォルダにない場合は、管理者が階層を指定する。ファイルの一覧の中に、管理者が機器20から登録した設定ファイルと画像データのファイルも含まれる。
S12: Since the
S13:管理者は設定ファイルの内容を確認したり、F~K列への情報を設定したりするため、設定ファイルを選択する。端末装置30の操作受付部33は選択を受け付け、第一通信部31が設定ファイルのファイルIDを指定して設定ファイルを外部サービスシステム40に要求する。
S13: The administrator selects a configuration file in order to confirm the contents of the configuration file and set information for columns F to K. The
S14:外部サービスシステム40の通信部19は設定ファイルの要求を受信し、設定ファイルを端末装置30に送信する。
S<b>14 : The
S15:管理者は設定ファイルの内容を確認し、F~K列への情報を設定する。端末装置30の操作受付部33は設定を受け付ける。
S15: The administrator confirms the contents of the setting file and sets the information in columns F to K. The
S16:管理者が例えば、設定ファイルをアップロードする操作を行うと、第一通信部31はA~K列へ情報が設定された設定ファイルを情報処理システム10に送信する。
S16: For example, when the administrator performs an operation of uploading a setting file, the
以上のようにして、外部サービスシステム40には設定ファイルが登録される。
The setting file is registered in the
図13は、設定ファイルと帳票の対応を説明する図である。表4にて説明したように、管理者は、フォーマット、CSV列名、CSV位置(列)、CSV位置(行)、OCR言語、及び、ファイル名に使う順序、を設定する。なお、必ずしも全ての列を設定しなくてもよい。 FIG. 13 is a diagram for explaining the correspondence between setting files and forms. As described in Table 4, the administrator sets the format, CSV column names, CSV position (columns), CSV position (rows), OCR language, and the order used for file names. Note that it is not always necessary to set all the columns.
図13の例では、ID=1の領域情報から取得されたデータはCSV列名の「書類名」と対応することが設定されている。「書類名」はファイル名の一番目に使用される。ID=2の領域情報から取得されたデータはCSV列名の「申請日」と対応することが設定されている。また、申請日のCSV位置が3列2行と設定されているので、ID=2の領域情報から取得されたデータはファイルの3列2行目に書き出される。更に「申請日」はファイル名の二番目に使用される。ID=3の領域情報から取得されたデータはCSV列名の「金額」と対応することが設定されている。また、金額のCSV位置が4列2行と設定されているので、ID=3の領域情報から取得されたデータはファイルの4列2行目に書き出される。
In the example of FIG. 13, the data acquired from the area information of ID=1 is set to correspond to the CSV column name "document name". "Document name" is used at the beginning of the file name. The data acquired from the area information of ID=2 is set to correspond to the CSV column name "application date". Also, since the CSV position of the application date is set to
<アプリと領域情報の対応付け>
次に、図14、図15を参照して、アプリと領域情報の対応付けについて説明する。図14は、アプリと領域情報の対応付けに関して端末装置30が表示する画面の一例である。管理者は端末装置30を操作して、端末装置30を情報処理システム10と通信させる。
<Associating applications with area information>
Next, with reference to FIGS. 14 and 15, the correspondence between applications and area information will be described. FIG. 14 is an example of a screen displayed by the
まず、図14(a)は管理者が情報処理システム10にログインすると表示される初期画面630である。管理者に認められている操作メニューが表示される。設定ファイルにアプリを対応づけるため、管理者がアプリ一覧を表示させるアイコン631を選択する。
First, FIG. 14A shows an
表2に示したように、ユーザ管理部44ではユーザごとに利用できるアプリと外部サービスシステム情報が登録されているので、情報処理システム10は外部サービスシステム40ごとに管理者が利用できるアプリの一覧を端末装置30に提供できる。
As shown in Table 2, the user management unit 44 registers the applications that can be used by each user and the external service system information. can be provided to the
図14(b)はアプリ一覧画面632の一例を示す。アプリ一覧画面632には管理者が利用できるアプリの一覧が表示される。管理者はアプリ一覧画面632から、外部サービスシステム40に登録した設定ファイルと対応付けるためのアプリ633(例えば、経費精算書アプリ)を選択する。操作受付部33がアプリ633の選択を受け付けることで、図14(c)に示す対応付け画面640が表示される。対応付け画面640は、外部サービスシステム選択欄641、アップロード先フォルダ欄642、及び、設定ファイル欄643を有している。
・外部サービスシステム選択欄641…領域から取得されたデータを書き出すファイルの保存先の外部サービスシステム40を管理者が設定するための欄である。したがって、管理者はアプリに予め対応付けられている外部サービスシステム40を変更したり、新規に設定したりできる。
・アップロード先フォルダ欄642…外部サービスシステム40において、領域から取得されたデータを書き出すファイルの保存先のフォルダを管理者が設定するための欄である。管理者がフォルダ選択ボタン642aを押下すると、外部サービスシステム40における管理者の認証情報で情報処理システム10が外部サービスシステム40にログインし、外部サービスシステム40においての管理者がアクセスできるトップフォルダが端末装置30に表示される。管理者は任意のフォルダを選択できる。
・設定ファイル欄643…アプリと対応付ける設定ファイルを管理者が選択するための欄である。管理者がファイルを選択ボタン644、を押下すると、外部サービスシステム40における管理者の認証情報で情報処理システム10が外部サービスシステム40にログインし、外部サービスシステム40においての管理者がアクセスできるトップフォルダが端末装置30に表示される。トップフォルダ(又は管理者が設定したフォルダ)には、情報処理システム10が登録し、管理者が更新した設定ファイルが含まれる。トップフォルダに設定ファイルがない場合、管理者はトップフォルダの下位のフォルダから設定ファイルを探すことができる。
FIG. 14B shows an example of the
External service
• Upload
A
図15は、図14の画面を介して管理者がアプリと設定ファイルを対応づける処理を説明するシーケンス図の一例である。図15の処理は図14(a)の画面が表示された状態からスタートする。 FIG. 15 is an example of a sequence diagram for explaining the processing by which the administrator associates the application with the setting file via the screen of FIG. 14 . The process of FIG. 15 starts from the state where the screen of FIG. 14(a) is displayed.
S21:管理者は情報処理システム10にログインして、初期画面630からアプリ一覧を表示する操作を端末装置30に入力する。端末装置30の操作受付部33は操作を受け付け、第一通信部31がアプリ一覧を情報処理システム10に要求する。
S21: The administrator logs in to the
S22:情報処理システム10の通信部19がアプリ一覧の要求を受信し、端末画面提供部42が管理者のユーザIDに対応づけられているアプリをユーザ管理部44から取得する。端末画面提供部42は、外部サービスシステム40ごとに管理者が利用できるアプリを含むアプリ一覧画面の画面情報を作成する。通信部19はアプリ一覧画面の画面情報を端末装置30に送信する。
S22: The
S23:管理者が、設定ファイルを対応付けるアプリを選択する。端末装置30の操作受付部33が選択を受け付ける。この後、上記のように端末装置30は対応付け画面640を表示する。
S23: The administrator selects an application with which the configuration file is associated. The
S24:管理者は、対応付け画面640でファイルを選択ボタン644、を押下する。操作受付部33が押下を受け付け、対応付け画面640で設定されている外部サービスシステム40に保存されているファイル一覧の要求を第一通信部31が情報処理システム10に送信する。
S24: The administrator presses a
S25:情報処理システム10の通信部19はファイル一覧の要求を受信し、アプリ実行部46が入出力処理部48に外部サービスシステム40を指定してファイル一覧を要求する。入出力処理部48は外部サービスシステム40に対応した外部サービス処理部62にファイル一覧を要求する。外部サービス処理部62は管理者の外部サービスシステム40(アプリに対応づけられているか、又は、対応付け画面でユーザが設定した)における認証情報をユーザ管理部44から取得し、外部サービスシステム40にファイル一覧の要求を送信する。
S25: The
S26:外部サービスシステム40は管理者の認証情報に基づいて、管理者のログインを許可し、管理者に対応づけられているファイルの一覧を取得する。ファイルの一覧が端末装置30に送信される。なお、図15では、設定ファイルが保存された外部サービスシステム40と、領域から取得されたデータのファイルが保存される外部サービスシステム40が同じという前提だが両者は異なってもよい。この場合、管理者は設定ファイルを選択後、対応付け画面640で外部サービスシステム40を変更する。
S26: Based on the administrator's authentication information, the
S27:端末装置30の表示制御部32はファイルの一覧を表示する。管理者はアプリと対応づけられる設定ファイルを選択する。端末装置30の操作受付部33は選択を受け付ける。
S27: The
S28:端末装置30の第一通信部31は設定ファイルの識別情報、アプリの識別情報、外部サービスシステム40、及び、アップロード先フォルダを指定して、設定ファイルとアプリの対応付け要求を情報処理システム10に送信する。
S28: The
S29:情報処理システム10の通信部19は設定ファイルとアプリの対応付け要求を受信し、アプリデータ管理部41がアプリデータ43に設定ファイルとアプリを対応付けて登録する。すなわち、applicationId、applicationName、fileId、fileName、及びアップロード先フォルダを対応づけて登録する。なお、外部サービスシステム40はアプリ処理情報53に登録される。
S29: The
以上により、アプリと設定ファイルが対応づけられた。以降、一般ユーザが機器20からアイコンを押下するだけで帳票の領域のデータをファイルに出力できる。
As described above, the application and the setting file are associated with each other. After that, the general user can output the data of the form area to the file simply by pressing the icon on the
なお、図15では、対応付け画面640で管理者がアプリと領域情報を対応づける方法を説明したが、領域情報の登録時にアプリと領域情報の対応付けを行ってもよい。
In FIG. 15, a method for the administrator to associate the application with the area information on the
この場合、例えば図9の領域登録画面610にアプリ名を入力するための欄が表示される。管理者は設定ファイルと対応づけたいアプリのアプリ名を入力する。情報処理システム10は設定ファイルを作成後、入力されたアプリ名のアプリと設定ファイルを対応づけることができる。つまり、管理者がアプリ名を設定して帳票を読み取らせれば、設定ファイルが生成され、連携元ファイルと設定ファイルとが対応づけられる。
また、図14(c)に示した対応付け画面640において、管理者は領域の拡張幅を設定できる。図16は対応付け画面640の変形例を示す。なお、図16の説明では、図14(c)との相違を主に説明する。
図16の対応付け画面640-2は、領域の拡張幅の設定欄645を有する。領域の拡張幅の設定欄645に、マーカーペンで特定された領域よりも領域情報(OCR領域)をどのぐらい拡張するかを管理者が設定できる。これにより、表4の領域情報はマーカーペンの色が付着した領域よりも広くなり、管理者がマーカーペンで指定した領域がマークすべき広さよりも狭かったり、ユーザが帳票の領域からはみ出して記入したりした場合でも、OCR処理部68が領域の文字に対しOCR処理することができる。
ただし、この例に限られず、対応付け画面640-2において、マーカーで囲われた内側のみとする(例えばOCR領域をマーカーで囲む場合であればマーカー部分は領域に含まない)か、又は、マーカー部分を含んだ領域とするかを管理者が設定してもよい。
また、どのような形式で管理者が領域を指定するかについて、色、ペンの種類、及び形等を対応付け画面640-2で受け付けてもよい。例えば、黄色マーカーで四角く囲む、赤ペンで丸く囲む、又は、緑色マーカーで塗りつぶす等を管理者が設定できる。
In this case, for example, a field for entering an application name is displayed on the
In addition, the administrator can set the expansion width of the area on the
The association screen 640-2 of FIG. 16 has a
However, it is not limited to this example. The administrator may set whether the area should include the part.
In addition, regarding the format in which the administrator designates the area, the color, pen type, shape, and the like may be received on the association screen 640-2. For example, the administrator can set to enclose in a square with a yellow marker, enclose in a circle with a red pen, or fill in with a green marker.
<アプリの複製>
帳票の形状は様々であるため、ユーザによりデータが記入される領域の場所も帳票によって様々である。そこで、本実施形態では、各帳票それぞれの形状に合わせて管理者が領域情報を登録することができる。各帳票ごとに領域情報を登録する方法の1つとして、管理者がアプリを複製する方法を説明する。
<Duplicate the app>
Since the form has various shapes, the location of the area where data is entered by the user also varies depending on the form. Therefore, in this embodiment, the administrator can register area information according to the shape of each form. As one method for registering area information for each form, a method for an administrator to duplicate an application will be described.
図17は、いくつかのアプリの選択画面650を示す。一例として、明細書アプリ、納付書アプリ、及び、OCR指定領域アプリがある場合、明細書アプリに対しては明細書の領域情報が、納付書アプリに対しては納付書の領域情報が、アプリデータ43においてそれぞれ対応づけられている。ユーザが、明細書の領域からデータを取得したい場合、明細書アプリを起動して明細書をスキャンすることで期待する領域のデータを出力できる。ユーザが、納付書の領域からデータを取得したい場合、納付書アプリを起動して納付書をスキャンすることで期待する領域のデータを出力できる。
FIG. 17 shows a
各アプリが行う処理はアプリ処理情報53に記載されているが、明細書アプリと納付書アプリが行う処理は、ファイルの保存先、アップロード先フォルダ、及び、設定ファイルが異なるものの、実行されるコンポーネントは同じである。したがって、管理者が明細書アプリ又は納付書アプリを複製すれば、領域の指定、領域の取得、設定ファイルの作成、及び、設定ファイルと複製したアプリとの対応付け、が行われることで、情報処理システム10が任意の帳票に対応したアプリを作成できる。
The processing performed by each application is described in the
図18を参照してアプリの複製について説明する。図18は、アプリの複製に際して管理者が操作する画面の一例である。図18(a)は管理者が情報処理システム10にログインすることで端末装置30が表示する初期画面630である。初期画面630には管理者が各種の設定を行うための設定ボタン651が表示される。
Application duplication will be described with reference to FIG. FIG. 18 is an example of a screen operated by an administrator when duplicating an application. 18A shows an
図18(b)は設定ボタン651の押下後に表示されるアプリ管理画面652である。アプリ管理画面652にはいくつかのアプリがグループ化されたグループ名653が表示される。なお、画面遷移は説明のための一例であって、図示した画面の省略や、新たな画面の追加が行われてよい。
FIG. 18B shows an
グループ名653の右側にはこのグループに所属するアプリの一覧が表示される。アプリの一覧に表示されるアプリは管理者に利用権限が認められているアプリである。管理者専用のアプリもあるし、他のユーザが使用するアプリもある。管理者は複製元となるアプリの設定ボタン654を押下する。設定ボタン654の押下により、メニューが表示され、該メニューの中に複製するボタン655がある。
A list of applications belonging to this group is displayed on the right side of the
管理者が複製するボタン655を押下すると、図18(c)に示す複製アプリ設定画面(ポップアップ画面)660が表示される。複製アプリ設定画面660は、アプリ名設定欄661、アイコンリスト欄662、及び、複製要求ボタン663を有している。アプリ名設定欄661には、複製により作成される新しいアプリに管理者が任意のアプリ名を入力する。アプリ名は任意でよいが、重複するアプリ名は排除されるか、又は、「~(2)」などのように枝番が付される。アプリ名以外にアイコン名、設定名と呼ばれてもよい。
When the administrator presses the
アイコンリスト欄662には、アイコンのリストが表示される。管理者は所望のアイコンを選択できる。参照ボタン664を押下して別のアイコンを表示させることも可能である。管理者が複製要求ボタン663を押下すると、複製元のアプリのアプリID,アプリ名、及び、アイコンが情報処理システム10に送信される。情報処理システム10はこれらを受信し、アプリ管理部49が複製元のアプリのアプリ処理情報53と画面情報54を使用して、新たにアプリを登録する。アプリ処理情報53のうち、アプリIDは重複しないものが採番され、アプリ名には管理者が入力したアプリ名が設定される。画面情報は複製元のアプリと同じであるが、このうちアイコンは管理者が選択したものである。アプリ処理情報、共有アプリ、及び、外部サービスシステム40の項目は複製元のアプリと同じである。例えばアプリ名等でユーザがアプリを識別可能な場合、すべてのアプリに対して別のアイコンが設定されている必要はない。
The
また、本実施形態ではアプリの複製に伴い、新たな画像処理領域の設定が追加されているが、アプリの複製でなく、設定の追加や、アイコンの追加という形で、新たな画像処理領域の追加と機器で選択を受け付ける識別情報を対応付ける設定を管理者が行ってもよい。 In addition, in the present embodiment, a new image processing area setting is added along with the duplication of the application. The administrator may make a setting that associates addition with identification information for accepting selection by the device.
図19は、情報処理システム10がアプリの複製を登録する手順を示すシーケンス図の一例である。
FIG. 19 is an example of a sequence diagram showing a procedure for the
S31:管理者が情報処理システム10の認証情報を端末装置30に入力する。端末装置30の操作受付部33は認証情報の入力を受け付け、第一通信部31が認証情報を情報処理システム10に送信することで、管理者が情報処理システム10にログインする。
S31: The administrator inputs the authentication information of the
S32:ログインにより情報処理システム10の端末画面提供部42が通信部19を介して初期画面の画面情報を端末装置30に送信する。その後、管理者の操作に応じて、端末画面提供部42は図18に示した画面の画面情報を端末装置30に送信する。
S<b>32 : Upon login, the terminal screen providing unit 42 of the
S33:管理者がアプリ名等を端末装置30に入力するので、操作受付部33が入力を受け付ける。
S33: Since the administrator inputs the application name and the like into the
S34:端末装置30の第一通信部31は複製元のアプリのアプリID,アプリ名、及び、アイコンを情報処理システム10に送信する。
S<b>34 : The
S35:情報処理システム10の通信部19はこれらを受信し、アプリ管理部49が複製元のアプリのアプリ処理情報53と画面情報54を使用して、新たにアプリを登録する。
S35: The
このように、管理者はアプリを複製することができる。管理者は複製により生成した新たなアプリに設定ファイルを対応付け、所望の帳票の所定の領域からデータを取得できる。 In this way, administrators can duplicate apps. The administrator associates a new application generated by duplication with a setting file, and can acquire data from a predetermined area of a desired form.
管理者は1つの複製元のアプリから複数の新しいアプリを作成でき、情報処理システム10は、複数の新しいアプリに対し、それぞれ別の設定ファイルの選択を受け付けることができる。同じ処理フローに対する何らかの識別情報が付与できれば良いため、アプリの複製は一例であってアイコンの追加、設定の追加という態様で同じ処理フローに識別情報が付与されてもよい。
The administrator can create a plurality of new applications from one copy source application, and the
<アプリと設定ファイルの対応付けを利用した帳票からのデータの取得>
アプリと設定ファイルの対応付けが完了した後は、ユーザが帳票を機器20に読み取らせることで、情報処理システム10が帳票からデータを取得できる。
<Acquiring data from a form using the correspondence between the application and the setting file>
After the application and the setting file are associated with each other, the
図20、図21を参照して、帳票からのデータの取得について説明する。図20は、機器20が表示する画面の遷移例を示す図である。
Acquisition of data from a form will be described with reference to FIGS. 20 and 21. FIG. FIG. 20 is a diagram showing a transition example of screens displayed by the
(1) 図20(a)に示すように、ユーザはアプリ一覧画面を機器20に表示させる。例えば、経費を精算したい場合、ユーザは経費精算書アプリのアイコンを選択する。どの帳票がどのアプリに対応しているかはユーザが把握しているが、アプリのアイコン690に表示されるアプリ名と帳票(原稿)の名称が一致しているとよい。このアプリ名はアイコン名や設定名と呼ばれてもよい。すなわち、アイコン690には帳票の名称が含まれるとよい。更に、アイコン690には、帳票のサムネイルが含まれるとよい。ユーザが帳票に対応していないアイコンを選択することを抑制しやすくなる。あるいは、ユーザがアイコン690を押下すると帳票のサムネイルが表示されてもよい。ユーザはサムネイルを拡大表示したり部分表示したりしてアイコン690を確認できる。
(1) As shown in FIG. 20(a), the user causes the
また、アイコン690にはリンクが埋め込まれていてもよい。リンクは、例えばアプリIDを含むURLか、又は、情報処理システム側でアプリIDと対応付けられているURLを有する。アイコン690の押下で、機器20はURLに接続することで、アプリIDを情報処理システムに通知する。
A link may also be embedded in the icon 690 . A link has, for example, a URL including an application ID, or a URL associated with the application ID on the information processing system side. By pressing the icon 690, the
またアイコン690が対応していない帳票をユーザが選択した場合、機器20がユーザに警告するとよい。例えば、機器20は読み取った帳票の画像データと、アイコン690に対応づけられている画像データを比較し、両者が異なる場合に、処理を継続するかどうかのメッセージなどを表示することでユーザに問い合わせる。画像データの比較は情報処理システム10が行ってもよい。なお、比較の方法としては、例えば、アイコン690に対応づけられている画像データで読み取った帳票の画像データを機器20又は情報処理システム10がパターンマッチングする方法がある。また、帳票にバーコードなどでアプリIDが印刷されている場合、このアプリIDとアイコン690に対応づけられているアプリIDを機器20又は情報処理システム10が比較する方法がある。
Also, if the user selects a form that the icon 690 does not correspond to, the
また、ユーザが選択するものがアイコンで、機器20が情報処理システム10に送信するのがアプリIDや設定番号等の文字列であってもよい。つまり選択される物自体はアプリID(識別情報)ではなくてもよい。
Alternatively, an icon may be selected by the user, and a character string such as an application ID or a setting number may be transmitted from the
(2) 経費精算書を機器20がスキャンする場合、ユーザは経費精算書を用意する(図20(b))。経費精算書はユーザが手書きで用意してもよいし、機器20がプリントアウトしてもよい。ユーザ自身がプリントアウトしたものではなくてもよい(公的に発行される書類や、他社から送られてくる書類等)。
(2) When the
(3) ユーザが選択したアプリが画面情報54に基づいて図20(c)の画面を表示する。図20(c)の画面は図9と同じである。ユーザはプリントアウトされた経費精算書をコンタクトガラスにセットし、スタートボタン613を押下することで機器20に読み取らせる。
(3) Based on the
帳票の画像データが情報処理システム10に送信され、次述するような処理によりファイルが出力される。
The image data of the form is transmitted to the
図21は外部サービスシステム40に保存されたファイルを説明する図である。図21(a)は外部サービスシステム40のアップロード先フォルダの一例を示す。すなわち、管理者が図14で設定したアップロード先フォルダに情報処理システム10が出力したファイルが保存される。図21(a)の「My Drive>経費精算書置き場」のファイル階層は一例であり、管理者はアクセス権があるフォルダを指定できる。
FIG. 21 is a diagram for explaining files saved in the
図21(b)はアップロード先フォルダに保存される2つのファイルを示す。1回の読み取り操作で2つのファイルが生成される。
A.帳票の領域から取得されたデータが保存されるCSVファイル681。
B.帳票の画像データを含むPDFファイル682。
FIG. 21(b) shows two files saved in the upload destination folder. A single read operation produces two files.
A. A
B. A
同じアプリが作成するCSVファイルは、1回の読み取り操作のたびに別々になる。ファイル名には申請日が含まれるので、ファイルが上書きされることはない。一方、同じアプリで取得されたデータは、読み取り操作のタイミングが異なっても、同一のCSVファイルに追加したい場合がある。この方法については後述する。こうすることで、庶務などの担当者は1つのCSVファイルにアクセスするだけで各社員のデータに対し精算等を行える。 CSV files created by the same app will be different for each read operation. The file name includes the application date, so the file cannot be overwritten. On the other hand, data acquired by the same application may be added to the same CSV file even if the timing of the read operation is different. This method will be described later. In this way, a person in charge of general affairs can settle accounts for each employee's data only by accessing one CSV file.
<<機器20が帳票をスキャンしない場合>>
図20の説明では、経費精算書を機器20がスキャンしていたが、情報処理システム10は帳票の画像データを端末装置30等から受信し、画像データの領域からデータを取得できる。この場合は、以下のようにして帳票の画像データを端末装置30が情報処理システム10に送信する。
<<When the
In the explanation of FIG. 20, the
・ ユーザが端末装置30で動作するワープロで経費精算書を表示させ、必要事項を入力する。したがって、必要事項は文字コードになっている。ユーザが端末装置30を情報処理システム10に接続して、ログインして、アプリ一覧を表示させる。端末装置30の画面は図20(a)の画面と同様になるので、ユーザが所望のアプリを選択する。情報処理システム10の端末画面提供部42は経費精算書を受付可能な画面情報を端末装置30に送信する。ユーザがこの画面で経費精算書の画像データが含まれるPDFファイル等を選択すると、端末装置30がPDFファイルを情報処理システム10に送信できる。
- The user displays the expense report on the word processor running on the
したがって、ユーザは帳票をプリントアウトしなくても情報処理システム10が帳票からデータを取得できる。この場合、後述する図22の処理における機器20の処理は端末装置30によって行われる。
Therefore, the
<動作手順>
図22は、情報処理システム10が機器20から帳票の画像データを含むPDFファイルを受信し、領域からデータを取得するシーケンス図の一例である。
<Operation procedure>
FIG. 22 is an example of a sequence diagram in which the
S41:帳票をプリントアウトしたユーザは機器20を操作して情報処理システム10における自分の認証情報を入力する。機器20の操作受付部23は認証情報の入力を受け付け、第二通信部21が認証情報を情報処理システム10に送信する。これにより、ユーザは情報処理システム10にログインする。ログインにより機器20の表示制御部22は、ユーザに利用権限が認められているアプリの一覧を表示する(図20(a))。ユーザは例えばプリントアウトした帳票の名称と一致するアプリ名のアプリを選択する。操作受付部23は選択を受け付ける。
S41: The user who has printed out the form operates the
S42:機器20の第二通信部21はアプリIDを指定してアプリ画面取得要求を情報処理システム10に送信する。
S42: The
S43:情報処理システム10の通信部19はアプリ画面取得要求を受信し、機器画面提供部47がアプリ管理部49からアプリIDで特定されるアプリの画面情報54を取得する。アプリのアプリ画面の画面情報が機器20に送信される。これにより、機器20の表示制御部22はアプリ画面を表示する(図20(c))。
S<b>43 : The
S44:ユーザはプリントアウトされた帳票をコンタクトガラスにセットし、スタートボタン613を押下する。機器20の操作受付部23は押下を受け付け、画像データ生成部24が帳票の画像データを生成し、この画像データをPDFファイルに変換する。
S 44 : The user sets the printed form on the contact glass and presses the
S45:機器20の第二通信部21はアプリのアプリIDとPDFファイルを指定して、アプリの実行を情報処理システム10に要求する。
S45: The
S46:情報処理システム10の通信部19はアプリの実行要求を受信し、アプリ実行部46がアプリの実行を開始する。アプリ実行部46はアプリIDを指定して入出力サービス部16にアプリの実行を要求する。入出力サービス部16はアプリ管理部49を介してアプリ処理情報53を取得する。これにより、アプリの処理フローが得られた。また、入出力処理部48はアプリデータ記憶部13からアプリIDに対応づけられたアプリデータ43を取得する。これにより、アプリに対応づけられている設定ファイルを特定できる。
S46: The
入出力処理部48はアプリデータ43とアプリ処理情報53に基づいて、設定ファイルの取得を外部サービス処理部62に要求する。
Based on the
S47:外部サービス処理部62はアプリデータ43に登録されているfileNameの項目のURLに接続し、設定ファイルを外部サービスシステム40から取得する。なお、外部サービス処理部62は、実行要求されたアプリが共有アプリでない場合はユーザの外部サービスシステム40における認証情報で外部サービスシステム40にログインし、実行要求されたアプリが共有アプリである場合は管理者の外部サービスシステム40における認証情報で外部サービスシステム40にログインする。
S47 : The external
S48:次に、入出力処理部48はアプリ処理情報53に基づいて、設定ファイルから領域情報を取得することをファイル出力部66に要求する。
S48: Next, based on the
S49:ファイル出力部66は設定ファイルの予め決まった行と列から全ての領域情報を取得し、入出力処理部48に返す。
S49: The
S50:次に、入出力処理部48はアプリ処理情報53に基づいて、画像データと領域情報を指定して、画像データからの領域の取得(切り取り)を領域特定部67に要求する。
S50: Next, based on the
S51:領域特定部67は画像データから領域情報で指定される領域を特定して取得し、領域の画像を入出力処理部48に返す。なお、領域特定部67は画像データから領域を取得(切り取り)しなくてもよい。この場合、OCR処理部68が領域情報で特定される画像データの領域にOCR処理を行えばよい。
S51 : The area specifying unit 67 specifies and acquires the area specified by the area information from the image data, and returns the image of the area to the input/
ステップS52~S55は領域の数だけ繰り返し実行される。 Steps S52 to S55 are repeated by the number of areas.
S52:入出力処理部48はアプリ処理情報53に基づいて、領域の画像を指定して、領域のOCR処理をOCR処理部68に要求する。この時、入出力処理部48は設定ファイルから取得したフォーマットとOCR言語を領域に対応づけて指定するとよい。
S52: Based on the
S53:OCR処理部68はフォーマットとOCR言語に対応した認識エンジンで領域にOCR処理を行う。OCR処理部68は文字コードに変換されたデータ(OCR処理結果)を入出力処理部48に返す。
S53: The OCR processing unit 68 performs OCR processing on the area with a recognition engine compatible with the format and OCR language. The OCR processing unit 68 returns the data converted into character code (OCR processing result) to the input/
なお、認識エンジンは、例えば文字の画像と文字コードがセットになった学習データを用いて両者の対応を学習し、画像からOCR処理結果(文字コード)を出力する識別機である。学習データが、日本語のみ、英語のみ、数値のみ、日付のみ、のように単純なほど、識別機の識別精度が向上する。一方、学習データに日本語、英語、数値及び日付の複数が混在すると、種々のデータの認識が可能になるが、識別精度が低下する傾向になる。したがって、フォーマットとOCR言語に対応した認識エンジンを使用することで認識精度を向上できる。 The recognition engine is, for example, a classifier that learns the correspondence between character images and character codes using learning data that is a set, and outputs OCR processing results (character codes) from the images. The simpler the training data, such as only Japanese, only English, only numbers, or only dates, the more the recognition accuracy of the classifier improves. On the other hand, if learning data includes a mixture of Japanese, English, numerical values, and dates, various data can be recognized, but the accuracy of identification tends to decrease. Therefore, recognition accuracy can be improved by using a recognition engine compatible with the format and OCR language.
ここで、機械学習とは、コンピュータに人のような学習能力を獲得させるための技術であり、コンピュータが,データ識別等の判断に必要なアルゴリズムを,事前に取り込まれる学習データから自律的に生成し,新たなデータについてこれを適用して予測を行う技術のことをいう。機械学習のための学習方法は、教師あり学習、教師なし学習、半教師学習、強化学習、深層学習のいずれかの方法でもよく、更に、これらの学習方法を組み合わせた学習方法でもよく、機械学習のための学習方法は問わない。また、認識エンジンは機械学習の学習効果によって生成されたものでなくてもよい。 Here, machine learning is a technology that allows a computer to acquire human-like learning ability, in which the computer autonomously generates algorithms necessary for judgments such as data identification from learning data taken in advance. It is a technology that makes predictions by applying this to new data. The learning method for machine learning may be supervised learning, unsupervised learning, semi-supervised learning, reinforcement learning, or deep learning, or may be a learning method combining these learning methods. Any learning method for Also, the recognition engine does not have to be generated by the learning effect of machine learning.
S54:次に、入出力処理部48はアプリ処理情報53に基づいて、領域から取得されたデータ、CSV列名、CSV位置、及び、ファイル名(設定ファイルから取得)を指定して、ファイル出力部66にデータを有するファイルの出力を要求する。
S54: Next, based on the
S55:ファイル出力部66は、CSV列名を列の先頭に書き込み、データをCSV位置で指定されるCSVファイルのセルに書き込み、OCR処理結果(CSVファイル)を入出力処理部48に返す。CSVファイルには指定されたファイル名が付与されている。なお、出力先のファイルの形式はCSVファイルに限らず、表形式のファイルであればよいし、テキストファイルでもよいし、その他のアプリケーションのファイルでもよい。
S55: The
S56:次に、入出力処理部48はアプリ処理情報53に基づいて、OCR処理結果(CSVファイル)、フォーマット及びOCR言語を指定して、OCR処理結果の補正をOCR補正部69に要求する。このフォーマットは表4に示された設定ファイルから取得されていて、管理者によって設定されたものである。
S56: Next, based on the
図23はOCR処理結果の補正を説明する図である。設定ファイルにフォーマットが設定されている場合、OCR補正部69はOCR処理結果を補正できる。OCR補正部69には指定文字列と変換文字のルールが図23に示すように定義されている。図23の変換ルール2201はフォーマットがNUMERICの場合のルールである。例えば、数値にはI,B、Zが含まれないので、それぞれ1,8,2に補正される。図23の変換ルール2202は言語がEnglishの場合のルールである。例えば、Englishには1,2、8が含まれないので、それぞれI,B,Zに補正される。
FIG. 23 is a diagram for explaining correction of OCR processing results. If the format is set in the setting file, the
S57:OCR補正部69は、補正したOCR処理結果(CSVファイル)を入出力処理部48に返す。
S57: The
ステップS58~S61はCSVファイルの数だけ実行される。1回の読み取り操作で作成されるCSVファイルの数は、帳票の数に関係なく1回の場合と、帳票のページ数と同じ場合がある。どちらが採用されるかは、アプリに設定されている。 Steps S58 to S61 are executed by the number of CSV files. Regardless of the number of forms, the number of CSV files created by one read operation may be one or equal to the number of pages of the form. Which one is adopted is set in the application.
S58:次に、入出力処理部48はアプリ処理情報53に基づいて、OCR処理結果(CSVファイル)のアップロードを外部サービス処理部62に要求する。アップロード先フォルダはアプリデータ43に設定されている。
S58: Next, based on the
S59:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにCSVファイルを保存する。
S59: The external
S60:メタデータの設定が可能な場合は、ステップS60が実行される。外部サービスシステム40がメタデータ(外部サービスシステム上でユーザが設定した項目で、文字列、日付など)の設定に対応している場合、アップロードするCSVファイルに紐付けるメタデータをユーザが設定できる。ユーザは機器20が表示する画面からメタデータを入力できる。入出力処理部48はメタデータのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはCSVファイルと同じである。
S60: If metadata can be set, step S60 is executed. If the
S61:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにメタデータを保存する。
S61: The external
S62:複数の帳票データが読み込まれた場合に、ユーザとしては個別のファイルに保存したい場合がある。この場合、入出力処理部48はアプリ処理情報53に基づいて、複数ページの画像データと共に、ページ分割をPDF処理部64に要求する。この処理は省略されてもよく、その場合、入出力処理部48は複数のデータを1つのファイルとして保存してよい。
S62: When multiple form data are read, the user may want to save them in individual files. In this case, based on the
S63:PDF処理部64は1ページずつに分解したPDFファイルを入出力処理部48に返す。
S63: The PDF processing unit 64 returns the PDF file decomposed page by page to the input/
S64:入出力処理部48はアプリ処理情報53に基づいて、PDFファイルを指定して、OCR処理をOCR処理部68に要求する。
S64: Based on the
S65:OCR処理部68はPDFファイルにOCR処理を行い、OCR処理で生成された文字コードをPDFファイルに透明テキストとして設定する。 S65: The OCR processing unit 68 performs OCR processing on the PDF file, and sets the character code generated by the OCR processing in the PDF file as transparent text.
ステップS66~S69はPDFファイルの数だけ実行される。 Steps S66 to S69 are executed by the number of PDF files.
S66:入出力処理部48はアプリ処理情報53に基づいて、テキスト付きPDFファイルのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはアプリデータ43に設定されている。
S66: Based on the
S67:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにテキスト付きPDFファイルを保存する。
S67: The external
S68:外部サービスシステム40が上記メタデータ(外部サービスシステム上でユーザが設定した項目で、文字列、日付など)に対応している場合、ユーザは機器20が表示する画面からメタデータを入力できる。入出力処理部48はメタデータのアップロードを外部サービス処理部62に要求する。アップロード先フォルダはPDFファイルと同じである。
S68: If the
S69:外部サービス処理部62は外部サービスシステム40のアップロード先フォルダにメタデータを保存する。
S69: The external
以上により、外部サービスシステム40のアップロード先フォルダに、CSVファイルとCSVファイルとは別のPDFファイルが登録された。
As described above, the CSV file and the PDF file different from the CSV file are registered in the upload destination folder of the
<外部サービスシステムに登録されたCSVファイルとPDFファイルの表示>
企業の担当者が社員の経費などを計算する場合、端末装置30を操作して外部サービスシステム40に接続させる。担当者にはアップロード先フォルダが通知されているので、端末装置30でCSVファイルとPDFファイルを取得できる。
<Display of CSV and PDF files registered in the external service system>
When a person in charge of a company calculates an employee's expenses, etc., the
図24は、端末装置30が表示する外部サービスシステム40のファイル一覧画面670の一例である。図24(a)に示すように、アップロード先フォルダにPDFファイル671とCSVファイル672が保存されている。図24(b)は端末装置30が表示させたCSVファイル672の内容を示す。すなわち、図24(b)は帳票から出力されたデータである。図24(b)では2つの領域から取得されたデータが保存されている。各列には設定ファイルに設定されているCSV列名も設定されており、ユーザは各列が何のデータかを判断できる。
FIG. 24 is an example of a
また、図25に示すように、機器20も処理結果を表示することが好ましい。図25は機器20が表示する出力データ表示画面691の一例である。出力データ表示画面691は、実行されたアプリ名692、及び、アプリが出力したファイルのリスト693を表示する。これらは情報処理システム10から機器20に送信される。CSVファイルにはCSVファイルの内容が含まれており、ユーザがCSVファイルを押下することで、帳票の領域から取得されCSVファイルに保存されたデータ694を機器20が表示することができる。
Moreover, as shown in FIG. 25, it is preferable that the
ファイル名やデータを確認したユーザは帳票が正しく処理されたかどうかを判断できる。 A user who has checked the file name and data can determine whether the form has been processed correctly.
なお、図22では処理の対象となる画像データをPDFファイルとしたが、JPEG、PNG、TIFF、BMP等、どのような形式の画像データでもよい。 Although the image data to be processed is a PDF file in FIG. 22, image data in any format such as JPEG, PNG, TIFF, and BMP may be used.
<複数の帳票が読み取られた場合>
図26を参照して複数の帳票が一度の読み取り操作で読み取られた場合を説明する。図26は、複数の帳票と、出力されたファイルを示す図である。図26(a)に示すように、アプリの実行時に複数の帳票が1回の読み取り操作で読み取られた。1回の読み取り操作とは、スタートボタン613が1回だけ押下された場合をいう。機器20は複数の帳票を順番に読み取り、情報処理システム10は各帳票の画像データの同じ領域から複数のデータを取得する。
<When multiple forms are read>
A case where a plurality of forms are read in one reading operation will be described with reference to FIG. FIG. 26 is a diagram showing a plurality of forms and output files. As shown in FIG. 26(a), multiple forms were read by one reading operation when the application was executed. One read operation means that the
図26(b)は複数の帳票が一度の読み取り操作で読み取られた場合のCSVファイルを示す図である。1行目が1枚目の帳票から取得されたデータであり、2行目が2枚目の帳票から取得されたデータである。このように、複数の帳票の複数のデータが1つのCSVファイルにまとめられるので、担当者は集計やグラフ化がしやすくなる。 FIG. 26(b) is a diagram showing a CSV file when a plurality of forms are read in one reading operation. The first line is the data obtained from the first form, and the second line is the data obtained from the second form. In this way, a plurality of data of a plurality of forms are collected in one CSV file, so that the person in charge can easily tabulate and graph.
なお、複数の帳票が一度の読み取り操作で読み取られた場合、ファイル出力部66は設定ファイルのCSV位置(開始行)を1つずつインクリメントする。つまり、帳票ごとに下の行にデータを書き込めばよい。
Note that when a plurality of forms are read in one reading operation, the
複数の帳票が一度の読み取り操作で読み取られた場合、情報処理システム10が帳票の数だけのCSVファイルを出力することも可能である。
When a plurality of forms are read in one reading operation, the
また、複数の帳票が複数回の読み取り操作で読み取られた場合(異なるタイミングで読み取られた場合)、情報処理システム10が1つの同じCSVファイルにデータを出力することも可能である。外部サービスシステム40がマージする場合と、情報処理システム10がマージする場合がある。
Also, when a plurality of forms are read by a plurality of reading operations (reading at different timings), the
・外部サービスシステム40がマージする場合、外部サービス処理部62はCSVファイルのマージを外部サービスシステム40に要求する。アプリが同じならCSVファイルのファイル名に同じ文字列(例えば経費精算書)が含まれるので、外部サービス処理部62はファイル名を指定してCSVファイルのマージを要求できる。外部サービスシステム40はすでに保存済みのCSVファイルの同じ列番号に、マージが要求されたCSVファイルの同じ列番号のデータを追加する。
- When the
・情報処理システムがマージする場合、外部サービス処理部62はファイル名を指定してCSVファイルを外部サービスシステム40からダウンロードする。外部サービス処理部62は取得したCSVファイルの同じ列番号に、新たに作成したCSVファイルの同じ列番号のデータを追加する。外部サービス処理部62はマージしたCSVファイルを外部サービスシステム40にアップロードする。
- When the information processing system merges, the external
このように、情報処理システムは受信した複数の画像データから同一の領域を取得し、OCR処理部68は、複数の画像データで同一の領域にOCR処理を行い、ファイル出力部66は、複数の画像データで同一の領域から生成された複数のデータを1つのファイルに出力することができる。
In this way, the information processing system acquires the same area from a plurality of received image data, the OCR processing unit 68 performs OCR processing on the same area with the plurality of image data, and the
<主な効果>
以上説明したように、本実施形態のデータ出力システムは、領域がマーキングされた帳票を機器20が読み取り、帳票ごとに領域情報を記憶する。そして、機器から送信された帳票の画像データから領域のみを取得してOCR処理を行い、OCR処理結果であるデータをファイルに出力する。これによって、同じ種類の複数の帳票において特定の領域のみを抜き出したファイルを簡単に作成することが可能になる。
<Main effects>
As described above, in the data output system of the present embodiment, the
<その他の適用例>
以上、本発明を実施するための最良の形態について実施例を用いて説明したが、本発明はこうした実施例に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
<Other application examples>
Although the best mode for carrying out the present invention has been described above using examples, the present invention is by no means limited to such examples, and various modifications can be made without departing from the scope of the present invention. and substitutions can be added.
例えば、本実施形態では、帳票の領域から取得されたデータをファイルに出力したが、ファイル化するのでなくメールで送信してもよいし、機器20に表示させてもよい。
For example, in the present embodiment, the data acquired from the area of the form is output to a file, but instead of being filed, the data may be sent by e-mail or displayed on the
また、本実施形態では指定された領域に対してOCR処理を行っているが、その他の画像処理(マスク処理や画像の抜出処理等)を行ってもよい。 Also, in the present embodiment, OCR processing is performed on the designated area, but other image processing (mask processing, image extraction processing, etc.) may be performed.
また、図5などの構成例は、端末装置30、機器20、及び情報処理システム10による処理の理解を容易にするために、主な機能に応じて分割したものである。処理単位の分割の仕方や名称によって本願発明が制限されることはない。端末装置30、機器20、及び情報処理システム10の処理は、処理内容に応じて更に多くの処理単位に分割することもできる。また、1つの処理単位が更に多くの処理を含むように分割することもできる。
Further, the configuration examples in FIG. 5 and the like are divided according to main functions in order to facilitate understanding of the processing by the
また、実施例に記載された装置群は、本明細書に開示された実施形態を実施するための複数のコンピューティング環境のうちの1つを示すものにすぎない。ある実施形態では、情報処理システム10は、サーバクラスタといった複数のコンピューティングデバイスを含む。複数のコンピューティングデバイスは、ネットワークや共有メモリなどを含む任意のタイプの通信リンクを介して互いに通信するように構成されており、本明細書に開示された処理を実施する。
Moreover, the devices described in the examples are only representative of one of several computing environments for implementing the embodiments disclosed herein. In some embodiments,
更に、情報処理システム10は、本実施形態で開示された処理ステップ、例えば図22等を様々な組み合わせで共有するように構成できる。例えば、所定のユニットによって実行されるプロセスは、情報処理システム10が有する複数の情報処理装置によって実行され得る。また、情報処理システム10は、1つのサーバ装置にまとめられていても良いし、複数の装置に分けられていても良い。
Further, the
上記で説明した実施形態の各機能は、一又は複数の処理回路によって実現することが可能である。ここで、本明細書における「処理回路」とは、電子回路により実装されるプロセッサのようにソフトウェアによって各機能を実行するようプログラミングされたプロセッサや、上記で説明した各機能を実行するよう設計されたASIC(Application Specific Integrated Circuit)、DSP(Digital Signal Processor)、FPGA(Field Programmable Gate Array)や従来の回路モジュール等のデバイスを含むものとする。 Each function of the embodiments described above may be implemented by one or more processing circuits. Here, the "processing circuit" in this specification means a processor programmed by software to perform each function, such as a processor implemented by an electronic circuit, or a processor designed to perform each function described above. Devices such as ASIC (Application Specific Integrated Circuit), DSP (Digital Signal Processor), FPGA (Field Programmable Gate Array) and conventional circuit modules are included.
10 情報処理システム
20 機器
30 端末装置
100 データ出力システム
10
Claims (20)
前記機器から画像データを受信する通信部と、
第一画像データから予め定められた情報が検出された領域を検出する領域検出部と、
前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力する第一出力部と、
前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報に基づいて第二画像データからOCR領域を特定する領域特定部と、
特定された前記OCR領域と前記第二画像データとに基づいて、前記OCR領域に対してOCR処理が行われたデータを出力する第二出力部と、
を有することを特徴とするデータ出力システム。 A data output system in which a device and an information processing system can communicate,
a communication unit that receives image data from the device;
an area detection unit that detects an area where predetermined information is detected from the first image data;
a first output unit for outputting to a setting file information about the area where the predetermined information detected by the area detection unit is detected;
an area identifying unit that identifies an OCR area from the second image data based on information about the area where the predetermined information contained in the setting file is detected;
a second output unit that outputs data obtained by performing OCR processing on the OCR area based on the specified OCR area and the second image data ;
A data output system characterized by comprising:
前記ファイルを外部サービスシステムに保存する外部サービス処理部を有することを特徴とする請求項1に記載のデータ出力システム。 the second output unit outputs a file containing the data;
2. The data output system according to claim 1, further comprising an external service processing unit for storing said file in an external service system.
前記領域特定部は、前記通信部が受信した複数の第二画像データから同一の前記OCR領域を特定し、
前記OCR処理部は、前記複数の第二画像データで同一の前記OCR領域にOCR処理を行い、
前記第二出力部は、前記複数の第二画像データで同一の前記OCR領域から生成された複数のデータを1つのファイルに出力することを特徴とする請求項2に記載のデータ出力システム。 an OCR processing unit that performs OCR processing only on the OCR area specified by the area specifying unit;
The area identifying unit identifies the same OCR area from a plurality of pieces of second image data received by the communication unit,
The OCR processing unit performs OCR processing on the same OCR area with the plurality of second image data,
3. The data output system according to claim 2, wherein the second output unit outputs a plurality of data generated from the same OCR area in the plurality of second image data to one file.
前記領域特定部は、前記通信部が異なるタイミングで受信した複数の第二画像データから同一の前記OCR領域を特定し、
前記OCR処理部は、前記複数の第二画像データで同一の前記OCR領域にOCR処理を行い、
前記第二出力部は、前記複数の第二画像データで同一の前記OCR領域から生成された複数のデータを同一のファイルに出力することを特徴とする請求項4に記載のデータ出力システム。 When the communication unit receives the second image data at different timings from the device,
wherein the area identifying unit identifies the same OCR area from a plurality of pieces of second image data received by the communication unit at different timings;
The OCR processing unit performs OCR processing on the same OCR area with the plurality of second image data,
5. The data output system according to claim 4, wherein the second output unit outputs a plurality of data generated from the same OCR area in the plurality of second image data to a same file.
前記OCR処理部は、前記データの種類に応じたOCR処理を前記OCR領域に行うことを特徴とする請求項7に記載のデータ出力システム。 The data type is set for each OCR area in the setting file,
8. The data output system according to claim 7, wherein said OCR processing section performs OCR processing on said OCR area according to the type of said data.
前記データの種類に応じて前記OCR処理部により得られた前記データを補正するOCR補正部を有することを特徴とする請求項7又は8に記載のデータ出力システム。 The data type is set for each OCR area in the setting file,
9. The data output system according to claim 7, further comprising an OCR correction section that corrects the data obtained by the OCR processing section according to the type of the data.
前記端末装置は、
前記機器が実行を要求するアプリケーションと、前記設定ファイルの選択を受け付ける操作受付部と、
前記操作受付部が受け付けた前記アプリケーションの識別情報と、前記設定ファイルの識別情報を前記情報処理システムに送信する第二の通信部と、を有し
前記情報処理システムは、
前記アプリケーションに前記設定ファイルを対応付け、
前記第二画像データと共に前記アプリケーションの実行が要求された場合、前記領域特定部は、該アプリケーションに対応づけられている前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報により前記第二画像データから前記OCR領域を特定することを特徴とする請求項7又は8に記載のデータ出力システム。 the data output system in communication with a terminal device;
The terminal device
an application requested to be executed by the device; an operation reception unit that receives selection of the configuration file;
a second communication unit configured to transmit the identification information of the application received by the operation receiving unit and the identification information of the setting file to the information processing system;
Associate the configuration file with the application;
When the execution of the application is requested together with the second image data, the area specifying unit determines the area where the predetermined information contained in the setting file associated with the application is detected. 9. The data output system according to claim 7, wherein the OCR area is specified from the second image data.
前記第二の通信部はファイル名に使用される前記データの指定を外部サービスシステムに送信し、
前記外部サービスシステムは、
前記ファイル名に使用される前記データの指定を前記設定ファイルに設定することを特徴とする請求項10に記載のデータ出力システム。 The operation accepting unit accepts designation of the data to be used for the file name of the file among the data output by the second output unit;
The second communication unit transmits the designation of the data used for the file name to the external service system,
The external service system is
11. The data output system according to claim 10, wherein designation of said data used for said file name is set in said setting file.
前記第二の通信部は複製元のアプリケーションの識別情報、及び、前記アプリ名を前記情報処理システムに送信し、
前記情報処理システムは、
前記複製元のアプリケーションを複製して前記アプリ名を付与した新しいアプリケーションを作成し、
前記操作受付部は、前記新しいアプリケーションと、前記設定ファイルの選択を受け付けることを特徴とする請求項10に記載のデータ出力システム。 The operation reception unit receives a selection of a copy source application and an application name of an application created by duplication,
The second communication unit transmits the identification information of the copy source application and the application name to the information processing system,
The information processing system is
creating a new application by duplicating the duplication source application and giving the application name;
11. The data output system according to claim 10, wherein said operation accepting unit accepts selection of said new application and said setting file.
前記領域検出部は該設定に基づいて前記予め定められた情報が検出された領域を検出し、
前記第二出力部は、前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力し、
前記領域特定部は、前記第二画像データから予め定められた情報が検出された領域に基づいて前記OCR領域を特定することを特徴とする請求項10に記載のデータ出力システム。 The operation receiving unit receives settings related to detection of an area in which the predetermined information is detected,
the area detection unit detects an area where the predetermined information is detected based on the setting;
The second output unit outputs information about the area where the predetermined information detected by the area detection unit is detected to a setting file,
11. The data output system according to claim 10, wherein the area identifying section identifies the OCR area based on an area where predetermined information is detected from the second image data.
前記機器から画像データを受信する通信部と、
第一画像データから予め定められた情報が検出された領域を検出する領域検出部と、
前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力する第一出力部と、
前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報に基づいて第二画像データからOCR領域を特定する領域特定部と、
特定された前記OCR領域と前記第二画像データとに基づいて、前記OCR領域に対してOCR処理が行われたデータを出力する第二出力部と、
を有することを特徴とする情報処理システム。 An information processing system capable of communicating with a device,
a communication unit that receives image data from the device;
an area detection unit that detects an area where predetermined information is detected from the first image data;
a first output unit for outputting to a setting file information about the area where the predetermined information detected by the area detection unit is detected;
an area identifying unit that identifies an OCR area from the second image data based on information about the area where the predetermined information contained in the setting file is detected;
a second output unit that outputs data obtained by performing OCR processing on the OCR area based on the specified OCR area and the second image data ;
An information processing system characterized by having:
通信部が、前記機器から画像データを受信するステップと、
領域検出部が、第一画像データから予め定められた情報が検出された領域を検出するステップと、
第一出力部が、前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力するステップと、
領域特定部が、前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報に基づいて第二画像データからOCR領域を特定するステップと、
第二出力部が、特定された前記OCR領域と前記第二画像データとに基づいて、前記OCR領域に対してOCR処理が行われたデータを出力するステップと、
を有することを特徴とするデータ出力方法。 A data output method performed by a data output system capable of communicating between a device and an information processing system,
a step in which a communication unit receives image data from the device;
an area detection unit detecting an area where predetermined information is detected from the first image data;
a step in which a first output unit outputs information about the area where the predetermined information detected by the area detection unit is detected to a setting file;
a step of an area identifying unit identifying an OCR area from the second image data based on information about the area where the predetermined information is detected, which is included in the setting file ;
a second output unit outputting data obtained by performing OCR processing on the OCR area based on the specified OCR area and the second image data ;
A data output method characterized by comprising:
前記機器から画像データを受信する通信部と、
第一画像データから予め定められた情報が検出された領域を検出する領域検出部と、
前記領域検出部が検出した前記予め定められた情報が検出された領域に関する情報を設定ファイルに出力する第一出力部と、
前記設定ファイルに含まれる前記予め定められた情報が検出された領域に関する情報に基づいて第二画像データからOCR領域を特定する領域特定部と、
特定された前記OCR領域と前記第二画像データとに基づいて、前記OCR領域に対してOCR処理が行われたデータを出力する第二出力部、
として機能させるためのプログラム。 An information processing system that can communicate with devices,
a communication unit that receives image data from the device;
an area detection unit that detects an area where predetermined information is detected from the first image data;
a first output unit for outputting to a setting file information about the area where the predetermined information detected by the area detection unit is detected;
an area identifying unit that identifies an OCR area from the second image data based on information about the area where the predetermined information contained in the setting file is detected;
a second output unit that outputs data obtained by performing OCR processing on the OCR area based on the specified OCR area and the second image data ;
A program to function as
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP21180461.2A EP3933678A1 (en) | 2020-06-30 | 2021-06-18 | Information processing system, data output system, image processing method, and carrier means |
US17/357,148 US11887391B2 (en) | 2020-06-30 | 2021-06-24 | Information processing system, data output system, image processing method, and recording medium |
CN202110735576.2A CN113870387A (en) | 2020-06-30 | 2021-06-30 | Data output system and method, image processing system and method |
JP2022128683A JP2022166166A (en) | 2020-06-30 | 2022-08-12 | Data output system, information processing system, data output method, and program |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020113443 | 2020-06-30 | ||
JP2020113443 | 2020-06-30 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022128683A Division JP2022166166A (en) | 2020-06-30 | 2022-08-12 | Data output system, information processing system, data output method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2022013603A JP2022013603A (en) | 2022-01-18 |
JP7124859B2 true JP7124859B2 (en) | 2022-08-24 |
Family
ID=80169697
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020217752A Active JP7124859B2 (en) | 2020-06-30 | 2020-12-25 | data output system, information processing system, data output method, program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7124859B2 (en) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202081A (en) | 2005-01-21 | 2006-08-03 | Seiko Epson Corp | Metadata creation apparatus |
JP2006209542A (en) | 2005-01-28 | 2006-08-10 | Canon Inc | Information processor and its control method |
JP2012049668A (en) | 2010-08-25 | 2012-03-08 | Murata Mach Ltd | Document reading apparatus, information processing apparatus, and program for information processing apparatus |
JP2017087572A (en) | 2015-11-10 | 2017-05-25 | 株式会社リコー | Duty-free sales document preparation system, duty-free sales document preparation apparatus, duty-free sales document preparation program, and duty-free sales document preparation method |
JP2018191032A (en) | 2017-04-28 | 2018-11-29 | キヤノンマーケティングジャパン株式会社 | Image formation apparatus, information processing apparatus, control method and program |
JP2019057307A (en) | 2018-11-15 | 2019-04-11 | 大日本印刷株式会社 | Document confirmation device, information processing system, document confirmation method, document confirmation program, character input device, character input method, and character input program |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH11167532A (en) * | 1997-12-02 | 1999-06-22 | Canon Inc | System, device, and method for data processing and recording medium |
-
2020
- 2020-12-25 JP JP2020217752A patent/JP7124859B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006202081A (en) | 2005-01-21 | 2006-08-03 | Seiko Epson Corp | Metadata creation apparatus |
JP2006209542A (en) | 2005-01-28 | 2006-08-10 | Canon Inc | Information processor and its control method |
JP2012049668A (en) | 2010-08-25 | 2012-03-08 | Murata Mach Ltd | Document reading apparatus, information processing apparatus, and program for information processing apparatus |
JP2017087572A (en) | 2015-11-10 | 2017-05-25 | 株式会社リコー | Duty-free sales document preparation system, duty-free sales document preparation apparatus, duty-free sales document preparation program, and duty-free sales document preparation method |
JP2018191032A (en) | 2017-04-28 | 2018-11-29 | キヤノンマーケティングジャパン株式会社 | Image formation apparatus, information processing apparatus, control method and program |
JP2019057307A (en) | 2018-11-15 | 2019-04-11 | 大日本印刷株式会社 | Document confirmation device, information processing system, document confirmation method, document confirmation program, character input device, character input method, and character input program |
Also Published As
Publication number | Publication date |
---|---|
JP2022013603A (en) | 2022-01-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7391672B2 (en) | Image processing system, control method and program for digitizing documents | |
US20200097162A1 (en) | Information processing system, service providing system, and flow setting method | |
JP2024103546A (en) | Information processing apparatus and control method for the same, and program | |
US11887391B2 (en) | Information processing system, data output system, image processing method, and recording medium | |
US11908215B2 (en) | Information processing apparatus, information processing method, and storage medium | |
US11620840B2 (en) | Image processing apparatus for extracting a desired character string from a scanned image | |
US11310372B2 (en) | Service providing system, information processing system, and information processing method for transmitting data to application with authority to store in external service system | |
US11503170B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP7494086B2 (en) | Information processing device, and control method and program thereof | |
US11800032B2 (en) | Apparatus, information processing method, and storage medium | |
US20240161451A1 (en) | Information processing system, processing method, and recording medium | |
JP7124859B2 (en) | data output system, information processing system, data output method, program | |
JP7476691B2 (en) | IMAGE PROCESSING SYSTEM, INFORMATION PROCESSING SYSTEM, IMAGE PROCESSING METHOD, AND PROGRAM | |
JP2022166166A (en) | Data output system, information processing system, data output method, and program | |
JP7388411B2 (en) | Information processing system, communication system, information processing method | |
JP2022140208A (en) | Data output system, information processing system, processing method, and program | |
US20240193975A1 (en) | Image processing apparatus, image processing method, and storage medium | |
US20240273067A1 (en) | Information processing apparatus, method for controlling information processing apparatus, and storage medium | |
US11533403B2 (en) | Process executing system, information processing system, information processing method, and recording medium for detecting duplicate image data from a same output material | |
JP5734400B2 (en) | Document processing apparatus and control method thereof, document management system, data processing method in the system, and computer program | |
JP7476572B2 (en) | Service providing system, information processing system, information processing method, and program | |
US20240064255A1 (en) | Information processing apparatus, control method of information processing apparatus, and storage medium | |
JP2024034740A (en) | Image processing apparatus, image processing system, image processing method, and program | |
JP2023114790A (en) | Information processing system, information setting method, program, and service providing system | |
JP2024034778A (en) | Image processing apparatus, image processing system, image processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210302 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210302 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220408 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220426 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220627 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220712 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220725 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7124859 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |