JP2006313994A - Device, method and program for acquiring information, and recording medium - Google Patents
Device, method and program for acquiring information, and recording medium Download PDFInfo
- Publication number
- JP2006313994A JP2006313994A JP2005135422A JP2005135422A JP2006313994A JP 2006313994 A JP2006313994 A JP 2006313994A JP 2005135422 A JP2005135422 A JP 2005135422A JP 2005135422 A JP2005135422 A JP 2005135422A JP 2006313994 A JP2006313994 A JP 2006313994A
- Authority
- JP
- Japan
- Prior art keywords
- information
- reliability
- information acquisition
- association
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
Abstract
Description
本発明は、情報取得装置、情報取得方法、情報取得プログラム及び記録媒体に関し、特に画像データに関連付けられている関連付け情報を前記画像データに基づいて取得する情報取得装置、情報取得方法、情報取得プログラム及び記録媒体に関する。 The present invention relates to an information acquisition device, an information acquisition method, an information acquisition program, and a recording medium, and in particular, an information acquisition device, an information acquisition method, and an information acquisition program for acquiring association information associated with image data based on the image data. And a recording medium.
電子透かし技術に代表されるように、従来より、文書画像に任意の情報を人間が容易に視認できない形で埋め込む技術の検討が行われている。例えば、特許文献1には、単語の前後の空白の長さの組み合わせを1つの符号単位とし、前後の長さの比率を署名データのビット値に応じて変化させることで、著作権を保護するための証明データを埋め込む方法が示されている。 As represented by the digital watermark technique, conventionally, a technique for embedding arbitrary information in a document image in a form that cannot be easily seen by humans has been studied. For example, in Patent Document 1, a combination of blank lengths before and after a word is used as one code unit, and the ratio of the lengths before and after is changed according to the bit value of signature data to protect copyright. A method for embedding proof data is shown.
また、特許文献2には、前後の文字間隔P及びSを用いて、P−SとP+Sとの比を量子化することで情報を埋め込む方法が示されている。 Patent Document 2 discloses a method of embedding information by quantizing the ratio between PS and P + S using the character spacings P and S before and after.
更に、特許文献3には、所定数の空白の大小関係のパターンによって情報を埋め込む方法が示されている。 Further, Patent Document 3 discloses a method of embedding information with a predetermined number of blank size patterns.
このように特許文献1、2及び3は、いずれも文字要素等の間隔(以下「文字間隔」という。)を用いて情報を埋め込み、抽出するものである。
しかしながら、文字間隔の長さを用いて情報を埋め込む場合、情報の埋め込まれた文書画像の印刷、及びその印刷物のスキャンといったアナログ処理過程において、文字要素が移動あるいは膨張することがある。その結果、文字要素同士が結合され、文字間隔の長さを正しく抽出できなくなるという問題がある。 However, when information is embedded using the length of the character spacing, the character element may move or expand in an analog processing process such as printing of a document image in which information is embedded and scanning of the printed matter. As a result, there is a problem that the character elements are connected to each other and the length of the character interval cannot be extracted correctly.
かかる問題は、画像の内容又は種別にかかわらず、画像データに対する情報の埋め込み及び抽出技術全般にいえる。 Such a problem can be said to general techniques for embedding and extracting information from image data regardless of the content or type of the image.
本発明は、上記の点に鑑みてなされたものであって、デジタルコンテンツに関連付けられている情報を適切に取得することのできる情報取得装置、情報取得方法、情報取得プログラム及び記録媒体の提供を目的とする。 The present invention has been made in view of the above points, and provides an information acquisition device, an information acquisition method, an information acquisition program, and a recording medium that can appropriately acquire information associated with digital content. Objective.
そこで上記課題を解決するため、本発明は、デジタルコンテンツに関する少なくとも二種類の被関連付け情報に対して関連付けられている関連付け情報を前記デジタルコンテンツに基づいて取得する情報取得装置であって、それぞれの前記被関連付け情報の相対的な第一の信頼度を算出又は判定する被関連付け情報信頼度判定手段と、前記デジタルコンテンツに基づいてそれぞれの前記被関連付け情報の内容を取得する情報取得手段と、取得されたそれぞれの前記被関連付け情報の内容に基づいて、前記被関連付け情報ごとに前記関連付け情報を推定する推定手段と、それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手段による前記被関連付け情報ごとの推定結果とに基づいて、前記関連付け情報を判定する関連付け情報判定手段とを有することを特徴とする。 Therefore, in order to solve the above-described problem, the present invention provides an information acquisition device that acquires association information associated with at least two types of associated information related to digital content based on the digital content, An associated information reliability determination unit that calculates or determines a relative first reliability of the associated information, an information acquisition unit that acquires contents of the associated information based on the digital content, and Based on the contents of the associated information, estimation means for estimating the association information for each of the associated information, the first reliability for the associated information, and the estimated information by the estimating means. Association information for determining the association information based on an estimation result for each association information And having a determining means.
また、上記課題を解決するため、本発明は、上記情報取得装置における情報取得方法、前記情報取得方法をコンピュータに実行させるための情報取得プログラム、又は前記情報取得プログラムを記録した記録媒体としてもよい。 In order to solve the above problem, the present invention may be an information acquisition method in the information acquisition apparatus, an information acquisition program for causing a computer to execute the information acquisition method, or a recording medium on which the information acquisition program is recorded. .
本発明によれば、デジタルコンテンツに関連付けられている情報を適切に取得することのできる情報取得装置、情報取得方法、情報取得プログラム及び記録媒体を提供することができる。 According to the present invention, it is possible to provide an information acquisition device, an information acquisition method, an information acquisition program, and a recording medium that can appropriately acquire information associated with digital content.
以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における画像処理装置の概略構成例を示す図である。図1において、画像処理装置10は、画像データに対して情報を関連付ける機能及び情報が関連付けられた画像データよりその情報を取得する機能を有する装置であり、情報関連付け部11、印刷部12、スキャン部13、及び関連付け情報取得部14等より構成されている。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating a schematic configuration example of an image processing apparatus according to an embodiment of the present invention. In FIG. 1, an image processing apparatus 10 is an apparatus having a function of associating information with image data and a function of acquiring the information from image data associated with the information. The information association unit 11, the printing unit 12, the scan Unit 13, an association information acquisition unit 14, and the like.
情報関連付け部11は、「画像データに関する情報」に情報を関連付ける。情報関連付け部11によって「画像データに関する情報」に関連付けられた情報を、以下「関連付け情報」という。関連付け情報は、例えば文字列、数字、ビット列等、様々なものが対象とされる。 The information association unit 11 associates information with “information regarding image data”. Information associated with “information related to image data” by the information association unit 11 is hereinafter referred to as “association information”. Various pieces of association information, such as character strings, numbers, and bit strings, are targeted.
「画像データに関する情報」とは、例えば、当該画像データの画素値やDCT(Discrete Cosine Transform )係数等の特徴量や、画像(絵)の内容、又は画像データそのものが相当する。特徴量への関連付け情報の関連付けは、例えば、その特徴量を所定の規則にしたがって操作(例えば、量子化)することにより行われる。また、画像(絵)の内容への関連付け情報の関連付けは、例えば、その画像の内容を操作(例えば、量子化)することにより行われる。より具体的には、画像に文字列が含まれている場合、その文字列を構成する文字と文字との間の距離を所定の規則に従って量子化することにより関連付け情報が関連付けられる。また、関連付け情報を表現するバーコードや二次元コード等を画像に合成することにより関連付け情報が関連付けられる。画像データそのものへの関連付け情報の関連付けは、例えば、画像データを含むファイルと関連付け情報を含むファイルとを関連付けて保存することにより行われる。 The “information about image data” corresponds to, for example, feature values such as pixel values and DCT (Discrete Cosine Transform) coefficients of the image data, image (picture) contents, or image data itself. The association of the association information with the feature amount is performed by, for example, operating (for example, quantizing) the feature amount according to a predetermined rule. Further, the association information is associated with the content of the image (picture) by, for example, operating (for example, quantizing) the content of the image. More specifically, when a character string is included in the image, the association information is associated by quantizing the distance between the characters constituting the character string according to a predetermined rule. Further, the association information is associated by synthesizing a barcode, a two-dimensional code, or the like representing the association information with the image. The association information is associated with the image data itself, for example, by associating and storing a file containing the image data and a file containing the association information.
以下、関連付け情報の関連付けの対象とされる「画像データに関する情報」を、「被関連付け情報」という。なお、情報関連付け部11は、一つの画像データについて、少なくとも二種類の被関連付け情報に対して関連付け情報を関連付ける。すなわち、それぞれの被関連付け情報に対して全く同一の関連付け情報が関連付けられる場合は、一つの画像データに対して一つの関連付け情報が多重に関連付けられることになる。 Hereinafter, “information relating to image data” that is a target of association information is referred to as “associated information”. The information association unit 11 associates association information with at least two types of associated information for one image data. That is, when exactly the same association information is associated with each associated information, one association information is associated with one image data in a multiple manner.
なお、以下において「画像データに関連付け情報を関連付ける」又は「関連付け情報を画像データに関連付ける」という場合は、「当該画像データの被関連付け情報に関連付け情報を関連付ける」ことを意味する。 In the following description, “associating association information with image data” or “associating association information with image data” means “associating association information with associated information of the image data”.
印刷部12は、画像処理装置10に接続されているプリンタ20のドライバソフトに相当し、関連付け情報が関連付けられた画像データを紙文書としてプリンタ20に印刷させる。 The printing unit 12 corresponds to driver software for the printer 20 connected to the image processing apparatus 10 and causes the printer 20 to print the image data associated with the association information as a paper document.
スキャン部13は、画像処理装置10に接続されているスキャナ30のドライバソフトに相当し、関連付け情報が関連付けられた画像データが印刷された紙文書をスキャンをスキャナ30に実行させ、スキャナ30によって読み取られた情報を画像データとして出力する。 The scanning unit 13 corresponds to driver software for the scanner 30 connected to the image processing apparatus 10, and causes the scanner 30 to scan a paper document on which image data associated with association information is printed. The obtained information is output as image data.
関連付け情報取得部14は、スキャナ部13により出力された画像データに基づいて当該画像データに関する少なくとも二種類の被関連付け情報より関連付け情報を取得し、取得された関連付け情報を出力する。 The association information acquisition unit 14 acquires association information from at least two types of associated information related to the image data based on the image data output by the scanner unit 13, and outputs the acquired association information.
情報関連付け部11及び関連付け情報取得部14について更に詳しく説明する。 The information association unit 11 and the association information acquisition unit 14 will be described in more detail.
図2は、情報関連付け部の機能構成例を示す図である。図2において、情報関連付け部11は、関連付け情報入力部111、第一関連付け部112、及び第二関連付け部113等より構成される。関連付け情報入力部111は、例えば、関連付け情報をユーザに入力させたり、又は所定のファイルより読み込んだりしたりすることにより、これから画像データに関連付けられる関連付け情報を取得する。 FIG. 2 is a diagram illustrating a functional configuration example of the information association unit. In FIG. 2, the information association unit 11 includes an association information input unit 111, a first association unit 112, a second association unit 113, and the like. The association information input unit 111 acquires association information associated with image data from now on, for example, by allowing the user to input association information or reading it from a predetermined file.
第一関連付け部112及び第二関連付け部113は、一つの画像データに対してそれぞれ異なる被関連付け情報を対象として関連付け情報を関連付ける。第一関連付け部112が対象とする被関連付け情報を以下「第一被関連付け情報」といい、第二関連付け部113が対象とする被関連付け情報を以下「第二被関連付け情報」という。 The first associating unit 112 and the second associating unit 113 associate association information with different pieces of associated information for one image data. The associated information targeted by the first association unit 112 is hereinafter referred to as “first associated information”, and the associated information targeted by the second association unit 113 is hereinafter referred to as “second associated information”.
図3は、関連付け情報取得部の機能構成例を示す図である。図3において、関連付け情報取得部14は、被関連付け情報信頼度判定部141、第一推定部142、第二推定部143、及び関連付け情報判定部144等より構成されている。 FIG. 3 is a diagram illustrating a functional configuration example of the association information acquisition unit. In FIG. 3, the association information acquisition unit 14 includes an associated information reliability determination unit 141, a first estimation unit 142, a second estimation unit 143, an association information determination unit 144, and the like.
第一推定部142及び第二推定部143は、それぞれ第一被関連付け情報又は第二被関連付け情報に基づいて関連付け情報を推定する機能を有する部分である。ここで、「推定する」というのは、第一推定部142及び第二推定部143によって導出された情報は、関連付け情報として確定されないことを意味する。すなわち、情報関連付け部11によって関連付け情報が関連付けられた画像データの画像は、プリンタ20による印刷やスキャナ30によるスキャン等の処理を経ることにより、一般的にその内容が変化する。画像の内容の変化は、被関連付け情報にも影響する。したがって、関連付け情報取得部14によって関連付け情報を取得しようとする際の被関連付け情報の内容(例えば、画素値やDCT係数等)は、情報関連付け部11によって関連付け情報が関連付けられた際の被関連付け情報の内容と必ずしも一致せず、誤差を含んでいる可能性が高い。かかる誤差を含んでいる被関連付け情報に基づいて取得又は算出された関連付け情報は必ずしも正しい値であるとは限らない。そこで、第一推定部142及び第二推定部143では、とりあえず、誤差を含んでいるかもしれない値を関連付け情報として推定するというわけである。 The 1st estimation part 142 and the 2nd estimation part 143 are parts which have a function which estimates correlation information based on 1st correlated information or 2nd correlated information, respectively. Here, “estimate” means that the information derived by the first estimation unit 142 and the second estimation unit 143 is not determined as association information. That is, the content of the image data associated with the association information by the information association unit 11 generally changes as a result of processing such as printing by the printer 20 or scanning by the scanner 30. Changes in the contents of the image also affect the associated information. Therefore, the contents (for example, pixel values, DCT coefficients, etc.) of the associated information when trying to acquire the association information by the association information acquisition unit 14 are related information when the association information is associated by the information association unit 11. It is not necessarily consistent with the contents of, and there is a high possibility that it contains errors. The association information acquired or calculated based on the associated information including such an error is not necessarily a correct value. Therefore, the first estimation unit 142 and the second estimation unit 143 estimate a value that may contain an error as association information for the time being.
第一推定部142は、第一情報取得部142a及び第一取得情報信頼度判定部142bとから構成される。第一情報取得部142aは、第一被関連付け情報に基づいて関連付け情報を取得する。第一取得情報信頼度判定部142bは、第一情報取得部142aによって取得された関連付け情報の信頼度を判定又は算出する。ここで、第一情報取得部142aによって取得された関連付け情報の信頼度とは、当該関連付け情報が、実際に関連付けられた関連付け情報と同じである可能性の高さ、又は確からしさを示す指標である。第一取得情報信頼度判定部142bは、第一情報取得部142aによって取得された被関連付け情報の内容と、関連付け情報が関連付けられることにより当該被関連付け情報が取り得る内容との差分に基づいて当該信頼度を判定又は算出する。 The first estimation unit 142 includes a first information acquisition unit 142a and a first acquisition information reliability determination unit 142b. The first information acquisition unit 142a acquires association information based on the first associated information. The first acquired information reliability determination unit 142b determines or calculates the reliability of the association information acquired by the first information acquisition unit 142a. Here, the reliability of the association information acquired by the first information acquisition unit 142a is an index that indicates the likelihood or probability that the association information is the same as the association information that is actually associated. is there. The first acquired information reliability determination unit 142b is based on the difference between the contents of the associated information acquired by the first information acquiring unit 142a and the contents that the associated information can take by associating the association information. Determine or calculate confidence.
第二推定部143は、第二情報取得部143a及び第二取得情報信頼度判定部143bとから構成されるが、これらは、第一推定部142における第一情報取得部142a及び第一取得情報信頼度判定部142bに相当する。 The second estimation unit 143 includes a second information acquisition unit 143a and a second acquisition information reliability determination unit 143b. These include the first information acquisition unit 142a and the first acquisition information in the first estimation unit 142. This corresponds to the reliability determination unit 142b.
被関連付け情報信頼度判定部141は、第一被関連付け情報及び第二被関連付け情報それぞれに対する相対的な信頼度を算出又は判定する。第一被関連付け情報及び第二被関連付け情報それぞれに対する相対的な信頼度とは、第一推定部142及び第二推定部143によって推定された関連付け情報に基づいて最終的に関連付け情報を判定する際に用いられる、それぞれの推定結果に対する重み付けをいう。すなわち、第一推定部142及び第二推定部143による二つの推定結果のいずれをより信頼するか、又は同程度信頼するのかを示す指標である。 The associated information reliability determination unit 141 calculates or determines a relative reliability for each of the first associated information and the second associated information. The relative reliability with respect to each of the first associated information and the second associated information is when the association information is finally determined based on the association information estimated by the first estimation unit 142 and the second estimation unit 143. The weighting for each estimation result used in. That is, it is an index indicating which of the two estimation results by the first estimation unit 142 and the second estimation unit 143 is to be trusted more or to the same extent.
関連付け情報判定部144は、被関連付け情報信頼度判定部141によって算出又は判定された第一被関連付け情報及び第二被関連付け情報それぞれに対する相対的な信頼度と、第一推定部142及び第二推定部143によるそれぞれの推定結果とに基づいて、関連付け情報を判定する。すなわち、関連付け情報判定部144は、最終的に関連付け情報はこうであったと結論付ける。 The association information determination unit 144 includes a relative reliability for each of the first associated information and the second associated information calculated or determined by the associated information reliability determination unit 141, the first estimation unit 142, and the second estimation. The association information is determined based on each estimation result by the unit 143. That is, the association information determination unit 144 finally concludes that the association information was like this.
図4は、本発明の実施の形態における画像処理装置のハードウェア構成例を示す図である。図4の画像処理装置10は、それぞれバスBで相互に接続されているドライブ装置100と、補助記憶装置102と、メモリ装置103と、演算処理装置104と、表示装置105と、入力装置106と等を有するように構成される。 FIG. 4 is a diagram illustrating a hardware configuration example of the image processing apparatus according to the embodiment of the present invention. 4 includes a drive device 100, an auxiliary storage device 102, a memory device 103, an arithmetic processing device 104, a display device 105, and an input device 106, which are mutually connected by a bus B. And so on.
画像処理装置10での処理を実現するプログラムは、CD―ROM等の記録媒体101によって提供される。プログラムを記録した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。補助記憶装置102は、インストールされたプログラムを格納すると共に、処理対象とする画像データ等を格納する。 A program for realizing processing in the image processing apparatus 10 is provided by a recording medium 101 such as a CD-ROM. When the recording medium 101 on which the program is recorded is set in the drive device 100, the program is installed from the recording medium 101 to the auxiliary storage device 102 via the drive device 100. The auxiliary storage device 102 stores the installed program and image data to be processed.
メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。演算処理装置104は、メモリ装置103に格納されたプログラムに従って画像処理装置10に係る機能を実行する。表示装置105はプログラムによるGUI(Graphical User Interface)等を表示する。入力装置106はキーボード及びマウス等で構成され、様々な操作指示を入力するために用いられる。 The memory device 103 reads the program from the auxiliary storage device 102 and stores it when there is an instruction to start the program. The arithmetic processing device 104 executes functions related to the image processing device 10 in accordance with a program stored in the memory device 103. The display device 105 displays a GUI (Graphical User Interface) or the like by a program. The input device 106 includes a keyboard and a mouse, and is used to input various operation instructions.
画像処理装置10をネットワークに接続することにより、他の端末からリモートで操作を行ってもよい。この場合、ドライブ装置100、表示装置105及び入力装置106等は、当該他の端末が有していればよく、画像処理装置10が必ずしも備えている必要はない。 The image processing apparatus 10 may be remotely operated from another terminal by connecting to the network. In this case, the drive device 100, the display device 105, the input device 106, and the like need only be included in the other terminals, and the image processing apparatus 10 does not necessarily have to include.
なお、画像処理装置10は、PC(Personal Computer)等の汎用的なコンピュータを用いて実現してもよい。また、プリンタ機能やスキャナ機能等、複数の機能を一台の筐体によって実現する複合機又は融合機と呼ばれる画像処理装置によって実現してもよい。複合機によって画像処理装置10を実現する場合、図1におけるプリンタ20やスキャナ30は画像処理装置10に内蔵されることになる。 The image processing apparatus 10 may be realized using a general-purpose computer such as a PC (Personal Computer). Further, it may be realized by an image processing apparatus called a multi-function machine or a multi-function machine that realizes a plurality of functions such as a printer function and a scanner function by a single casing. When the image processing apparatus 10 is realized by a multifunction machine, the printer 20 and the scanner 30 in FIG. 1 are built in the image processing apparatus 10.
以下、第一〜第三の実施の形態に分けて、画像処理装置10の処理を具体的に説明する。第一の実施の形態では、自然画像に対して輝度及び色差を操作することで二重に関連付け情報を関連付け、その画像から関連付け情報を取得する例について説明する。すなわち、第一の実施の形態では、輝度が第一被関連付け情報に相当し、色差が第二被関連付け情報に相当する。 Hereinafter, the processing of the image processing apparatus 10 will be specifically described by dividing it into first to third embodiments. In the first embodiment, an example will be described in which association information is associated with a natural image by manipulating luminance and color difference, and the association information is acquired from the image. That is, in the first embodiment, the luminance corresponds to the first associated information, and the color difference corresponds to the second associated information.
まず、自然画像に輝度及び色差を操作することで二重に関連付け情報を関連付ける処理について説明する。図5は、第一の実施の形態における情報関連付け処理を説明するためのフローチャートである。 First, a process for associating association information with a natural image by manipulating luminance and color difference will be described. FIG. 5 is a flowchart for explaining the information association processing in the first embodiment.
ステップS101において、情報関連付け部11は、関連付け情報の関連付けの対象とされる画像データ(以下「対象画像」という。)をメモリ上に読み込む。続いて、関連付け情報入力部111は、関連付け情報をユーザに入力させる(S102)。関連付け情報は、例えば、テキスト入力領域を有したダイアログ等を表示させることにより入力させてもよい。また、予め、ファイル等に保存されている情報を関連付け情報としてもよく、この場合、ステップS102では、当該ファイル等より関連付け情報が読み込まれる。なお、関連付け情報は、2進数によるビット列を入力させてもよいが、例えば、文字列等、人間に理解可能な形式によって入力させてもよい。 In step S <b> 101, the information association unit 11 reads image data (hereinafter referred to as “target image”) to be associated with the association information into the memory. Subsequently, the association information input unit 111 causes the user to input association information (S102). The association information may be input by, for example, displaying a dialog having a text input area. Information stored in a file or the like in advance may be used as the association information. In this case, in step S102, the association information is read from the file or the like. The association information may be input as a binary bit string, but may be input in a human-readable format such as a character string.
続いて、情報関連付け部11は、対象画像をYCbCr変換する(S103)。続いて、第一関連付け部112は、対象画像のY(輝度)成分に関連付け情報を関連付ける(S104)。具体的には、関連付け情報をビット列に変換し、各画素に1ビットずつ割り当てる。割り当ての順番は例えばラスタ走査を用いて定めればよい。例えば、ビット値「0」が割り当てられた画素では、Y成分の画素値を所定の定数uの偶数倍で元の値に最も近い値量子化する。また、ビット値「1」が割り当てられた画素ではY信を定数u数の奇数倍で元の値に最も近い値に量子化する。 Subsequently, the information association unit 11 performs YCbCr conversion on the target image (S103). Subsequently, the first association unit 112 associates association information with the Y (luminance) component of the target image (S104). Specifically, the association information is converted into a bit string, and one bit is assigned to each pixel. The order of assignment may be determined using raster scanning, for example. For example, in a pixel to which a bit value “0” is assigned, the pixel value of the Y component is quantized closest to the original value by an even multiple of a predetermined constant u. Further, in a pixel to which the bit value “1” is assigned, the Y signal is quantized to a value closest to the original value by an odd multiple of the constant u number.
図6は、Y成分の画素値に関連付け情報を関連付ける様子を概念的に示す図である。図6では、対象画像501に関連付け情報601(「010010110」のビット列)が関連付けられて対象画像502が生成される様子が示されている。対象画像501及び対象画像502における各数値は、それぞれのY成分の画素値を示す。また、図6においては定数uの値を10としている。 FIG. 6 is a diagram conceptually illustrating a state in which the association information is associated with the pixel value of the Y component. FIG. 6 shows a state in which the target image 502 is generated by associating the target image 501 with the association information 601 (the bit string “010010110”). Each numerical value in the target image 501 and the target image 502 indicates a pixel value of each Y component. In FIG. 6, the value of the constant u is 10.
例えば、対象画像501の各画素について左から右、かつ上から下の順でビット値を割り当てるとすると画素値243、245、248には、それぞれ「0」、「1」、「0」が割り当てられる。したがって、「0」が割り当てられた243および248は、10の偶数倍で元の値に最も近い値である240に量子化される。「1」が割り当てられた245は、10の奇数倍で元の値に最も近い値「250」に量子化される。他の画素についても同様の処理がなされる。 For example, if bit values are assigned to each pixel of the target image 501 in order from left to right and from top to bottom, “0”, “1”, and “0” are assigned to the pixel values 243, 245, and 248, respectively. It is done. Therefore, 243 and 248 assigned “0” are quantized to 240 which is an even multiple of 10 and is closest to the original value. 245 assigned “1” is quantized to a value “250” that is an odd multiple of 10 and is closest to the original value. Similar processing is performed for other pixels.
続いて、第二関連付け部113は、対象画像のCb(色差)成分に関連付け情報を関連付ける(S105)。この処理はY成分の画素値に関連付ける場合と同様に、画素ごとに関連付け情報のビット値を割り当て、割り当てられたビット値に応じて各画素値を所定の定数の奇数又は偶数倍に量子化すればよい。 Subsequently, the second associating unit 113 associates the association information with the Cb (color difference) component of the target image (S105). In this process, as in the case of associating with the pixel value of the Y component, the bit value of the association information is assigned to each pixel, and each pixel value is quantized to an odd number or an even multiple of a predetermined constant according to the assigned bit value. That's fine.
以上で、情報関連付け処理は終了し、関連付け情報が関連付けられた画像データは、印刷部12によってプリンタ20より紙文書として出力される。 Thus, the information association process is completed, and the image data associated with the association information is output from the printer 20 as a paper document by the printing unit 12.
続いて、上記の情報関連付け処理を経て印刷された紙文書をスキャナ30で読み取ることによって取り込まれた画像データより関連付け情報を取得する処理について説明する。図7は、第一の実施の形態における関連付け情報取得処理を説明するためのフローチャートである。 Next, a process for acquiring association information from image data captured by reading a paper document printed through the above information association process with the scanner 30 will be described. FIG. 7 is a flowchart for explaining the association information acquisition process in the first embodiment.
ステップS151において、関連付け情報取得部14は、スキャナ30によって読み取られた画像データ(以下「対象画像」という。)をメモリ上に読み込む。続いて、被関連付け情報信頼度判定部141は、対象画像がカラー画像であるかモノクロ画像であるかを判定し(S152)、その判定結果に応じて第一被関連付け情報(Y成分)及び第二被関連付け情報(Cb成分)に対する相対的な信頼度を判定する(S153)。すなわち、対象画像がモノクロ画像と判定された場合、被関連付け情報信頼度判定部141は、Y成分の画素値に対する信頼度を1.0とし、Cb成分の画素値に対する信頼度を0.0とする。モノクロ画像の場合、色差成分は含まれていないからである。一方、対象画像がカラー画像であると判定された場合、被関連付け情報信頼度判定部141は、Y成分の画素値及びCb成分の画素値に対する信頼度をそれぞれ0.5とする。すなわち、カラー画像は輝度成分と色差成分を有するため、双方の値を同じだけ信頼するということである。 In step S151, the association information acquisition unit 14 reads the image data read by the scanner 30 (hereinafter referred to as “target image”) onto the memory. Subsequently, the associated information reliability determination unit 141 determines whether the target image is a color image or a monochrome image (S152), and the first associated information (Y component) and the first image are determined according to the determination result. The relative reliability with respect to the second related information (Cb component) is determined (S153). That is, when the target image is determined to be a monochrome image, the associated information reliability determination unit 141 sets the reliability for the pixel value of the Y component to 1.0, and sets the reliability for the pixel value of the Cb component to 0.0. To do. This is because a monochrome image does not include a color difference component. On the other hand, when it is determined that the target image is a color image, the associated information reliability determination unit 141 sets the reliability of the pixel value of the Y component and the pixel value of the Cb component to 0.5. That is, since a color image has a luminance component and a color difference component, both values are trusted by the same amount.
以下、Y成分の画素値に対する信頼度をRyとし、Cb成分の画素値に対する信頼度をRcbと表記する。 Hereinafter, the reliability for the pixel value of the Y component is denoted by Ry, and the reliability for the pixel value of the Cb component is denoted by Rcb.
続いて、第一情報取得部142aは、対象画像の各画素におけるY成分の画素値を取得する(S154)。続いて、第一取得情報信頼度算出部142bは、各画素のY成分の画素値から、各画素に割り当てられたビット値が「0」である信頼度(可能性の高さ)を算出することにより関連付け情報を推定する(S155)。 Subsequently, the first information acquisition unit 142a acquires the pixel value of the Y component in each pixel of the target image (S154). Subsequently, the first acquired information reliability calculation unit 142b calculates the reliability (high possibility) that the bit value assigned to each pixel is “0” from the pixel value of the Y component of each pixel. Thus, the association information is estimated (S155).
具体的には各画素のY成分の画素値を関連付け時に使用された定数uの二倍で除算し、その商とその商に最も近い整数値との差分から信頼度を算出する。定数uの二倍で除するのは、ビット値「0」の関連付けの際に画素値は定数uの偶数倍に量子化されるからである。すなわち、画素値を定数uの二倍で除した際の商とその商に最も近い整数値との差分は、当該画素値に「0」が関連付けられているほど小さいものであると期待できる。したがって、この差分が小さいほど当該画素値に関連付けられたビット値が「0」である信頼度は高いといえる。 Specifically, the pixel value of the Y component of each pixel is divided by twice the constant u used at the time of association, and the reliability is calculated from the difference between the quotient and the integer value closest to the quotient. The reason for dividing by twice the constant u is that the pixel value is quantized to an even multiple of the constant u when the bit value “0” is associated. That is, the difference between the quotient when the pixel value is divided by twice the constant u and the integer value closest to the quotient can be expected to be smaller as “0” is associated with the pixel value. Therefore, it can be said that the smaller the difference, the higher the reliability that the bit value associated with the pixel value is “0”.
例えば、図6の対象画像502の一行目の画素値が、印刷及びスキャンを経ることにより変化し、ステップS154では、242、251、238という値として取得されたものとする。ここで、「0」が割り当てられた画像の画素値である242を定数uの2倍(10×2=20)で除した商(12.1)とその商に最も近い整数値(12)との差分は0.1である。一方、「1」が割り当てられた画素の画素値である251を定数uの2倍(20)で除した商(12.55)とその商に最も近い整数値(13)との差分は0.45である。 For example, it is assumed that the pixel value in the first row of the target image 502 in FIG. 6 changes as a result of printing and scanning, and is acquired as values 242, 251, and 238 in step S 154. Here, a quotient (12.1) obtained by dividing 242 which is a pixel value of an image to which “0” is assigned by twice a constant u (10 × 2 = 20) and an integer value (12) closest to the quotient Is 0.1. On the other hand, the difference between the quotient (12.55) obtained by dividing 251 which is the pixel value of the pixel assigned “1” by twice the constant u (20) and the integer value (13) closest to the quotient is 0. .45.
なお、単純に当該差分のみで信頼度を判定するのではなく、数学的な信頼度の算出モデルを用いることにより信頼度を算出することが望ましい。信頼度の算出モデルは様々なものが考えられるが、例えばガウス分布のモデルに基づき、以下のような信頼度モデル(関数)を用いることができる。 Note that it is desirable to calculate the reliability by using a mathematical reliability calculation model, instead of simply determining the reliability based only on the difference. There are various reliability calculation models. For example, the following reliability model (function) can be used based on a Gaussian model.
u:量子化の際の定数値
μ:引数xの平均値
σ:引数xの標準偏差
信頼度関数(1)の引数xに、前記差分にuを乗じた値を与えることで信頼度を算出することができる。ここで算出されたi番目の画素のビット値が「0」である信頼度をRy0(i)表記する。
u: Constant value during quantization μ: Average value of argument x σ: Standard deviation of argument x Confidence is calculated by giving the value obtained by multiplying the difference by u to argument x of the reliability function (1) can do. The reliability that the bit value of the i-th pixel calculated here is “0” is expressed as Ry0 (i).
続いて、第二情報取得部143aは、対象画像の各画素におけるCb成分の画素値を取得する(S156)。続いて、第二取得情報信頼度算出部143bは、各画素のCb成分の画素値から、各画素に関連付けられたビット値が「0」である信頼度を算出することにより関連付け情報を推定する。(S157)。ここでの信頼度の算出は、ステップS155と同様に行えばよい。なお、ここで算出されたi番目の画素のビット値が「0」である信頼度をRcb0(i)と表記する。 Subsequently, the second information acquisition unit 143a acquires the pixel value of the Cb component in each pixel of the target image (S156). Subsequently, the second acquired information reliability calculation unit 143b estimates the association information by calculating the reliability that the bit value associated with each pixel is “0” from the pixel value of the Cb component of each pixel. . (S157). The calculation of the reliability here may be performed in the same manner as in step S155. The reliability with which the bit value of the i-th pixel calculated here is “0” is expressed as Rcb0 (i).
続いて、関連付け情報判定部144は、Y成分の画素値に対する信頼度(Ry)と、Cb成分の画素値に対する信頼度(Rcb)と、Y成分に係るi番目のビット値が「0」である信頼度Ry0(i)と、Cb成分に係るi番目のビット値が「0」である信頼度Rcb0(i)とに基づいて、最も信頼度の高い関連付け情報を判定する(S158)。 Subsequently, the association information determination unit 144 determines that the reliability (Ry) for the pixel value of the Y component, the reliability (Rcb) for the pixel value of the Cb component, and the i-th bit value related to the Y component are “0”. Based on a certain reliability Ry0 (i) and a reliability Rcb0 (i) whose i-th bit value related to the Cb component is “0”, the association information with the highest reliability is determined (S158).
具体的には、画素ごとに以下の式を計算し、関連付け情報のi番目のビット値が「0」である信頼度R0(i)を算出する。 Specifically, the following formula is calculated for each pixel, and the reliability R0 (i) in which the i-th bit value of the association information is “0” is calculated.
R0(i)=Ry×Ry0(i)+Rcb×Rcb0(i)
ここで、関連付け情報判定部144は、R0(i)が0.5以上である場合、i番目の画素のビット値は「0」であると判定する。そうでない場合、関連付け情報判定部144は、i番目の画素のビット値は「1」であると判定する。これをビット値が関連付けられた全ての画素に対して行い、最も信頼度の高いビット列、すなわち関連付け情報を判定する。なお、判定結果は、表示装置に表示させてもよいし、ファイル等に保存してもよい。
R0 (i) = Ry × Ry0 (i) + Rcb × Rcb0 (i)
Here, the association information determination unit 144 determines that the bit value of the i-th pixel is “0” when R0 (i) is 0.5 or more. Otherwise, the association information determination unit 144 determines that the bit value of the i-th pixel is “1”. This is performed for all the pixels associated with the bit value, and the bit string with the highest reliability, that is, the association information is determined. The determination result may be displayed on a display device or stored in a file or the like.
以上で関連付け情報取得処理は終了する。 The association information acquisition process ends here.
図7の処理の特徴の一つとしてステップS152で画像種別の判定を行い、モノクロ画像のときは輝度成分のみを情報取得に利用し、カラー画像のときは輝度と色差の両方を利用することが挙げられる。モノクロ画像では色差成分は失われるが、Y成分が用いられていればモノクロ変換された画像からでも関連付け情報を取得することができる。技術的には、Y成分、Cb成分、Cr成分のうちいずれをも被関連付け情報とすることが可能であるが、上記の観点より少なくともY成分を被関連付け情報として用いるのが好ましい。また、Cr成分に比べCb成分の変化の方が人間の視覚に対する影響を小さくできる傾向にあるため、Cb成分を用いるのが好ましい。但し、Cr成分を用いて三重に関連付け情報を関連付けてもよい。 As one of the features of the processing in FIG. 7, the image type is determined in step S152. For a monochrome image, only the luminance component is used for information acquisition, and for a color image, both luminance and color difference are used. Can be mentioned. In the monochrome image, the color difference component is lost, but if the Y component is used, the association information can be acquired even from the monochrome-converted image. Technically, any of the Y component, the Cb component, and the Cr component can be used as associated information, but at least the Y component is preferably used as associated information from the above viewpoint. In addition, it is preferable to use the Cb component because the change of the Cb component tends to reduce the influence on human vision compared to the Cr component. However, the association information may be associated in triplicate using the Cr component.
また、画像種別の判別はモノクロ又はカラーに限るものではなく、例えばカラーインデックスを用いた画像フォーマットであれば、インデックス数が多いときは色差に対する信頼度を相対的に上げ、インデックス数が少ないときは色差に対する信頼度を相対的に下げるといったことも可能である。 Also, the determination of the image type is not limited to monochrome or color. For example, in the case of an image format using a color index, when the number of indexes is large, the reliability for color differences is relatively increased, and when the number of indexes is small. It is also possible to relatively reduce the reliability with respect to the color difference.
更に、特定のビット列を関連付け情報と合わせて埋め込んでおき、被関連付け情報の信頼度の算出時にその特定のビット列の信頼度を算出し、その信頼度を各被関連付け情報の信頼度としてもよい。この方法いついては第二の実施の形態において詳しく説明する。 Furthermore, a specific bit string may be embedded together with the association information, the reliability of the specific bit string may be calculated when calculating the reliability of the associated information, and the reliability may be used as the reliability of each associated information. This method will be described in detail in the second embodiment.
上述したように、第一の実施の形態における画像処理装置10によれば、輝度成分及び色差成分を対象として二重に同じ内容(値)の関連付け情報を関連付ける。また、関連付け情報の取得時には、輝度成分及び色差成分に対する信頼度を考慮して最も信頼度の高い関連付け情報を判定するため、画像データに関連付けられた情報の抽出精度を向上させることができる。 As described above, according to the image processing apparatus 10 in the first embodiment, the association information of the same content (value) is associated with the luminance component and the color difference component twice. Further, when obtaining the association information, the association information with the highest reliability is determined in consideration of the reliability with respect to the luminance component and the color difference component, so that the extraction accuracy of the information associated with the image data can be improved.
次に、第二の実施の形態について説明する。第二の実施の形態では、文字列と文字列以外の画像(例えば写真)から構成される電子文書(以下、単に「文書」という。)に対して文字間の距離(以下「文字間隔長」という。)とDCT係数とを操作することにより二重に関連付け情報を関連付け、その文書の画像から関連付け情報を取得する例について説明する。すなわち、第一の実施の形態では、文字間隔長が第一被関連付け情報に相当し、DCT係数が第二被関連付け情報に相当する。なお、ここで「文書」とは、ワープロソフト等や所定のアプリケーションによって生成される文書ファイルでもよく、文字列を画像として含む画像データであってもよい。 Next, a second embodiment will be described. In the second embodiment, a distance between characters (hereinafter referred to as “character interval length”) with respect to an electronic document (hereinafter simply referred to as “document”) composed of a character string and an image (for example, a photograph) other than the character string. )) And the DCT coefficient will be described in association with the association information in duplicate, and the association information is acquired from the image of the document. That is, in the first embodiment, the character interval length corresponds to the first associated information, and the DCT coefficient corresponds to the second associated information. Here, the “document” may be a document file generated by word processing software or a predetermined application, or image data including a character string as an image.
まず、文字間隔長及びDCT係数を操作することにより二重に関連付け情報を関連付ける処理について説明する。図8は、第二の実施の形態における情報関連付け処理を説明するためのフローチャートである。 First, a process for associating association information doubly by manipulating the character spacing length and the DCT coefficient will be described. FIG. 8 is a flowchart for explaining the information association processing in the second embodiment.
ステップS201において、情報関連付け部11は、関連付け情報の関連付けの対象とされる文書をメモリ上に読み込む。続いて、関連付け情報入力部111は、関連付け情報をユーザに入力させる(S202)。続いて、情報関連付け部11は、文書をテキスト領域とそれ以外の画像領域とに分割する(S203)。 In step S201, the information association unit 11 reads a document to be associated with association information into a memory. Subsequently, the association information input unit 111 causes the user to input association information (S202). Subsequently, the information association unit 11 divides the document into a text region and other image regions (S203).
続いて、第一関連付け部112は、テキスト領域に関連情報を関連付ける(S204)。具体的には、関連付け情報をビット列に変換し、各文字間隔に1ビットずつ割り当てる。ビット値「0」が割り当てられた文字間隔では、文字間隔長を所定の定数uの偶数倍で元の値に最も近い値に量子化する。また、ビット値「1」が割り当てられた文字間隔では文字間隔長を定数uの奇数倍で元の値に最も近い値に量子化する。なお、ここでの定数uの値は、第一の実施の形態における定数uの値と同値である必要はない。 Subsequently, the first association unit 112 associates the related information with the text area (S204). Specifically, the association information is converted into a bit string, and one bit is assigned to each character interval. In the character interval to which the bit value “0” is assigned, the character interval length is quantized to a value closest to the original value by an even multiple of a predetermined constant u. In the character interval to which the bit value “1” is assigned, the character interval length is quantized to a value closest to the original value by an odd multiple of the constant u. Note that the value of the constant u here does not have to be the same as the value of the constant u in the first embodiment.
図9は、文字間隔長にビット値を関連付ける様子を概念的に示す図である。図9では、「文書画像」という文字列の各文字間隔の文字間隔長l1、l2、l3に関連付け情報(「011」のビット列)が関連付けられる様子が示されている。したがって、「0」が割り当てられる文字間隔長l1の値は2uに、1が割り当てられる文字間隔長l2及びl3は3uにそれぞれ量子化されている。 FIG. 9 is a diagram conceptually showing how a bit value is associated with a character interval length. FIG. 9 shows how the association information (the bit string “011”) is associated with the character interval lengths l1, l2, and l3 of each character interval of the character string “document image”. Accordingly, the value of the character interval length l1 to which “0” is assigned is quantized to 2u, and the character interval lengths l2 and l3 to which 1 is assigned are quantized to 3u.
また、第一関連付け部112は、ユーザに入力された関連付け情報と共に特定ビット列を文字間隔長に割り当てる。以下、当該特定ビット列をも含めて関連付け情報という。 Moreover, the 1st correlation part 112 allocates a specific bit sequence to character space | interval length with the correlation information input by the user. Hereinafter, the specific bit string is also referred to as association information.
図10は、特定ビット列を含む関連付け情報の例を示す図である。図10では、ユーザに入力された関連付け情報の先頭に特定ビット列(「0101」)が付加された例が示されている。なお、後述するように、特定ビット列は被関連付け情報(ここでは、文字間隔長)に対する信頼度を判定するための情報として用いられる。 FIG. 10 is a diagram illustrating an example of association information including a specific bit string. FIG. 10 shows an example in which a specific bit string (“0101”) is added to the head of the association information input by the user. As will be described later, the specific bit string is used as information for determining the reliability of the associated information (here, the character interval length).
続いて、第二関連付け部113は、分割された画像領域に対して関連付け情報を関連付ける(S205)。具体的には画像領域を複数画素からなるブロックごとに分割し、各ブロックに関連付け情報のビット列のビット値を1ビットずつ割り当てる。更に、ブロックごとにDCTをかけ、得られたDCT係数のうち特定の係数を割り当てられたビット値に応じて特定の値に変更する。 Subsequently, the second association unit 113 associates association information with the divided image regions (S205). Specifically, the image area is divided into blocks each composed of a plurality of pixels, and the bit value of the bit string of the association information is assigned to each block bit by bit. Further, DCT is applied to each block, and a specific coefficient among the obtained DCT coefficients is changed to a specific value according to the assigned bit value.
図11は、DCT係数にビット値を関連付ける様子を概念的に示す図である。図11では、ブロックの単位を3×3画素とした場合に、当該ブロックに「0」が割り当てられた場合には、その中心のDCT係数の値を50とし、「1」が割り当てられた場合には、その中心のDCT係数の値を−50とする例が示されている。値を変更するDCT係数は、画像の変化に影響の少ないものを選択するのが好ましい。 FIG. 11 is a diagram conceptually showing how a bit value is associated with a DCT coefficient. In FIG. 11, when the block unit is 3 × 3 pixels and “0” is assigned to the block, the value of the DCT coefficient at the center is set to 50, and “1” is assigned. Shows an example in which the value of the DCT coefficient at the center is −50. As the DCT coefficient for changing the value, it is preferable to select a DCT coefficient having little influence on the change of the image.
なお、第一関連付け部112と同様、第二関連付け部113は、特定ビット列が付加された情報を関連付け情報として関連付ける。 Similar to the first associating unit 112, the second associating unit 113 associates information to which the specific bit string is added as association information.
DCT係数の変更後、第二関連付け部113は、ビット値を割り当てた各ブロックに対して逆DCTを施し、DCT係数から画像を復元する。 After changing the DCT coefficient, the second associating unit 113 performs inverse DCT on each block to which the bit value is assigned, and restores the image from the DCT coefficient.
以上で、情報関連付け処理は終了する。関連付け情報が関連付けられた文書は、印刷部12によってプリンタ20より紙文書として出力される。 This completes the information association process. The document associated with the association information is output from the printer 20 as a paper document by the printing unit 12.
続いて、上記の情報関連付け処理を経て印刷された紙文書をスキャナ30で読み取ることによって取り込まれた画像データより関連付け情報を取得する処理について説明する。図12は、第二の実施の形態における関連付け情報取得処理を説明するためのフローチャートである。 Next, a process for acquiring association information from image data captured by reading a paper document printed through the above information association process with the scanner 30 will be described. FIG. 12 is a flowchart for explaining association information acquisition processing in the second embodiment.
ステップS251において、関連付け情報取得部14は、スキャナ30によって読み取られた画像データ(以下「対象画像」という。)をメモリ上に読み込む。続いて、関連付け情報取得部14は、対象画像をテキスト領域と画像領域との二つに分割する(S252)。文書が一度印刷されてスキャンされた場合、全体が画像となるが、このときでも文書構造解析技術を用いて画像を識別・分割し、テキスト領域と画像領域に分けることができる。 In step S <b> 251, the association information acquisition unit 14 reads image data read by the scanner 30 (hereinafter referred to as “target image”) on the memory. Subsequently, the association information acquisition unit 14 divides the target image into two parts, a text area and an image area (S252). When a document is printed once and scanned, the entire image becomes an image. Even at this time, the image can be identified and divided using a document structure analysis technique, and divided into a text area and an image area.
続いて、第一情報取得部142aは、対象画像より分割されたテキスト領域に画像として含まれている文字列の各文字間隔長を取得する(S253)。続いて、第一取得情報信頼度算出部142bは、各文字間隔長からそれぞれの文字間隔長に割り当てられたビット値が「0」である信頼度を算出することにより関連付け情報を推定する(S254)。当該信頼度の算出は、第一の実施の形態と同様に行えばよい。すなわち、第一情報取得部142aによって取得された文字間隔長と、「0」が割り当てられた文字間隔長が量子化されることにより取り得る値(量子化ポイント)からの差分を信頼度関数(1)の引数xに与えればよい。ここで、関連付け情報のうち、特定ビット列のi番目のビットが「0」である信頼度をRcsp(i)と表記し、ユーザに入力された情報のi番目のビット値が「0」である信頼度をRcs0(i)と表記する。 Subsequently, the first information acquisition unit 142a acquires each character interval length of the character string included as an image in the text area divided from the target image (S253). Subsequently, the first acquired information reliability calculation unit 142b estimates the association information by calculating the reliability that the bit value assigned to each character interval length is “0” from each character interval length (S254). ). The calculation of the reliability may be performed in the same manner as in the first embodiment. That is, the difference between the character interval length acquired by the first information acquisition unit 142a and the value (quantization point) that can be obtained by quantizing the character interval length to which “0” is assigned is represented by a reliability function ( What is necessary is just to give to the argument x of 1). Here, in the association information, the reliability that the i-th bit of the specific bit string is “0” is expressed as Rcsp (i), and the i-th bit value of the information input to the user is “0”. The reliability is expressed as Rcs0 (i).
続いて、第二情報取得部143aは、分割された画像領域よりビット値が割り当てられたDCT係数を取得する(S255)。すなわち、対象画像より分割された画像領域を複数画素からなるブロックごとに分割し、ブロックごとにDCTをかけ、得られたDCT係数のうちビット値が割り当てられているDCT係数(図11においては中心のDCT係数)を取得する。 Subsequently, the second information acquisition unit 143a acquires a DCT coefficient to which a bit value is assigned from the divided image area (S255). That is, the image area divided from the target image is divided into blocks each composed of a plurality of pixels, DCT is applied to each block, and among the obtained DCT coefficients, a DCT coefficient to which a bit value is assigned (the center in FIG. 11). DCT coefficient).
続いて、第二取得情報信頼度算出部143bは、取得された各DCT係数からそれぞれのDCT係数に割り当てられたビット値が「0」である信頼度を算出することにより関連付け情報を推定する(S256)。例えば、DCT係数を±u/2に変更してビット値を割り当てた場合(図11は、u=100のケースに該当する。)、信頼度関数(1)の引数xにビット値「0」を表す値(図11では50)と、第二情報取得部143aによって取得されたDCT係数との絶対差分を与えることで当該信頼度を算出すればよい。但し、取得されたDCT係数がu/2を超える場合はビット値「0」の信頼度を1、−u/2を下回る場合はビット値「0」の信頼度を0と算出する。ここで、特定ビット列のi番目のビット値が「0」である信頼度をRdctp(i)と表記し、ユーザに入力された関連付け情報におけるi番目のビット値が「0」である信頼度をRdct0(i)と表記する。 Subsequently, the second acquired information reliability calculation unit 143b estimates the association information by calculating the reliability in which the bit value assigned to each DCT coefficient is “0” from each acquired DCT coefficient ( S256). For example, when the bit value is assigned by changing the DCT coefficient to ± u / 2 (FIG. 11 corresponds to the case of u = 100), the bit value “0” is set in the argument x of the reliability function (1). The reliability may be calculated by giving the absolute difference between the value representing the value (50 in FIG. 11) and the DCT coefficient acquired by the second information acquisition unit 143a. However, when the obtained DCT coefficient exceeds u / 2, the reliability of the bit value “0” is calculated as 1, and when the acquired DCT coefficient is lower than −u / 2, the reliability of the bit value “0” is calculated as 0. Here, the reliability that the i-th bit value of the specific bit string is “0” is expressed as Rdctp (i), and the reliability that the i-th bit value in the association information input to the user is “0”. Indicated as Rdct0 (i).
続いて、被関連付け情報信頼度判定部141は、第一被関連付け情報(文字間隔長)及び第二被関連付け情報(DCT係数)のそれぞれに関連付けられた特定ビット列に基づいて、それぞれに対する信頼度を判定する(S257)。すなわち、特定ビット列の各ビット値が0である信頼度の平均値を被関連付け情報に対する信頼度とする。 Subsequently, the associated information reliability determination unit 141 determines the reliability for each based on the specific bit string associated with each of the first associated information (character interval length) and the second associated information (DCT coefficient). Determination is made (S257). That is, the average value of the reliability with which each bit value of the specific bit string is 0 is set as the reliability for the associated information.
ここで、文字間隔長に対する信頼度をRcs、DCT係数に対する信頼度をRdctとする。例えば「0101」を特定ビット列とした場合、Rcsは次のように計算できる。 Here, the reliability for the character spacing length is Rcs, and the reliability for the DCT coefficient is Rdct. For example, when “0101” is a specific bit string, Rcs can be calculated as follows.
Rcs ={Rcsp(0)+(1−Rcsp(1))+Rcsp(2)+(1−Rcsp(3))}/4
Rdctも同様に計算できる。
Rcs = {Rcsp (0) + (1-Rcsp (1)) + Rcsp (2) + (1-Rcsp (3))} / 4
Rdct can be calculated similarly.
更に、RcsとRdctとの合計を1.0とするため、それぞれを以下の演算によって正規化する。 Further, in order to set the sum of Rcs and Rdct to 1.0, each is normalized by the following calculation.
Rcs=Rcs/(Rcs+Rdct)
Rdct=Rdct/(Rcs+Rdct)
続いて、関連付け情報判定部144は、文字間隔長に対する信頼度(Rcs)とDCT係数に対する信頼度(Rdct)と、文字間隔長に係るi番目のビット値が「0」である信頼度Rcs0(i)と、DCT係数に係るi番目のビット値が「0」である信頼度Rdct0(i)とに基づいて、最も信頼度の高い関連付け情報を判定する(S258)。
Rcs = Rcs / (Rcs + Rdct)
Rdct = Rdct / (Rcs + Rdct)
Subsequently, the association information determination unit 144 determines the reliability (Rcs) for the character interval length, the reliability (Rdct) for the DCT coefficient, and the reliability Rcs0 (i-th bit value for the character interval length is “0”). Based on i) and the reliability Rdct0 (i) whose i-th bit value related to the DCT coefficient is “0”, the association information with the highest reliability is determined (S258).
具体的には、各文字間隔長又は各DCT係数ごとに以下の式を計算し、関連付け情報のi番目のビット値が「0」である信頼度R0(i)を算出する。 Specifically, the following formula is calculated for each character interval length or each DCT coefficient, and the reliability R0 (i) in which the i-th bit value of the association information is “0” is calculated.
R0(i) = Rcs×Rcs0(i)+Rdct×Rdct0(i)
ここで、関連付け情報判定部144は、R0(i)が0.5以上である場合、i番目のビット値は「0」であると判定する。そうでない場合、関連付け情報判定部144は、i番目のビット値は「1」であると判定する。これをビット値が関連付けられた全ての文字間隔長及びDCT係数に対して行い、最も信頼度の高いビット列、すなわち関連付け情報を判定する。
R0 (i) = Rcs × Rcs0 (i) + Rdct × Rdct0 (i)
Here, the association information determination unit 144 determines that the i-th bit value is “0” when R0 (i) is 0.5 or more. Otherwise, the association information determination unit 144 determines that the i-th bit value is “1”. This is performed for all character interval lengths and DCT coefficients associated with bit values, and the bit string with the highest reliability, that is, the association information is determined.
以上で、関連付け情報取得処理は終了する。 This is the end of the association information acquisition process.
上述したように、第二の実施の形態における画像処理装置10によれば、文書を構成する領域ごと(テキスト領域や画像領域ごと)に適した方法によって関連情報を関連付け、多重に関連付けられた関連付け情報を統合して信頼度の高い関連付け情報を判定するため、情報の抽出精度を高めることができる。また、特定ビット列を用いて各被関連付け情報の信頼度を算出するため、より信頼性の高い結果を得ることができる。 As described above, according to the image processing apparatus 10 in the second embodiment, related information is associated by a method suitable for each region (for each text region or image region) constituting a document, and multiple associations are associated. Since information is integrated and association information with high reliability is determined, information extraction accuracy can be improved. Further, since the reliability of each associated information is calculated using the specific bit string, a more reliable result can be obtained.
ところで、文字間隔の数や画像のブロック数は、文書によって異なり関連付けが可能なビット数が変動する。しかし、多くの応用では、関連付け情報は固定ビット長であることが要求される。そこで、関連付け情報のビット数が少ないときは同じ情報を繰り返して関連付け、関連付け情報のビット数が多いときは可能な分だけ関連付け、関連付けできなかった部分のビット値は同一の信頼度、すなわち0.5とするようにしてもよい。 By the way, the number of character intervals and the number of image blocks vary depending on the document, and the number of bits that can be associated varies. However, in many applications, the association information is required to have a fixed bit length. Therefore, when the number of bits of the association information is small, the same information is repeatedly associated, and when the number of bits of the association information is large, the association is made as much as possible. It may be set to 5.
また、関連付け情報のビット数が被関連付け情報のビット数(第二の実施の形態では、文字間隔の数やDCT係数を得るためのブロック数)より多い場合、二種類の被関連付け情報のそれぞれに関連付け情報の各ビット値を同じ順番で割り当てると、最後のビット値が割り当てられなくなる。かかる場合は、一方の被関連付け情報には最初のビット値から順に割り当て、他方の被関連付け情報には最後のビット値から順に割り当てるようにすることで、関連付けられる情報量を増加させてもよい。 Further, when the number of bits of the association information is larger than the number of bits of the associated information (in the second embodiment, the number of character intervals and the number of blocks for obtaining the DCT coefficient), each of the two types of associated information If the bit values of the association information are assigned in the same order, the last bit value cannot be assigned. In such a case, the associated information amount may be increased by assigning one associated information in order from the first bit value and assigning the other associated information in order from the last bit value.
次に、第三の実施の形態について説明する。第三の実施の形態では、画像データに対して所定の図形パターンを合成し、また、画像データを含むファイル(画像ファイル)と関連付け情報を含むファイルとを関連付けて保存することにより二重に関連付け情報を関連付け、その画像から関連付け情報を取得する例について説明する。ここでは、所定の図形パターンとして二次元コードを用いる。すなわち、第三の実施の形態では、二次元コードが第一被関連付け情報に相当し、画像データそのもの(画像ファイル)が第二被関連付け情報に相当する。但し、所定の図形パターンは、情報を表現できるものであれば、バーコード等、二次元コード以外のものであってもよい。 Next, a third embodiment will be described. In the third embodiment, a predetermined graphic pattern is synthesized with image data, and a file containing image data (image file) and a file containing association information are stored in association with each other in duplicate. An example in which information is associated and association information is acquired from the image will be described. Here, a two-dimensional code is used as the predetermined graphic pattern. That is, in the third embodiment, the two-dimensional code corresponds to the first associated information, and the image data itself (image file) corresponds to the second associated information. However, the predetermined graphic pattern may be other than a two-dimensional code such as a barcode as long as it can express information.
まず、関連付け情報の関連付け処理について説明する。図13は、第三の実施の形態における情報関連付け処理を説明するためのフローチャートである。 First, association processing of association information will be described. FIG. 13 is a flowchart for explaining the information association process in the third embodiment.
ステップS301において、情報関連付け部11は、関連付け情報の関連付けの対象とされる画像データ(以下「対象画像」という。)をメモリ上に読み込む。続いて、関連付け情報入力部111は、関連付け情報をユーザに入力させる(S302)。 In step S <b> 301, the information association unit 11 reads image data (hereinafter referred to as “target image”) to be associated with association information into a memory. Subsequently, the association information input unit 111 causes the user to input association information (S302).
続いて、第一関連付け部112は、関連付け情報に基づいて二次元コードを生成し、その二次元コードを画像データの画像に重畳させる(S303)。二次元コードとしては例えばQR(Quick Response)コードを用いてもよい。 Subsequently, the first association unit 112 generates a two-dimensional code based on the association information, and superimposes the two-dimensional code on the image of the image data (S303). For example, a QR (Quick Response) code may be used as the two-dimensional code.
図14は、関連付け情報からの二次元コードの生成例を示す図である。図14において、(A)は関連付け情報を示し、(B)は関連付け情報に基づいて生成された二次元コードを示す。図14では、関連付け情報(A)のビット列を二次元的に配列し、その配列と同じ配列で、ビット値が0の場合は白(無色)の矩形領域(以下「セル」という。)、ビット値が(1)の場合は黒のセルを配置することにより、二次元コード(B)が生成されている。 FIG. 14 is a diagram illustrating an example of generating a two-dimensional code from association information. 14A shows association information, and FIG. 14B shows a two-dimensional code generated based on the association information. In FIG. 14, the bit string of the association information (A) is two-dimensionally arranged. When the bit value is 0, the bit string is white (colorless) rectangular area (hereinafter referred to as “cell”), bit. When the value is (1), a two-dimensional code (B) is generated by arranging black cells.
続いて、第二関連付け部113は、画像データと関連付け情報とをそれぞれの対応関係を維持できる方法で、それぞれ画像ファイルまたは関連付け情報ファイルとして保存する。二つのファイルの対応付けは、例えば、両者のファイル名に基づいて行ってもよいし、両者を同じフォルダに保存することにより行ってもよい。 Subsequently, the second associating unit 113 stores the image data and the association information as an image file or an association information file, respectively, by a method capable of maintaining the corresponding relationship. The association between the two files may be performed based on the file names of both, or may be performed by saving both in the same folder.
以上で、情報関連付け処理は終了し、関連付け情報が関連付けられた画像データは、印刷部12によってプリンタ20より紙文書として出力される。 Thus, the information association process is completed, and the image data associated with the association information is output from the printer 20 as a paper document by the printing unit 12.
続いて、上記の情報関連付け処理を経て印刷された紙文書をスキャナ30で読み取ることによって取り込まれた画像データより関連付け情報を取得する処理について説明する。図15は、第三の実施の形態における関連付け情報取得処理を説明するためのフローチャートである。 Next, a process for acquiring association information from image data captured by reading a paper document printed through the above information association process with the scanner 30 will be described. FIG. 15 is a flowchart for explaining association information acquisition processing according to the third embodiment.
ステップS351において、関連付け情報取得部14は、スキャナ30によって読み取られた画像データ(以下「対象画像」という。)をメモリ上に読み込む。続いて、被関連付け情報信頼度判定部141は、第一被関連付け情報(二次元コード)及び第二被関連付け情報(画像ファイル)に対する相対的な信頼度を算出する(S352)。ここでの信頼度は、第一又は第二の実施の形態のように画像の種別に基づいて算出してもよいし、特定ビットパターンの関連付けを用いることにより算出してもよい。また、それぞれを0.5としてもよい。以下、二次元コードに対する信頼度をRcode、画像ファイルに対する信頼度をRmatchと記述する。なお、RcodeとRmatchの合計が1.0となるように正規化しておく。 In step S351, the association information acquisition unit 14 reads image data read by the scanner 30 (hereinafter referred to as “target image”) into the memory. Subsequently, the associated information reliability determination unit 141 calculates a relative reliability with respect to the first associated information (two-dimensional code) and the second associated information (image file) (S352). The reliability here may be calculated based on the type of image as in the first or second embodiment, or may be calculated by using association of a specific bit pattern. Each may be set to 0.5. Hereinafter, the reliability for the two-dimensional code is described as Rcode, and the reliability for the image file is described as Rmatch. Note that normalization is performed so that the sum of Rcode and Rmatch is 1.0.
続いて、第一情報取得部142aは、対象画像より二次元コードを切り出す(S353)。続いて、第一取得情報信頼度算出部142bは、切り出された二次元コードを復号された情報に基づいて、二次元コードに関連付けられた関連付け情報の各ビット値が「0」である信頼度を算出することにより関連付け情報を推定する(S354)。二次元コードとしてQRコードを使用する場合は、誤り訂正符号化が施されるため復号の可否に応じて信頼度は1.0又は0.0のいずれかとなる。誤り訂正なしの二次元コードを使用する場合は、例えば二次元コードをセル分割した際の白又は黒画素の比率を信頼度とすればよい。 Subsequently, the first information acquisition unit 142a cuts out a two-dimensional code from the target image (S353). Subsequently, the first acquired information reliability calculation unit 142b has a reliability in which each bit value of the association information associated with the two-dimensional code is “0” based on information obtained by decoding the extracted two-dimensional code. Is estimated by calculating (S354). When a QR code is used as a two-dimensional code, since error correction coding is performed, the reliability is either 1.0 or 0.0 depending on whether decoding is possible. When a two-dimensional code without error correction is used, for example, the ratio of white or black pixels when the two-dimensional code is divided into cells may be used as the reliability.
図16は、二次元コードをセル分割した際の白画素の比率によってビット値が0である信頼度を算出する例を示す図である。 FIG. 16 is a diagram illustrating an example of calculating reliability with a bit value of 0 based on the ratio of white pixels when a two-dimensional code is divided into cells.
図16において(A)は、第一情報取得部142aによって対象画像より切り出された二次元コードを示す。二次元コード(A)は、印刷やスキャン等の処理を経ることによって、その形状が劣化している。(B)は、二次元コード(A)をビット値が割り当てられたセルごとに分割した様子を示す。(C)は、(B)において分割された各セルにおける白画素の比率を数値として示している。したがって、図16によれば、最初のビット値が0である信頼度は0.89、次のビット値は0.01、以降、098、0.91、・・・と判定することができる。 In FIG. 16, (A) shows the two-dimensional code cut out from the target image by the first information acquisition unit 142a. The shape of the two-dimensional code (A) is deteriorated through processing such as printing and scanning. (B) shows a state in which the two-dimensional code (A) is divided for each cell to which a bit value is assigned. (C) shows the ratio of white pixels in each cell divided in (B) as a numerical value. Therefore, according to FIG. 16, it can be determined that the reliability of the first bit value being 0 is 0.89, the next bit value is 0.01, and thereafter, 098, 0.91,.
以下、二次元コードより得られるi番目のビットが「0」である信頼度をRcode0(i)と表記する。 Hereinafter, the reliability that the i-th bit obtained from the two-dimensional code is “0” is expressed as Rcode0 (i).
続いて、第二情報取得部143aは、関連付け情報ファイルと対応付けられて保存されている画像ファイルを取得する(S355)。ここで、複数の画像ファイルがぞれぞれの関連付けファイルと対応付けられて保存されている場合は、その複数の画像ファイルが取得される。 Subsequently, the second information acquisition unit 143a acquires an image file stored in association with the association information file (S355). Here, when a plurality of image files are stored in association with each association file, the plurality of image files are acquired.
続いて、第二取得情報信頼度算出部143bは、対象画像と取得された画像ファイルとの類似度に基づいて画像ファイルに関連付けられた関連付け情報の各ビット値が「0」である信頼度を算出することにより関連付け情報を推定する。具体的には、第二取得情報信頼度算出部143bは、第二情報取得部143aによって取得された画像ファイルと対象画像とのパターンマッチング等によって対象画像に類似する画像ファイルを選択する。ここで選択された画像ファイルを以下「選択画像」という。ここでは、複数の画像ファイルが選択されてもよい。例えば5番目まで類似するもの、又は類似度が閾値以上のものといった選択基準を設けてもよい。更に、第二情報取得部143aは、選択画像に対応付けられている関連付け情報ファイルを取得し、それぞれの選択画像と対象画像との類似度をそれぞれの関連付け情報ファイルに含まれている関連付け情報に対する信頼度とする。 Subsequently, the second acquired information reliability calculation unit 143b determines the reliability that each bit value of the association information associated with the image file is “0” based on the similarity between the target image and the acquired image file. The association information is estimated by calculating. Specifically, the second acquired information reliability calculation unit 143b selects an image file similar to the target image by pattern matching between the image file acquired by the second information acquisition unit 143a and the target image. The image file selected here is hereinafter referred to as “selected image”. Here, a plurality of image files may be selected. For example, a selection criterion such as one that is similar up to the fifth one or a similarity that is equal to or higher than a threshold may be provided. Furthermore, the second information acquisition unit 143a acquires an association information file associated with the selected image, and the similarity between each selected image and the target image is associated with the association information included in each association information file. Reliable.
各関連付け情報に対する信頼度からi番目のビット値が「0」である信頼度Rmatch0(i)を算出することができる。例えば、次のようにすればよい。 The reliability Rmatch0 (i) having the i-th bit value of “0” can be calculated from the reliability for each association information. For example, the following may be performed.
m番目の選択画像の類似度をS(m)とし、m番目の選択画像に対応付けられた関連付け情報のi番目のビットが0であるとき、m番目の関連付け情報のi番目のビット値が0である信頼度をRmatch0(m,i)=S(m)とする。また、m番目の関連付け情報のi番目のビットが1であるとき、Rmatch0(m,i)=0とする。全ての選択画像に対してRmatch0(m,i)を算出し、そのビットごとの平均値をRmatch0(i)とする。 When the similarity of the m-th selected image is S (m) and the i-th bit of the association information associated with the m-th selected image is 0, the i-th bit value of the m-th association information is The reliability of 0 is Rmatch0 (m, i) = S (m). When the i-th bit of the m-th association information is 1, Rmatch 0 (m, i) = 0. Rmatch0 (m, i) is calculated for all selected images, and the average value for each bit is defined as Rmatch0 (i).
なお、類似度S(m)は、選択画像の類似度の合計が1となるように以下のように予め正規化しておく。 The similarity S (m) is normalized in advance as follows so that the total similarity of selected images is 1.
S(m)←S(m)/ΣS(i){iは選択画像}
続いて、関連付け情報判定部144は、二次元コードに対する信頼度(Rcode)と、画像ファイルに対する信頼度(Rmatch)と、二次元コードに係るi番目のビット値が「0」である信頼度Rcode0(i)と、画像ファイルに係るi番目のビット値が「0」である信頼度Rmatch0(i)とに基づいて、最も信頼度の高い関連付け情報を判定する(S357)。
S (m) ← S (m) / ΣS (i) {i is the selected image}
Subsequently, the association information determination unit 144 determines the reliability (Rcode) for the two-dimensional code, the reliability (Rmatch) for the image file, and the reliability Rcode0 in which the i-th bit value related to the two-dimensional code is “0”. Based on (i) and the reliability Rmatch0 (i) whose i-th bit value related to the image file is “0”, the association information with the highest reliability is determined (S357).
具体的には、まず以下の式を計算し、関連付け情報のi番目のビット値が「0」である信頼度R0(i)を算出する。
R0(i)=Rcode×Rcode0(i) + Rmatch×Rmatch0(i)
ここで、関連付け情報判定部144は、R0(i)が0.5以上である場合、i番目のビット値は「0」であると判定する。そうでない場合、関連付け情報判定部144は、i番目のビット値は「1」であると判定する。これをすべてのビット値に対して行い、最も信頼度の高いビット列、すなわち関連付け情報を判定する。
Specifically, first, the following equation is calculated to calculate the reliability R0 (i) in which the i-th bit value of the association information is “0”.
R0 (i) = Rcode × Rcode0 (i) + Rmatch × Rmatch0 (i)
Here, the association information determination unit 144 determines that the i-th bit value is “0” when R0 (i) is 0.5 or more. Otherwise, the association information determination unit 144 determines that the i-th bit value is “1”. This is performed for all the bit values, and the bit string with the highest reliability, that is, the association information is determined.
以上で、関連付け情報取得のフローは終了する。 This is the end of the association information acquisition flow.
なお、関連付け情報の判定後に更に改ざん判定のステップを設けてもよい。取得された関連付け情報のi番目のビット値をb(i)とし、次の式を計算し、取得された関連付け情報全体の信頼度Rを算出する。 Note that a tampering determination step may be further provided after the association information is determined. The i-th bit value of the acquired association information is set to b (i), the following equation is calculated, and the reliability R of the entire acquired association information is calculated.
R=Σ{R0(i)+b(i)×(1−2×R0(i))}/ビット数
この信頼度Rが所定の閾値以下である場合、改ざんがあったと判定する。これは画像の画素値の変動が少ない環境下で有効である。そのような環境で信頼度Rが低いということは、画像が書き換えられた、または二次元コードを上書きされた可能性が高いといえる。
このことから改ざんの検出が可能である。
R = Σ {R0 (i) + b (i) × (1-2 × R0 (i))} / number of bits When the reliability R is equal to or less than a predetermined threshold value, it is determined that there has been falsification. This is effective in an environment where there is little variation in the pixel value of the image. If the reliability R is low in such an environment, it can be said that there is a high possibility that the image has been rewritten or the two-dimensional code has been overwritten.
This makes it possible to detect tampering.
なお、信頼度Rは、各ビットのビット値に対する信頼度の平均値に相当する。すなわち、i番目のビット値が0の場合(すなわちb(i)=0の場合)、上記式の{R0(i)+b(i)×(1−2×R0(i))}は、R0(i)となり、これはi番目のビット値が0である信頼度を示す。一方、i番目のビット値が1の場合(すなわちb(i)=1の場合)、上記式の{R0(i)+b(i)×(1−2×R0(i))}は、1−R0(i)となり、これはi番目のビット値が1である信頼度を示す。したがって、各ビットのビット値が当該ビット値であることの信頼度の合計の平均値が信頼度Rの値となる。 The reliability R corresponds to an average value of reliability with respect to the bit value of each bit. That is, when the i-th bit value is 0 (that is, when b (i) = 0), {R0 (i) + b (i) × (1-2 × R0 (i))} in the above formula is R0 (I), which indicates the confidence that the i-th bit value is 0. On the other hand, when the i-th bit value is 1 (that is, when b (i) = 1), {R0 (i) + b (i) × (1-2 × R0 (i))} in the above formula is 1 −R0 (i), which indicates the confidence that the i-th bit value is 1. Therefore, the average value of the reliability of the bit value of each bit being the bit value becomes the value of reliability R.
上述したように、第三の実施の形態における画像処処理装置10によれば、多重に関連付けられた関連付け情報を統合して信頼度の高い関連付け情報を判定するため、情報の抽出精度を高めることができる。 As described above, according to the image processing apparatus 10 in the third embodiment, since the association information associated with multiple is integrated and the highly reliable association information is determined, the information extraction accuracy is increased. Can do.
なお、第三の実施の形態では、は画像データそのものをファイルとして保存しておく例を説明したが、画像マッチングの計算速度や画像ファイルを保存するための記憶容量を考慮して画像データの特徴量を関連付け情報ファイルと対応付けて保存しておいてもよい。画像データの特徴量としては、画素値の統計量、フーリエ変換、DCT、ウェーブレット変換などで得られた係数値等を用いることができる。また画像データがテキストを含む文書から変換されたものならば、レイアウト、文字数、文字間隔値、などを特徴量として用いることができる。 In the third embodiment, the example in which the image data itself is stored as a file has been described. However, the image data characteristics are considered in consideration of the calculation speed of image matching and the storage capacity for storing the image file. The amount may be stored in association with the association information file. As the feature amount of the image data, a pixel value statistic, a coefficient value obtained by Fourier transform, DCT, wavelet transform, or the like can be used. If the image data is converted from a document including text, the layout, the number of characters, the character spacing value, and the like can be used as the feature amount.
上記第一から第三の実施の形態に分けて説明したが、本発明によれば、被関連付け情報が一つの情報に限定されず、関連付け情報の対象となる画像データに適した被関連付け情報を選択して情報を関連付けることができるため、関連付け情報の耐久性を高めることができると共に、例えば、音声、動画、文書、及びプログラム等、画像データ以外の様々なデジタルコンテンツに適切に関連付け情報を関連付け、その関連付け情報を取得することができる。 As described above in the first to third embodiments, according to the present invention, the related information is not limited to one information, and the related information suitable for the image data that is the target of the related information is Since it is possible to select and associate information, the durability of the association information can be enhanced, and for example, the association information is appropriately associated with various digital contents other than image data such as audio, video, document, and program. That association information can be acquired.
なお、第一から第三の実施の形態において説明した以外にも、被関連付け情報としては、例えば、RGBの各成分の組み合わせ、文字要素(高さ・幅・傾き・太さ・書体・間隔)の組み合わせ、画素値を積分変換した際の異なる係数領域の組み合わせ(例:フーリエ変換における高周波と低周波の組み合わせ)、ドットパターン、バーコードと前記要素の組み合わせ、及び、画像マッチングと前記要素の組み合わせ等、状況に応じて様々な情報を選択することが可能である。 In addition to those described in the first to third embodiments, as related information, for example, combinations of RGB components, character elements (height, width, inclination, thickness, typeface, interval) , Combinations of different coefficient areas when pixel values are integrated (eg, combination of high frequency and low frequency in Fourier transform), dot pattern, combination of barcode and the element, and combination of image matching and the element It is possible to select various information depending on the situation.
以上、本発明の実施例について詳述したが、本発明は係る特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。 As mentioned above, although the Example of this invention was explained in full detail, this invention is not limited to the specific embodiment which concerns, In the range of the summary of this invention described in the claim, various deformation | transformation * It can be changed.
10 画像処理装置
11 情報関連付け部
12 印刷部
13 スキャン部
14 関連付け情報取得部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 演算処理装置
105 表示装置
106 入力装置
111 関連付け情報入力部
112 第一関連付け部
113 第二関連付け部
141 被関連付け情報信頼度判定部
142 第一推定部
142a 第一情報取得部
142b 第一取得情報信頼度判定部
143 第二推定部
143a 第二情報取得部
143b 第二取得情報信頼度判定部
144 関連付け情報判定部
B バス
DESCRIPTION OF SYMBOLS 10 Image processing apparatus 11 Information correlation part 12 Printing part 13 Scan part 14 Association information acquisition part 100 Drive apparatus 101 Recording medium 102 Auxiliary storage apparatus 103 Memory apparatus 104 Arithmetic processing apparatus 105 Display apparatus 106 Input apparatus 111 Association information input part 112 1st Association unit 113 Second association unit 141 Associated information reliability determination unit 142 First estimation unit 142a First information acquisition unit 142b First acquisition information reliability determination unit 143 Second estimation unit 143a Second information acquisition unit 143b Second acquisition Information reliability determination unit 144 Association information determination unit B bus
Claims (35)
それぞれの前記被関連付け情報の相対的な第一の信頼度を算出又は判定する被関連付け情報信頼度判定手段と、
前記デジタルコンテンツに基づいてそれぞれの前記被関連付け情報の内容を取得する情報取得手段と、
取得されたそれぞれの前記被関連付け情報の内容に基づいて、前記被関連付け情報ごとに前記関連付け情報を推定する推定手段と、
それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手段による前記被関連付け情報ごとの推定結果とに基づいて、前記関連付け情報を判定する関連付け情報判定手段とを有することを特徴とする情報取得装置。 An information acquisition device that acquires association information associated with at least two types of associated information regarding digital content based on the digital content,
Associated information reliability determination means for calculating or determining a relative first reliability of each associated information;
Information acquisition means for acquiring the contents of the associated information based on the digital content;
Estimating means for estimating the association information for each piece of associated information based on the content of each piece of the associated information acquired;
And an association information determination unit that determines the association information based on the first reliability for each of the associated information and an estimation result for each of the associated information by the estimation unit. Information acquisition device.
前記判定手段は、それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手段による前記被関連付け情報ごとの推定結果と、該推定結果に対する前記第二の信頼度とに基づいて、前記関連付け情報を判定することを特徴とする請求項1記載の情報取得装置。 The estimation unit is configured to perform second estimation on the estimation result based on a difference between the content of the associated information acquired by the information acquisition unit and the content of the associated information associated with the association information. Calculate confidence,
The determination means is based on the first reliability with respect to each associated information, the estimation result for each associated information by the estimation means, and the second reliability with respect to the estimation result, The information acquisition apparatus according to claim 1, wherein association information is determined.
前記情報取得手段は、前記画像データの各画素の輝度成分と色差成分の画素値を取得し、
前記推定手段は、取得されたそれぞれの画素値に基づいて、前記輝度成分及び前記色差成分ごとに前記関連付け情報を推定することを特徴とする請求項1乃至6いずれか一項記載の情報取得装置。 The digital content is image data,
The information acquisition means acquires a pixel value of a luminance component and a color difference component of each pixel of the image data,
The information acquisition apparatus according to claim 1, wherein the estimation unit estimates the association information for each of the luminance component and the color difference component based on each acquired pixel value. .
前記情報取得手段は、前記画像データに画像として含まれている文字列における文字間隔長と、前記画像データに基づくDCT係数とを取得し、
前記推定手段は、取得された前記文字間隔長と前記DCT係数とに基づいて、前記文字間隔長及び前記DCT係数ごとに前記関連付け情報を推定することを特徴とする請求項1乃至6いずれか一項記載の情報取得装置。 The digital content is image data,
The information acquisition means acquires a character interval length in a character string included as an image in the image data and a DCT coefficient based on the image data,
The said estimation means estimates the said correlation information for every said character space | interval length and said DCT coefficient based on the acquired said character space | interval length and said DCT coefficient. The information acquisition device described in the section.
前記情報取得手段は、前記画像データに合成されている図形パターンと、所定の記憶領域に保存されている保存画像データ又は該保存画像データの特徴量とを取得し、
前記推定手段は、取得された前記図形パターンと前記保存画像データ又は前記特徴量の外部に対応付けられて保存されている外部データとに基づいて、前記図形パターン及び前記保存画像データ又は前記特徴量ごとに前記関連付け情報を推定することを特徴とする請求項1乃至6いずれか一項記載の情報取得装置。 The digital content is image data,
The information acquisition means acquires a graphic pattern combined with the image data, stored image data stored in a predetermined storage area, or a feature amount of the stored image data,
The estimation unit is configured to determine the graphic pattern and the stored image data or the feature amount based on the acquired graphic pattern and the stored image data or the external data stored in association with the outside of the feature amount. The information acquisition apparatus according to claim 1, wherein the association information is estimated every time.
それぞれの前記被関連付け情報の相対的な第一の信頼度を算出又は判定する被関連付け情報信頼度判定手順と、
前記デジタルコンテンツに基づいてそれぞれの前記被関連付け情報の内容を取得する情報取得手順と、
取得されたそれぞれの前記被関連付け情報の内容に基づいて、前記被関連付け情報ごとに前記関連付け情報を推定する推定手順と、
それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手順における前記被関連付け情報ごとの推定結果とに基づいて、前記関連付け情報を判定する関連付け情報判定手順とを有することを特徴とする情報取得方法。 An information acquisition method for acquiring association information associated with at least two types of associated information regarding digital content based on the digital content,
An associated information reliability determination procedure for calculating or determining a relative first reliability of each associated information;
An information acquisition procedure for acquiring the contents of the associated information based on the digital content;
An estimation procedure for estimating the association information for each piece of associated information based on the content of each piece of the associated information acquired;
An association information determination procedure for determining the association information based on the first reliability with respect to each of the associated information and an estimation result for each of the associated information in the estimation procedure. Information acquisition method.
前記判定手順は、それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手順における前記被関連付け情報ごとの推定結果と、該推定結果に対する前記第二の信頼度とに基づいて、前記関連付け情報を判定することを特徴とする請求項15記載の情報取得方法。 The estimation procedure is based on the difference between the content of the associated information acquired in the information acquisition procedure and the content that can be taken by the associated information associated with the association information. Calculate confidence,
The determination procedure is based on the first reliability for each associated information, the estimation result for each associated information in the estimation procedure, and the second reliability for the estimation result. The information acquisition method according to claim 15, wherein association information is determined.
前記情報取得手順は、前記画像データの各画素の輝度成分と色差成分の画素値を取得し、
前記推定手順は、取得されたそれぞれの画素値に基づいて、前記輝度成分及び前記色差成分ごとに前記関連付け情報を推定することを特徴とする請求項15乃至20いずれか一項記載の情報取得方法。 The digital content is image data,
The information acquisition procedure acquires a pixel value of a luminance component and a color difference component of each pixel of the image data,
21. The information acquisition method according to claim 15, wherein the estimation procedure estimates the association information for each of the luminance component and the color difference component based on each acquired pixel value. .
前記情報取得手順は、前記画像データに画像として含まれている文字列における文字間隔長と、前記画像データに基づくDCT係数とを取得し、
前記推定手順は、取得された前記文字間隔長と前記DCT係数とに基づいて、前記文字間隔長及び前記DCT係数ごとに前記関連付け情報を推定することを特徴とする請求項15乃至20いずれか一項記載の情報取得方法。 The digital content is image data,
The information acquisition procedure acquires a character interval length in a character string included as an image in the image data and a DCT coefficient based on the image data,
The said estimation procedure estimates the said correlation information for every said character space | interval length and said DCT coefficient based on the acquired said character space | interval length and said DCT coefficient, It is any one of Claim 15 thru | or 20 characterized by the above-mentioned. Information acquisition method described in the section.
前記情報取得手順は、前記画像データに合成されている図形パターンと、所定の記憶領域に保存されている保存画像データ又は該保存画像データの特徴量とを取得し、
前記推定手順は、取得された前記図形パターンと前記保存画像データ又は前記特徴量の外部に対応付けられて保存されている外部データとに基づいて、前記図形パターン及び前記保存画像データ又は前記特徴量ごとに前記関連付け情報を推定することを特徴とする請求項15乃至20いずれか一項記載の情報取得方法。 The digital content is image data,
The information acquisition procedure acquires a graphic pattern combined with the image data, stored image data stored in a predetermined storage area, or a feature amount of the stored image data,
The estimation procedure is based on the acquired graphic pattern and the stored image data or the external data stored in association with the outside of the feature amount, and the graphic pattern and the stored image data or the feature amount. 21. The information acquisition method according to claim 15, wherein the association information is estimated every time.
それぞれの前記被関連付け情報の相対的な第一の信頼度を算出又は判定する被関連付け情報信頼度判定手順と、
前記デジタルコンテンツに基づいてそれぞれの前記被関連付け情報の内容を取得する情報取得手順と、
取得されたそれぞれの前記被関連付け情報の内容に基づいて、前記被関連付け情報ごとに前記関連付け情報を推定する推定手順と、
それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手順における前記被関連付け情報ごとの推定結果とに基づいて、前記関連付け情報を判定する関連付け情報判定手順とを有することを特徴とする情報取得プログラム。 An information acquisition program for causing a computer to acquire association information associated with at least two types of associated information related to digital content based on the digital content,
An associated information reliability determination procedure for calculating or determining a relative first reliability of each associated information;
An information acquisition procedure for acquiring the contents of the associated information based on the digital content;
An estimation procedure for estimating the association information for each piece of associated information based on the content of each piece of the associated information acquired;
An association information determination procedure for determining the association information based on the first reliability with respect to each of the associated information and an estimation result for each of the associated information in the estimation procedure. Information acquisition program.
前記判定手順は、それぞれの前記被関連付け情報に対する前記第一の信頼度と、前記推定手順における前記被関連付け情報ごとの推定結果と、該推定結果に対する前記第二の信頼度とに基づいて、前記関連付け情報を判定することを特徴とする請求項29記載の情報取得プログラム。 The estimation procedure is based on the difference between the content of the associated information acquired in the information acquisition procedure and the content that can be taken by the associated information associated with the association information. Calculate confidence,
The determination procedure is based on the first reliability for each associated information, the estimation result for each associated information in the estimation procedure, and the second reliability for the estimation result. 30. The information acquisition program according to claim 29, wherein association information is determined.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005135422A JP4485989B2 (en) | 2005-05-06 | 2005-05-06 | Information acquisition apparatus, information acquisition method, information acquisition program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005135422A JP4485989B2 (en) | 2005-05-06 | 2005-05-06 | Information acquisition apparatus, information acquisition method, information acquisition program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2006313994A true JP2006313994A (en) | 2006-11-16 |
JP4485989B2 JP4485989B2 (en) | 2010-06-23 |
Family
ID=37535309
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005135422A Expired - Fee Related JP4485989B2 (en) | 2005-05-06 | 2005-05-06 | Information acquisition apparatus, information acquisition method, information acquisition program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4485989B2 (en) |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091465A (en) * | 2000-09-05 | 2002-03-27 | Internatl Business Mach Corp <Ibm> | Data processing detecting system, additional information embedding device, additional information detector, digital contents, music contents processor, additional data embedding method and contents processing detecting method, storage medium and program transmitter |
JP2004023786A (en) * | 2002-06-18 | 2004-01-22 | Samsung Electronics Co Ltd | Method and apparatus for extracting repeatedly inserted watermark |
-
2005
- 2005-05-06 JP JP2005135422A patent/JP4485989B2/en not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002091465A (en) * | 2000-09-05 | 2002-03-27 | Internatl Business Mach Corp <Ibm> | Data processing detecting system, additional information embedding device, additional information detector, digital contents, music contents processor, additional data embedding method and contents processing detecting method, storage medium and program transmitter |
JP2004023786A (en) * | 2002-06-18 | 2004-01-22 | Samsung Electronics Co Ltd | Method and apparatus for extracting repeatedly inserted watermark |
Also Published As
Publication number | Publication date |
---|---|
JP4485989B2 (en) | 2010-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Holub et al. | Random projections of residuals for digital image steganalysis | |
JP6173542B1 (en) | Image processing apparatus, image processing method, and program | |
EP2608104B1 (en) | Image processing device, image processing method, and image processing program | |
JP2006050551A (en) | Image processing apparatus, image processing method, program and storage medium | |
JP4631900B2 (en) | Information processing apparatus, information processing system, and information processing program | |
JP4532331B2 (en) | Information embedding device, information extracting device, information embedding method, information extracting method, information embedding program, and information extracting program | |
JP4712885B2 (en) | Image processing apparatus and image processing method | |
JP4867620B2 (en) | Image processing apparatus and image processing program | |
JP5731027B2 (en) | Direction determining apparatus, direction determining method, and computer-readable recording medium | |
JP5010636B2 (en) | Image processing method and computer-readable recording medium recording program | |
JP5335581B2 (en) | Image processing apparatus, image processing method, and program | |
JP2007143123A (en) | Image processing apparatus, image processing method, image processing program, and recording medium | |
JP5036643B2 (en) | Information processing apparatus, information processing method, and program | |
JP5703898B2 (en) | Form management system, form image management method, and program | |
JP4966260B2 (en) | Image processing method, image processing apparatus, program, and computer-readable storage medium | |
JP4485989B2 (en) | Information acquisition apparatus, information acquisition method, information acquisition program, and recording medium | |
JP2007109177A (en) | Image processing apparatus, its control method, and program | |
JP2006237858A (en) | Image processing apparatus, image processing method, program for allowing computer to execute the method, and recording medium | |
JP2008085579A (en) | Device for embedding information, information reader, method for embedding information, method for reading information and computer program | |
JP2005341493A (en) | Information embedding apparatus, information detecting apparatus, information embedding/detecting system, information embedding method, information detecting method, information embedding/detecting method, information embedding program, information detecting program, information embedding/detecting program and recording medium | |
JP2019091976A (en) | Program, image processing apparatus, and image processing method | |
JP4575873B2 (en) | Image processing device | |
JP5612851B2 (en) | Information processing apparatus, information processing method, and program | |
JP3995844B2 (en) | A method and apparatus for extracting texture feature amounts and comparing texture feature amounts for different digital gradation images, and a program for extracting texture feature amounts and comparing texture feature amounts for different digital gradation images recoding media | |
JP2007228281A (en) | Image processing method, image processing device, image processing program, and information recording medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080423 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100316 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100325 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4485989 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130402 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140402 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |