JP4934124B2 - Image forming apparatus - Google Patents
Image forming apparatus Download PDFInfo
- Publication number
- JP4934124B2 JP4934124B2 JP2008276518A JP2008276518A JP4934124B2 JP 4934124 B2 JP4934124 B2 JP 4934124B2 JP 2008276518 A JP2008276518 A JP 2008276518A JP 2008276518 A JP2008276518 A JP 2008276518A JP 4934124 B2 JP4934124 B2 JP 4934124B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- chapter division
- chapter
- image
- page
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Facsimiles In General (AREA)
- Editing Of Facsimile Originals (AREA)
Description
本発明は、章分け機能を搭載した画像形成装置に関する。 The present invention relates to an image forming apparatus equipped with a chapter division function.
最近の画像形成装置では、デジタル化した原稿画像を一度画像メモリに蓄積し、種々の加工を施した後、記録媒体に印刷できるようにしている。
このような画像形成装置には、大量の印刷に章分けなどの区切り処置を行う章分け機能を搭載したものがある。
この章分け機能は、両面印刷において指定されたページを、それが偶数番ページ(通常は記録用紙の裏面に印刷される)であっても記録用紙の表面に印刷して次ページを該記録用紙の裏面に印刷するものである。
In recent image forming apparatuses, a digitized document image is once stored in an image memory, and after various processing, it can be printed on a recording medium.
Some of these image forming apparatuses are equipped with a chapter division function for performing a separation process such as chapter division for a large amount of printing.
This chaptering function prints the specified page in double-sided printing on the front side of the recording paper even if it is an even-numbered page (usually printed on the back side of the recording paper) and the next page on the recording paper. It prints on the back side.
特許文献1では、ユーザが章ごとの先頭ページおよびタイトル情報を指定して、読み取った原稿画像を指定された章ごとの先頭ページで章分けするとともに、章番号付きのタイトルを合成して印刷している。これにより、章ごとに視認性の高い記録用紙を出力することができる。 In Patent Document 1, the user specifies the first page and title information for each chapter, divides the read original image into chapters by the first page for each specified chapter, and synthesizes and prints titles with chapter numbers. ing. Thereby, it is possible to output a highly visible recording sheet for each chapter.
また、近年、パーソナルコンピュータの高機能化、低価格化に伴い、オフィスにおける文書の電子ファイル化が急速に進んでいる。文書を電子化して閲覧するためのフォーマットとして、現在、最も普及しているフォーマットは、米国アドビ社が開発したPDF(Portable Document Format)形式である。このPDF形式の文書は、ハードウェアに依存することなしに、常に同じ態様で閲覧や印刷を行うことができるという特徴をもち、この形式は標準的な閲覧フォーマットの地位を確立している。 In recent years, with the increase in functionality and price of personal computers, the creation of electronic files for documents in offices is rapidly progressing. As a format for digitizing and browsing a document, the most popular format at present is a PDF (Portable Document Format) format developed by Adobe in the United States. This PDF document has a feature that it can always be browsed and printed in the same manner without depending on hardware, and this format has established the status of a standard browsing format.
このPDF形式では、表示装置上で閲覧中に特定のページや項目へと即座に表示内容を変えるリンク機能を付加することも可能になっており、PDF形式で作成された電子文書には、リンク情報をもった索引や目次が用意されるのが一般的である。
一般に、章分け箇所は、ページの先頭行とは限らず、先頭以外の行にも存在しているのが実情である。しかし、特許文献1では、ページ単位でしか章分けができないので、このような先頭以外の行に章分け箇所がある原稿文書には利用できない。さらに、章分けした原稿文書を記憶装置等へ保存することができない。 In general, chapter divisions are not limited to the top line of a page, but are actually present in lines other than the top line. However, since Patent Document 1 can divide chapters only in page units, it cannot be used for a manuscript document having chapter divisions on lines other than the top. Furthermore, the document document divided into chapters cannot be stored in a storage device or the like.
また、PDF形式の電子文書では、章が存在する対応ページを拾い出す作業を行わねばならず、また、リンク機能をもたせるためには、リンク情報を付加するための余分な作業を行わねばならないため、リンク情報付の電子文書を作成するユーザには大きな作業負担がかかる。 Also, in an electronic document in PDF format, an operation for picking up a corresponding page in which a chapter exists must be performed, and in order to provide a link function, an extra operation for adding link information must be performed. A user who creates an electronic document with link information is burdensome.
本発明は、上述の実情を考慮してなされたものであって、読み込んだ原稿画像にユーザの希望通りの章分け箇所を設定し、該章分け箇所にリンク情報を付加した原稿の電子文書の保存を行う画像形成装置を提供することを目的とする。 The present invention has been made in consideration of the above-described circumstances, and sets a chapter division as desired by the user in the read original image, and an original electronic document in which link information is added to the chapter division. An object of the present invention is to provide an image forming apparatus that performs storage.
上記の課題を解決するために、本発明の画像形成装置は、複数ページからなる原稿を読み取って電子文書を作成可能な画像形成装置において、読み取った原稿画像を文字認識して抽出した行単位の文字列から、ユーザから与えられた条件に基づいて、章分け箇所の候補行を抽出して該候補行の画像に仮マーカー付けし、前記仮マーカー付けした候補行を含むページの画像を表示して、ユーザからの指示に基づいて前記候補行が章分け箇所であることを確定し、前記確定された章分け箇所にマーカー付けして原稿画像を修正するとともに、該章分け箇所の行から抽出した文字列と前記章分け箇所とを関連付けしたリンク情報を含むアウトラインデータを生成し、すべての原稿画像と、該アウトラインデータとからリンク情報付の電子文書を生成する。 In order to solve the above-described problems, an image forming apparatus according to the present invention is an image forming apparatus capable of reading an original consisting of a plurality of pages and creating an electronic document. Based on the condition given by the user from the character string, the candidate line of the chapter division part is extracted, the temporary marker is added to the image of the candidate line, and the image of the page including the candidate line with the temporary marker is displayed. Then, based on an instruction from the user, the candidate line is confirmed to be a chapter division part, and the document image is corrected by marking the determined chapter division part and extracted from the line of the chapter division part. Generates outline data including link information that associates the character string and the chapter section with each other, and generates an electronic document with link information from all the original images and the outline data. That.
上述の章分け箇所の候補行は、次の1つ以上の条件の組み合わせで抽出する。
(1)原稿画像内の行の文字サイズがユーザの指定した文字サイズより大きいときに、該行を章分け箇所の候補行とする。
(2)原稿画像内の空白行数がユーザの指定した空白行数より大きいときに、空白行の次の行を章分け箇所の候補行とする。
(3)ユーザの指定したページ番号に合致した原稿画像内の先頭行を章分け箇所の候補行とする。
(4)原稿画像内の行の文字列にユーザの指定した文字列含むときに、該行を章分け箇所の候補行とする。
(5)原稿画像内のユーザの指定した行を章分け箇所の候補行とする。
Candidate lines for the above-mentioned chapter division locations are extracted by a combination of one or more of the following conditions.
(1) When the character size of a line in the document image is larger than the character size specified by the user, the line is set as a candidate line for a chapter division part.
(2) When the number of blank lines in the document image is larger than the number of blank lines specified by the user, the next line after the blank line is set as a candidate line for the chapter division part.
(3) The first line in the document image matching the page number designated by the user is set as a candidate line for the chapter division part.
(4) When the character string specified by the user is included in the character string of the line in the document image, the line is set as a candidate line for the chapter division part.
(5) A line designated by the user in the document image is set as a candidate line for a chapter division.
本発明によれば、読み込んだ原稿画像にユーザの希望通りの章分け箇所を設定し、該章分け箇所にリンク情報を付加した電子文書を保存できるので、リンク情報付の電子文書を作成するユーザの作業負担を軽減させることができる。 According to the present invention, a chapter division as desired by the user can be set in the read original image, and an electronic document with link information added to the chapter division can be stored. Therefore, a user who creates an electronic document with link information Work load can be reduced.
さらに、上記の電子文書を章ごとに印刷したい場合、表示されたリンク情報により章の位置を即座に見つけることができるので、原稿を一枚一枚確認して章ページを選び出す必要がなくなる。 Furthermore, when it is desired to print the electronic document for each chapter, the position of the chapter can be immediately found by the displayed link information, so that it is not necessary to check each manuscript and select a chapter page.
以下、図面を参照して本発明の画像形成装置に係る好適な実施形態について説明する。本実施形態では、画像形成装置として、多機能を備えた複合機(MFP)を用いて説明する。 Hereinafter, preferred embodiments according to an image forming apparatus of the present invention will be described with reference to the drawings. In this embodiment, an image forming apparatus will be described using a multifunction peripheral (MFP) having multiple functions.
図1は、本実施形態のMFPのハードウェアの概略構成を示すブロック図である。同図において、MFP100は、制御部101、記憶部102、操作パネル103、画像読取部104、画像出力部105、ネットワークインターフェース106、システムバス107から構成されている。
FIG. 1 is a block diagram illustrating a schematic configuration of hardware of the MFP according to the present embodiment. In FIG. 1, the MFP 100 includes a control unit 101, a
制御部101は、制御プログラムを実行するCPU、制御プログラムや各種データを格納するROM、主にワークエリアとして使われるRAM等からなり、MFP100全体を制御する。
The control unit 101 includes a CPU that executes a control program, a ROM that stores control programs and various data, a RAM that is mainly used as a work area, and the like, and controls the
記憶部102は、例えば、大容量のハードディスクからなり、画像読取部104で読み取った画像データや、ネットワークインターフェース106で接続された外部の端末装置から送信された画像データを記憶管理するデータベースを構成する。
The
画像読取部104は、オートドキュメントフィーダ(ADF)を含み、束状のあるいは1枚の原稿画像を光源で照射し、原稿反射像をレンズで固体撮像素子上に結像し、固体撮像素子からラスタ状の画像読取信号を所定密度の画像データとして取得して、一旦記憶部102に記憶する。ここでは、読み取った原稿の画像データは、PDF形式に規定されている形式であるものとする。
画像出力部105は、記憶部102に一旦記憶された画像データを制御部101で記録信号に変換し、順次出力して紙上に画像を形成する。
The
The
操作パネル103は、タッチパネルと一体となった表示部、テンキー、キーボード、スタートボタン、ストップボタン等を備えており、各種情報の表示および各種指示の入力に使用され、ユーザの指示や表示は制御部101で制御される。
The
ネットワークインターフェース106は、イーサネット(登録商標)、トークンリング、FDDI等の規格によりコンピュータ等の端末装置やネットワーク機器同士を接続する際に使用する。
また、ネットワークインターフェース106を介して外部に送信するには、制御部101において、画像読取部104から得られる画像データを外部出力用の画像ファイルへと変換して出力する。
また、ネットワークインターフェース106介して外部から受信するには、制御部101において、外部の端末装置から出力された印刷データを制御部101が受信し、その印刷データを画像出力部105で印刷可能なラスタデータに変換した後、画像出力部105によって印刷用紙上に画像を形成する。
システムバス107は、CPUに接続するデータバス、アドレスバスおよび制御信号バス等であり、制御部101が当該システムバスを介して各部を制御する。
The
In order to transmit to the outside via the
In order to receive from the outside via the
A system bus 107 is a data bus, an address bus, a control signal bus, or the like connected to the CPU, and the control unit 101 controls each unit via the system bus.
次に、制御部101の本発明に係る部分について説明する。
図2は、制御部101の詳細な機能構成図であり、制御部101は、章分け条件取得部111、テキスト抽出部121、マーカー設定部131、章分け情報確定部141、PDF変換部151、章分け情報記憶部161、操作履歴記憶部171、PDF文書記憶部181を含んで構成されている。
Next, the part which concerns on this invention of the control part 101 is demonstrated.
FIG. 2 is a detailed functional configuration diagram of the control unit 101. The control unit 101 includes a chaptering condition acquisition unit 111, a
まず、各記憶部について説明する。
章分け情報記憶部161は、画像読取部104で読み取られた画像データを各ページ毎に次のような項目を記憶する。
ページ番号:読み取った画像データの各ページに振られた番号である。
画像データ:1ページ分の画像データである。
First, each storage unit will be described.
The chapter division information storage unit 161 stores the following items for each page of the image data read by the
Page number: A number assigned to each page of the read image data.
Image data: One page of image data.
以下のライン番号、マーカーフラグ、文字サイズ、文字列、文字列の領域座標は、上記の画像データの1ページに存在する文字領域から抽出された行毎に設けられるデータ項目である。
ライン番号:ページに含まれる文字領域から抽出した各行毎に振られる順番号である。
マーカーフラグ:下記の文字列にマーカーを付加するか否かを表わすフラグ情報であり、「有」のときは、下記の文字列が章タイトルを表わしており、この文字列(章タイトル)にマーカーを付加するとともに、アウトラインデータとして文字列(章タイトル)とのリンク情報を生成することを示す。また、「無」のときには、下記文字列は、章タイトル以外の単なる文字列または空行であることを示す。
文字列:下記文字列の領域範囲の画像データを文字認識してテキスト化した時の文字コードである。空行のときには空行を表わすコードとする。
文字列の領域範囲:行内にある文字列が1ページ分の画像データのどこにあったかを示す、先頭文字と最後文字の座標である。
文字サイズ:上記文字列の先頭文字のサイズである。
The following line number, marker flag, character size, character string, and region coordinates of the character string are data items provided for each line extracted from the character region existing on one page of the image data.
Line number: A sequential number assigned to each line extracted from the character area included in the page.
Marker flag: Flag information indicating whether or not to add a marker to the following character string. When “Yes”, the following character string represents the chapter title, and this character string (chapter title) has a marker. Is added, and link information with a character string (chapter title) is generated as outline data. When “None” is indicated, the following character string indicates a simple character string other than a chapter title or a blank line.
Character string: This is a character code when the image data in the area range of the following character string is recognized and converted into text. If the line is blank, the code represents the blank line.
Area range of character string: The coordinates of the first character and the last character indicating where the character string in the line is in one page of image data.
Character size: The size of the first character of the above character string.
操作履歴記憶部171は、章分け情報確定部141において、プレビュー表示したページの画像に表示されたマーカー付きの文字列(章タイトル)を章分け箇所とするか否かの設定を操作履歴として累積記憶する。この記憶部には、章分け有効または章分け無効の種類と、その対象となったページ番号と、章分け箇所の判断の元になった行のライン番号を対応付けて記憶する。
The operation history storage unit 171 accumulates, as an operation history, a setting as to whether or not a character string with a marker (chapter title) displayed in the preview-displayed page image in the chapter division
PDF文書記憶部181は、PDF変換部151によって生成したリンク情報付きのPDF形式の電子文書を記憶する。この電子文書には、章分け箇所となった文字列にマーカーが付加されたすべての原稿ページの画像データ、該画像データから抽出した行毎の文字列、マーカーが付加された文字列とこの文字列のあった画像データの位置とを関連付ける情報を持つアウトラインデータが含まれている。
The PDF
次に、処理機能について説明する。
ユーザが章分け機能を利用するときには、まず、操作パネル103から原稿読取の設定を入力し、図3に例示したような章分け機能指示画面を操作パネル103の表示部に表示させる。この章分け機能指示画面には、章分け機能ボタン301、設定リセットボタン302、閉じるボタン303、次の原稿ありボタン304、次の原稿なしボタン305、スタートボタン306が表示される。これらのボタンが押されると、ボタン部分の表示濃度が増大し、選択されたことがユーザに識別可能になっている。
Next, the processing function will be described.
When the user uses the chapter division function, first, an original reading setting is input from the
章分け機能ボタン301は、章分け機能を使用するか否かを選択するボタンである。
設定リセットボタン302は、この画面で設定した設定内容を初期化するためのボタンである。
閉じるボタン303は、画像読取動作を終了するボタンである。
次の原稿ありボタン304は、原稿の束を読み取った後に次の原稿の束があることを選択するためのボタンである。原稿が多いときには、原稿をいくつかの束に分けてその束毎に次の原稿ありボタン304とスタートボタン306を押し、最後の束のときに次の原稿なしボタン305とスタートボタン306を押して、すべての原稿を読み込ませるのに使う。
次の原稿なしボタン305は、原稿の束を読み取った後に次の原稿がないことを選択するためのボタンである。
スタートボタン306は、原稿の読取動作を開始させるためのボタンである。
The chapter
A setting
A
The next
The next original no
A
そして、ユーザは、章分け機能ボタン301および次の原稿ありボタン304または次の原稿なしボタン305を選択し、原稿の束をADFにセットし、スタートボタン306を押す。
制御部101は、スタートボタン306が押されたことを検知すると、画像読取部104により読み取ったすべての原稿の画像データを1ページごとにページ番号を振って、章分け情報記憶部161に記憶し、すべての原稿が読み終わると章分け条件取得部111を起動する。
Then, the user selects the
When the control unit 101 detects that the
章分け条件取得部111は、図4に例示するような章分け条件選択画面を操作パネル103の表示部に表示する。この章分け条件選択画面には、文字サイズボタン401、空白行ボタン402、ページ指定ボタン403、ユーザ設定ボタン404、全ページ検査ボタン405、キャンセルボタン406、OKボタン407が表示される。
The chapter division condition acquisition unit 111 displays a chapter division condition selection screen as illustrated in FIG. 4 on the display unit of the
文字サイズボタン401は、章分けを実行する際に、指定した文字サイズを基準として章分けする箇所を設定するボタンである。
空白行ボタン402は、指定した空白行数を基準として章分けする箇所を設定するボタンである。空白行の次の行が章分けの先頭行とする。
ページ指定ボタン403は、ページ番号を指定して章分けする箇所を設定するボタンである。
ユーザ設定ボタン404は、ユーザが文字列を指定して章分け箇所を設定するボタンである。
全ページ検査ボタン405は、文書の各ページをプレビュー画面で確認し、1箇所ずつ章分け箇所を設定するボタンである。
キャンセルボタン406は、既に選択した条件をすべて初期化するボタンである。
OKボタン407は、章分け条件の設定が完了した場合に使用するボタンである。
A
The
A
The
The all
A cancel
An
章分け条件取得部111は、文字サイズボタン401、空白行ボタン402、ページ指定ボタン403、ユーザ設定ボタン404のいずれかが押されたことを検知すると、ボタンに応じた基準値を入力する入力欄を表示し、その入力を促す。基準値の入力後、OKボタン407が押されたことを検知すると、これまでに取得したすべての章分け条件の種類と基準値を対応付けて制御部101に戻す。
しかし、OKボタン407が押される前にキャンセルボタン406が押されたことを検知すると、これまでに指定した章分け条件の種類と基準値を消去して、次のボタンが押されるまで待機する。
When the chaptering condition acquisition unit 111 detects that any one of the
However, if it is detected that the cancel
上記の基準値は、各章分け条件によって、次のように指定する。
例えば、文字サイズボタン401が押されると、図5に例示するように、文字サイズ設定欄408と設定文字サイズプレビュー画面409が表示される。
文字サイズ設定欄408は、選択中にテンキーを使用して、章分け箇所の基準となる文字サイズを入力する。設定文字サイズプレビュー画面409には、設定した文字サイズの文字『A』が表示され、章分けの基準となる文字サイズがどのくらいの大きさなのかを実際に見て確認することができる。
The above reference values are specified as follows according to the chapter division conditions.
For example, when the
A character
また、空白行ボタン402が押されると、図6に例示するように、空白行数設定欄410が表示される。空白行数設定欄410は、選択中にテンキーを使用して、章分け箇所を判断する基準となる空白行数を入力する。
When the
また、ページ指定ボタン403が押されると、図7に例示するように、ページ番号設定欄411が表示される。ページ番号設定欄411は、選択中にテンキーを使用して、章分けを行うページ番号を入力する。このページ指定の場合には、図8に例示するように、各章の章タイトルは、ページの先頭行になければならない。例えば、図8の場合、各章のページ番号が1,2,3,6,9,12であるから、図7のように、ページ番号設定欄411には『1,2,3,6,9,12』を入力する
When the
また、ユーザ設定ボタン404が押されると、図9に例示するように、ユーザ指定文字列設定欄412が表示される。ユーザ指定文字列設定欄412は、選択中にテンキーを使用して、章分け箇所となる行に含まれる文字列を入力する。例えば、図9の場合、各章のタイトル内に指定された文字列『2008/』が含まれると、この行を章分け箇所とする。
When the
また、全ページ検査ボタン405が押されたときには、指定されたページをプリビュー表示して、章分け箇所を指でなぞって指定するので、図10に例示するように基準値の指定は行われない。
Also, when the all
上記の章分け条件は、1つの指定であってもよいし、また、複数個を組み合わせて行っても構わない。例えば、空白行数が3行以上あり、且つ空白行の次行の先頭文字のサイズが20pt以上であるときに行を章分け箇所と指定したい場合には、文字サイズボタン401と空白行ボタン402を両方選択して基準値を設定する。
The above chaptering condition may be one designation, or a plurality of chaptering conditions may be combined. For example, when the number of blank lines is 3 or more and the size of the first character of the next line after the blank line is 20 pt or more and a line is to be designated as a chapter division part, the
次に、制御部101は、テキスト抽出部121を起動する。
テキスト抽出部121は、公知の技術を用いて、次のような手順により、1ページごとに各行内の文字列に関する情報を抽出して章分け情報記憶部161を更新して、制御部101に戻る。
Next, the control unit 101 activates the
The
(1)1ページの画像データの文字領域を判別する。
(2)この文字領域から行を表わす行領域を抽出する。
(3)各行領域について、文字が存在する領域範囲を抽出する。
この領域範囲は、先頭文字と最後文字の座標で示す。例えば、横書きの場合には、文字列のあった領域の左上隅の座標を先頭文字の座標とし、領域の右下隅の座標を最後文字の座標とする。縦書きの場合には、領域の右上隅の座標を先頭文字の座標とし、領域の左下隅の座標を最後文字の座標とする。
(4)この文字の存在する領域範囲について文字認識を行って、行の文字コード列を取得する。
(5)この文字の存在する領域範囲にある文字列の先頭文字の文字サイズを取得する。
(6)上記の取得した各行について、章分け情報記憶部161のライン番号、マーカーフラグ、文字列、文字サイズ、文字列の領域範囲を更新する。ここで、ライン番号は、ページ毎に各行に振られた順番号であり、マーカーフラグは「無」とする。
(1) The character area of one page of image data is determined.
(2) A line area representing a line is extracted from the character area.
(3) For each line area, extract an area range where characters exist.
This area range is indicated by the coordinates of the first character and the last character. For example, in the case of horizontal writing, the coordinates of the upper left corner of the area where the character string is located are the coordinates of the first character, and the coordinates of the lower right corner of the area are the coordinates of the last character. In the case of vertical writing, the coordinates of the upper right corner of the area are the coordinates of the first character, and the coordinates of the lower left corner of the area are the coordinates of the last character.
(4) Character recognition is performed for the area range in which this character exists, and the character code string of the line is acquired.
(5) The character size of the first character of the character string in the area range where this character exists is acquired.
(6) The line number, marker flag, character string, character size, and character string area range of the chapter division information storage unit 161 are updated for each acquired line. Here, the line number is a sequential number assigned to each line for each page, and the marker flag is “none”.
次に、制御部101は、マーカー設定部131を起動して、章分け条件取得部111から取得したすべての章分け条件の種類と対応する基準値を送る。
マーカー設定部131は、制御部101から送られてきた章分け条件の種類および基準値を参照して、ページ毎にすべての行に対してマーカーフラグを決定して、章分け情報記憶部161を更新し、制御部101に戻る。
Next, the control unit 101 activates the
The
マーカーフラグは、指定された章分け条件にもとづいて、章分け情報記憶部161に記憶されているすべての行について判定が行われる。
また、指定された章分け条件が複数ある場合には、すべてのページに対して章分け条件を1つずつ適用して、各行のマーカーフラグを設定する。
The marker flag is determined for all the rows stored in the chaptering information storage unit 161 based on the specified chaptering condition.
If there are a plurality of designated chapter division conditions, the chapter division conditions are applied to all pages one by one, and the marker flag of each line is set.
(1)文字サイズによる章分け:
行の文章の先頭文字の文字サイズが指定された基準値より大きいか等しいときに、この行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(1) Chapter division by character size:
When the character size of the first character of the sentence in the line is greater than or equal to the specified reference value, this line is determined as the chapter division line, and the marker flag is set to “present”.
(2)空白行による章分け:
連続した空行の個数が指定された基準値より大きいか等しいときに、空行の次の行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(2) Chapter division by blank lines:
When the number of consecutive blank lines is greater than or equal to the specified reference value, the next line after the blank line is determined as the chapter division line, and the marker flag is set to “present”.
(3)ページ指定による章分け:
指定されたページの先頭行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(3) Chapter division by page designation:
The first line of the specified page is determined as the chapter division line, and the marker flag is set to “present”.
(4)ユーザ設定による章分け:
指定された文字列を含む行を章分け箇所の行と決定し、マーカーフラグを「有」に設定する。
(4) Chapter division by user setting:
The line containing the specified character string is determined to be a chapter division line, and the marker flag is set to “present”.
(5)全ページ検査による章分け:
この場合には、事前にマーカーフラグの設定はしない。
(5) Chapter division by all page inspection:
In this case, the marker flag is not set in advance.
次に、制御部101は、章分け情報確定部141を起動する。
この章分け情報確定部141は、マーカー設定部131で仮に設定された章分け箇所の行をユーザによって確定するものであり、その動作は、(1)「文字サイズ」、「空白行」、「ページ指定」、「ユーザ設定」による章分け条件が指定された場合と、(2)「全ページ検査」による章分け条件が指定された場合とでは、異なるので分けて説明する。
Next, the control unit 101 activates the chapter division
The chapter division
(1)章分け情報確定部141は、章分け条件として、「文字サイズ」、「空白行」、「ページ指定」、「ユーザ設定」が指定された場合、図11に例示するような章分け箇所の確定画面を操作パネル103の表示部に表示する。
(1) The chapter division
この章分け箇所の確定画面には、プレビュー表示画面501、プレビュー表示しているページ番号表示502、読み取った原稿の全ページ数表示503、章分けページリスト表示504、章分けページリスト表示用スクロールバー505、章分けページリスト用ページ番号506、章分け有効(はい)ボタン507、章分け無効(いいえ)ボタン508、戻るボタン509、設定リセットボタン510、設定完了ボタン511が表示される。
The chapter division confirmation screen includes a
この章分けページリスト表示504には、マーカー設定部131で仮に設定した章分け箇所を含むページ(マーカーフラグが「有」である行を含むページ)のページ番号のリストが表示される。
ユーザが正しく章分けされたかを確かめたいときに、このリストにある確かめたいページ番号をタッチして選択する。
The chapter division
When the user wants to check whether the chapter is correctly divided, the page number to be checked in this list is touched and selected.
章分け情報確定部141は、このタッチを検出すると、タッチ位置からページ番号を決定して、プレビュー表示中ページ番号表示502にタッチしたページ番号が表示し、そのページの画像をプレビュー表示画面501に表示する。この画像には、文字列(章タイトル)にマーカーが付されて表示される。
When detecting this touch, the chaptering
例えば、図12のように、章分けページリスト表示504でページ番号20を選択すると、プレビュー表示中ページ番号表示502に「20」が表示され、プレビュー表示画面501にページ番号20の画像が表示される。この画像には、章タイトル「2.目的」にマーカー512が付けられて表示される。
For example, as shown in FIG. 12, when
ユーザは、プレビュー表示画面501にプレビューされた画像を見て、正しくマーカーが付されていると判断したときには、章分け有効ボタン(はい)507を押す(図13)。
この場合、章分け情報確定部141は、押したボタンの種類(このときは「章分け有効ボタン」である)と、ページ番号(「20」)と、マーカーの付されていたライン番号とを対応付けて操作履歴記憶部171に累積記憶する。
When the user looks at the previewed image on the
In this case, the chapter division
また、ユーザは、プレビュー表示画面501にプレビューされた画像を見て、正しくマーカーが章分け箇所の行に付されていないと判断したときには、章分け無効ボタン(いいえ)508を押す(図14)。
この場合、章分け情報確定部141は、図14のように章分けページリスト表示504内のページ番号「20」を削除し、プレビュー表示画面501やプレビュー表示中ページ番号表示502を初期状態に戻すとともに、押したボタンの種類(このときは「章分け無効ボタン」である)と、ページ番号(「20」)と、マーカーの付されていたライン番号とを対応付けて操作履歴記憶部171に累積記憶する。
Also, when the user views the previewed image on the
In this case, the chapter division
また、章分け情報確定部141は、戻るボタン509が押されたことを検知すると、操作履歴記憶部171に記憶していた最後に行った操作の逆操作を行ったときの表示を行うとともに、最後の操作履歴を削除する。
また、章分け情報確定部141は、設定リセットボタン510が押されたことを検知すると、テキスト抽出部121で抽出した章分け状態の表示に戻すとともに、操作履歴記憶部171も初期状態に戻す。
また、章分け情報確定部141は、設定完了ボタン511が押されたことを検知すると、制御部101に戻る。
In addition, when the chapter division
Further, when detecting that the setting
Further, the chapter division
(2)章分け情報確定部141は、「全ページ検査」による章分け条件が指定された場合、図15に例示するような章分け箇所の確定画面を操作パネル103の表示部に表示する。
図15の画面に表示された各ボタンの意味は、上述の図11と同じであるので説明を省略する。但し、「全ページ検査」の条件の場合には、プレビュー表示画面501をタッチパネルとして使用する点が相違する。
(2) When the chapter division condition by “all page inspection” is designated, the chapter division
The meaning of each button displayed on the screen of FIG. 15 is the same as that of FIG. However, the “all page inspection” condition is different in that the
ユーザは、章分けページリスト表示504には、ページ番号が一つも表示されていないので、全ページ数表示503に表示されたページ数(図15の場合は120ページ)の中から、表示したいページ番号を適宜選んで、テンキーによりプレビュー表示中ページ番号表示502に入力し、プレビュー表示画面501でそのページの画像を確認しながら、1ページごとに章分け箇所を設定していく。
Since no page number is displayed in the chapter division
章分け情報確定部141は、プレビュー表示中ページ番号表示502が選択され、テンキーからページ番号「20」が入力されたことを検知すると、章分け情報記憶部161を参照して、指定されたページ番号「20」に対応する画像を取得して、図16のようにプレビュー表示画面501に表示する。
When the chapter number
図16において、ユーザがページ番号「20」中の『2.目的』という行を章分け箇所として使用したい場合には、プレビュー表示画面501の『2.目的』という文字列を「指」でなぞる(図17の矢印513)。
章分け情報確定部141は、プレビュー表示画面501が指でなぞられたことを検知し、指でなぞられた位置の『2.目的』の部分にマーカー513を付加してプレビュー表示画面501の表示を更新する。
In FIG. 16, the user selects “2. When it is desired to use the line “Purpose” as a chapter division, “2. The character string “purpose” is traced with a “finger” (
The chapter division
さらに、このマーカー513が付加された状態で、章分け有効ボタン507が押されたことを検知すると、指でなぞられた位置と、文字列『2.目的』の領域範囲とからページ内のライン番号を決定し、章分けページリスト表示504にページ番号「20」を追加表示する(図18)。この場合、章分け情報確定部141は、押したボタンの種類(このときは「章分け有効ボタン」である)と、ページ番号(「20」)と、指でなぞられた文字列に対応するライン番号とを対応付けて操作履歴記憶部171に累積記憶する。
Further, when it is detected that the chapter division
同様にして、プレビュー表示画面501でそのページの画像を確認しながら、1ページごとに章分け箇所を設定していき、最後に、設定完了ボタン511が押されたときに、制御部101に戻る。
Similarly, while checking the image of the page on the
次に、制御部101は、PDF変換部151を起動する。
PDF変換部151は、章分け情報記憶部161に記憶した情報および操作履歴記憶部171に記憶した操作履歴からリンク情報付きのPDF形式の電子文書を生成してPDF文書記憶部181に記憶し、制御部101に戻る。
Next, the control unit 101 activates the
The
上記の変換処理は、まず、操作履歴記憶部171に記憶した操作履歴を順に取り出して、操作が「章分け有効ボタン」であるときには、対応するページ番号のライン番号のマーカーフラグを「有」に設定し、また、「章分け無効ボタン」であるときには、対応するページ番号のライン番号のマーカーフラグを「無」に設定して、章分け情報記憶部161を更新する。 In the above conversion process, first, operation histories stored in the operation history storage unit 171 are sequentially extracted. When the operation is a “chapter effective button”, the marker flag of the line number of the corresponding page number is set to “present”. When it is set to “invalid chapter division button”, the marker flag of the line number of the corresponding page number is set to “none”, and the chapter division information storage unit 161 is updated.
次に、章分け情報記憶部161に記憶した各ページの画像データを、マーカーフラグが「有」に設定されているライン番号の文字列(章タイトル)にマーカーを付して修正する。
また、章分け情報記憶部161のすべてのライン番号について、マーカーフラグが「有」に設定されているライン番号の文字列(章タイトル)およびページ番号を取り出して、章タイトルとページ番号とからなるアウトラインデータを作成する(PDF形式におけるしおりに相当する)。
さらに、このアウトラインデータ中の文字列と、該文字列に対応するマーカー付きの文字列とをリンクで接続するリンク情報を作成する。
最後に、作成されたすべてのページについて、画像データ、すべての行の文字列コードと、アウトラインデータをまとめてPDF形式の電子文書を生成して、PDF文書記憶部181に記憶する。
Next, the image data of each page stored in the chapter division information storage unit 161 is corrected by adding a marker to the character string (chapter title) of the line number for which the marker flag is set to “present”.
Further, for all line numbers in the chapter division information storage unit 161, the character string (chapter title) and page number of the line number for which the marker flag is set to “exist” are extracted, and the chapter title and page number are included. Outline data is created (corresponding to a bookmark in PDF format).
Further, link information for connecting the character string in the outline data and a character string with a marker corresponding to the character string by a link is created.
Finally, for all the created pages, the image data, the character string codes of all the lines, and the outline data are combined to generate an electronic document in PDF format, and stored in the PDF
上述のように、章分け機能を利用すると、原稿からPDF形式のリンク情報付の電子文書を作成することができ、このPDF文書記憶部181に記憶された文書データをネットワークで接続された外部の端末装置へ送信することもできるし、また、これをもとに印刷することもできる。
As described above, by using the chapter division function, an electronic document with link information in PDF format can be created from a manuscript, and the document data stored in the PDF
また、上述のようにして作成されたリンク情報付の電子文書をネットワークで接続した端末装置から読み込んだり、USB等のインターフェースで接続した記憶装置から読み込んだときには、制御部101は、PDF文書記憶部181に記憶された画像データのうち、アウトラインデータと先頭ページの画像を図19のように操作パネル103の表示部に表示する。図19では、アウトラインデータ601とページの画像データ602が表示される。画像データ602には、最初は先頭ページが表示されるが、アウトラインデータ601の中の文字列(章タイトル)をタッチすると、その文字列を含むページの画像が表示される。
このように、ユーザは、アウトラインデータ601に表示された章タイトルを選択することによって、その章の印刷だけを速やかに指示することができる。
When the electronic document with link information created as described above is read from a terminal device connected via a network or read from a storage device connected via an interface such as a USB, the control unit 101 displays a PDF document storage unit. Among the image data stored in 181, outline data and the first page image are displayed on the display unit of the
As described above, the user can promptly instruct only the printing of the chapter by selecting the chapter title displayed in the
尚、本発明は上述した実施形態に限定されず、本発明の要旨を逸脱しない範囲内で各種の変形、修正が可能であるのは勿論である。
例えば、ネットワークを介して端末装置から原稿画像をMFPに送信し、MFPから送られてくる仮に設定した章分け箇所を該端末装置が表示し、その仮の章分け箇所が有効であるか無効であるかの確定情報を該端末装置から受信したMFPがリンク情報付きの電子文書を生成して、該端末装置に送り返すように構成してもよい。
Note that the present invention is not limited to the above-described embodiment, and various modifications and corrections can be made without departing from the scope of the present invention.
For example, a document image is transmitted from the terminal device to the MFP via the network, and the provisionally set chapter division location sent from the MFP is displayed on the terminal device, and the provisional chapter division location is valid or invalid. It may be configured such that the MFP that has received the certain information from the terminal device generates an electronic document with link information and sends it back to the terminal device.
100…MFP(複合機)、101…制御部、102…記憶部、103…操作パネル、104…画像読取部、105…画像出力部、106…ネットワークインターフェース、107…システムバス、111…章分け条件取得部、121…テキスト抽出部、131…マーカー設定部、141…章分け情報確定部、151…PDF変換部、161…章分け情報記憶部、171…操作履歴記憶部、181…PDF文書記憶部、301…章分け機能ボタン、302…設定リセットボタン、303…閉じるボタン、304…次の原稿ありボタン、305…次の原稿なしボタン、306…スタートボタン、401…文字サイズボタン、402…空白行ボタン、403…ページ指定ボタン、404…ユーザ設定ボタン、405…全ページ検査ボタン、406…キャンセルボタン、407…OKボタン、408…文字サイズ設定欄、409…設定文字サイズプレビュー画面、410…空白行数設定欄、411…ページ番号設定欄、412…ユーザ指定文字列設定欄、501…プレビュー表示画面、502…プレビュー表示中ページ番号表示、503…全ページ数表示、504…ページリスト表示、505…ページリスト表示用スクロールバー、506…ページリスト用ページ番号、507…章分け有効ボタン、508…章分け無効ボタン、509…戻るボタン、510…設定リセットボタン、511…設定完了ボタン、512…マーカー付き章タイトル、513…マーカー付き章タイトル、513…指でなぞった章タイトルの矢印、601…アウトラインデータ、602…アウトラインデータからリンクされたページの画像。
DESCRIPTION OF
Claims (6)
読み取った原稿画像を文字認識して抽出した行単位の文字列から、ユーザから与えられた条件に基づいて、章分け箇所の候補行を抽出して該候補行の画像に仮マーカー付けし、
前記仮マーカー付けした候補行を含むページの画像を表示して、ユーザからの指示に基づいて前記候補行が章分け箇所であることを確定し、
前記確定された章分け箇所にマーカー付けして原稿画像を修正するとともに、該章分け箇所の行から抽出した文字列と前記章分け箇所とを関連付けしたリンク情報を含むアウトラインデータを生成し、
すべての原稿画像と、該アウトラインデータとからリンク情報付の電子文書を生成することを特徴とする画像形成装置。 In an image forming apparatus capable of creating an electronic document by reading a document consisting of a plurality of pages,
Based on the conditions given by the user, from the character string in line units extracted by character recognition of the read document image, the candidate line of the chapter division part is extracted and a temporary marker is attached to the image of the candidate line,
Display an image of a page including the candidate line with the provisional marker, and confirm that the candidate line is a chapter division based on an instruction from the user,
Correcting the document image by marking the determined chapter division location, and generating outline data including link information associating the character string extracted from the chapter division location and the chapter division location;
An image forming apparatus that generates an electronic document with link information from all original images and the outline data.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008276518A JP4934124B2 (en) | 2008-10-28 | 2008-10-28 | Image forming apparatus |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008276518A JP4934124B2 (en) | 2008-10-28 | 2008-10-28 | Image forming apparatus |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010109420A JP2010109420A (en) | 2010-05-13 |
JP4934124B2 true JP4934124B2 (en) | 2012-05-16 |
Family
ID=42298476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008276518A Active JP4934124B2 (en) | 2008-10-28 | 2008-10-28 | Image forming apparatus |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4934124B2 (en) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5804758B2 (en) * | 2011-04-19 | 2015-11-04 | キヤノン株式会社 | Information processing apparatus, information processing apparatus control method, and computer program |
JP2012238953A (en) * | 2011-05-10 | 2012-12-06 | Sharp Corp | Image forming system and function addition method |
JP5993849B2 (en) * | 2011-06-09 | 2016-09-14 | 達也 進藤 | Document sharing system |
JP5794677B2 (en) | 2011-06-14 | 2015-10-14 | キヤノン株式会社 | Information processing apparatus, information processing apparatus control method, and computer program |
JP2014226897A (en) * | 2013-05-27 | 2014-12-08 | 大日本印刷株式会社 | Printer capable of guaranteeing continuity of pages when resuming printing and method for resuming printing by printer |
JP6545573B2 (en) * | 2015-08-25 | 2019-07-17 | シャープ株式会社 | Image processing apparatus, image forming apparatus, and chapter division processing method |
US9690528B1 (en) | 2016-03-30 | 2017-06-27 | Konica Minolta Laboratory U.S.A., Inc. | Automatically editing print job based on state of the document to be printed |
CN109479081B (en) * | 2017-07-03 | 2019-12-17 | 京瓷办公信息系统株式会社 | Document reading apparatus |
JP6616865B2 (en) * | 2018-06-05 | 2019-12-04 | シャープ株式会社 | Image transmitting apparatus and image transmitting method |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3313519B2 (en) * | 1994-09-19 | 2002-08-12 | シャープ株式会社 | Image processing device |
JP3976802B2 (en) * | 1994-11-15 | 2007-09-19 | キヤノン株式会社 | Image processing apparatus and image processing method |
JPH09204439A (en) * | 1996-01-29 | 1997-08-05 | Matsushita Electric Ind Co Ltd | Information display device |
JP2000250908A (en) * | 1999-02-26 | 2000-09-14 | Planet Computer:Kk | Support device for production of electronic book |
JP2003132042A (en) * | 2001-10-29 | 2003-05-09 | Sharp Corp | Table of contents generation device |
JP2005004616A (en) * | 2003-06-13 | 2005-01-06 | Hypergear:Kk | Link information production system for document |
-
2008
- 2008-10-28 JP JP2008276518A patent/JP4934124B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
JP2010109420A (en) | 2010-05-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4934124B2 (en) | Image forming apparatus | |
US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
US8610929B2 (en) | Image processing apparatus, control method therefor, and program | |
US8634100B2 (en) | Image forming apparatus for detecting index data of document data, and control method and program product for the same | |
JP5187057B2 (en) | Layout printing system, layout document browsing method, and program | |
TW452746B (en) | Image scanner and optical character recognition device using said image scanner | |
CN101800826B (en) | Image processing apparatus, terminal, printer apparatus and image processing method, having image restoring function | |
US10528679B2 (en) | System and method for real time translation | |
US20090049375A1 (en) | Selective processing of information from a digital copy of a document for data entry | |
JP7483384B2 (en) | Image processing system for digitizing documents, and its control method and program | |
US8134739B2 (en) | Information processing device for outputting reduced-size pages | |
US20120030234A1 (en) | Method and system for generating a search query | |
US8854635B2 (en) | Document processing device, method, and recording medium for creating and correcting formats for extracting characters strings | |
US9614984B2 (en) | Electronic document generation system and recording medium | |
JP2013196479A (en) | Information processing system, information processing program, and information processing method | |
JP2010086151A (en) | Data generation device, scanner, and computer program | |
US9310971B2 (en) | Document viewing device for display document data | |
US20240129416A1 (en) | Method of producing image data and image reading system | |
US10511733B2 (en) | Setting method and setting apparatus of image forming apparatus | |
JP2011134285A (en) | Printing processing apparatus, printing processing program, and printing processing method | |
JP6205973B2 (en) | Change history output device, program | |
US20100188674A1 (en) | Added image processing system, image processing apparatus, and added image getting-in method | |
JP2007148486A (en) | Method for supporting document browsing, system for the same, document processor, and program | |
JP2015087830A (en) | Document processing apparatus and program | |
JP6217314B2 (en) | Form processing system and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20110223 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120113 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20120124 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20120217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4934124 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150224 Year of fee payment: 3 |