JP2014085689A - 画像再配置方法、画像再配置システム、および画像再配置プログラム - Google Patents
画像再配置方法、画像再配置システム、および画像再配置プログラム Download PDFInfo
- Publication number
- JP2014085689A JP2014085689A JP2012231467A JP2012231467A JP2014085689A JP 2014085689 A JP2014085689 A JP 2014085689A JP 2012231467 A JP2012231467 A JP 2012231467A JP 2012231467 A JP2012231467 A JP 2012231467A JP 2014085689 A JP2014085689 A JP 2014085689A
- Authority
- JP
- Japan
- Prior art keywords
- area
- character
- image
- histogram
- column
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 72
- 230000008707 rearrangement Effects 0.000 title claims abstract description 46
- 238000000605 extraction Methods 0.000 claims abstract description 8
- 239000010979 ruby Substances 0.000 claims description 23
- 229910001750 ruby Inorganic materials 0.000 claims description 23
- 230000010354 integration Effects 0.000 claims description 18
- 239000000284 extract Substances 0.000 claims description 5
- 230000008569 process Effects 0.000 description 41
- 238000004458 analytical method Methods 0.000 description 24
- 238000002372 labelling Methods 0.000 description 18
- 238000003860 storage Methods 0.000 description 18
- 238000009877 rendering Methods 0.000 description 14
- 238000006243 chemical reaction Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 238000013500 data storage Methods 0.000 description 8
- 230000008859 change Effects 0.000 description 5
- 238000005520 cutting process Methods 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 230000011218 segmentation Effects 0.000 description 4
- 238000000926 separation method Methods 0.000 description 4
- 239000004072 C09CA03 - Valsartan Substances 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 230000003247 decreasing effect Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 238000007781 pre-processing Methods 0.000 description 3
- 238000007493 shaping process Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Landscapes
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Character Input (AREA)
- Image Processing (AREA)
Abstract
【解決手段】コンピュータ1が行う画像再配置方法であって、読み込んだ文書画像から、複数の文字矩形を含む文字領域を抽出する領域抽出ステップと、前記文字領域を所定数に分割し、各分割領域毎に前景のヒストグラムを生成し、各分割領域で作成されるヒストグラムの位置のずれを用いて、画像の傾きを推定する傾き推定ステップと、前記傾きの分だけ各文字矩形の位置をずらして、前記文字領域のヒストグラムを生成し、前記ヒストグラムの幅の行領域または列領域を抽出し、当該行領域または列領域に含まれる文字矩形の高さまたは幅を、前記行領域の高さまたは前記列領域の幅に合わせる行・列取得ステップと、を行う。
【選択図】図1
Description
図5は、レイアウト解析部1が行う、リフローデータ生成処理のフローチャートである。ここでは、画像読み込みからリフローデータを生成するまでについて説明する。
まず、画像読み込み部11は、処理対象となるデータ(文書データなど)を、画像として読み込み、記憶部18に記憶する。本実施形態では、例えば、プリミティブな画像処理にOpenCV を活用し、OpenCVは各種画像コーデックをサポートしているため、様々な形式(例えば、JPEG 形式、PNG 形式、TIFF 形式など)に対応可能であるものとする。なお、読み込みの際には、画像の2値化処理で使用するため、強制的にグレースケール画像として読み込むものとする。そして、読み込んだ画像のページ(画像ファイル)毎に、S12からS17の処理を行う。
2値化処理部12は、S11で読み込まれた画像の2値化処理を行う。2値化処理は、濃淡がある画像(8bit 画像であれば0〜255)をある条件に従って、0 か1 の2値で表すように変換する処理のことである。ここでは、文字、もしくは図表がある部分を1、文字がない部分、すなわち背景を0 として認識するように2 値化を行う。画像の2値化処理により、画像の文字・図表部分(前景)と背景の分離を行うアルゴリズムについて、以下に説明する。
最適な2 値化の結果を得るには、2 値化自体のアルゴリズム以外に前処理が重要である。本実施形態では、前処理として「背景の調整」と「網掛け領域の処理」の2つを行うものとする。
2値化とは、画像の各ピクセルを背景クラスと前景クラスに分ける処理である。本実施形態においては、2値化処理に判別分析法を活用し、閾値を決定しているが、判別分析法以外の手法を用いて2値化処理を行うこととしてもよい。判別分析法ではクラス間分散ω0 とクラス内分散ωiの比で表される分離度Tが最大となる閾値を決定する。
ラベリング部13は、S12の2値化処理で検出された前景において、ピクセルの連結する成分毎に異なるラベルをつけていくラベリング処理を行う。すなわち、連結成分を囲む矩形をラベリング結果として抽出する。理想的には1文字もしくは1つの図表が、それぞれ1つの連結成分と認識される。例えば「日」という文字は1つの連結成分として得ることができる。このラベリングの結果を、初期ラベリング結果の保持リスト(srcArea)として記憶部18に格納する。
初期ラベリング結果の保持リスト(srcArea)に格納されたラベリング結果からラベル同士を比較し、矩形が重なる場合はこのように統合(一方を削除し、もう一方を更新)を行う。
図表認識部14は、S13で統合されたラベリング結果を用いて、図表を示す連結成分を抽出し、図表を表すラベルとそれ以外のラベルとに分ける。これは一般的に、図表が文字よりも大きいことなどのレイアウトに関する事前知識を活用して抽出を行う。また、図表と、それに紐づくキャプションは一体となってユーザに提示することが望ましいため、図表とそれに紐づくキャプションを示す連結成分の統合処理を行う。
図表を表すラベルは、文字を表すラベルに比べて非常に大きいため、矩形サイズに閾値を設けることで容易に検出を行うことができる。本実施形態では、画像全体の面積の1% 以上の矩形面積の大きさを持つラベルを図表として認識し、記憶部18の図表領域リスト(IR Layout::imageArea)に格納する。また図表として認識されなかったラベルは、文字候補として、記憶部18の文字候補リスト(IR Layout::charCandidate)に格納する。
図表とそれの説明であるキャプションは、一覧性を保つために1つの図表領域として統合することが必要である。ここでは、検出された図表とキャプションを統合する処理について説明する。すなわち、図表領域の周囲のキャプションエリア候補に、文字候補としてのラベルが存在する場合、当該文字候補のラベルをキャプションと判別し、当該キャプションを図表領域に統合する。以下に、キャプションの統合処理について説明する。
まず、検出された図表領域の周囲に、キャプションエリア候補を設定する。キャプションエリア候補は、図9に示すように図表領域70の4 辺から等距離Lの範囲を設定する。図表領域の上端をTop領域71、下端をBottom領域72、左端をLeft領域73、右端をRight領域74とする。距離Lは、例えば、図表領域を表すパラメータを利用し、L = min(width, height) としてもよい。すなわち、対象とする図表領域のwidth (幅)およびheight(高さ)の小さい方の値としてもよい。
X 方向のヒストグラムを作成する場合は、当該ラベルの領域rの左端≦i≦右端を満たす全てのiについてhx(i)に1を加え、
Y 方向のヒストグラムを作成する場合は、当該ラベルの領域rの上端≦i≦下端を満たす全てのjについてhx(j)に1を加える。
ヒストグラムの計算が終わった後、キャプションエリアを設定する。図12のBottom 領域に示すように、ヒストグラムのランレングスを計算し、最も外側のヒストグラム81のランの終端82までをキャプションエリア83として拡張する。
文字切り出し部15は、記憶部18の文字候補リスト(IR Layout::charCandidate)を用いて、1 文字、1文字の矩形を切り出す処理を行う。
まず、文字候補リスト(IR Layout::charCandidate)のデータを用いて、文字領域を取得する。一般的な書籍を対象と仮定すれば、縦方向で文書の領域を分割することができる。例えば、文書の上部から柱領域(章題などが書かれるエリア)、本文領域、ノンブル領域(ページ番号の書かれるエリア)のように分割して別の領域として考えることが可能である。そこで、文字候補リスト(IR Layout::charCandidate)を利用して、Y 方向の前景ヒストグラムを作成し、このランレングスを計算することで領域の縦分割を行う。
文字候補の上端≧分割された文字領域の上端、
かつ、 文字候補の下端≦分割された文字領域の下端、
を満たす全ての文字候補の中で、最小の左端および最大の右端を、それぞれ文字領域の左端および右端とする。取得した文字領域は、記憶部18の文字領域リスト(IR Layout::charArea)に格納しておく。
取得された文字領域で、文字が縦書きで書かれているか、横書きで書かれているかを判定する。まず、図15に示すように、取得された文字領域内でX 方向、Y 方向のヒストグラムを作成する。ヒストグラム作成後、X 方向、Y 方向の双方で、白ラン(連続する前景ヒストグラムの長さ)および黒ラン(連続する背景ヒストグラムの長さ)の平均を計算する。ただし、前景ヒストグラム、背景ヒストグラムとは、それぞれ、ヒストグラムの値が0より大きい部分、ヒストグラムの値が0である部分のことである。
文字領域の縦書き・横書きが判定できたら、縦書きの場合はX 方向のヒストグラムを利用して列を取得し、横書きの場合はY 方向のヒストグラムを利用して行の取得を行う。以降は簡単のため、文字領域が縦書きである場合について説明する。
図16に示す例では、2等分した場合の例であるため、上記式では(文字領域の高さ ÷ 2)としているが、分割数に応じて分割した領域間の距離を設定する。すなわち、分割領域のうち2つが選択されたとき、
傾きs=x÷(|一方の領域の中心のy座標−他方の領域の中心のy座標|÷2)
とする。また、分割数が3以上の場合は分割領域の選択方法が複数通りあるため、例えばy座標が最も離れた2つを選択してもよいし、y座標が小さい方から2つを選択してもよい。一般的には分割領域の距離が離れている方が高精度になるため前者を用いるが、小説等でせりふが多い文字領域など、文字領域の下方まで文字が続かない行が多いときには後者の方がよい場合がある。さらに、分割領域の組み合わせを複数とって各々でsを算出し、その平均値や中央値をとってもよい。複数の組み合わせは、全ての組み合わせや、隣接する分割領域の組み合わせでもよいし、他の組み合わせでも構わない。
文字領域の縦書き・横書きを判定し、傾きの推定を終えると、縦書きの場合はX 方向のヒストグラムを利用して列を取得、横書きの場合はY 方向のヒストグラムを利用して行の取得を行う。ここでは、文字領域が縦書きである場合について説明を行う。
領域rの左端 ≦ ヒストグラムの左端 + s * 領域rの上端 かつ
領域rの右端 ≦ ヒストグラムの右端 + s * 領域rの上端
の場合、以下の処理を行う。
これまでに取得された行・列の中にはルビに当たるものも含まれている。ルビを単独でリフローして表示してしまうと、意味が通らなくなってしまうため、ルビはルビをつける対象の文字矩形と統合を行う。
日本語を構成する文字(漢字、ひらがな)は、1つ文字が1つの連結成分とはなっていないため、これまでの処理で得られた文字候補の矩形は、1つの文字が複数の矩形に分かれてしまうことが頻繁に起こる。そこで、1つの文字であると推定できる文字候補の矩形同士を統合し、さらにレンダリング時のリフロー配置を見易くするために改行の認識、文字間隔の整形を行う。
これまでの処理により、文字矩形は行・列に属し、行の場合、並び順はX方向の小さい順、矩形の高さは行の高さと等しくなっており、列の場合、並び順はY方向の小さい順、矩形の幅は列幅と等しくなっている(ルビと統合した矩形は除く)。すなわち、行の場合はY方向、列の場合はX方向での統合を考える必要はなく、並んでいる矩形を順に統合するかどうか判断すれば良いことになる。矩形の統合ルールとして日本語の文字の特徴、文字の幅と高さが同程度となることを利用した。
リフロー表示部3のレンダリング部31でリフローを行う際に改行を把握していると、適切に改行を入れることができ、読み易さに寄与することができるため、段落の認識を行う。
ここまでの処理で得られた矩形は、文字に外接する矩形であるため、文字間の余白が削られてしまっている。このままレンダリング部31でリフローを行うと文字が詰まってしまう。そこで文字間の余白部分を連続する前後の文字矩形に配分する。余白は均等に存在するのではなく、前後の文字矩形の大きさによって変わるため、それを考慮して配分する。
これまでの文字や図表の情報の切り出し結果により、リフローデータを作成することができるが、対象とする画像のレイアウトによってはうまく機能しない場合がある。そこで、レイアウト変換部16は、読み手の読みやすさを考慮して、解析された結果が一定条件下の場合には読み込んだ画像のページ全体を図表領域にするなどの、解析したレイアウトの結果を変更する処理を行う。
一覧性が必要なページの場合や、取得したレイアウト解析結果が明らかに失敗している状況においては、無理やりリフローデータを生成するよりも、そのページは一枚の画像として表示した方が読み手の立場で考えると好ましい。具体的には下記のケースの場合、その読み込んだ画像を画像ページとしてページ全体を図表領域として、変換を行う。
処理対象として文字が主体の文書を想定しているため、ページ中の文字領域面積と比較して、図表領域面積が大きな場合(表紙など)には、図表の一覧性を確保するために画像ページとして変換を行う。
目次ページは、一覧性が重要であること、また、文字に飾りが付いていることが多いため、正確に認識して切り出すことが難しい。そこで目次と認識できた場合には画像ページとして変換を行う。
文字領域や図表領域として検出された領域が非常に少ないページ(例えば、章題だけが書いてあるページ)は一覧性が大事なことが多いため、画像ページへと変換する。具体的には、レイアウト解析により取得し各領域の面積の和(SUM_AREA = CHARH_AREA + CHARV_AREA + FIGURE_AREA)が、ページ全体の面積(PAGE AREA = X SIZE ・ Y SIZE)に対し、n%(例えば、5% )以下の場合には、画像ページへと変換する。
リフローデータにした時点で紙書籍の”ページ”という概念がなくなるため、ページ番号が書かれているノンブル領域は必要のないデータとなる、また柱と呼ばれる章題などを書かれた領域についてもページ単位に付与されている情報であるため、リフローデータの生成には用いないことにする。
S16の処理後に、レイアウト変換部16は、処理対象の画像の1ページ分の処理結果を記憶部18に出力する。なお、S20で最終的に出力するリフローデータは、S11で読み込んだ全てのページの画像と1 対1 に対応するものであるが、S17で一時的な結果を出力することで、読み込んだ画像の1 ページ目の画像ファイルから最終ページの画像ファイルまで逐次的に処理を行う必要がなくなるため、並列計算による処理速度の向上を実現することが可能になる。
本の背表紙にはバーコードがついており、バーコードを認識することで本の識別子であるISBN コードを取得する。ISBN コードを取得できれば音楽CD のCDDB からメタデータが取得できるのと同様に本のメタデータを取得し、S11で読み込んだ画像のコンテンツの管理に役立てることができる。そこで、バーコード解析部17は、所定のページの画像の中のバーコードを検出し、検出したバーコードからコード種別を判別し、ISBN-13 もしくはISBN-10 の情報のみを取得する。本実施形態では、背表紙は基本的に最終ページに存在すると仮定し、最終ページのみこの処理を行うこととするが、最終ページだけでなく、例えば、最終ページから数ページ(10ページ以下程度)にこの処理を行うこととしてもよい。
S11で読み込んだ画像の全てのページに対し、文字情報および図表の切り出しが行われた後に、S17で出力したテンポラリ結果ファイルを統合し、1つのリフローデータとして記憶部18に出力する。本実施形態では、リフロー表示部3のレンダリング部31などのレンダリングエンジンで利用できるように、JSON 形式でリフローデータの出力を行う。JSON データは1 コンテンツに対し、1 つのJSONファイルとし、全てのページの解析結果を含んだものとして定義する。本実施形態では、高速化のために並列演算を行っており、逐次先頭からページ順に処理するわけではないため、各ページ毎の処理結果をテンポラリ結果としてS17で出力し、それを最後に統合することで最終JSON ファイルを作成する。
図24は、スマートフォン、タブレット端末などに搭載されたリフロー表示部3が行う、リフロー表示処理のフローチャートである。
11:画像読み込み部
12:2値化処理部
13:ラベリング部
14:図表認識部
15:文字切り出し部
16:レイアウト変換部
17:バーコード解析部
18:記憶部
2 :データ保存部
3 :リフロー表示部
31:レンダリング部
32:ディスプレイ
33:操作受付部
Claims (8)
- コンピュータが行う画像再配置方法であって、
読み込んだ文書画像から、複数の文字矩形を含む文字領域を抽出する領域抽出ステップと、
前記文字領域を所定数に分割し、各分割領域毎に前景のヒストグラムを生成し、各分割領域で作成されるヒストグラムの位置のずれを用いて、画像の傾きを推定する傾き推定ステップと、
前記傾きの分だけ各文字矩形の位置をずらして、前記文字領域のヒストグラムを生成し、前記ヒストグラムの幅の行領域または列領域を抽出し、当該行領域または列領域に含まれる文字矩形の高さまたは幅を、前記行領域の高さまたは前記列領域の幅に合わせる行・列取得ステップと、を行うこと
を特徴とする画像再配置方法。 - 請求項1に記載の画像再配置方法であって、
前記領域抽出ステップは、前記文書画像から、図表が含まれる図表領域を抽出し、
前記図表領域の周囲のキャプション候補領域に文字矩形が存在する場合、当該文字矩形をキャプションと判別し、前記キャプションを前記図表領域に統合するキャプション統合ステップを、さらに行うこと
を特徴とする画像再配置方法。 - 請求項1または2に記載の画像再配置方法であって、
前記文字領域のX方向およびY方向のヒストグラムを生成し、X方向の背景のヒストグラムの連続する長さの平均が、Y方向の背景のヒストグラムの連続する長さの平均より大きい場合、縦書きであると判別し、それ以外は横書きであると推定する文字方向推定ステップを、さらに行うこと
を特徴とする画像再配置方法。 - 請求項1から3のいずれか一項に記載の画像再配置方法であって、
隣接する行または列の間隔が、大きい方の行の高さまたは列の幅に対して所定の割合以下であって、隣接する行の高さまたは列の幅の比が所定の割合以下の場合は、高さが小さい方の行または幅が小さい方の列はルビであると判別し、前記ルビを対象とする文字矩形に統合するルビ統合ステップを、さらに行うこと
を特徴とする画像再配置方法。 - 請求項1から4のいずれか一項に記載の画像再配置方法であって、
連続する文字矩形の余白を、当該文字矩形に配分すること
を特徴とする画像再配置方法。 - 請求項1から5のいずれか一項に記載の画像再配置方法であって、
前記文書画像から切り出した文字矩形または図表領域のオブジェクトの集合を、所定のオブジェクト数を基準として分割する分割ステップと、
分割した単位で、前記オブジェクトをディスプレイの表示領域の大きさに応じて生成した再配置領域に再配置する再配置ステップと、
前記再配置領域を前記ディスプレイの表示領域に応じて分割したリフローページをディスプレイに表示する表示ステップと、を行うこと
を特徴とする画像再配置方法。 - 画像再配置システムであって、
読み込んだ文書画像から、複数の文字矩形を含む文字領域を抽出する領域抽出手段と、
前記文字領域を所定数に分割し、各分割領域毎に前景のヒストグラムを生成し、各分割領域で作成されるヒストグラムの位置のずれを用いて、画像の傾きを推定する傾き推定手段と、
前記傾きの分だけ各文字矩形の位置をずらして、前記文字領域のヒストグラムを生成し、前記ヒストグラムの幅の行領域または列領域を抽出し、当該行領域または列領域に含まれる文字矩形の高さまたは幅を、前記行領域の高さまたは前記列領域の幅に合わせる行・列取得手段と、を備えること
を特徴とする画像再配置システム。 - コンピュータが実行する画像再配置プログラムであって、
前記コンピュータに、
読み込んだ文書画像から、複数の文字矩形を含む文字領域を抽出する領域抽出ステップと、
前記文字領域を所定数に分割し、各分割領域毎に前景のヒストグラムを生成し、各分割領域で作成されるヒストグラムの位置のずれを用いて、画像の傾きを推定する傾き推定ステップと、
前記傾きの分だけ各文字矩形の位置をずらして、前記文字領域のヒストグラムを生成し、前記ヒストグラムの幅の行領域または列領域を抽出し、当該行領域または列領域に含まれる文字矩形の高さまたは幅を、前記行領域の高さまたは前記列領域の幅に合わせる行・列取得ステップと
を実行させるための画像再配置プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012231467A JP6030915B2 (ja) | 2012-10-19 | 2012-10-19 | 画像再配置方法、画像再配置システム、および画像再配置プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012231467A JP6030915B2 (ja) | 2012-10-19 | 2012-10-19 | 画像再配置方法、画像再配置システム、および画像再配置プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2014085689A true JP2014085689A (ja) | 2014-05-12 |
JP6030915B2 JP6030915B2 (ja) | 2016-11-24 |
Family
ID=50788728
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012231467A Active JP6030915B2 (ja) | 2012-10-19 | 2012-10-19 | 画像再配置方法、画像再配置システム、および画像再配置プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6030915B2 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108460384A (zh) * | 2018-02-08 | 2018-08-28 | 南京晓庄学院 | 一种脱机手写体文本的字符切分方法 |
JP2018142286A (ja) * | 2017-02-28 | 2018-09-13 | シナノケンシ株式会社 | 電子図書製作用プログラム |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07121658A (ja) * | 1993-10-20 | 1995-05-12 | Nippon Digital Kenkyusho:Kk | 文字列検出方式 |
JPH08101886A (ja) * | 1994-09-30 | 1996-04-16 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08235307A (ja) * | 1995-02-27 | 1996-09-13 | Nec Corp | 文字列検出装置 |
JPH1125213A (ja) * | 1997-07-07 | 1999-01-29 | Oki Electric Ind Co Ltd | 行方向判定方法および行方向判定装置 |
JP2000295461A (ja) * | 1999-04-09 | 2000-10-20 | Sharp Corp | 画像合成方法およびカラーファクシミリ装置 |
JP2003288334A (ja) * | 2002-03-28 | 2003-10-10 | Toshiba Corp | 文書処理装置及び文書処理方法 |
JP2009531789A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | 種々のサイズのディスプレイ上にレンダリングするための画像に基づくリフロー可能なファイルの生成 |
JP2009289107A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 情報処理装置 |
JP2012068858A (ja) * | 2010-09-22 | 2012-04-05 | Sharp Corp | ページ数決定装置、ページ数決定方法、ページ数決定プログラム、及びコンピュータ読み取り可能な記録媒体 |
-
2012
- 2012-10-19 JP JP2012231467A patent/JP6030915B2/ja active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07121658A (ja) * | 1993-10-20 | 1995-05-12 | Nippon Digital Kenkyusho:Kk | 文字列検出方式 |
JPH08101886A (ja) * | 1994-09-30 | 1996-04-16 | Oki Electric Ind Co Ltd | 文字認識装置 |
JPH08235307A (ja) * | 1995-02-27 | 1996-09-13 | Nec Corp | 文字列検出装置 |
JPH1125213A (ja) * | 1997-07-07 | 1999-01-29 | Oki Electric Ind Co Ltd | 行方向判定方法および行方向判定装置 |
JP2000295461A (ja) * | 1999-04-09 | 2000-10-20 | Sharp Corp | 画像合成方法およびカラーファクシミリ装置 |
JP2003288334A (ja) * | 2002-03-28 | 2003-10-10 | Toshiba Corp | 文書処理装置及び文書処理方法 |
JP2009531789A (ja) * | 2006-03-29 | 2009-09-03 | アマゾン・テクノロジーズ・インコーポレイテツド | 種々のサイズのディスプレイ上にレンダリングするための画像に基づくリフロー可能なファイルの生成 |
JP2009289107A (ja) * | 2008-05-30 | 2009-12-10 | Toshiba Corp | 情報処理装置 |
JP2012068858A (ja) * | 2010-09-22 | 2012-04-05 | Sharp Corp | ページ数決定装置、ページ数決定方法、ページ数決定プログラム、及びコンピュータ読み取り可能な記録媒体 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2018142286A (ja) * | 2017-02-28 | 2018-09-13 | シナノケンシ株式会社 | 電子図書製作用プログラム |
CN108460384A (zh) * | 2018-02-08 | 2018-08-28 | 南京晓庄学院 | 一种脱机手写体文本的字符切分方法 |
CN108460384B (zh) * | 2018-02-08 | 2024-01-19 | 南京晓庄学院 | 一种脱机手写体文本的字符切分方法 |
Also Published As
Publication number | Publication date |
---|---|
JP6030915B2 (ja) | 2016-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9007405B1 (en) | Column zoom | |
KR101334483B1 (ko) | 문서를 디지털화하는 장치 및 방법과, 컴퓨터 판독가능 기록 매체 | |
US8515176B1 (en) | Identification of text-block frames | |
CN102289667B (zh) | 对经历光学字符识别(ocr)过程的文本文档中出现的错误的用户纠正 | |
EP2669847B1 (en) | Document processing apparatus, document processing method and scanner | |
US8824798B2 (en) | Information processing device, computer readable medium storing information processing program, and information processing method | |
JP5321109B2 (ja) | 情報処理装置及び情報処理プログラム | |
US9734132B1 (en) | Alignment and reflow of displayed character images | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
JP2010123002A (ja) | 文書画像レイアウト装置 | |
JP2016181057A (ja) | 画像処理装置、画像処理方法及び画像処理プログラム | |
US8526744B2 (en) | Document processing apparatus and computer readable medium | |
JP5950700B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
JP6030915B2 (ja) | 画像再配置方法、画像再配置システム、および画像再配置プログラム | |
JP5182902B2 (ja) | 文書イメージ出力装置 | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
US10609249B2 (en) | Scanner and scanning control program which outputs an original image and an extracted image in a single file | |
JP2008108114A (ja) | 文書処理装置および文書処理方法 | |
JP2013020477A (ja) | 画像処理装置およびプログラム | |
JP6322086B2 (ja) | 表示制御装置、表示装置、プログラム、記録媒体 | |
JP7241506B2 (ja) | 光学式文字認識結果の修正支援装置および修正支援用プログラム | |
JP5794154B2 (ja) | 画像処理プログラム、画像処理方法、及び画像処理装置 | |
JP4518212B2 (ja) | 画像処理装置及びプログラム | |
JP4830763B2 (ja) | 画像処理システムおよび画像処理プログラム | |
US8643651B2 (en) | Type-setting method for a text image file |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150902 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20160622 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20160628 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20160822 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20161004 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20161021 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6030915 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |