Nothing Special   »   [go: up one dir, main page]

JPH01306958A - 文書処理システム - Google Patents

文書処理システム

Info

Publication number
JPH01306958A
JPH01306958A JP63137526A JP13752688A JPH01306958A JP H01306958 A JPH01306958 A JP H01306958A JP 63137526 A JP63137526 A JP 63137526A JP 13752688 A JP13752688 A JP 13752688A JP H01306958 A JPH01306958 A JP H01306958A
Authority
JP
Japan
Prior art keywords
information
document
machine
readable
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63137526A
Other languages
English (en)
Inventor
Toshinori Watanabe
俊典 渡辺
Shinichi Hayashi
林 晋一
Koichiro Ino
伊能 弘一郎
Fumihiko Mori
文彦 森
Hiroshi Watanabe
坦 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP63137526A priority Critical patent/JPH01306958A/ja
Publication of JPH01306958A publication Critical patent/JPH01306958A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は人間と計算機とのインタフェイスの改良に係り
、特に一般社会で従来使用されてきた文書や図面を、人
間のみでなく計算機にも理解可能なものとすることによ
り、インタフェイスの容易化及び高度化を図る文書の表
現方法およびその表現方法の文書を処理する処理方法に
関する。
〔従来の技術〕
すかし絵は人間のみが見ること、及び表現される情報が
お札の持つ情報と対応していない、あらかじめ紙面に作
り込んでおく等の点とで本発明の目的には使用できない
。盲人用点字含み文書は人間の視覚と触覚とに関する2
重情報を同時表現したものであり、人間用とM11重用
の2重情報表現法と異なる。バーコードは商品売価等を
コード化して、商品名のとなりに表示しておき、削算機
にこれを直接読み取らせて支払計算のための売価入力の
手間をはふいたものであるが、人間の目に見える様式で
バーコードを表現している。
〔発明が解決しようとする課題〕
従来、計算機で作成した文書や図形情報はフロッピーテ
ィスフや磁気カードあるいは磁気テープなど、人間が直
接読めないが計算機には読みとれる形で保存あるいは伝
達されてきた。内容を目でみるために別途、デイスプレ
ィ装置やラインプリンタ装置が使用されてきた。この状
況では、同一の情報を計算機のみに可読な媒体と、人間
には可読であるが計算機には可読困難な媒体とで二重管
理する必要が生じ、社会一般で多用される文書の表現方
法としては改良の余地がある。
改良のひとつの方向として、人間には可読な情報すなわ
ち紙面に書かれたテキストや図形を、直接計算機で読め
込む技術が、既に数10年間に渡って研究開発されてき
た。しかしながら、これらの一般に文字認識あるいは画
像認識の研究は、諸般の研究分野の中でも最も困難な研
究といわれており、郵便番瀉等のごく限定された領域で
のみ実用化されているにすぎない。この限定された例に
おいても、文字が汚されていたりすると計算機には直ち
に不可能となってしまう。図形や画像情報についてはさ
らに困難であり、回路図面の自動入力すなわちディジタ
イザの開発も遅々として進まないのが実情である。この
方面の研究の現段階での結論として、計算機が、読み取
ろうとしている文字や図形の意味、ひいてはそれらを含
む文章や図面の意味を理解せぬ限り、本格的な文字や画
像の認識は無理であろうと言われている。そこで、取り
あえず、紙面上の情報をビットパターンとして単純に入
力するだけの、スキャナー技術等がパーソナルコンピュ
ータ等で利用され始めているが、入力対象のもつ意味情
報等を考慮しているわけではないので、入力ビツトプレ
ーンに相応する大規模メモリを使用している割には、入
力後の画質はノイズや入力文書上の汚れ等によって大幅
に劣下してしまうという状況である。現在、異国語間の
自動翻訳への期待が大きい。その理想は人間社会で一般
に使用されている文書を与えるのみで、自動翻訳結果の
文書を、テキストのみでなく図形等も含めて作成してく
れる自動翻訳機の実現である。
これを可能にするには、前述した文書自動入力という困
難な課題の解決のあと、さらに文書理解と自動翻訳とい
う2つの困難な課題を解決せねばならず、実現は遠い将
来のものになると予想される。
問題の根源は、生命の起源に遡る数億年の歴史の中で進
化してきた人間の目と脳の機能を計算機に無理矢理に真
似させようとしている所にある。
計算機側ではその起源以来、計算機言語はそれなりに発
達し、文書や図形の意味をメモリ上に表現する手段とし
てのデータ構造技術などの発展によって文字9文章9図
形などの計算機処理は容易に可能な状況になって来た。
このことから、人間と計算機という大いに起源やその内
部処理メカニズムの異なる2つの存在に応した情報表現
を同−文書上に混用することによって、人間と人間2人
間と計算機、泪算機と計算機との間のコミュニケーショ
ンが大幅に容易化されると考えられる。
本発明の目的は、人間と計算機間のインタフェースの容
易化および高度化を実現した文書の表現方法を提供する
ことにある。
〔課題を解決するための手段〕
上記目的を達成するために、本発明では、文書上に人間
には容易に読めるが機械には必ずしも容易に読めない従
来の文字や図形情報と、人間が上記情報を読むのに妨害
とならない形式にて、すなわち人間には可読困難な形式
で書かれた情報とを同−文書上に並記しておき、人間が
文書を利用する場合には前者を、機械が文書を処理する
場合には後者をみるようにする。微細化表示技術の進歩
がめざましい現状では人間の目視可能域にきわめて大容
量の計算機用の情報を記述することは容易である。従っ
て、文字や図形の表示手段としてのフォント情報のみで
なく、1語や文章の意味構造、あるいは風景図■1や回
路図面の意味情報まで表現できる。このことを利用して
、あらかじめ文書上に、その文書の意味構造情報を並記
しておき、これを読み取って翻訳に活用させることで、
先に述べたある国語の文書から別の国語の文書に自動翻
訳をおこなうこともきわめて容易となる。
以上の基本的アイデアを現実化するには、文書上への画
情報の記述方式、計算機による諌記述の作成方式、ある
いは読み取り方式などを実現する必要かある。
〔作用〕 本発明では、同一の文書上に、人間の視覚用の情報ツー
1ミと機械が読み取るための情報コードとを並記し、お
互いが相手の情報を判読不可能とすることが無いように
しておくことにより、人間は従来通り文書を読むことが
でき、さらに機械は機械用の情報コードを通して容易に
文書を入力することができるようになる。この方法は、
人間の視覚用の情報コードを直接、機械にも読み取らせ
ようとする従来の文字や図形認識技術よりもはるかに容
易かつ安価に実現できるし、その性能ははるかに高いも
のになる。たとえば、人間の視覚用の情報コード“Ho
use”という英単語の表示上に、2−7コー1−を陰
伏させる方法で機械用ロー)・を表示する場合、”Mo
use”の表示rfI積内に、多数の機械用コードを繰
り返し表示しておけば、仮にII HOI+の部分がシ
ミなどで汚れた場合でも、残余分にひとつでも機械コー
ドが可読状態であれば、容易に”Mouse”という英
単語を計算機内に復元できる。これは上記従来の文字認
識技術では不可能であった。
同一の文書上には、テキストや図形が混在していること
が一般的であり、これらを、その意味まで含めて機械で
認識させることは、単なる文字認識よりもさらに困難な
課題であり、人間用の表示を直接機械に読み取らせる方
向での研究は、はとんど手についていない状況であるが
、本発明の方法を用いると、図形表示に陰伏させる方法
で、その図形の表示原点9図形の種別(円、長方形等)
、図形のサイズ、回転角度2周囲線の幅、内部の模様2
色などを機械用コードで表示しておくことにより、容易
に図形読み取りが実用1できる。図形の一部が汚れたり
切断されていても、既述の繰り返し表示法を用いること
で、容易に原情報の読み取りが可能となる。
文書の単語レベルよりもさらに上位の、文章を−括して
みた場合の意味情報を、例えば構文解析木の形式で機械
用コード化して文書上に陰伏させておくことにより、機
械は容易に文章の意味構造を認識できることになるので
、これを利用して文全体を別の旨語に変換することが楽
に実現できることになる。すなわち、文書の異国語への
翻訳が容易に実現できる。ただし、この例の場合、最初
に文章を作成する段階でその構文解析木データを何らか
の方法で(例えば文章作成エディタの機能の一部に構文
解析木データ作成機能をもうけておく方法など)文章と
対応させて作成する機能が必要となる。
〔実施例〕
以下、本発明の一実施例を、以下、図面を用いて説明す
る。
第1図において100及び100′は本発明を採用した
異種表示手段の同時表現文書を出力あるいは入力するこ
とのできる計算機システムであり、110はその本体部
の計算機、120は文書入出力装置、i 30はデイス
プレィ、140はマウス、(1]) 150はキーボードである。本発明の表現方法を採用し
た文書160が計算機システム100によって出力され
、100′によって入力される状況が図に示しである。
第2図(a)は本発明の異種表示手段同時表現文書を作
成する方法の1例を示す。図の文書: i 60上には
、人間が視覚可能なテキスl−200と図形210とが
記述されているが、同時にたとえば磁気をおびた透明あ
るいは紙160の表m′j色と同色のインクによる機械
可読情報が並記されている。
この状況をA−A’断面線220及びB−B’断面線2
30に沿った断面図(第4図(b)および(C))で示
す。第2図(b)断面図240においては、紙242の
上にテキスト” House”の、視覚により可読な物
質252を用いた表示の下部に機械可読視覚不可読物質
250を用いた” T−101188”のコードによる
表示が、繰り返し7て2.44,246゜248部に作
成されている。ここで、繰り返し表示しているわけは、
一部分の表示が汚れなどによって読み取れなくなった場
合にも、原情報を読み取れるように配慮したためである
。第2図のB−B′断面図260には、同様に視覚可読
物質252による長方形の表示と並んで、機械可読視覚
不可読物質250を用いた長方形のコード表現が264
゜266部に繰り返し作成されている。機械可読視覚不
可読物質による情報表現コードは、開始」−F 270
 、コード本体部272.終了コード274という組み
で形成され機械読み取りを簡単化している。図でロー+
:27o、272,274等は、図示を簡略化したが、
実際にはもつと多くのビット数を用いて充分に情報を表
現できるようになっているものとする。
第3図は、異種表示手段同時表現文書の別の実施例を示
している。本方法は、一般にMNコード化法とよばれる
、ビット1とOの頻度がコード同志で比較的均一なコー
ド化法を用いるものである、文字N HI+を視覚可読
物質によって表示する際に視覚困gICであるが機械可
読な微細化レベルで、機械用の文字II HI+のコー
ドが300部と310部とに2サイクル分記述されてい
る。コード340部は無情報コード部分である。各サイ
クルで、開始コード320,322、コード本体325
゜327、終了コード330,332が表示しである。
A−A’断面線360に沿った断面図が第3図(b)で
ある。この実施例の場合には、紙面242上に、視覚可
読物質のみによって人間用と機械用の情報が並記しうる
ので、第2図の実施例に比較して、文書入出力のための
装置120が安価に実現できることになる。
第4図(a)、(b)および(c)は機械可読物質によ
るテキスト表現コード400.図形表税1コード430
9文章表現コード460の詳細を示す。
いずれも開始コード270と終了コード274の間にコ
ード本体部を持っている。テキスト表現コード400は
、表示物がテキストであることを表示物タイプ指定コー
ド410で表示したあと、テキスト指定コード412に
よって表示内容、例えば”House”を表示し、表示
色指定コード414によって色を、フォントタイプ指定
コード416によって表示フォントの種別を、テキスト
座標コ−ド418によって文書上の視覚可能テキストの
表示位置の文書中での座標点を表示している。最後に、
誤り訂正符号420が付加されている。図形コード43
0では、表示物タイプ指定コード4S31によって、表
示物が図形であることを表示したあと、図形タイプ指定
コード432によって表示図形が長方形か円かといった
区別を指定し、表示色指定ロー+:434によって図形
の色を、図形外周幅指定コード436によって外周境界
線の幅を表示し、図形座標指定コード438によって文
書上での当該図形の表示位置座標を表示している。さら
に図形意味指定ロー1−; 440によって、当該図形
が例えば家の壁を表わすといった情報を表示している。
文章表現コード460の例では、文書全体が例えば“T
hj、s :is a House、”というテキスト
であることを462で表示したあと、この文章の動詞、
主語、目的語を各々、464゜466.4−68のコー
ドで表示している。ここで示した例は、他にも種々可能
なコード表現方法の一例にすぎず、文字、単語2文章9
図形をはしめ(]5) 種々の対象をコードで表現する方法であれば何であって
も利用できる。
なお、以上の説明では、人間に目視可能な情報、例えば
、”Th1s is a House、”とこれに対応
した機械可読情報とが文書上で重複した位置に表現され
る場合を示したが、両者は必すしも重複した位置に表示
される必要はなく、両者が別々の位置に表示されていて
も良い。
第5図は、本発明の文書の出力及び入力処理機構500
の実施例である。文書処理機能を持った計算機110は
、信号線520によって文書入出力装置120を構成す
る入出力機構500と接続されている。入出力機構50
0は信号線530を介して入出力ヘッド540と接続さ
れている。
550はヘッドの移動アームである。ヘット上には、文
書作成時に使用する磁気含有インクを射出するためのノ
ブ95602通常のインクを射出するためのノズル5フ
02文書入力時に使用する磁気センサーとが備えられて
いる。ヘッド540は文書150上のスキャンベルト5
90を一回のストロークでスキャンし、出力モードの場
合にはノズル560と570を用いて各々磁気含有イン
クで機械可読用のコードを、通常のインクで目視可読情
報を文書上に出力し、第2図実施例の文書を作成する。
入力モードの場合には、磁気センサー580を用いて文
書上の機械可読コードを読み込む。文書処理機能付き計
算機110では、文書編集ソフi・ウェアによって、テ
キストや図形含みの文書が作成され、その高次情報コー
ド、例えばテキストについてはアスキーコード表現が、
開始マークと終了マークとではさまれたひとつのレロー
1くとして信号線520を介して、入出力処理機構50
0に伝えられる。入出力処理機構500ではこの高次情
報レコードの各要素たとえばテキストの場合、−文字ず
つを、変換辞書を用いてプリンタ出力用の低次情報ロー
:(に変換する。この時、目視可読情報と機械可読情報
とのペアとなったコードを作成し、これらによってプリ
ンタヘッド540を制御し、文書上に画情報を印刷する
。文書を読み込む場合には、磁気センサーによって得ら
れる機械可読な低次情報を、入出力処理機構500によ
って辞書を用いて高次情報に変換し、計算機110に送
る。文書上への情報並記方式として第3図実施例を用い
る場合のプリンタヘッドを595に示す。この場合には
、通常インクノズ  ′ル570と光学センサー598
とをヘッド上に備けておいて、目視可能情報印刷時に、
通常インクノズルからのインク射出を、機械可読コード
のビットパターン配列に合わせてオンオフ制御すること
により文書上にMNコードを陰伏させた目視可能情報を
作成させる方式が可能である。逆に文書読み込み時には
、光学センサー598によってMNコードを低次情報と
して読み込み、入出力処理機構500によって高次情報
に変換し、これを計算機110に転送する。
第6図は、入出力処理機構500の機能ブロック図であ
る。計算機110とは高次情報路520を介して接続さ
れており、プリンタ側とは低次情報路530を介して接
続されている。出力時には高次情報は一旦、データバッ
ファ612に蓄積される。計算機110から送られる高
次〜低次変換辞書は辞書メモリ610に記憶される。高
次→低次変換部614では辞書メモリ610内の辞書を
用いてデータバッファ612上の高次情報を低次情報に
変換し、低次情報データバッファ616に蓄積する。6
16内の低次情報にはパリティコード及び印刷制御フォ
ーマツ1へコードがパリティ付加及びフォーマット生成
部617によって添付されたのち、出力データ生成部6
19によって印刷信号に変換され、D/A変換器618
を通してプリンタに送られる。
文書人力時には、文書上の機械可読な低次情報のアナロ
グ信号が先ずA/D変換器620によってディジタル化
され誤り訂正部621で誤り訂正を受けたのちデータバ
ッファ622に蓄積される。
訂正部612内には文書上に多重表現された機械可読コ
ードが全て読み込まれるため、重複削除処理部624に
よって重複を削除し、重複を徐いたデータが一時メモリ
626に蓄積される。このあと辞書を用いた低次→高次
変換部628で低次→高次変換処理が実施され、得られ
た高次情報はデータバッファ630に蓄積され、計算機
110に送られる。
図では出力処理と入力処理とを判り易く説明するために
、入出力の双方の処理で共有できる処理ブロックを別々
に図示したが、実際に実現する場合には、高次情報デー
タバッファ612と630、低次情報データバッファ6
16と622などは同一のものを並用してもよい。また
、各部614゜616.617,619,621,62
4,624等を1つ又は複数のマイクロプロセッサで実
現できる。
第7図は計算機110側での文書編集処理の概要を示す
。処理モード判定700ののち、利用者のモード選択が
文書編集であれば、文書編集ソフトウェア710を起動
してテキストや図を対話形で作成する。この時、作成さ
れたテキス1へや図形は文書上での表示位置、テキスト
や図形の性質等の様々な情報をアスキーコード等の高次
表現形式で計算機110内のメモリ上に記憶する。また
、ひとまとまりの情報ブロック、たとえば”House
”という単語、あるいは長方形という形状ごとに、高次
情報には開始マークと終了マークがつけられ、以降の出
力処理時の単位レコードとされる。翻訳などをおこなわ
せたい場合には、ひとつの文章全体を単位レコードと定
義し、その文の構文木情報、たとえば主語、a詞、目的
語などを、視覚可能情報と共にレコード内に定義する。
利用者が出力処理モードを選択した場合には処理720
をおこなう。すなわち、先ず高次情報を低次情報に変換
するだめの辞書を入出力処理機構500に出力し、その
あと計算機メモリ上の高次情報レコードを第6図のデー
タバッファ612に転送し、第6図処理部614〜61
8によって印刷処理をおこなう。
利用者が入力処理モードを選択した場合には、先ず入出
力処理機構500に変換辞書を転送する。
次に第6図処理部620〜628によって低次情報の読
み込みと高次情報への変換をおこなったのち、データバ
ッファ630内の全レコードを計算機メモリ内に取り込
む。
第8図は第6図610の辞書メモリに転送して高次・低
次情報間の変換をおこなわせる変換辞書の内容説明であ
る。ヘッダ800部は、辞書がメモリ上に配置された時
のフィールド内容を示しており、802の部分はアドレ
ス、804部は辞書  ′種別たとえばテキス1〜用か
図形用がといったことをビット情報で記述する部分であ
る。806部は高次情報フィールドであり例えばアスキ
ーコードが記入される。808部は各々の高次情報に対
する低次視覚可能情報のニー1・、810部は視覚不可
機械可読情報コードであり、812部全体が低次情報コ
ードを記述するフィールドとなっている。
図で814部は文字11 A +1に関する辞書内容で
ある。ある高次情報を低次情報に変換するには、図中の
フィールド806のビットパターンとマツ≠ンクさせ、
マツチする行の低次情報フィールド内のビットパターン
を取り出せば良い。逆に機械可読低次情報を高次情報に
変換するには図中のコード810のビットパターンとマ
ツチングさせ、マツチする行の高次情報フィールドの内
容を取り出せば良い。
第9図は文書出力時の高次情報から低次情報への変換処
理を詳細に説明したものである。データバッファ612
内のレコードはレコードを構成する単位情報ごとに高次
→低次変換部614内のメモリ上の900部に取り出さ
れ、辞書メモリ610の804.’806部とマツチン
グ(処理912)され、マツチした行914の低次情報
部808.810のビットパターンがメモリ上の920
部に取り出され(処理916)、低次情報データバッフ
ァ616に転送される。流れ図で示すと、先ずデータバ
ッファ6]2が空か否か調べ(処理930)、空でなけ
れば、低次レコード開始コードをデータバッファ616
に転送しく処理932)、引続いてデータバッファ61
2内のひとつのレコードを読み出して、その構成単位た
とえばテキストレコードの場合、その−文字ずつを辞書
を用いて低次情報に変換し、次々にデータバッファ61
6に転送する(処理940)。ひとつのレコードを変換
したのち低次レコードの終了コ一ドをデータバッファ6
16に転送しく処理942)、データバッファ616内
に開始コードと終了コードで囲まれたひとつの低次情報
レコードを作成する。最後にこうして作成したひとつの
低次情報レコードに出力形式命令コードを書き込む(処
理944)。これは例えば、視覚可能情報、” Hou
 se I+に並記すべき機械可読コードの出力重複回
数等を指定するためである。以下同様にデータバッファ
612内の全レコードを処理したあと終了する。
第10図(、)および(b)は文書入力時の低次情報の
高次情報への変換処理の詳細を示す。データバッファ6
22内の開始コードと終了コードで囲まれた低次情報レ
コードはひとつづつ重複データ削除部624に取り込ま
れる(処理1000)、開始コードあるいは終了コード
が脱落しているレコードは、紙面上のシミなどで破損さ
れた情報とみて廃却(処理1006)する。そうでない
レコードについては、−時メモリ626内に記憶されて
いるレコード1¥:1002との間で同一性判定処理1
004をおこない、同一データの場合には重複データで
あるとみて廃却(処理1006)する。
同一でない場合には一時メモリ内に記憶させる(処理1
008)。同一性判定のためには、レコード1001の
ビットパターンと1002のレロー)〈各々のビットパ
ターンとの排他的論理和(FOR)演算をビットごとに
実施し、全ピッ1−が0ならば同一データと判断する方
式が簡便である。なお、全提条件として、文書入力に先
立って一時メモリ626はクリアしておく必要がある。
同一文書の異る場所から同一内容、例えば”House
”というテキストが入力された場合には、入力された低
次レコード上には、例えば第4図に示したような表示位
置座標コード418も含まれているため、EOR演算に
よって同一性判定をおこなう際に異る入力データである
と判定される。よって、上記の重複レコード削除処理に
よって削除されるのは、文書上の同一場所に表示された
可視情報ひとつに対して文書の汚れなどへの対応力向上
のためにわざと複数並記されていた機械可読情報の内の
余分なものだけとなる。データバッファ622のレコー
ドを全て処理し、データバッファ622が空になったら
、1時メモリ内のレコードをひとつづつ選び、各レコー
ド上の単位データ並び(1010,1011なと)ごと
に、ひとつづつ変換部628内のメモリ上しこよみこみ
(処理1012)、これを辞書内の低次情報フィールド
の内の機械可読情報フィールド810部のビットパター
ンとマツチングさせ(処理1.020)、マツチした行
1022の高次情報フィールド804,806部のビッ
トパターンをメモリ1030に取り出す。
次にメモリ1030の内容を高次情報データバッファ6
30に送る。なお、ひとつのレコードをデータバッファ
630内に転送するに先立ってレコード開始コードをデ
ータバッファ630に送っておき、ひとつのレコードの
処理を全て終了した時点で終了コードを送り、データバ
ッファ630内にひとつの高次情報レコードを作成する
。第10  ′図(b)には以上が流れ図として説明さ
れている。
以上によってデータバッファ630には入力文書上の機
械可読情報が、重複を省いて高次情報レコ−ドの形で読
み取られたことになる。
第11図は高次情報と低次情報との関係を説明したもの
である。本例では高次情報の単位ブロックとして英文テ
キスト”Th1s js a House、”を用いて
いる。もちろん、単位ブロックとして複数個の文からな
る文章全体を採用することもできるが、その定義のh法
は文書編集の都合によって任意に決めれば良いものであ
って、ここで示す例が絶対的なものではない。ここでは
、高次情報の単位ブロックがいくつかの単位レコード1
102の集合で形成されており、単位レコードは開始コ
ード]−110と終了コード1114の間に高、数情報
本体部1112を持ち、本体部1112の中にレコード
内単位情報11o3をいくつか保持していることを例と
してあげている。高次情報レコード1102に対応する
低次情報レコードを1104に示す。開始ロー+: 1
120と終了コード1130の間に、出力フオーマッド
コード1122.コード本体部1124.パリティコー
ド1128を持っている。コード本体部1124内の単
位情報1106は、例えばテキストの一文字に対する可
視情報コード1132と機械可読情報コード1134の
ペアとして定義されている。低次情報単位レコード11
04は、いくつか集まって低次情報の単位ブロック11
08を形成している。
次に第6図の出力データ生成部619の処理の内容を第
12図で詳述する。先ず、データバッファ616内の低
次情報レコードが、パリティ及び出力フォーマット情報
を付加されて、処理機構617より出力されて来たもの
を入力として受理する(処理1200)、次にこの入力
情報」二に記述されている低次情報本体部(例えは第1
1図中の1124)の内容及びフォーマットコードの内
容(例えば第11図1122)により出力するテキスト
や図形のビットパターンを作成する(処理1202)。
続いて、作成したビットパターンを、印刷器の1行分ず
つD/A変換器に出力する(処理1204)。処理12
02では、視覚用の出力情報と機械用の出力情報との双
方がビットパターン化され、処理1204の出力では双
方が出力される。この出力信号によって第5図の印刷用
ヘッド540あるいは595の動作が制御され、目視可
能情報と機械可読情報との双方とが同−文書上に表示さ
れる。
第13図は本発明の応用例として一部が汚れた文書を入
力し編集する場合を示している。本発明にもとづく文書
1300 (文書1)は、1部が汚されているとする。
別に文書1304 (文書2)も使用する。先ず両文書
上の機械可読情報をスキャンして入力する(処理130
6)。汚れ13o2が存在していても、本発明における
機械可読情報の重複化出力表示方式により、汚れていな
い1個の情報が存在すれば原情報は復元できる。入力さ
れた低次情報は高次情報に変換され(処理1308)、
計算機本体上の主メモリに取り込まれ、文書編集ソフト
ウェアを用いて編集がほどこされる(処理1310)。
入力した低次情報には文書上のテキストや図形の表示位
置座標等も含まれているので、低次→高次変換処理13
08で、それらの情報も高次情報に変換しておけば、例
えば文書2の中の太陽の図面を対話処理によって文書1
の座標系内に移動させることは容易である。この他、文
書1内の文字タイプの変更、家の図形の屋根の部分を黒
くぬりつぶすといった変更も対話によって容易に実現で
きる。文書編集の終了後、計算機メモリ上に作成された
新文書の高次情報を低次情報に変換し〔処理1312)
低次情報をプリンタ装置によって出力表示させると(処
理1.314)、目視可能情報と機械可読情報が並記さ
れた新文書]3〕6が得られる。本応用例で証明される
本発明の、従来技術に比較した大きな特徴は、1部分が
汚れなどによって破損された文書を直接入力しても、原
情報が容易に復元できること、テキストや図形を含む一
般文書の、文書上に表記された情報の意味までを含めた
直接的読み取りが容易に実現でき、従来のようにフロッ
ピィ−ディスク等と印刷用紙の2重所有や管理が不要と
なることなどである。
現在、多用されるようになってきたスキャナーは白黒の
単純なドツトパターンとして文書を入力できるのみであ
り、テキストや図形の意味情報までを復元入力すること
は不可能であり、本応用例に比較しうる高度な編集機能
を実現することはできない。
第14図は、本発明を応用した異−涌語文書間の直接自
動翻訳方式の説明図である。本例の場合には、原文書1
400上には目視可能情報に並記して機械可読コードに
よって目視可能情報の意味構造が論理学で使用される述
語の形式で除法記載されているものとする。入力処理に
よって、容易に家(赤)。
という、″赤い家″という文章の述語表現が高次情報と
して計算機内部のメモリ上に復元できる(処理1402
)。こうして復元された述語の各各の要素、すなわち″
家′″と″赤′″とを翻訳辞書1406を用いて翻訳し
、別言語で記述した述語、house(red)。
を得る。
次に、この新しく得られた高次情報を出力処理すること
により、Red houseという異語゛語テキストを
持った新文書1408をプリントアウトさせることかで
きる。
本応用例で示される本発明の意義は、従来不可能である
とされてきた、図形やテキストを含む一般文書の、異言
語文書への直接的変換が容易に実現できるという点であ
る。従来の言語翻訳においては、目視可能なテキスト、
すなわち本例の場合には“赤い家”という、ある評語で
記述された情報を先ず構文解析によって家(赤)″とい
う述語に変換し、次にこれを異国語に変換するという方
式を取っている。構文解析段階はきわめて困難な処理で
あり、未だ正しい翻訳をおこなえる状況ではなく、将来
ともに不可能であろうとの予想もされている。ところが
、文書編集用ラフ1−ウェアに、文書を作成する途中で
文書作成者との対話により、作成者が意図している文の
真の意味構造を抽出して述語等の形式で記述し、文その
ものとは別に保持することは現在の技術で容易に可能で
ある。本応用例では、この方式を利用して取得した述語
家(赤)′″と、表示文赤い家″とが原文書1400上
に並記しであると想定して説明をおこなった。
第15図は、異言語文書間の自動翻訳において。
格文法によって意味表現する例を示すものである。
格文法では、第15図の原文「私は8時に電車で学校へ
行く」に対して、「行く」という動詞を中心として、そ
の動作主は「私」9時は「8時」。
手段は「電車」、終点は「学校」であるというように、
文の中の語の持つ意味的役割りを明示する形で文全体の
意味を表わす。この意味表現を同図(c)のような形で
高次情報として、人間向けの原文と並記しておけば、そ
の機械可読情報から同図(d)のように、訳文” ■g
o to the 5choolat 8 o’clo
ck by trajn、”を自動生成することができ
る。
情報媒体の汚染や欠損に対する情報保護方法としては、
幾種類かの異なる方法によって機械可読情報を表現して
並記する形もとる。例えば、光でのスキャン用のバーコ
ードと磁気読取り用の磁気インクによる方法、情報媒体
中の一部分をマイクロフィルム化する方法や、半導体記
憶装置を情報媒体に埋め込むノブ法と上記方法との組合
わせ等である。
第14図では、本発明をテキストと図形の双方を含む文
章の異国語間翻訳処理に適用する例を示したが、もつと
簡単な例で、かつ最近の文書処理の中で技術開発課題と
なっている、文書からの特定情報の切り出し処理への適
用について第16図を用いて説明する。
第16図1500はテキスト部1504と図形部150
2を共に持った文書である。テキスト部の開始列の部位
(1510,1512)に本発明の機械可読コードによ
るテキスト開始記号を記入し、終了列部位(1514,
1516,1518)にテキスト終了記号を記入する。
また、図形部の開始列部位(1520,1522)に図
形開始記号を、終了列部位(1524,1526)に図
形終了記号を各々記入する。以」二のように作成された
文書を例えば第5図実施例に示した装置によって、図で
水平力向にスキャンすることにより、容易に文書中のテ
キスト部と図形部を認識でき、例えば図形だけを選択的
に取り出すといった機能を実現できる。図中で1510
.1514部などに記入する機械可読コードによる開始
あるいは終了記号のかわりに、目視可能情報とは別の場
所に、テキスト部位や図形部位に関する情報を記憶して
おく方法も考えられるが、これらに比べて、上記実施例
では、人間用と機械用の情報を重ね書きできる方式が有
利である。
(1)文書面積の有効活用ができる。
(2)文書上に情報を印刷する時に、原紙面に対する印
刷情報の位置が予定通りにならずに、ずれたり、回転し
たりすることが一般的である。別の部位に人間用と機械
用の情報を記載する方式だと、このような外乱への耐久
力が弱くなる。
例えば紙面左上点を起点と約束して機械用コードで表示
したテキスト部15o4の原点位置が実際の原点位置と
ずれてしまい、文書を再度読み取る際にエラーを起こす
。これに対して、機械用と人間用の情報を同一部所に重
ねて記述する実施例では、双方の情報が同一の外乱を等
しく35) く受けるため再度読み取る際のエラーは少くなる。すな
わち外乱への耐久力が強いと昌える。
〔発明の効果〕
本発明によれば、人間が目視可能な情報と、人間には目
視困難であるが機械には可読な情報とによってテキスト
や図形を含む文書を作成することによって、次のような
効果かある。
(1)従来のように人間用に紙髪使用した文書を作成し
、機械用にフロッピーディスクを使用して文書の機械コ
ードを保管するという2重管理か不要となる。
(2)文書をその意味情報まで含めて直接機械に読み取
られることが可能となる。しかも、機械用の情報を多重
化して文書上に表現することによって、文書の一部が破
損した場合でも容易に原文書を復元できる。以上は、従
来大変困難であるとされてきた、一般文書の機械による
直接解読が可能となることを意味する。回路図■Iの自
動読み取りも同等に可能となる。
(3)文書上に文や図形の意味情報を機械可読な形で並
記しておくことにより、異国語間文書自動翻訳が容易に
実現できる。従来はこれは不可能であった。
【図面の簡単な説明】
第1図は本発明の全体概要を示す概念図、第2図は本発
明文書表現方法による一実施例を示す図、第3図は本発
明文書表現方法による他の実施例を示す図、第4図は本
発明文書表現における機械可読情報のコード化実施例を
示す図、第5図は本発明文書の入出力部の説明図、第6
図は本発明文書の入出力機能のブロック図、第7図は本
発明における文書編集ソフトウェアの一例を示す図、第
8図は本発明で用いる高次・低次情報変換辞書の一実施
例図、第9図は本発明での出力処理主要部の一実施例の
説明図、第10図(a)、(b)は本発明での入力処理
主要部の一部実施例の説明図、第11図は本発明で使用
する高次情報と低次情報との関係説明図、第12図は本
発明での末端出力処理部の処理内容説明図、第13図は
本発明を応用した部分破損文書直接入力による文書編集
方式の一実施例を示す図、第14図は本発明を応用した
、異国語文書間自動翻訳方式の一実施例を示す図、第1
5図は本発明を応用した異国語文書間自動翻訳方式の他
の実施例を示す図、第16図は本発明の文書切り出し処
理への適用例を示す図である。

Claims (1)

  1. 【特許請求の範囲】 1、人間が目視できる情報表現様式の情報と人間には目
    視困難であるが機械には可読な情報表現様式の情報との
    両者の文書上での表示位置が重複する文書上での情報表
    現方法。 2、目視困難機械可読表現物質として、磁気を含む物質
    あるいは光の反射特性に特徴を有する物質を使用する請
    求項第1項の情報表現方法。 3、人間に目視可能な情報表現物質を用いて人間には目
    視困難であるが機械には可読な情報を表現する請求項第
    1項の情報表現方法。 4、2−7コードに代表されるMNコードとよばれるコ
    ード化方式によつて、目視可能物質の文書への付着状況
    を変化させることにより、見た目の文書上の文字等の濃
    淡を均一化しつつ、かつ機械可読情報を併記する請求項
    第1項の情報表現方法。 5、請求項第1項の情報表現方法により文書を作成する
    手段を備えた処理システム。 6、請求項第1項の情報表現方法により作成された文書
    を読み取る手段を備えた処理システム。 7、目視可能情報と目視困難機械可読情報とを文書上に
    同時表示する手段と、目視困難機械可読情報を読み取る
    手段とを備えた計算機システム。 8、目視可能情報及び目視困難機械可読情報生成用デー
    タのペアを、文字や図形に対して定義した辞書を使用し
    て請求項第1項の文書を計算機システムに入出力する方
    法。 9、目視可能情報のひとつの表示に対して、対応する目
    視困難機械可読情報を複数個表示するようにした請求項
    第1項の情報表現方法。 10、請求項第9項記載の文書上の複数表現された機械
    可読情報から、同一情報についてはひとつのみの情報を
    選出する機能を備えた情報表現方法。 11、請求項第1項の表現方法により、テキスト及び図
    形情報を同時表示した文書の読み取り、編集、編集結果
    の出力のいずれかをおこなう文書編集装置。 12、請求項第1項記載の表現方法による文書において
    、目視可能文章及び図形の一方あるいは双方の意味情報
    を目視困難機械可読情報として保持させ、これを利用す
    ることによつて異言語文書間の機械翻訳をおこなわせる
    翻訳装置。 13、意味情報記述手段として述語論理学における項の
    概念を使用する請求項第12項の翻訳装置。 14、請求項第12項記載の意味情報記述手段を用いて
    、文書入力によつて、計算機システムの動作制御をおこ
    なわせる処理システム。 15、医療相談、法律相談、住民表管理、特許管理、設
    計図管理、プロジエクト管理、絵画管理、楽曲管理、生
    産管理、図書館管理または教育の分野に適用した請求項
    第14項の処理システム。 16、大規模記憶装置と請求項第6項のシステムとを組
    合せて使用する文書管理システム。 17、機械可読情報を複数の異なる記録手段によつて記
    録し、読みとる手段を有する請求項第7項の計算機シス
    テム。
JP63137526A 1988-06-06 1988-06-06 文書処理システム Pending JPH01306958A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63137526A JPH01306958A (ja) 1988-06-06 1988-06-06 文書処理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63137526A JPH01306958A (ja) 1988-06-06 1988-06-06 文書処理システム

Publications (1)

Publication Number Publication Date
JPH01306958A true JPH01306958A (ja) 1989-12-11

Family

ID=15200739

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63137526A Pending JPH01306958A (ja) 1988-06-06 1988-06-06 文書処理システム

Country Status (1)

Country Link
JP (1) JPH01306958A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232564A (ja) * 1990-05-30 1992-08-20 Xerox Corp 電子文書処理装置
JPH07295958A (ja) * 1994-04-27 1995-11-10 Ricoh Co Ltd ペーパーメディアシステム

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5329025A (en) * 1976-08-31 1978-03-17 Oki Electric Ind Co Ltd Chinese-character input device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5329025A (en) * 1976-08-31 1978-03-17 Oki Electric Ind Co Ltd Chinese-character input device

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04232564A (ja) * 1990-05-30 1992-08-20 Xerox Corp 電子文書処理装置
JPH07295958A (ja) * 1994-04-27 1995-11-10 Ricoh Co Ltd ペーパーメディアシステム

Similar Documents

Publication Publication Date Title
JP3219251B2 (ja) 電子文書処理装置
US6035308A (en) System and method of managing document data with linking data recorded on paper media
US5327342A (en) Method and apparatus for generating personalized handwriting
Finneran The literary text in the digital age
Piotrowski Natural language processing for historical texts
CA2365937C (en) System and method for distributing multilingual documents
US5133024A (en) Image data bank system with selective conversion
EP0459793B1 (en) Document processing
US5787449A (en) Method and system for manipulating the architecture and the content of a document separately from each other
JPH10228468A (ja) 文書情報管理システム
JPS6165290A (ja) ベクトル文字フオントの作成装置
Landoni The Visual Book system: A study of the use of visual rhetoric in the design of electronic books
JPH01306958A (ja) 文書処理システム
JP2004072558A (ja) 電子白板および電子白板のデータ出力方法
JPH0451871B2 (ja)
JPH08127152A (ja) 印刷装置および印刷装置の翻訳印刷方法
Beebe A Bibliography of Publications about Typographic Fonts
Hsieh et al. Component extraction from handwritten Chinese characters for font synthesis in personal style using smartphone APP
JP3080891B2 (ja) 帳票処理装置
Forrest Approaches to digital preservation: re-examining the recovery of the Chora of Metaponto, The Necropoleis
JPS61234464A (ja) 文書作成装置
Rinaldi Internet Architecture and News Design: How Language and Cultural Context Affect the Transition of Chinese Language Newspapers from Print to Online
Brüggemann-Klein et al. How to please authors and publishers: a versatile document preparation system at Karlsruhe
Rood et al. The comparative Siouan dictionary project
Molesworth The open interchange of electronic documents (open document architecture (ODA))