Nothing Special   »   [go: up one dir, main page]

JP2003316773A - 文書管理システム、方法、プログラム及び記憶媒体 - Google Patents

文書管理システム、方法、プログラム及び記憶媒体

Info

Publication number
JP2003316773A
JP2003316773A JP2002117787A JP2002117787A JP2003316773A JP 2003316773 A JP2003316773 A JP 2003316773A JP 2002117787 A JP2002117787 A JP 2002117787A JP 2002117787 A JP2002117787 A JP 2002117787A JP 2003316773 A JP2003316773 A JP 2003316773A
Authority
JP
Japan
Prior art keywords
document
search information
search
document management
binder
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2002117787A
Other languages
English (en)
Inventor
Takashi Mizuno
貴史 水野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002117787A priority Critical patent/JP2003316773A/ja
Publication of JP2003316773A publication Critical patent/JP2003316773A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 文書管理システム上でバインダを検索する場
合、バインドされる前の素材文書に検索情報が付与され
ていたとしても、バインダにインポートされた時点で消
えてしまっていた。また、電子バインダから素材文書を
エクスポートする際、該エクスポートした素材文書には
検索情報が付加されなかった。 【解決手段】 本発明の文書管理システムでは、複数の
電子文書から所望の素材文書を複数抽出して結合させる
ことにより、1つの電子バインダ文書を作成するバイン
ダ文書作成手段と、前記素材文書それぞれに関する検索
情報を取得する取得手段と、前記取得手段で取得した検
索情報を、前記バインダ文書作成手段で作成した電子バ
インダ文書に含まれる素材文書の検索情報として保存す
るよう制御する保存手段とを有する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、電子的な文書を登
録し管理する文書管理システムに関するものである。
【0002】
【従来の技術】企業では文書管理システムを導入し、文
書の再利用を推進しようとしている。近年、紙の文書を
スキャナを用いて取り込んだ画像文書や、パソコンで作
成された文書などに対し、検索のためのインデックス情
報を付加して登録保存するような文書管理システムが研
究されている。
【0003】また、近年、登録されている複数の文書か
ら任意のページを抜き出してバインダのように綴じて一
つの文書のようにすることも研究されている。それをこ
こでは電子バインダと呼ぶ。
【0004】
【発明が解決しようとする課題】しかしながら、文書管
理システム上でバインダを検索する場合、バインドされ
る前の素材文書に検索情報が付与されていたとしても、
バインダにインポートされた時点で消えてしまってい
た。また、電子バインダから素材文書をエクスポートす
る際、該エクスポートした素材文書には検索情報が付加
されなかった。
【0005】
【課題を解決するための手段】上記課題を解決するため
に、本発明の文書管理システムは、複数の電子文書を管
理する文書管理システムであって、複数の電子文書から
所望の素材文書を複数抽出して結合させることにより、
1つの電子バインダ文書を作成するバインダ文書作成手
段と、前記素材文書それぞれに関する検索情報を取得す
る取得手段と、前記取得手段で取得した検索情報を、前
記バインダ文書作成手段で作成した電子バインダ文書に
含まれる素材文書の検索情報として保存するよう制御す
る保存手段とを有する。
【0006】上記課題を解決するために、本発明の文書
管理方法は、複数の電子文書を管理する文書管理システ
ムを制御する文書管理方法であって、複数の電子文書か
ら所望の素材文書を複数抽出して結合させることによ
り、1つの電子バインダ文書を作成するバインダ文書作
成ステップと、前記素材文書それぞれに関する検索情報
を取得する取得ステップと、前記取得ステップで取得し
た検索情報を、前記バインダ文書作成ステップで作成し
た電子バインダ文書に含まれる素材文書の検索情報とし
て保存するよう制御する保存ステップとを有する。
【0007】
【発明の実施の形態】以下、図面を参照して本実施形態
を説明する。
【0008】本実施形態では、異なるアプリケーション
ソフトで作成した電子文書を同一のページの綴りとして
扱う事を可能とした電子バインダにおいて、バインダの
素材文書の検索情報に関して説明する。
【0009】バインダ文書とは、異なるアプリケーショ
ンで作成した電子文書を作成したアプリケーションの違
いを意識することなく取り扱うことのできる形態のフォ
ーマットである。単純にアプリケーションのデータファ
イル(素材文書)を束ねただけのフォーマットもある
が、本実施形態では、素材文書についてページを確定さ
せ、その確定させたページから必要なページを集めて、
1つの電子バインダ文書とする。ページを確定させるの
は、例えばプレーンテキスト文書など文書のページ区切
りが明確でないものがあるため、インポートされた時点
でページを確定させる必要がある。ページを確定させる
方法は、アプリケーションの印刷機能を利用し、例え
ば、Adobe社のPDFであるとか、W3C(World Wide Web Co
nsortium)で定められたSVG(Scalable Vector Graphic
s)など表示・印刷可能なアプリケーションに依らない
統一的なフォーマットに変換し、ページを確定する。ペ
ージを確定させ、統一的なフォーマットを持たせること
により、素材文書を作成したアプリケーションが無い環
境でも閲覧、印刷でき、また、アプリケーションが存在
する環境でもアプリケーションの設定により、ページ位
置がずれる可能性があるが、そのような位置ずれを回避
できるメリットがある。
【0010】図1は、文書管理システムの概略を示すブ
ロック図である。データベース101、データベース登
録部102、データベース検索部103、検索データ構
築解析部104、データベースアクセスユーザインタフ
ェイス部105から成る。
【0011】文書管理システム利用者は、データベース
アクセスユーザインタフェイス部105を用いて視覚的
に文書の登録、削除、複製、検索等の文書管理に関わる
操作を行う。また、検索のためのインデックス付けも行
える。入力された操作に応じて、文書をデータに登録す
る必要があれば、データベース登録部102を呼び出
し、データベース101に登録する。また、検索を行う
場合、検索のためのインデックスを登録するなど検索に
関わる動作を行った場合は、103データベース検索部
が呼ばれ、検索のための問い合わせをデータベース10
1に行う。尚、検索の際に、データベースに登録されて
いる情報を更新する必要が生じた場合には、102デー
タベース登録部を利用してデータベースに登録されてい
る情報を更新する。
【0012】図2は本実施形態の文書管理システムに用
いることが可能なコンピュータの構成例を示す。201
はROM202に格納されている制御プログラムに従っ
て本装置全体の制御を行うCPU、202はCPU20
1に後述するフローチャートに示す処理を実行させるた
めのプログラム等を格納するROM、203はCPUが
処理を行う際のワークエリアとして用いたり文書画像デ
ータ等を記憶したりするRAM、204は磁気ディスク
等の外部記憶装置であり、205はディスプレイ、20
6はキーボード、207はマウス等のポインティングデ
バイス、208は画像を読み取るためのイメージスキャ
ナである。また、209はネットワークインターフェー
スであり、図示しない遠隔地に存在する装置と通信し、
プログラムやデータなどを読み込んだり、書き込んだり
する。なお、本実施形態の文書管理システムは、コンピ
ュータがプログラムを実行することにより実現されるも
のとするが、このコンピュータはひとつの装置から構成
されても良いし、複数の装置から構成されても構わな
い。なお、本実施形態に用いられる文書管理制御プログ
ラムは、ROMに格納されているものとしたが、ハード
ディスクなどの記憶媒体に格納されていてもよいし、フ
ロッピー(R)ディスクやCD−ROMなどのリムーバ
ブル記憶媒体に格納され、必要に応じて読み込まれて実
行されるものであってもよいし、ネットワークを介して
外部装置から受信されて実行されるものであってもよ
い。また、本実施形態の文書管理システムは、文書管理
サーバと複数の文書管理クライアントから構成され、文
書管理サーバで文書と検索情報とを管理し、別の装置上
で動作する文書管理クライアントでユーザからの各種指
示を行ったり検索結果等の表示を行えるようにしてもよ
いし、文書管理サーバが動作しているコンピュータ装置
上に文書管理クライアントも動作するようにしてもよ
い。
【0013】文書管理システムとバインダについて図3
を用いて説明する。301は、本実施形態における文書
管理システムの画面例である。302は、コンピュータ
のOS上で管理されたファイル管理画面の例である。3
03は、バインダ編集のためのソフトウェアの例であ
る。304は、素材電子文書を管理する「ドキュメント
リスト」である。305は、ドキュメントリスト304
で選択された文書の各ページのサムネイル画像を表示す
る「ページビュー」である。306は、インポートされ
たドキュメントから必要なページを抽出して生成電子文
書として管理する「ワークスペース」である。307
は、生成した電子バインダ文書を表示するためのソフト
ウェア(ビューアー)画面例である。
【0014】素材電子文書をバインダ編集ソフトウェア
にインポートすると、ドキュメントリスト304に文書
が挿入され、先に述べたように文書を作成したアプリケ
ーションの印刷機能を利用してページ確定し、確定され
た各ページからサムネイルが作成され、ページビュー3
05に表示される。ドキュメントリストから文書単位も
しくは、ページビューからページ単位で必要なページを
ワークスペースに集めることで所望の電子バインダ文書
を作成する。
【0015】文書管理システムにおいて、文書を検索す
るために、文書名や文書が作成された日付、更新された
日付、作者名などが用いられる。また、検索を容易にす
るためにユーザがその文書を特徴付けるキーワードを付
けることができたり、文書の種類を登録したりすること
もできる。図4は、文書管理システム上で文書検索を行
うためのユーザインターフェイスの一形態である。40
1は、文書名で検索するための情報を入力する領域であ
る。402に検索したい文書名を入力する。403のチ
ェックボックスにチェックされていれば、文書名での検
索が実行される。なお、404の各チェックボックスは
それぞれ右に書かれている項目で検索したい場合に、チ
ェックしておく。チェックされたものについて、全て満
たす文書を検索する(AND検索)。本実施形態では図
示していないが、検索項目の内容を入力する欄は、完全
一致だけでは無く、部分一致や前方一致、後方一致、正
規表現を用いて検索可能であり、また、アルファベット
の大文字・小文字を区別する/しない、全角・半角を区
別する/しないをユーザに選択させるオプションを与え
ることができる。検索項目が文書管理システムの検索項
目に設定されていれば、検索項目は図4に図示された項
目に限らない。
【0016】また、日付での検索も可能である。日付で
の検索としては、「作成日」「更新日」「アクセス日」
があり、それぞれ「文書を作成した日」「文書を更新し
た日」「文書をアクセスした日」となる。検索を行わせ
るためには、上記説明と同様にして検索させたい項目を
405のチェックボックスでチェックする。日付は一定
期間を入力でき、406に検索開始、407に検索終了
日付を入力する。
【0017】ボタン408を押すことで、検索が実行さ
れる。検索については公知の技術を用いて行われる。ボ
タン409は、図4のユーザインターフェイスを終了す
るためのボタンであり、ボタン410は、入力した項目
をクリアするためのボタンである。
【0018】本実施形態では、404、405でチェッ
クした項目をAND検索しているが、OR検索(チェッ
クしたものどれかに該当すればよい)など検索のための
公知の技術を用いた検索であっても構わない。
【0019】図5は、検索結果表示の例である。501
に検索された文書数、503が結果の一覧を表示してお
り、文書名、サイズ、ページ数、更新日の情報が表示さ
れる。502は、503の中から選択した文書の文書管
理システム内の位置が表示される。504は、通常の文
書を表しており、505はバインダ文書を表している。
このように、文書名の横に文書を特徴付けるアイコンが
配置される。バインダ文書の場合は、更に、内部に持つ
素材文書が検索にヒットした場合、506に記されるよ
うに、内部の文書も検索結果に表示される。バインダ文
書及び通常の文書は、図4、図5で説明したような文書
検索で検索することが可能である。以上が、文書管理シ
ステムにおける文書検索処理である。
【0020】図9において、本実施形態でのバインダの
概略を述べる。図9では、バインダはEBINDER部
(901)に次のような情報を有する。EBINDER
_INFO部(902)は、バインダのメタ情報を保持
する部分である。この部分には、タイトルや作成者の情
報などを入れることができる。JOBS部(903)
は、JOB部(904)から成る。図9では、一つしか
JOB部が無いが、複数あってもよい。JOB部は、バ
インダ文書に対する情報を記述できる。図9において
は、バインダの検索情報が記述されているバインダの検
索情報ファイル(912)を指す形式をしている。MA
TERIAL部(905)は、バインダに取り込まれた
素材文書に対する情報が記載させる。一つ一つの素材文
書に対する情報は、EFILE部(906)に記載され
る。EFILE部では、素材文書、ページ単位にばらさ
れたページ数分のPDFファイル、個々のページのサム
ネイルなどへのリンク情報が記載されている。尚、EF
ILE部には、必ず一意なIDが振られるようになって
いる。RELATED部(907)は、複数のREL部
(908)から成る。図9では、3つのREL部が存在
している。REL部には、検索情報ファイル(914)
へのリンク先が記載されており、更にEFLIE部に対
応させるためのIDが記述されている。PAGEIND
EX部(909)は、バインダ内の素材文書から所望な
ページを指し示すために用意されている。PAGEIN
DEX部は、構成文書のページを表す複数のINDEX
部(910)から成る。BOOKBINDING部は、
PAGEINDEX部がリンクで指しているページを統
合して、一つの文書ファイルにまとめたものを表すもの
である。
【0021】本実施形態では、素材文書がバインダにイ
ンポートされたとき、文書管理システムから入力される
系(即ち素材文書に検索情報が既に付いている場合)
と、オペレーティングシステムが管理するファイルシス
テムなどから入力される系(検索情報が付かない場合)
の2通りがある。
【0022】図6は、本発明の実施形態で実行されるイ
ンポートの際のフローチャートである。
【0023】まず、S601で文書のバインダへのイン
ポートについての初期化処理処理を行う。ここでは、例
えば、マウスを用いてドラッグ&ドロップ処理を行った
場合にドロップされたファイルを取得する処理など公知
の技術で実現できるため、その詳細については省略す
る。
【0024】S602において、インポートされた文書
がドキュメント管理システムからのものであるか否かを
判定する。ドキュメント管理システムのものであれば
(S602でYes)、S603に進む。S603で
は、ドキュメント管理システムのデータベースから当該
文書の検索情報を取得する。取得する検索情報は、図4
で説明された項目である。尚、本実施形態では図4に示
した項目だけであるが、検索に必要な項目が文書管理シ
ステムの検索項目に設定されていれば、S603で取得
される項目は、上述した項目に限らない。
【0025】一方、S602でドキュメント管理システ
ムからインポートされたものでないと判断された場合
(S602でNo)、S604に進む。S604では、
ファイルフォーマットから検索情報を取得できるか否か
を判断する。これは、その文書を作成したアプリケーシ
ョンによっては、該文書ファイルから検索情報を取得で
きるものがあるために実行される。検索情報が取得でき
る場合(S604でYes)、S605に進む。S60
5では、ファイルフォーマットから検索に必要な情報を
取得する。例えば、ワープロ文書など、文書によっては
作成者を取得することができるものがある。検索情報取
得のためには、アプリケーション毎に定義された取得手
法を利用する。S604でNoの場合、もしくは、S6
05の処理が終了した場合、S606に進む。S606
では、OSのファイルシステムが持つファイルのタイム
スタンプ(作成日、更新日、アクセス日)を取得する。
S603、もしくは、S606の処理の後、S607へ
進む。
【0026】S607では、S603で取得した検索情
報、もしくは、S604,S605で取得した検索情報
を元にして、検索情報保持ファイルを作成する。検索情
報保持ファイルには、検索情報の項目が書かれる。検索
情報保持ファイルの詳細については、後述する。S60
8に進み、インポートされた文書と共に検索情報保持フ
ァイルをバインダ内に保存する。
【0027】次に、検索情報を保持するためのファイル
について図7を用いて説明する。本発明では、XML
(Extensible Markup Language)記述を利用して、検索
情報保持ファイルを作成する。1行目の701は、XM
L記述で定められた必須の宣言であるXML宣言を表
す。このXMLのルート要素は、<CBINDEX>で
ある。この内部に検索のための情報が記述されていく。
<CBINDEX>の内部(704)は、複数の<FI
LE>要素から成る。<FILE>要素には、type属性
があり、どのような検索情報が内部に記述されているか
を表す。図7では、702、703の二つの<FILE
>があり、それぞれの属性はSystemIndex、UserIndexで
ある。ここで、SystemIndexの<FILE>要素内の情
報(702)は、文書管理システム内の検索サービスが
始めから提供している情報であることを示し、UserInde
xの<FILE>要素内の情報(703)は、ユーザが
独自に作成した検索のための項目が書かれていることを
示している。<FILE>要素の内部は、更に複数の<
FIELD>要素から成る。<FIELD>要素は、検
索項目の情報が記され、<FIELD>内部に実際の項
目が記述されている。<FIELD>要素は、以下の属
性を持つ。検索項目名としてname属性、項目の種類(文
字列なのか数値なのかなど)としてtype属性、項目の最
大サイズとしてsize属性、そのサイズの単位を表すもの
としてsizeUnit属性、項目の識別子を表すid属性があ
る。これらは、全てが必須ではなく、最低限name属性と
type属性だけ存在すればよい。また、size属性、sizeUn
it属性、id属性は、文書管理システムの検索プログラム
が利用するためのデータである。実際に記述されている
項目が、type属性で指定された型と異なる、最大サイズ
を越える等の障害が起こった場合、例えば、エラーメッ
セージを表示すると言った処理については、文書管理シ
ステムが処理をしてよい。
【0028】type属性の一例として、FIXSTRING(固定
長文字列)、FIXMAXSTRING(最大文字数指定固定長文字
列)、VARSTRING(可変長文字列)、BOOL(真偽値)、D
ATE(日付)、LONG(整数値)、ULONG(非負整数値)、
DOUBLE(浮動小数点値)などが挙げられる。
【0029】例えば、705では、検索項目名が「Auth
or」であり作成者のための検索項目である。また、type
属性が「String」であることから、作成者は文字列で記
述され、size属性、sizeUnit属性がそれぞれ「63」、
「byte」であることから、最大サイズが63バイトとな
る。従って、作成者の項目として、最大63バイトの文
字列が入力できることを<FIELD>の属性で表して
いる。そして、705の<FIELD>には、検索項目
の情報として「Yamada Taro」が記載されている。
【0030】このようなXML形式で、検索項目につい
て記述したものをS607で作成する。
【0031】図8は、簡素化した電子バインダのフォー
マットの一例である。801は、先に説明したXML宣
言である。ルート要素である802の<EBINDER
>タグ内で電子バインダの内容を表す。尚、version要
素は、この電子バインダのバージョンを表す。この例で
は、1.00である。802の内部には、803の<REL
ATED>部、804の<MATERIAL>部、80
5の<JOBS>部から成る。但し、<EBINDER
>の内部構成はこの限りではなく、例えば、電子バイン
ダの構成を表す<INDEX>部や構成された統合電子
文書を表す<BOOKBINDG>部などがあってもよ
い。
【0032】804<MATERIAL>タグは、電子
バインダ内に持つ素材文書を表す。files属性が素材文
書数を表す。素材文書はそれぞれ806<EFILE>
タグで表される。<EFILE>タグのhref属性が素材
文書の保存先を表し、id属性がこの素材文書を一意に表
す識別子であり、totalpage属性がこの素材文書の持つ
ページ数を表す。素材文書は電子バインダに入れられる
際に、印刷処理によってページが確定されるためにペー
ジ数を求められる。
【0033】805<JOBS>タグ以下に電子バイン
ダに対する検索情報について記述される。<JOBS>
内部には、807<JOBTICKET>タグが必要な
だけ記述される。href属性に検索情報ファイルの格納場
所が書かれる。このフォーマットは図7に示したもので
ある。<JOBS>タグにはその他に電子バインダに関
する情報も置くことができる。例えば、電子バインダに
色の指定がある場合ここに色に関する情報のファイルの
所在を指定することなどもできる。role属性は、<JO
B>タグがどのような情報を表しているのかを表すため
のものであり、本実施例の場合は、「Index」という属
性値が設定され、検索情報であることが示される。
【0034】803<RELATED>タグ内には、素
材文書に関連した情報が記述されている。内部には、<
REL>タグを必要なだけ持つことが可能である。図8
においては、808の<REL>タグ一つである。<R
EL>タグ内部には素材文書に関連していればどのよう
な情報でも記述することが可能であるが、本実施例では
素材文書に対する検索情報を表すものだけが示されてい
る。href属性に素材文書に対する検索情報の保存先が記
述される。この場合は、当該電子バインダ管理ファイル
から相対的なディレクトリの位置である「related\rel0
\index.xml」となる。role属性は、<REL>タグがど
のような情報を表しているのかを表すためのものであ
り、本実施例の場合は、「Index」という属性値が設定
され、検索情報であることが示される。また、<REL
ATED>タグがどの素材文書に対する検索情報を表し
ているのか示すために、idref属性があり、対応する<
EFILE>のid属性が用いられる。図8では素材文書
は一つしかなく、そのid属性である「ef996545875」が
値として記述される。
【0035】以上述べてきたように、バインダ文書には
バインダ自身に対する検索情報と素材文書それぞれに対
する検索情報が存在する。これらを用いて公知の検索シ
ステム(データベースシステム)で検索処理が行える。
【0036】検索処理を行うために、データベースに検
索情報を登録するには、バインダ文書の保存時に同時に
登録される。図10を用いて、バインダ文書の検索シス
テム(データベース)への登録を説明する。バインダ文
書の保存が指示されると、S1001でバインダ文書か
らバインダ自身に対する検索情報ファイルを取得する。
具体的には、803<RELATED>部以下の808
<REL>部で属性roleが、Indexであるもののhref属
性に記されたファイルを取得する。S1002で、S1
001で読み出した検索情報ファイルを解析する。この
解析処理には、W3C(World Wide Web コンソーシア
ム)で規定されているDOMなどを用いて行われる。S
1003で、S1002で解析した結果をデータベース
へ登録する。S1004において、当該バインダ文書の
素材文書数をcountに代入する。S1005でcountが1
以上であるならば(S1005でYes)、S1006に
進み、0以下であるならば(S1005でNo)処理を終
了する。S1006では、バインダ文書のcount番目の
素材文書を取り出す。具体的には、図8において、80
4<MATERIAL>部の806<EFILE>部を
まず探索する。その際に、count番目とは、<EFIL
E>部が<MATERIAL>部の中に出現した順番に
対応させることができる。count番目の<EFILE>
部の中のhref属性を抽出し、そこに記されたファイルを
取得する。S1007で、S1006で取得したファイ
ルを解析し、S1008で解析結果を登録する。このと
き、登録の仕方として、単純な文書単位の登録ではな
く、当該バインダ文書のcount番目の素材文書の検索情
報として登録される。S1009で、countから1を減
じ、S1005に戻る。
【0037】尚、保存処理自体や保存に関わる関連処理
については、ここでは示していない。また、ファイルが
見つからない等の一般的なエラー処理については省略し
ている。
【0038】図11に情報が登録されたデータベースの
一例を示す。文書識別子1101とそれに対応する検索
情報1102のフィールドからなるものとする。バイン
ダではない通常の文書は、1103に文書識別子、11
04に文書名や作成日、作成者、文書の種類など検索情
報が配置される。バインダ文書は、1105に同様に文
書識別子が置かれる。また、1106にも文書名や作成
日、作成者などの情報が記録される。文書の種類がバイ
ンダ文書となる。1107は、素材文書であり、文書識
別子が置かれる。検索情報が異なり1108に自身が属
するバインダ文書の識別子や1109に、そのバインダ
文書中の何番目の素材文書であるかが示される。その他
については、他の一般的な文書と同等である。
【0039】バインダ文書の保存時だけでなく、図4で
示すような文書管理システム上のインターフェイスで検
索情報を追加、変更、削除等の編集がなされた場合も検
索システムで情報が登録、更新される。なお、検索に際
して、素材文書を検索対象としない設定も可能である。
【0040】素材文書をエクスポートする場合につい
て、図12を用いて説明する。素材文書のエクスポート
先は、OSの管理するファイルシステムと文書管理シス
テム内の2ヶ所がある。まず、素材文書のエクスポート
が指示されると、素材文書ファイルのIDが与えられ、
バインダ管理ファイルから対応するid属性を持つ<EF
ILE>部を探索し、href属性を求める。そしてhref属
性に指示されているファイルを取得する(S160
1)。
【0041】S1602でエクスポート先が、文書管理
システムか判定される。文書管理システムへの保存であ
るならば(S1602でYes)、S1603で、取得し
た素材ファイルに対応する検索情報ファイルを求める。
一方、S1602でエクスポート先が文書管理システム
でない場合(OSのファイルシステムなどの場合)(S
1602でNo)、取得した素材文書をそのままエクスポ
ートして処理を終了する。
【0042】S1604では、S1601で取得した素
材ファイルを文書管理システムに保存する。S1605
では、S1603での求めた結果、検索情報ファイルが
存在したか判定する。S1605で存在していると判断
されたならば(Yes)、S1607において素材ファイ
ルの検索情報ファイルの解析が行われる。S1605で
存在しないと判断されたならば(S1605でNo)なら
ば、バインダ文書自身の検索情報ファイルを探索する
(S1606)。存在していなければ(S1606でN
o)、終了する。また、S1606でバインダ文書自身
の検索情報ファイルが取得できたなら(S1606でYe
s)、S1608に進む。S1608でバインダの検索
情報ファイルを取得し、S1609でそれを解析する。
S1610では、S1607、もしくはS1609で解
析された結果を抽出した素材文書の検索情報としてデー
タベースシステムに反映させる。
【0043】
【発明の効果】以上述べたように、複数の素材文書をバ
インドしてバインド文書を作成する際、元の素材文書に
付加されていた検索情報を保存することができる。
【0044】また、バインド文書内に含まれる素材文書
をエクスポートする際、当該エクスポートする素材文書
に関する検索情報も出力することができる。
【図面の簡単な説明】
【図1】文書管理システム概略ブロック図
【図2】コンピュータ構成図
【図3】バインダアプリケーション表示画面例
【図4】検索時表示画面例
【図5】検索結果表示画面例
【図6】インポート処理フローチャート
【図7】検索情報XML記述例
【図8】バインダ文書XML記述例
【図9】バインダ文書内部構成模式図
【図10】検索情報登録処理フローチャート
【図11】検索情報内部構成模式図
【図12】エクスポート処理フローチャート

Claims (20)

    【特許請求の範囲】
  1. 【請求項1】 複数の電子文書を管理する文書管理シス
    テムであって、 複数の電子文書から所望の素材文書を複数抽出して結合
    させることにより、1つの電子バインダ文書を作成する
    バインダ文書作成手段と、 前記素材文書それぞれに関する検索情報を取得する取得
    手段と、 前記取得手段で取得した検索情報を、前記バインダ文書
    作成手段で作成した電子バインダ文書に含まれる素材文
    書の検索情報として保存するよう制御する保存手段とを
    有することを特徴とする文書管理システム。
  2. 【請求項2】 前記取得手段は、前記素材文書がオペレ
    ーションシステムが管理するファイルシステムからの抽
    出であった場合に、該ファイルシステムが管理する情報
    を検索情報として取得することを特徴とする請求項1に
    記載の文書管理システム。
  3. 【請求項3】 前記取得手段は、前記素材文書が他のフ
    ァイルシステムからの抽出であった場合に、該素材文書
    のファイルフォーマットに含まれる情報を検索情報とし
    て取得することを特徴とする請求項1に記載の文書管理
    システム。
  4. 【請求項4】 前記取得手段は、前記素材文書が本文書
    管理システムに管理されている文書であった場合、本文
    書管理システムのデータベースから検索情報を取得する
    ことを特徴とする請求項1に記載の文書管理システム。
  5. 【請求項5】 更に、前記保存された検索情報を用い
    て、ユーザが所望する電子バインダ文書を検索する検索
    手段を有することを特徴とする請求項1に記載の文書管
    理システム。
  6. 【請求項6】 前記検索手段は、ユーザが所望する検索
    キーに一致する、電子バインダ文書内の素材文書を識別
    可能に表示することを特徴とする請求項5に記載の文書
    管理システム。
  7. 【請求項7】 更に、文書管理システムに管理されてい
    る電子バインダ文書内の素材文書をエクスポートする
    際、当該エクスポートされる素材文書に関わる検索情報
    を抽出して、当該エクスポートされる素材文書の検索情
    報として保存するよう制御するエクスポート手段を有す
    ることを特徴とする請求項1に記載の文書管理システ
    ム。
  8. 【請求項8】 前記エクスポート手段は、前記電子バイ
    ンダ文書内の素材文書自身に関連付けられた検索情報が
    存在しない場合は、当該電子バインダ文書自身に関連付
    けられた検索情報を、前記エクスポートされる素材文書
    の検索情報として抽出して保存するよう制御することを
    特徴とする請求項7に記載の文書管理システム。
  9. 【請求項9】 前記検索情報は、XMLで記述されるこ
    とを特徴とする請求項1に記載の文書管理システム。
  10. 【請求項10】 複数の電子文書を管理する文書管理シ
    ステムを制御する文書管理方法であって、 複数の電子文書から所望の素材文書を複数抽出して結合
    させることにより、1つの電子バインダ文書を作成する
    バインダ文書作成ステップと、 前記素材文書それぞれに関する検索情報を取得する取得
    ステップと、 前記取得ステップで取得した検索情報を、前記バインダ
    文書作成ステップで作成した電子バインダ文書に含まれ
    る素材文書の検索情報として保存するよう制御する保存
    ステップとを有することを特徴とする文書管理方法。
  11. 【請求項11】 前記取得ステップでは、前記素材文書
    がオペレーションシステムが管理するファイルシステム
    からの抽出であった場合に、該ファイルシステムが管理
    する情報を検索情報として取得することを特徴とする請
    求項10に記載の文書管理方法。
  12. 【請求項12】 前記取得ステップでは、前記素材文書
    が他のファイルシステムからの抽出であった場合に、該
    素材文書のファイルフォーマットに含まれる情報を検索
    情報として取得することを特徴とする請求項10に記載
    の文書管理方法。
  13. 【請求項13】 前記取得ステップでは、前記素材文書
    が本文書管理システムに管理されている文書であった場
    合、本文書管理システムのデータベースから検索情報を
    取得することを特徴とする請求項10に記載の文書管理
    方法。
  14. 【請求項14】 更に、前記保存された検索情報を用い
    て、ユーザが所望する電子バインダ文書を検索する検索
    ステップを有することを特徴とする請求項10に記載の
    文書管理方法。
  15. 【請求項15】 前記検索ステップでは、ユーザが所望
    する検索キーに一致する、電子バインダ文書内の素材文
    書を識別可能に表示することを特徴とする請求項14に
    記載の文書管理方法。
  16. 【請求項16】 更に、文書管理方法に管理されている
    電子バインダ文書内の素材文書をエクスポートする際、
    当該エクスポートされる素材文書に関わる検索情報を抽
    出して、当該エクスポートされる素材文書の検索情報と
    して保存するよう制御するエクスポートステップを有す
    ることを特徴とする請求項10に記載の文書管理方法。
  17. 【請求項17】 前記エクスポートステップでは、前記
    電子バインダ文書内の素材文書自身に関連付けられた検
    索情報が存在しない場合は、当該電子バインダ文書自身
    に関連付けられた検索情報を、前記エクスポートされる
    素材文書の検索情報として抽出して保存するよう制御す
    ることを特徴とする請求項16に記載の文書管理方法。
  18. 【請求項18】 前記検索情報は、XMLで記述される
    ことを特徴とする請求項10に記載の文書管理システ
    ム。
  19. 【請求項19】 請求項10乃至18のいずれかに記載
    の文書管理方法の各ステップを、コンピュータに実行さ
    せるためのプログラムコードを含むことを特徴とするコ
    ンピュータプログラム。
  20. 【請求項20】 請求項10乃至18のいずれかに記載
    の文書管理処理方法の各ステップを、コンピュータに実
    行させるためのプログラムコードを含むことを特徴とす
    るコンピュータプログラムを格納したコンピュータ読み
    取り可能な記憶媒体。
JP2002117787A 2002-04-19 2002-04-19 文書管理システム、方法、プログラム及び記憶媒体 Withdrawn JP2003316773A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002117787A JP2003316773A (ja) 2002-04-19 2002-04-19 文書管理システム、方法、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002117787A JP2003316773A (ja) 2002-04-19 2002-04-19 文書管理システム、方法、プログラム及び記憶媒体

Publications (1)

Publication Number Publication Date
JP2003316773A true JP2003316773A (ja) 2003-11-07

Family

ID=29534882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002117787A Withdrawn JP2003316773A (ja) 2002-04-19 2002-04-19 文書管理システム、方法、プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP2003316773A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031465A (ja) * 2004-07-16 2006-02-02 Canon Inc 画像処理装置及びその制御方法並びにその制御プログラム
JP2008139970A (ja) * 2006-11-30 2008-06-19 Fuji Xerox Co Ltd 情報処理システム、情報処理装置及び情報処理プログラム
JP2008250943A (ja) * 2007-03-30 2008-10-16 Fujitsu Ltd 文書管理サーバプログラム、および文書管理サーバ
JP2012008776A (ja) * 2010-06-24 2012-01-12 Digital Electronics Corp 画面作成装置およびプログラム
JP2012216147A (ja) * 2011-04-01 2012-11-08 Canon Inc データ処理装置、データ処理方法およびプログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006031465A (ja) * 2004-07-16 2006-02-02 Canon Inc 画像処理装置及びその制御方法並びにその制御プログラム
JP4533027B2 (ja) * 2004-07-16 2010-08-25 キヤノン株式会社 印刷装置、及び、印刷装置の制御方法
JP2008139970A (ja) * 2006-11-30 2008-06-19 Fuji Xerox Co Ltd 情報処理システム、情報処理装置及び情報処理プログラム
JP2008250943A (ja) * 2007-03-30 2008-10-16 Fujitsu Ltd 文書管理サーバプログラム、および文書管理サーバ
JP2012008776A (ja) * 2010-06-24 2012-01-12 Digital Electronics Corp 画面作成装置およびプログラム
JP2012216147A (ja) * 2011-04-01 2012-11-08 Canon Inc データ処理装置、データ処理方法およびプログラム

Similar Documents

Publication Publication Date Title
JP4290011B2 (ja) ビューワ装置及びその制御方法、プログラム
JP4324060B2 (ja) 文書管理システム及びその方法と文書管理装置及び当該装置の制御方法
JPH08241332A (ja) 全文登録語検索装置および方法
JPH08255155A (ja) 全文登録語検索装置および方法
JP2004139466A (ja) 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
JPH11328218A (ja) コンテンツ属性情報正規化方法、情報収集・サービス提供システム、属性情報設定装置並びにプログラム格納記録媒体
JP2008090404A (ja) 文書検索装置、文書検索方法および文書検索プログラム
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
JP2003316773A (ja) 文書管理システム、方法、プログラム及び記憶媒体
KR19990038731A (ko) 전자문서를 위한 메타데이타 모형 및 모형화 방법과 메타데이타관리시스템 및 그 관리방법
JP2002215519A (ja) ウェブページ生成方法およびシステム、ウェブページ生成プログラム、記録媒体
JP2010092383A (ja) 電子文書ファイル検索装置、電子文書ファイル検索方法及びコンピュータプログラム
JP2001256256A (ja) 電子文書検索装置および電子文書検索方法
JP2007115131A (ja) 情報処理装置及びその制御方法、情報処理システム、コンピュータプログラム、記憶媒体
JP2000020549A (ja) 文書データベースシステムへの入力支援装置
JP2002169802A (ja) 公共事業支援統合情報システムにおける電子納品データ作成支援システム及び記録媒体
JP4255538B2 (ja) 構造化文書蓄積検索装置
JP2002342342A (ja) 文書管理方法及びその実施システム並びにその処理プログラムと記録媒体
JP2002140338A (ja) 辞書構築支援装置および辞書構築支援方法
JP2007115132A (ja) 情報処理装置及びその制御方法、情報処理システム、コンピュータプログラム、記憶媒体
Chang An electronic finding aid using extensible markup language (XML) and encoded archival description (EAD)
JP2009110506A (ja) 情報処理装置及び情報処理プログラム
JP2000315209A (ja) 画像ファイリング装置、画像ファイリング方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008287607A (ja) 情報処理装置およびプログラム
JP2004164301A (ja) 情報処理装置、情報処理方法およびその方法をコンピュータに実行させるプログラム

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20050705