JPH1145257A - Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device - Google Patents
Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the deviceInfo
- Publication number
- JPH1145257A JPH1145257A JP9199618A JP19961897A JPH1145257A JP H1145257 A JPH1145257 A JP H1145257A JP 9199618 A JP9199618 A JP 9199618A JP 19961897 A JP19961897 A JP 19961897A JP H1145257 A JPH1145257 A JP H1145257A
- Authority
- JP
- Japan
- Prior art keywords
- web
- search
- classification item
- document
- web document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、収集したWeb文
書を予め用意した各カテゴリーに自動的に分類すること
を可能にし、Web文書の分類作業に要する労力を軽減
したWeb文書の検索支援装置およびその装置としてコ
ンピュータを機能させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Web document search support apparatus which enables automatic classification of collected Web documents into respective categories prepared in advance and reduces the labor required for Web document classification. The present invention relates to a computer-readable recording medium that stores a program for causing a computer to function as the device.
【0002】[0002]
【従来の技術】インターネットには非常に多くの情報が
存在しているが、これらの中には体系立てて整理された
ものは少なく、所望の情報を見つけ出すことは困難であ
ることが多い。そこで、この問題を解決するために様々
な手法が開発されている。2. Description of the Related Art There is a great deal of information on the Internet, but few of them are systematically organized and it is often difficult to find desired information. Therefore, various methods have been developed to solve this problem.
【0003】その手法の代表的な例として、インデック
ス(索引)を用いたものと、検索エンジンを用いたもの
がある。インデックスを用いたものは、Web文書を収
集し、収集したWeb文書を芸術,コンピュータ,娯
楽,スポーツ等の様々なカテゴリーに分類し、分類した
カテゴリーを利用して必要な情報を探し出すことができ
るようにしたものである。各カテゴリーには、何層かの
サブカテゴリーを作成することができ、例えば、スポー
ツのカテゴリーからは、野球,バスケット,サッカー,
ホッケー等のサブカテゴリーを見つけ出すことができ
る。そして、興味のあるサブカテゴリーにたどり着く
と、関連するWeb文書の一覧が表示され、その中から
所望のWeb文書を選択することができる。[0003] As typical examples of the method, there are a method using an index (index) and a method using a search engine. The index-based method collects Web documents, classifies the collected Web documents into various categories such as arts, computers, entertainment, sports, and the like, and searches for necessary information using the classified categories. It was made. Each category can have several levels of subcategories, for example, from sports categories, baseball, basketball, soccer,
You can find subcategories such as hockey. When the user arrives at the sub-category of interest, a list of related Web documents is displayed, and a desired Web document can be selected from the list.
【0004】一方、検索エンジンを用いたものは、We
b文書を収集し、収集したWeb文書を用いて所望のW
eb文書を検索することができるようにしたデータベー
スを作成しておき、検索条件を検索エンジンに与え、検
索条件に該当するWeb文書をデータベースから検索す
るというものである。すなわち、検索条件を入力するこ
とにより、入力した検索条件に該当するWeb文書の一
覧が表示されるため、その中から所望のWeb文書を選
択することができる。On the other hand, those using a search engine are We
b, and collects the desired W using the collected Web document.
A database in which an e-document can be searched is created, search conditions are given to a search engine, and a Web document corresponding to the search condition is searched from the database. That is, by inputting a search condition, a list of Web documents corresponding to the input search condition is displayed, and a desired Web document can be selected from the list.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上記イ
ンデックスを用いたものにあっては、カテゴリー別にW
eb文書が分類されているため、所望のWeb文書を見
つけ易いという利点があるものの、Web文書をカテゴ
リー別に分類する作業を人手により行っているため、分
類作業に大変な労力が必要であるという問題点があっ
た。However, in the case of using the above index, W
Although the Web documents are classified, there is an advantage that a desired Web document can be easily found. However, since the work of classifying Web documents by category is performed manually, a problem that a great deal of labor is required for the classification work. There was a point.
【0006】また、上記検索エンジンを用いたものにあ
っては、検索条件を与えることによって、該当するWe
b文書の一覧を得ることができるため、カテゴリー別の
分類に左右されることなく、網羅的な検索結果を得るこ
とができて便利であるが、その反面、数千件のWeb文
書が検索結果として返って来ることがあり、検索結果の
検討に時間を要する場合があるという問題点があった。In the case of using the above search engine, a search condition is given so that
b. A list of documents can be obtained, which is convenient because comprehensive search results can be obtained without being affected by classification by category. However, on the other hand, thousands of Web documents are searched. As a result, there is a problem that it may take time to examine the search results.
【0007】本発明は上記に鑑みてなされたものであっ
て、収集したWeb文書を予め用意した各カテゴリーに
自動的に分類することを可能にし、Web文書の分類作
業に要する労力を軽減することを目的とする。SUMMARY OF THE INVENTION The present invention has been made in view of the above circumstances, and makes it possible to automatically classify collected Web documents into respective categories prepared in advance, thereby reducing the labor required for classifying Web documents. With the goal.
【0008】また、本発明は上記に鑑みてなされたもの
であって、カテゴリー別にWeb文書を自動的に分類す
ることにより、適切な数の検索結果を得ることができる
ようにすることを目的とする。Further, the present invention has been made in view of the above, and it is an object of the present invention to automatically classify Web documents by category so that an appropriate number of search results can be obtained. I do.
【0009】[0009]
【課題を解決するための手段】上記目的を達成するた
め、請求項1のWeb文書の検索支援装置は、予め設定
した分類項目に従ってインターネット上のWeb文書を
分類して管理し、Webクライアントの要求に応じて前
記分類項目を提示すると共に、前記Webクライアント
で選択された分類項目に該当するWeb文書の一覧を提
示することにより、Web文書の検索を支援するWeb
文書の検索支援装置であって、前記Web文書を収集す
る収集手段と、前記収集手段で収集したWeb文書を入
力し、入力したWeb文書を検索するために用いる検索
情報を生成して格納する格納手段と、検索条件を入力す
る検索条件入力手段と、前記検索条件入力手段で入力さ
れた検索条件を前記分類項目として設定する分類項目設
定手段と、前記Webクライアントからの要求に応じ
て、前記分類項目設定手段で設定した分類項目を提示す
る分類項目提示手段と、前記Webクライアントで前記
分類項目提示手段で提示した分類項目が選択されると、
選択された分類項目に基づいて、前記格納手段に格納さ
れた前記検索情報を用いて該当するWeb文書を検索す
る検索手段と、前記検索手段の検索結果に基づいて、該
当するWeb文書の一覧を前記Webクライアントに提
示するWeb文書一覧提示手段と、を備えたものであ
る。According to a first aspect of the present invention, there is provided a Web document search support apparatus that classifies and manages Web documents on the Internet in accordance with a predetermined classification item, and requests a Web client. Web page supporting the search of the Web document by presenting the classification item according to the above, and presenting a list of Web documents corresponding to the classification item selected by the Web client.
A document search support apparatus, comprising: a collection unit that collects the Web document; a storage unit that inputs the Web document collected by the collection unit, and generates and stores search information used to search the input Web document. Means, search condition input means for inputting search conditions, classification item setting means for setting the search conditions input by the search condition input means as the classification items, and the classification in response to a request from the Web client. When a classification item presenting means for presenting the classification item set by the item setting means and a classification item presented by the classification item presenting means on the Web client are selected,
A search unit that searches for a corresponding Web document using the search information stored in the storage unit based on the selected classification item; and a list of relevant Web documents based on a search result of the search unit. Web document list presenting means for presenting to the Web client.
【0010】また、請求項2のWeb文書の検索支援装
置は、請求項1に記載のWeb文書の検索支援装置にお
いて、さらに、ユーザ独自の分類項目を提示することが
できるように、前記分類項目をユーザ単位で保持するた
めの分類項目保持手段を備え、前記検索条件入力手段
が、前記Webクライアントから検索条件を入力し、前
記分類項目設定手段が、前記検索条件入力手段で入力さ
れた検索条件を前記分類項目として設定し、前記分類項
目保持手段が、前記分類項目設定手段で設定された分類
項目を保持し、前記分類項目提示手段が、Webクライ
アントからの要求に基づいて、前記分類項目保持手段か
ら該当する分類項目を読み出して提示するものである。According to a second aspect of the present invention, there is provided the Web document search support device according to the first aspect, wherein the classification item is further provided so that a user-specific classification item can be presented. Is stored in the user unit, the search condition input unit inputs a search condition from the Web client, and the classification item setting unit sets the search condition input by the search condition input unit. Is set as the classification item, the classification item holding unit holds the classification item set by the classification item setting unit, and the classification item presentation unit stores the classification item based on a request from a Web client. The relevant classification item is read out from the means and presented.
【0011】また、請求項3のWeb文書の検索支援装
置は、請求項1または2に記載のWeb文書の検索支援
装置において、さらに、前記分類項目設定手段で設定し
た分類項目の中からアンド条件の対象となる分類項目を
指定する指定手段を備え、前記指定手段で前記アンド条
件の対象となる分類項目が指定された場合、前記分類項
目設定手段が、前記検索条件入力手段で入力された検索
条件を入れ子の分類項目として前記アンド条件の対象と
なる分類項目の下位に配置するものである。According to a third aspect of the present invention, there is provided the web document search support device according to the first or second aspect, further comprising an AND condition from among the classification items set by the classification item setting means. Specifying means for specifying a classification item to be a target of the search condition, and when a classification item to be a target of the AND condition is specified by the specification means, the classification item setting means sets the search input by the search condition input means. The condition is arranged as a nested classification item below the classification item targeted by the AND condition.
【0012】さらに、請求項4のコンピュータ読み取り
可能な記録媒体は、前記請求項1〜3のいずれか1つに
記載のWeb文書の検索支援装置の各手段としてコンピ
ュータを機能させるためのプログラムを記録したもので
ある。A computer-readable recording medium according to a fourth aspect of the present invention stores a program for causing a computer to function as each unit of the Web document search support apparatus according to any one of the first to third aspects. It was done.
【0013】[0013]
【発明の実施の形態】以下、本発明のWeb文書の検索
支援装置およびその装置としてコンピュータを機能させ
るためのプログラムを記録したコンピュータ読み取り可
能な記録媒体の一実施の形態について、添付の図面を参
照しつつ詳細に説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS Hereinafter, an embodiment of a Web document search support apparatus and a computer-readable recording medium storing a program for causing a computer to function as the apparatus according to the present invention will be described with reference to the accompanying drawings. This will be described in detail.
【0014】図1は、本実施の形態のWeb文書の検索
支援装置のブロック構成図である。図1において、10
0はCPUを、101はROMを、102はRAMを、
103はWeb文書収集ソフト104,カテゴリー管理
ソフト105および検索ソフト106を格納したハード
ディスク装置を、107はキーボード,マウス等からな
る入力装置を、108はCRT等のディスプレイを、1
09は転置ファイルを、110はインターネット111
を介してWebクライアント(図示せず)と情報の送受
信を可能とする通信装置を、112は上記各部を接続す
るバスをそれぞれ示している。FIG. 1 is a block diagram of a Web document search support apparatus according to the present embodiment. In FIG. 1, 10
0 is a CPU, 101 is a ROM, 102 is a RAM,
A hard disk device 103 stores Web document collection software 104, category management software 105, and search software 106, an input device 107 such as a keyboard and a mouse, a display device 108 such as a CRT.
09 is the transposed file, 110 is the Internet 111
, A communication device capable of transmitting and receiving information to and from a Web client (not shown) via the Internet; and 112, a bus connecting the above-described units.
【0015】図1において、Web文書収集ソフト10
4(例えば、スパイダー)は、Web文書に埋め込まれ
ているハイパーテキストのリンクを辿って世界中のWe
b文書を収集するものである。In FIG. 1, Web document collection software 10
4 (for example, a spider) follows a hypertext link embedded in a Web document to
b Collect documents.
【0016】転置ファイル109は、Web文書収集ソ
フト104で収集したWeb文書と、Web文書から後
述する方法で抽出した複数の索引語との関係を規定し、
ある索引語が各Web文書それぞれにおいてどの程度重
要な語彙であるかをベクター表現を用いて示したもので
あって、この索引語を用いて該当するWeb文書を検索
することができるようにしたものである。The transposed file 109 defines the relationship between a Web document collected by the Web document collection software 104 and a plurality of index words extracted from the Web document by a method described later.
It shows how important a vocabulary is in each Web document by using a vector expression, and it is possible to search for the corresponding Web document using this index word. It is.
【0017】この転置ファイル109は、後述する検索
ソフト106によって生成される。具体的には、1つの
Web文書を予め定め複数のセンテンスからなるサブド
キュメント単位に区切り、サブドキュメントから上記索
引語となる名詞句を抽出して、抽出した名詞句それぞれ
について、サブドキュメント中の出現頻度,収集したW
eb文書全体における分布等の統計情報を求め、求めた
名詞句毎の統計情報を用いて各サブドキュメントをベク
ター表現に変換する。そして、変換したサブドキュメン
トのベクター表現に基づいて、Web文書のベクター表
現を生成する。転置ファイル109は、このようにして
ベクター表現されたWeb文書を格納するものである。The transposed file 109 is generated by the search software 106 described later. Specifically, one Web document is divided into sub-documents consisting of a plurality of sentences determined in advance, and the noun phrases serving as the above-mentioned index words are extracted from the sub-documents. Frequency, W collected
Statistical information such as distribution in the entire eb document is obtained, and each sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. Then, a vector expression of the Web document is generated based on the vector expression of the converted sub-document. The transposition file 109 stores the Web document represented in vector in this way.
【0018】なお、各索引語には、対応するWeb文書
中の重要度に応じた重み付けを行うことができる。ま
た、Web文書のベクター表現については、実際の検索
を行う際に、サブドキュメントのベクター表現に基づい
て生成することにしても良い。Each index term can be weighted according to the importance in the corresponding Web document. Further, the vector expression of the Web document may be generated based on the vector expression of the sub-document when performing an actual search.
【0019】カテゴリー管理ソフト105は、後に詳細
に説明するが、Web文書収集ソフト104で収集した
Web文書を分類するためのカテゴリーを設定し、管理
するためのものである。設定されたカテゴリーには、後
述する検索ソフト106が利用する検索条件が関連づけ
られ、この検索条件に基づいて検索ソフト106が転置
ファイル109から検索したWeb文書の一覧が表示さ
れる。As will be described later in detail, the category management software 105 is for setting and managing a category for classifying Web documents collected by the Web document collection software 104. The set category is associated with a search condition used by the search software 106 described later, and a list of Web documents searched by the search software 106 from the transposed file 109 based on the search condition is displayed.
【0020】図2は、検索ソフト106の処理を示す概
略ブロック図である。検索ソフト106は、Web文書
収集ソフト104で収集したWeb文書を転置ファイル
109に登録する処理と、ベクトル空間検索を利用した
検索処理とを行うものである。FIG. 2 is a schematic block diagram showing the processing of the search software 106. The search software 106 performs a process of registering the Web document collected by the Web document collection software 104 in the transposition file 109 and a search process using a vector space search.
【0021】検索ソフト106において、転置ファイル
109に登録する処理は、自然言語処理モジュール20
1と、データベース・ビルド・コンポーネント205と
によって行われる。具体的に、自然言語処理モジュール
201は、Web文書収集ソフト104によって収集さ
れたWeb文書200を入力し、品詞情報等を格納した
辞書202および各単語の係り受け等を解析するための
文法辞書203を用いて形態素解析,構文解析,名詞句
抽出等の解析処理を行い、上述したサブドキュメント毎
の名詞句リストを含むドキュメント・セット204を生
成する。データベース・ビルド・コンポーネント205
は、自然言語処理モジュール201で生成したドキュメ
ント・セット204を入力し、入力したドキュメント・
セット204中の各サブドキュメントをベクター表現に
変換すると共に、サブドキュメントのベクター表現に基
づいて、Web文書のベクター表現を生成して転置ファ
イル109に登録する。In the search software 106, the process of registering the transposed file 109 is performed by the natural language processing module 20.
1 and the database build component 205. More specifically, the natural language processing module 201 inputs the Web document 200 collected by the Web document collection software 104, and stores a part-of-speech information and the like dictionary 202 and a grammar dictionary 203 for analyzing the dependency of each word. Is used to perform analysis processing such as morphological analysis, syntax analysis, and noun phrase extraction to generate a document set 204 including the above-described noun phrase list for each sub-document. Database Build Component 205
Inputs the document set 204 generated by the natural language processing module 201, and
Each sub-document in the set 204 is converted into a vector expression, and a vector expression of a Web document is generated based on the vector expression of the sub-document and registered in the transposition file 109.
【0022】一方、検索処理は、自然言語処理モジュー
ル201と、クエリー・ビルド・コンポーネント207
と、検索エンジン209とによって行われる。具体的
に、自然言語処理モジュール201は、カテゴリー管理
ソフト105から検索条件206を入力し、品詞情報等
を格納した辞書202および各単語の係り受け等を解析
するための文法辞書203を用いて形態素解析,構文解
析,名詞句抽出等の解析処理を行い、検索条件206中
の名詞句のリストを含むドキュメント・セット204を
生成する。クエリー・ビルド・コンポーネント207
は、ドキュメント・セット204を入力し、検索条件2
06を構成する各名詞句について、検索条件206中の
出現頻度,Web文書全体における分布等の統計情報を
求め、求めた統計情報を用いて検索条件206をベクタ
ー表現に変換したクエリー・ドキュメント208を生成
する。検索エンジン209は、クエリー・ビルド・コン
ポーネント207で生成したクエリー・ドキュメント2
08を入力し、転置ファイル109中の各Web文書の
ベクトルとクエリー・ドキュメント208のベクトルと
を比較して、クエリー・ドキュメント208との類似度
に応じたスコアを各Web文書に付与し、所定の閾値を
超えるスコアが付与されたWeb文書リスト210を検
索結果として出力する。On the other hand, the search processing is performed by the natural language processing module 201 and the query build component 207.
And the search engine 209. Specifically, the natural language processing module 201 inputs a search condition 206 from the category management software 105, and uses a dictionary 202 storing part-of-speech information and the like and a grammar dictionary 203 for analyzing the dependency of each word and the like. Analysis processing such as analysis, syntax analysis, and noun phrase extraction is performed, and a document set 204 including a list of noun phrases in the search condition 206 is generated. Query build component 207
Inputs the document set 204 and sets the search condition 2
For each of the noun phrases that make up 06, statistical information such as the frequency of appearance in the search condition 206 and the distribution in the entire Web document is obtained, and the query document 208 obtained by converting the search condition 206 into a vector expression using the obtained statistical information is obtained. Generate. The search engine 209 generates the query document 2 generated by the query build component 207.
08, the vector of each Web document in the transposed file 109 is compared with the vector of the query document 208, and a score corresponding to the similarity with the query document 208 is given to each Web document. The Web document list 210 to which a score exceeding the threshold is given is output as a search result.
【0023】なお、図1においては、Web文書の検索
支援装置を1台のコンピュータで構成した様子を示した
が、このWeb文書の検索支援装置で行う処理に応じて
複数台のコンピュータで構成することにしても良い。Although FIG. 1 shows a case where the Web document search support device is constituted by one computer, the Web document search support device is constituted by a plurality of computers in accordance with the processing performed by the Web document search support device. You may decide.
【0024】次に、上述した構成を備えたWeb文書の
検索支援装置の動作について、(1)転置ファイルの生
成処理,(2)カテゴリーの設定処理,(3)カテゴリ
ーへの分類処理の順で詳細に説明する。Next, the operation of the Web document search support device having the above-described configuration will be described in the order of (1) a process of generating an inverted file, (2) a process of setting a category, and (3) a process of classifying into a category. This will be described in detail.
【0025】(1)転置ファイルの生成処理 図3は、転置ファイルの生成処理を示すフローチャート
である。Web文書収集ソフト104は、ハイパーテキ
ストのリンクを辿って世界中のWeb文書200を収集
する処理を行う(S301)。(1) Transposition File Generation Process FIG. 3 is a flowchart showing a transposition file generation process. The Web document collection software 104 performs a process of collecting Web documents 200 around the world by following hypertext links (S301).
【0026】検索ソフト106は、Web文書収集ソフ
ト104が収集したWeb文書200を入力し、入力し
たWeb文書200を転置ファイル109に登録するた
めの処理を開始する(S302)。The search software 106 inputs the Web document 200 collected by the Web document collection software 104, and starts a process for registering the input Web document 200 in the transposition file 109 (S302).
【0027】検索ソフト106において、自然言語処理
モジュール201は、ステップS302で入力したWe
b文書200を解析する処理を行う(S303)。具体
的には、入力したWeb文書200について、辞書20
2および文法辞書203を用いて形態素解析,係り受け
等の構文解析を行い、Web文書200を複数のサブド
キュメントに区分すると共に、区分したサブドキュメン
トから名詞句を抽出する等の処理を行う。In the search software 106, the natural language processing module 201 sends the We
A process of analyzing the b-document 200 is performed (S303). Specifically, for the input Web document 200, the dictionary 20
2 and a grammar dictionary 203 to perform syntax analysis such as morphological analysis and dependency, to divide the Web document 200 into a plurality of sub-documents, and to perform processing such as extracting a noun phrase from the divided sub-documents.
【0028】そして、自然言語処理モジュール201
は、ステップS303における処理の結果に基づいて、
サブドキュメント毎に名詞句リストを生成し、生成した
名詞句リストを含むドキュメント・セット204を生成
する(S304)。Then, the natural language processing module 201
Is based on the result of the processing in step S303.
A noun phrase list is generated for each sub-document, and a document set 204 including the generated noun phrase list is generated (S304).
【0029】その後、データベース・ビルド・コンポー
ネント205は、自然言語処理モジュール201で生成
したドキュメント・セット204を入力し、Web文書
のベクター表現を生成して転置ファイル109に登録す
る処理を行う(S305)。Thereafter, the database build component 205 receives the document set 204 generated by the natural language processing module 201, generates a vector expression of the Web document, and registers the vector expression in the transposed file 109 (S305). .
【0030】具体的には、ドキュメント・セット204
中のサブドキュメントの各名詞句を転置ファイル109
の索引語として、サブドキュメント中の出現頻度,We
b文書200全体における分布等の統計情報を求め、求
めた名詞句毎の統計情報を用いてサブドキュメントをベ
クター表現に変換する。この処理をドキュメント・セッ
ト204中の全てのサブドキュメントについて行い、変
換したサブドキュメントのベクター表現に基づいて、W
eb文書200のベクター表現を生成して転置ファイル
109に登録する。Specifically, the document set 204
Transpose file 109 for each noun phrase of subdocument in
Frequency of occurrence in subdocuments, We
The statistical information such as distribution in the entire b-document 200 is obtained, and the sub-document is converted into a vector expression using the obtained statistical information for each noun phrase. This processing is performed for all sub-documents in the document set 204, and based on the vector representation of the converted sub-documents, W
A vector expression of the eb document 200 is generated and registered in the transposition file 109.
【0031】上述した処理は、Web文書収集ソフト1
03が新たなWeb文書200を収集して来る毎に行わ
れる。したがって、転置ファイル102には、常に最新
のWeb文書200に関する情報が格納されていること
になる。The above processing is performed by the Web document collection software 1
03 is performed every time a new Web document 200 is collected. Therefore, the transposed file 102 always stores information on the latest Web document 200.
【0032】(2)カテゴリーの設定処理 続いて、Web文書収集ソフト104で収集したWeb
文書200を分類するためのカテゴリーを設定する処理
について説明する。図4は、カテゴリーの設定処理を説
明するための説明図である。(2) Category setting processing Subsequently, the Web collected by the Web document collection software 104
Processing for setting a category for classifying the document 200 will be described. FIG. 4 is an explanatory diagram for explaining the category setting process.
【0033】カテゴリー管理ソフト105は、Web文
書の検索支援装置の管理者からの指示に応じて各カテゴ
リーを設定していく。まず、カテゴリーとして、例えば
「スポーツ」が入力されると、カテゴリー管理ソフト1
05は、図4に示すようにカテゴリー「スポーツ」を設
定する。そして、設定したカテゴリー「スポーツ」の下
位には、さらにサブカテゴリーを設定することができ
る。ここでは、サブカテゴリーとして「野球」,「サッ
カー」,「バスケット」,「テニス」が設定される。The category management software 105 sets each category according to an instruction from the administrator of the Web document search support device. First, when, for example, “sports” is input as a category, the category management software 1
05 sets the category "sports" as shown in FIG. Further, a sub-category can be further set below the set category “sports”. Here, “baseball”, “soccer”, “basket”, and “tennis” are set as subcategories.
【0034】続いて、作成したサブカテゴリーに、該当
するWeb文書200を検索して、その一覧を表示する
ための検索条件206を関連づける。この検索条件20
6は、検索式,検索文,キーワードの集合,例示用We
b文書等のいずれであっても良い。また、検索条件20
6として、サブカテゴリーに付したカテゴリー名を用い
ることにしても良い。したがって、ユーザがサブカテゴ
リーを選択すると、関連づけられた検索条件206が検
索ソフト106に出力された後、転置ファイル109か
ら検索条件206に該当するWeb文書200が検索さ
れ、検索されたWeb文書200の一覧が選択されたサ
ブカテゴリーに表示されることになる。Subsequently, the corresponding Web document 200 is searched for the created sub-category, and the search condition 206 for displaying the list is associated with the search result. This search condition 20
6 is a set of search formulas, search sentences, keywords, and We
It may be any document such as b document. Also, search condition 20
As 6, a category name given to a subcategory may be used. Therefore, when the user selects a sub-category, after the associated search condition 206 is output to the search software 106, the transposed file 109 is searched for the Web document 200 corresponding to the search condition 206, and the searched Web document 200 The list will be displayed in the selected sub-category.
【0035】同様の処理を行うことにより、さらに、カ
テゴリー「芸術」,「ビジネス」等を設定していくこと
ができる。By performing the same processing, the categories "art" and "business" can be further set.
【0036】なお、図5に示したサブカテゴリー「野
球」等だけではなく、カテゴリー「スポーツ」等につい
ても検索条件206を設定することができる。このよう
にして、サブカテゴリーをカテゴリーに対するアンド条
件にすることができる。その結果、カテゴリー「スポー
ツ」を選択した場合には、「スポーツ」に関するWeb
文書200が転置ファイル109から検索されて、その
一覧が表示される。また、サブカテゴリー「野球」が選
択された場合には、「スポーツ」に関するWeb文書
で、かつ、「野球」に関するWeb文書が転置ファイル
109から検索されて、その一覧が表示されることにな
る。The search condition 206 can be set not only for the subcategory "baseball" and the like shown in FIG. 5, but also for the category "sports" and the like. In this way, a subcategory can be an AND condition for a category. As a result, when the category “sports” is selected, the Web related to “sports” is selected.
The document 200 is retrieved from the transposed file 109, and a list thereof is displayed. When the sub-category “baseball” is selected, a Web document relating to “sports” and a Web document relating to “baseball” are retrieved from the transposed file 109 and a list thereof is displayed.
【0037】このようにして、図5に示すようなカテゴ
リーが設定される。設定されたカテゴリーはカテゴリー
管理ソフト105で管理され、要求に応じて、Webク
ライアントに提示される。In this way, categories as shown in FIG. 5 are set. The set category is managed by the category management software 105, and is presented to the Web client upon request.
【0038】(3)カテゴリー毎の分類処理 続いて、上述したようにして設定したカテゴリーに基づ
いて、Web文書200を分類してWebクライアント
に提示するための処理について説明する。図6はカテゴ
リー毎の分類処理を示すフローチャートである。(3) Classification Processing for Each Category Next, processing for classifying the Web document 200 based on the category set as described above and presenting it to the Web client will be described. FIG. 6 is a flowchart showing the classification process for each category.
【0039】カテゴリー管理ソフト105は、Webク
ライアントからの要求があると(S601)、設定した
カテゴリーをWebクライアントに提示する(S60
2)。Upon receiving a request from the Web client (S601), the category management software 105 presents the set category to the Web client (S60).
2).
【0040】そして、カテゴリー管理ソフト105は、
Webクライアントからカテゴリーのいずれかを選択し
た結果を入力すると、該当するカテゴリーに関連づけら
れた検索条件206を検索ソフト105に出力する(S
603)。Then, the category management software 105
When a result of selecting one of the categories is input from the Web client, the search condition 206 associated with the category is output to the search software 105 (S
603).
【0041】本実施の形態を説明するにあたっては、図
5に示したカテゴリー「スポーツ」のサブカテゴリー
「野球」がWebクライアントによって選択されたもの
とする。したがって、カテゴリー管理ソフト105は、
検索条件206として、予め関連づけられた「野球」に
関する検索式,検索文,キーワードの集合または例示用
の文書を検索ソフト106に出力する。In describing this embodiment, it is assumed that the sub-category "baseball" of the category "sports" shown in FIG. 5 has been selected by the Web client. Therefore, the category management software 105
As a search condition 206, a search expression, a search sentence, a set of keywords, or a document for illustration relating to “baseball” associated in advance is output to the search software 106.
【0042】検索ソフト106は、カテゴリー管理ソフ
ト105から検索条件206を入力し、自然言語処理モ
ジュール201が検索条件206の解析処理を行う(S
604)。具体的には、辞書202および文法辞書20
3を用いて形態素解析,係り受け等の構文解析処理を行
う。The search software 106 inputs the search condition 206 from the category management software 105, and the natural language processing module 201 performs an analysis process of the search condition 206 (S
604). Specifically, the dictionary 202 and the grammar dictionary 20
3 is used to perform syntax analysis such as morphological analysis and dependency.
【0043】そして、自然言語処理モジュール201
は、ステップS604での解析結果に基づいて、検索条
件206から転置ファイル109中の索引語に対応する
名詞句を抽出し、名詞句からなるドキュメント・セット
204を生成する(S605)。Then, the natural language processing module 201
Extracts a noun phrase corresponding to the index term in the transposed file 109 from the search condition 206 based on the analysis result in step S604, and generates a document set 204 including the noun phrase (S605).
【0044】続いて、クエリー・ビルド・コンポーネン
ト207は、自然言語処理モジュール201からドキュ
メント・セット204を入力し、入力したドキュメント
・セット204を構成する各名詞句について、検索条件
206中の出現頻度,Web文書200全体における分
布等の統計情報を求め、求めた統計情報を用いてドキュ
メント・セット204をベクター表現に変換したクエリ
ー・ドキュメント208を生成する(S606)。Subsequently, the query build component 207 inputs the document set 204 from the natural language processing module 201, and for each noun phrase constituting the input document set 204, the appearance frequency in the search condition 206, Statistical information such as distribution in the entire Web document 200 is obtained, and a query document 208 is generated by converting the document set 204 into a vector expression using the obtained statistical information (S606).
【0045】検索エンジン209は、クエリー・ビルド
・コンポーネント207で生成したクエリー・ドキュメ
ント208を入力し、転置ファイル109中の各Web
文書200のベクトルとクエリー・ドキュメント208
のベクトルを比較して、クエリー・ドキュメント208
との類似度に応じたスコアを各Web文書200に付与
する(S607)。The search engine 209 receives the query document 208 generated by the query build component 207 and inputs each of the web pages in the transposed file 109.
Vector of document 200 and query document 208
Are compared to form a query document 208
Then, a score corresponding to the degree of similarity is given to each Web document 200 (S607).
【0046】なお、類似度に応じたスコアは、各Web
文書200とクエリー・ドキュメント208との類似度
を余弦距離に基づいて表現したものであり、スコアが大
きいWeb文書200がよりクエリー・ドキュメント2
08と類似していることを表している。The score according to the degree of similarity is calculated for each Web site.
This is a representation of the similarity between the document 200 and the query document 208 based on the cosine distance, and the Web document 200 having the larger score has more query document 2
08 is similar.
【0047】そして、検索エンジン209は、予め設定
されたスコアの閾値に基づいて、閾値を超えるスコアが
付与されたWeb文書200を選択し、選択したWeb
文書200に基づいて、Web文書リスト210を生成
して、検索結果として出力する(S608)。Then, the search engine 209 selects a Web document 200 to which a score exceeding the threshold is assigned based on a preset score threshold, and selects the selected Web
The Web document list 210 is generated based on the document 200 and output as a search result (S608).
【0048】図7は、Web文書リスト210の一例を
示す説明図である。図7に示すように、Web文書リス
ト210には、クエリー・ドキュメント208との類似
度に応じたスコアのランキング,Web文書名,URL
等が表示される。FIG. 7 is an explanatory diagram showing an example of the Web document list 210. As shown in FIG. 7, the Web document list 210 includes a ranking of the score according to the similarity with the query document 208, a Web document name, and a URL.
Are displayed.
【0049】カテゴリー管理ソフト105は、検索エン
ジン209からWeb文書リスト210を入力し、入力
したWeb文書リスト210に基づいて、上位のランキ
ングのWeb文書200から順に並べ、かつ、該当する
カテゴリーに関連づけてWeb文書200の一覧をWe
bクライアントに提示する(S609)。The category management software 105 inputs the Web document list 210 from the search engine 209, arranges the Web documents 200 in the order of the highest ranking based on the input Web document list 210, and associates the Web documents with the corresponding category. List of Web documents 200
b to the client (S609).
【0050】図8は、Webクライアントで選択された
カテゴリーに関連づけてWeb文書200を一覧表示し
た様子の一例を示す説明図である。図8に示すように、
ステップS603で選択されたサブカテゴリー「野球」
に該当するWeb文書200が検索ソフト106によっ
て転置ファイル109から検索され、該当するWeb文
書200の一覧がWebクライアントに画面表示され
る。FIG. 8 is an explanatory diagram showing an example of a state in which a list of Web documents 200 is displayed in association with the category selected by the Web client. As shown in FIG.
The sub-category “baseball” selected in step S603
Are searched from the transposed file 109 by the search software 106, and a list of the corresponding Web documents 200 is displayed on the Web client on the screen.
【0051】図8においては、カテゴリーに関連づけら
れた検索条件206に最も近いWeb文書200から順
に表示することにしたため、ユーザがWeb文書200
を選択する際の基準を提供することができる。なお、こ
こでは類似度に応じてWeb文書200を表示すること
にしたが、もちろん、日付順,五十音順等でWeb文書
名を表示することにしても良い。In FIG. 8, the Web documents 200 are displayed in order from the Web document 200 closest to the search condition 206 associated with the category.
Can be provided when choosing Here, the Web document 200 is displayed according to the degree of similarity, but it is needless to say that the Web document name may be displayed in date order, Japanese syllabary order, or the like.
【0052】そして、Webクライアント側では、図8
に示したWeb文書200の一覧から所望のWeb文書
200を選択することにより、Web文書200の内容
を閲覧することができる。Then, on the Web client side, FIG.
By selecting a desired Web document 200 from the list of Web documents 200 shown in (1), the contents of the Web document 200 can be browsed.
【0053】このように、本実施の形態のWeb文書の
検索支援装置によれば、収集したWeb文書200を予
め用意した各カテゴリーに自動的に分類することを可能
にしたため、Web文書200の分類作業に要する労力
を軽減することができる。また、収集したWeb文書2
00によって転置ファイル102が常に更新されている
ため、各カテゴリーには、常に最新のWeb文書200
を分類してWebクライアントに提示することができ
る。さらに、カテゴリー別にWeb文書200を自動的
に分類することにより、適切な数のWeb文書200を
得ることができる。As described above, according to the Web document search support apparatus of the present embodiment, it is possible to automatically classify the collected Web documents 200 into respective categories prepared in advance. The labor required for the work can be reduced. In addition, the collected Web document 2
00, the transposed file 102 is always updated, so that each category always has the latest Web document 200.
Can be classified and presented to the Web client. Furthermore, an appropriate number of Web documents 200 can be obtained by automatically classifying the Web documents 200 by category.
【0054】また、Webクライアント側の操作自体
は、カテゴリーでWeb文書200を管理する通常のW
eb文書200の検索支援装置と同様であるため、We
b文書200を検索して表示しているということを意識
させることなく、Web文書200を予め分類しておい
たかのようにWebクライアントに提示することができ
る。Also, the operation itself on the Web client side is a normal W
Since it is the same as the search support device of the web document 200,
The web document 200 can be presented to the web client as if the web document 200 had been classified beforehand, without being aware that the b-document 200 was searched and displayed.
【0055】また、作成したカテゴリーのいくつかに当
てはまるようなWeb文書200については、検索ソフ
ト106による検索によって、該当する全てのカテゴリ
ーに表示されることになる。Also, Web documents 200 that fall into some of the created categories will be displayed in all applicable categories by the search using the search software 106.
【0056】また、各カテゴリーに表示されたWeb文
書200において、Webクライアントのユーザが分類
結果としてふさわしいと思うWeb文書200やふさわ
しくないと思うWeb文書200については、その結果
を本実施の形態のWeb文書の検索支援装置にフィード
バックすることができる。すなわち、ユーザは、分類結
果としてふさわしいと思うWeb文書200に対して、
正の重み、例えば「+」を指定することができ、検索結
果としてふさわしくないと思うWeb文書200に対し
て負の重み、例えば「−」を指定することができる。そ
の結果、入力した重みが正の指定である場合には、転置
ファイル109中の該当するWeb文書200の重みが
強化され、入力した重みが負の指定である場合には、W
eb文書200の重みが弱められる。In the Web documents 200 displayed in each category, the results of the Web document 200 that the user of the Web client considers appropriate as the classification result or the Web document 200 not appropriate are considered as the classification result. Feedback can be provided to the document search support device. That is, the user, for the Web document 200 considered appropriate as the classification result,
A positive weight, for example, “+” can be specified, and a negative weight, for example, “−” can be specified for the Web document 200 that is not suitable as a search result. As a result, if the input weight is a positive specification, the weight of the corresponding Web document 200 in the transposed file 109 is strengthened, and if the input weight is a negative specification, the W
The weight of the eb document 200 is reduced.
【0057】また、本実施の形態においては、ベクトル
空間法による検索を例にとって説明したが、ブーリアン
検索により検索処理を行うことにしても良い。In the present embodiment, the search by the vector space method has been described as an example. However, the search processing may be performed by a Boolean search.
【0058】また、上述したカテゴリーは、本実施の形
態のWeb文書の検索支援装置の管理者側で設定するも
のであるため、Webクライアントのユーザが所望する
カテゴリーが存在しない場合も考えられる。したがっ
て、カテゴリー管理ソフト105に、ユーザ毎にカテゴ
リーを設定することができるような機能を持たせても良
い。具体的には、Webクライアントからカテゴリー管
理ソフト105を呼び出すことができるようにし、上述
したようにしてカテゴリーや検索条件の設定を行うこと
ができるようにする。設定したカテゴリーは、カテゴリ
ー管理ソフト105によってユーザ毎に管理する。カテ
ゴリー管理ソフト105は、Webクライアントのユー
ザから自己のカテゴリーの表示の要求を受信すると、該
当するカテゴリーをWebクライアントのユーザに提示
する。なお、その後の処理については、上述した通りで
あるため、ここではその説明を省略する。Since the above-mentioned category is set by the administrator of the Web document search support apparatus according to the present embodiment, there may be a case where the category desired by the Web client user does not exist. Therefore, the category management software 105 may be provided with a function for setting a category for each user. Specifically, the category management software 105 can be called from the Web client, and the category and the search condition can be set as described above. The set category is managed for each user by the category management software 105. When the category management software 105 receives a request to display its own category from the Web client user, the category management software 105 presents the corresponding category to the Web client user. Since the subsequent processing is as described above, the description thereof is omitted here.
【0059】さらに、本実施の形態で説明したWeb文
書の検索支援装置は、予め用意されたプログラムをコン
ピュータやワークステーションで実行することによって
実現される。このプログラムは、ハードディスク,フロ
ッピーディスク,CD−ROM,MO,DVD等のコン
ピュータで読み取り可能な記録媒体に記録され、コンピ
ュータによって記録媒体から読み出されることによって
実行される。また、このプログラムは、上記記録媒体を
介して、またはネットワークを介して配布することがで
きる。Further, the Web document search support device described in the present embodiment is realized by executing a prepared program on a computer or a workstation. This program is recorded on a computer-readable recording medium such as a hard disk, a floppy disk, a CD-ROM, an MO, and a DVD, and is executed by being read from the recording medium by the computer. This program can be distributed via the recording medium or via a network.
【0060】[0060]
【発明の効果】以上説明したように、本発明のWeb文
書の検索支援装置(請求項1)によれば、Web文書を
収集する収集手段と、収集手段で収集したWeb文書を
入力し、入力したWeb文書を検索するために用いる検
索情報を生成して格納する格納手段と、検索条件を入力
する検索条件入力手段と、検索条件入力手段で入力され
た検索条件を前記分類項目として設定する分類項目設定
手段と、Webクライアントからの要求に応じて、前記
分類項目設定手段で設定した分類項目を提示する分類項
目提示手段と、Webクライアントで前記分類項目提示
手段で提示した分類項目が選択されると、選択された分
類項目に基づいて、前記格納手段に格納された前記検索
情報を用いて該当するWeb文書を検索する検索手段
と、検索手段の検索結果に基づいて、該当するWeb文
書の一覧を前記Webクライアントに提示するWeb文
書一覧提示手段と、を備えたため、Web文書の分類作
業に要する労力を軽減することができる。加えて、カテ
ゴリー別にWeb文書を自動的に分類することにより、
適切な数のWeb文書を得ることができる。As described above, according to the Web document search support apparatus of the present invention (claim 1), a collection unit for collecting Web documents, and a Web document collected by the collection unit are input and input. Storage means for generating and storing search information used for searching for a searched Web document, search condition input means for inputting search conditions, and classification for setting the search conditions input by the search condition input means as the classification items Item setting means, a classification item presenting means for presenting the classification items set by the classification item setting means in response to a request from the Web client, and a classification item presented by the classification item presenting means on the Web client are selected. Search means for searching for a corresponding Web document using the search information stored in the storage means based on the selected classification item, and search by the search means Based on the result, for a list of relevant Web documents and a Web document list presenting means for presenting the Web client, it is possible to reduce the labor required for classification tasks Web documents. In addition, by automatically classifying Web documents by category,
An appropriate number of Web documents can be obtained.
【0061】また、本発明のWeb文書の検索支援装置
(請求項2)によれば、請求項1に記載のWeb文書の
検索支援装置において、さらに、ユーザ独自の分類項目
を提示することができるように、前記分類項目をユーザ
単位で保持するための分類項目保持手段を備え、前記検
索条件入力手段は、前記Webクライアントから検索条
件を入力し、前記分類項目設定手段は、前記検索条件入
力手段で入力された検索条件を前記分類項目として設定
し、前記分類項目保持手段は、前記分類項目設定手段で
設定された分類項目を保持し、前記分類項目提示手段
は、Webクライアントからの要求に基づいて、前記分
類項目保持手段から該当する分類項目を読み出して提示
するため、Webクライアントのユーザが所望する分類
項目が用意されていない場合であっても、ユーザ独自の
分類項目を設定することができ、所望のWeb文書を得
ることができるようにすることができる。Further, according to the Web document search support apparatus of the present invention (claim 2), in the Web document search support apparatus of claim 1, it is possible to further present a user-specific classification item. A search condition input means for inputting a search condition from the Web client; and a search condition input means for storing the search condition in the search condition input means. Is set as the classification item, the classification item holding unit holds the classification item set by the classification item setting unit, and the classification item presentation unit sets the search condition based on a request from the Web client. In order to read out and present the corresponding classification item from the classification item holding means, the classification item desired by the user of the Web client is prepared. Even If no, it is possible to set your own category, it is possible to be able to obtain a desired Web document.
【0062】また、本発明のWeb文書の検索支援装置
(請求項3)によれば、請求項1または2に記載のWe
b文書の検索支援装置において、さらに、前記分類項目
設定手段で設定した分類項目の中からアンド条件の対象
となる分類項目を指定する指定手段を備え、前記指定手
段で前記アンド条件の対象となる分類項目が指定された
場合、前記分類項目設定手段は、前記検索条件入力手段
で入力された検索条件を入れ子の分類項目として前記ア
ンド条件の対象となる分類項目の下位に配置するため、
より詳細な分類を可能とすることができる。Further, according to the Web document search support apparatus of the present invention (claim 3), the Web document according to claim 1 or 2 is provided.
The b-document search support device further includes a designation unit for designating a classification item to be subjected to an AND condition from among the classification items set by the classification item setting unit, and the designation unit is a target of the AND condition. When a classification item is specified, the classification item setting unit arranges the search condition input by the search condition input unit as a nested classification item below the classification item targeted by the AND condition,
More detailed classification can be made possible.
【0063】さらに、本発明のコンピュータ読み取り可
能な記録媒体(請求項4)によれば、請求項1〜3のい
ずれか1つに記載のWeb文書の検索支援装置の各手段
としてコンピュータを機能させるためのプログラムを記
録したため、このプログラムをコンピュータに実行させ
ることにより、Web文書の分類作業に要する労力を軽
減することができるWeb文書の検索支援装置を実現す
ることができる。Further, according to the computer-readable recording medium of the present invention (claim 4), a computer is caused to function as each means of the Web document search support apparatus according to any one of claims 1 to 3. Therefore, by executing the program on a computer, it is possible to realize a Web document search support apparatus that can reduce the labor required for the Web document classification work.
【図1】本実施の形態のWeb文書の検索支援装置のブ
ロック構成図である。FIG. 1 is a block diagram of a Web document search support apparatus according to an embodiment.
【図2】本実施の形態のWeb文書の検索支援装置にお
いて、検索ソフト106の処理を示す概略ブロック図で
ある。FIG. 2 is a schematic block diagram showing processing of search software 106 in the Web document search support device of the present embodiment.
【図3】本実施の形態のWeb文書の検索支援装置にお
いて、転置ファイルの生成処理を示すフローチャートで
ある。FIG. 3 is a flowchart showing a process of generating a transposed file in the web document search support device according to the embodiment;
【図4】本実施の形態のWeb文書の検索支援装置にお
いて、カテゴリーの設定処理を説明するための説明図で
ある。FIG. 4 is an explanatory diagram illustrating a category setting process in the web document search support device of the present embodiment.
【図5】本実施の形態のWeb文書の検索支援装置にお
いて、設定したカテゴリーの一例を示す説明図である。FIG. 5 is an explanatory diagram showing an example of a set category in the Web document search support device of the present embodiment.
【図6】本実施の形態のWeb文書の検索支援装置にお
いて、カテゴリー毎の分類処理を示すフローチャートで
ある。FIG. 6 is a flowchart showing classification processing for each category in the Web document search support device of the present embodiment.
【図7】本実施の形態のWeb文書の検索支援装置にお
いて、Web文書リストの一例を示す説明図である。FIG. 7 is an explanatory diagram showing an example of a Web document list in the Web document search support device of the present embodiment.
【図8】本実施の形態のWeb文書の検索支援装置にお
いて、Webクライアントで選択されたカテゴリーに関
連づけてWeb文書を一覧表示した様子の一例を示す説
明図である。FIG. 8 is an explanatory diagram showing an example of a state where a list of Web documents is displayed in association with a category selected by a Web client in the Web document search support device of the present embodiment.
100 CPU 101 ROM 102 RAM 103 ハードディスク装置 104 Web文書収集ソフト 105 カテゴリー管理ソフト 106 検索ソフト 107 入力装置 108 ディスプレイ 109 転置ファイル 110 通信装置 111 インターネット 112 バス 200 Web文書 201 自然言語処理モジュール 202 辞書 203 文法辞書 204 ドキュメント・セット 205 データベース・ビルド・コンポーネント 206 検索条件 207 クエリー・ビルド・コンポーネント 208 クエリー・ドキュメント 209 検索エンジン 210 Web文書リスト 100 CPU 101 ROM 102 RAM 103 Hard Disk Device 104 Web Document Collection Software 105 Category Management Software 106 Search Software 107 Input Device 108 Display 109 Transposed File 110 Communication Device 111 Internet 112 Bus 200 Web Document 201 Natural Language Processing Module 202 Dictionary 203 Grammar Dictionary 204 Document set 205 Database build component 206 Search condition 207 Query build component 208 Query document 209 Search engine 210 Web document list
Claims (4)
ネット上のWeb文書を分類して管理し、Webクライ
アントの要求に応じて前記分類項目を提示すると共に、
前記Webクライアントで選択された分類項目に該当す
るWeb文書の一覧を提示することにより、Web文書
の検索を支援するWeb文書の検索支援装置であって、 前記Web文書を収集する収集手段と、 前記収集手段で収集したWeb文書を入力し、入力した
Web文書を検索するために用いる検索情報を生成して
格納する格納手段と、 検索条件を入力する検索条件入力手段と、 前記検索条件入力手段で入力された検索条件を前記分類
項目として設定する分類項目設定手段と、 前記Webクライアントからの要求に応じて、前記分類
項目設定手段で設定した分類項目を提示する分類項目提
示手段と、 前記Webクライアントで前記分類項目提示手段で提示
した分類項目が選択されると、選択された分類項目に基
づいて、前記格納手段に格納された前記検索情報を用い
て該当するWeb文書を検索する検索手段と、 前記検索手段の検索結果に基づいて、該当するWeb文
書の一覧を前記Webクライアントに提示するWeb文
書一覧提示手段と、 を備えたことを特徴とするWeb文書の検索支援装置。1. Classifying and managing Web documents on the Internet in accordance with preset classification items, presenting the classification items in response to a request from a Web client,
A web document search support device that supports a web document search by presenting a list of web documents corresponding to the classification items selected by the web client, wherein: a collection unit that collects the web documents; A storage unit for inputting the Web document collected by the collection unit and generating and storing search information used for searching the input Web document; a search condition input unit for inputting a search condition; A classification item setting unit configured to set the input search condition as the classification item; a classification item presentation unit configured to present the classification item set by the classification item setting unit in response to a request from the Web client; When the classification item presented by the classification item presentation unit is selected, the storage unit is selected based on the selected classification item. Search means for searching for a corresponding Web document by using the stored search information; Web document list presenting means for presenting a list of relevant Web documents to the Web client based on a search result of the search means; A web document search support device comprising:
ることができるように、前記分類項目をユーザ単位で保
持するための分類項目保持手段を備え、 前記検索条件入力手段は、前記Webクライアントから
検索条件を入力し、 前記分類項目設定手段は、前記検索条件入力手段で入力
された検索条件を前記分類項目として設定し、 前記分類項目保持手段は、前記分類項目設定手段で設定
された分類項目を保持し、 前記分類項目提示手段は、Webクライアントからの要
求に基づいて、前記分類項目保持手段から該当する分類
項目を読み出して提示することを特徴とする請求項1に
記載のWeb文書の検索支援装置。2. The system according to claim 1, further comprising: a classification item holding unit configured to hold the classification items for each user so that a user-specific classification item can be presented. A search condition is input, the classification item setting unit sets the search condition input by the search condition input unit as the classification item, and the classification item holding unit sets the classification item set by the classification item setting unit. 2. The Web document search according to claim 1, wherein the classification item presentation unit reads and presents a corresponding classification item from the classification item storage unit based on a request from a Web client. 3. Support equipment.
た分類項目の中からアンド条件の対象となる分類項目を
指定する指定手段を備え、 前記指定手段で前記アンド条件の対象となる分類項目が
指定された場合、前記分類項目設定手段は、前記検索条
件入力手段で入力された検索条件を入れ子の分類項目と
して前記アンド条件の対象となる分類項目の下位に配置
することを特徴とする請求項1または2に記載のWeb
文書の検索支援装置。3. The system according to claim 1, further comprising: a designation unit for designating a classification item to be subjected to an AND condition from among the classification items set by the classification item setting unit. The classification item setting means, if specified, arranges the search condition input by the search condition input means as a nested classification item below the classification item targeted by the AND condition. Web described in 1 or 2
Document search support device.
のWeb文書の検索支援装置の各手段としてコンピュー
タを機能させるためのプログラムを記録したことを特徴
とするコンピュータ読み取り可能な記録媒体。4. A computer-readable recording medium storing a program for causing a computer to function as each unit of the Web document search support apparatus according to claim 1. .
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199618A JPH1145257A (en) | 1997-07-25 | 1997-07-25 | Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9199618A JPH1145257A (en) | 1997-07-25 | 1997-07-25 | Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH1145257A true JPH1145257A (en) | 1999-02-16 |
Family
ID=16410855
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9199618A Pending JPH1145257A (en) | 1997-07-25 | 1997-07-25 | Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH1145257A (en) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20000054312A (en) * | 2000-06-01 | 2000-09-05 | 최우석 | Establishing provide Method for ordered web information |
JP2000293425A (en) * | 1999-04-01 | 2000-10-20 | Nec Commun Syst Ltd | Internet web retrieval system |
JP2001075859A (en) * | 1999-08-31 | 2001-03-23 | Just Syst Corp | Device for cyclic acquiring information |
JP2001134616A (en) * | 1999-10-25 | 2001-05-18 | Nec Corp | Method and system for constructing web information on specific topic |
KR100461766B1 (en) * | 2001-06-14 | 2004-12-14 | 주식회사 로직플랜트 | A system for providing personal information and a method thereof |
JP2006092235A (en) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | Program for operating computer as retrieval word updating device, retrieval word updating method and retrieval word updating device |
JP2006189972A (en) * | 2004-12-28 | 2006-07-20 | Chugoku Electric Power Co Inc:The | Information management system |
KR100621737B1 (en) * | 1999-12-27 | 2006-09-06 | 학교법인 포항공과대학교 | Method for auto-classifying Web Sites |
KR100691686B1 (en) | 2001-12-27 | 2007-03-09 | 후지제롯쿠스 가부시끼가이샤 | Apparatus and method for collecting information from information providing server |
JP4812212B2 (en) * | 1999-09-24 | 2011-11-09 | ユナイテッド ビデオ プロパティーズ インク | Interactive TV program guide with extended user interface |
-
1997
- 1997-07-25 JP JP9199618A patent/JPH1145257A/en active Pending
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000293425A (en) * | 1999-04-01 | 2000-10-20 | Nec Commun Syst Ltd | Internet web retrieval system |
JP2001075859A (en) * | 1999-08-31 | 2001-03-23 | Just Syst Corp | Device for cyclic acquiring information |
JP4812212B2 (en) * | 1999-09-24 | 2011-11-09 | ユナイテッド ビデオ プロパティーズ インク | Interactive TV program guide with extended user interface |
JP2001134616A (en) * | 1999-10-25 | 2001-05-18 | Nec Corp | Method and system for constructing web information on specific topic |
KR100621737B1 (en) * | 1999-12-27 | 2006-09-06 | 학교법인 포항공과대학교 | Method for auto-classifying Web Sites |
KR20000054312A (en) * | 2000-06-01 | 2000-09-05 | 최우석 | Establishing provide Method for ordered web information |
KR100461766B1 (en) * | 2001-06-14 | 2004-12-14 | 주식회사 로직플랜트 | A system for providing personal information and a method thereof |
KR100691686B1 (en) | 2001-12-27 | 2007-03-09 | 후지제롯쿠스 가부시끼가이샤 | Apparatus and method for collecting information from information providing server |
US7216120B2 (en) | 2001-12-27 | 2007-05-08 | Fuji Xerox Co., Ltd. | Apparatus and method for collecting information from information providing server |
JP2006092235A (en) * | 2004-09-24 | 2006-04-06 | Fuji Xerox Co Ltd | Program for operating computer as retrieval word updating device, retrieval word updating method and retrieval word updating device |
JP2006189972A (en) * | 2004-12-28 | 2006-07-20 | Chugoku Electric Power Co Inc:The | Information management system |
JP4623635B2 (en) * | 2004-12-28 | 2011-02-02 | 中国電力株式会社 | In-house information management system |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3755134B2 (en) | Computer-based matched text search system and method | |
JP4241934B2 (en) | Text processing and retrieval system and method | |
JP3717808B2 (en) | Information retrieval system | |
JP3577819B2 (en) | Information search apparatus and information search method | |
JPH11102376A (en) | Method and device for automatically displaying text extracted from data base relating to retrieval inquiry | |
JP4091146B2 (en) | Document retrieval apparatus and computer-readable recording medium recording a program for causing a computer to function as the apparatus | |
JPH1145257A (en) | Web document retrieval supporting device and computer readable recording medium recorded with program for functioning computer as the device | |
JPH11296537A (en) | Information retrieval system, information providing device, information retrieval terminal device, information retrieving method, and storage medium | |
JPH1145274A (en) | Extension method for key word using co-occurrence between words and computer readable recording medium recording program for making computer execute respective processes of the method | |
JP2003196294A (en) | Knowledge analyzing system and method | |
JP2004054882A (en) | Synonym retrieval device, method, program and storage medium | |
JPH1145268A (en) | Document retrieval device and computer-readable recording medium where eprogram making computer funtion as same device is recorded | |
JPH11338869A (en) | Information recommendation method and system, storage medium storing information recommendation program, information storage method and device, and storage medium storing information storage program | |
JP2010286888A (en) | Information collection system, information collection method, and program therefor | |
JPH1145252A (en) | Information retrieval device and computer readable recording medium for recording program for having computer function as the same device | |
JPH11154164A (en) | Adaptability calculating method in whole sentence search processing and storage medium storing program related to the same | |
JP2002056009A (en) | Method and device for classifying document | |
JP4384736B2 (en) | Image search device and computer-readable recording medium storing program for causing computer to function as each means of the device | |
JPH1145238A (en) | Document management system and computer readable recording medium for recording program for having computer function as the same system | |
JP2000105769A (en) | Document display method | |
JP4138048B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device | |
JPH1145254A (en) | Document retrieval device and computer readable recording medium recorded with program for functioning computer as the device | |
JPH1145255A (en) | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded | |
JP4368550B2 (en) | Document search apparatus, document search method, and program causing computer to execute the method | |
JP3872764B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND PROGRAM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040721 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070529 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070730 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080115 |