Nothing Special   »   [go: up one dir, main page]

JP2003330958A - Information retrieval device, method, program, and recording medium - Google Patents

Information retrieval device, method, program, and recording medium

Info

Publication number
JP2003330958A
JP2003330958A JP2002133906A JP2002133906A JP2003330958A JP 2003330958 A JP2003330958 A JP 2003330958A JP 2002133906 A JP2002133906 A JP 2002133906A JP 2002133906 A JP2002133906 A JP 2002133906A JP 2003330958 A JP2003330958 A JP 2003330958A
Authority
JP
Japan
Prior art keywords
search
query
information
analysis
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002133906A
Other languages
Japanese (ja)
Inventor
Tomonori Kudou
朋紀 工藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2002133906A priority Critical patent/JP2003330958A/en
Publication of JP2003330958A publication Critical patent/JP2003330958A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To provide an information retrieval device highly precisely and efficiently providing a retrieval result according to a user's intention. <P>SOLUTION: This information retrieval device, at first, obtains a query inputted via an input device 3 in a step S51, and performs a language analysis to the query obtained in the step S51 in a following step S52. In a step S53, it determines that either retrieval mode is applied thereto based on the language analysis result of the query in the step S52. When the query word number is one, it is determined to apply whole sentence retrieval, when the query word number is not less than one and not more than a prescribed number, it is determined to apply a phrase retrieval, and when the query word number exceeds the prescribed number, it is determined to apply a concept retrieval. <P>COPYRIGHT: (C)2004,JPO

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、方式がそれぞれ異
なる複数の検索手段を有する情報検索装置、情報検索方
法、プログラムおよび記憶媒体に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an information retrieval device, an information retrieval method, a program and a storage medium having a plurality of retrieval means of different systems.

【0002】[0002]

【従来の技術】近年、大量の文書データを扱う機会が増
加してきており、所望の文書データを検索する方法とし
て、多種多様の方法が用いられている。これは、単純な
キーワード検索(キーワードを指示し、それが出現する
か否かで検索を行う)だけでは、ユーザの要求を十分に
満たすことができないためである。そこで、キーワード
間の関係や構文情報の類似度による方法や文書の内容を
特徴付ける文書ベクトルを用いて検索を行う方法が出現
している。また、内容を特徴付ける意味、分野、単語そ
のものを次元とし、その特徴量を値とすることによって
ベクトル表現し、文書ベクトル間の内積等の値を用いて
文書間の類似度を求める方法も考案されている。このよ
うに各種検索方法があるが、ユーザは検索目的や検索状
況によって、どの検索方法で検索するかを決定し、検索
を行う必要がある。
2. Description of the Related Art In recent years, there have been increasing opportunities to handle a large amount of document data, and various methods are used as a method for searching for desired document data. This is because a simple keyword search (a keyword is designated and a search is performed based on whether or not the keyword appears) cannot sufficiently satisfy the user's request. Therefore, a method based on the relationship between keywords and the degree of similarity of syntax information, and a method of searching using a document vector that characterizes the content of a document have appeared. Also, a method has been devised in which a meaning, a field, or a word itself that characterizes contents is used as a dimension, and a vector is expressed by using the feature amount as a value, and the similarity between documents is obtained using a value such as an inner product between document vectors. ing. Although there are various search methods as described above, it is necessary for the user to determine which search method to use for the search, depending on the search purpose and the search status.

【0003】次に、ユーザの検索目的や検索状況に応じ
て複数の検索方法のうち、いずれの検索方法を用いて検
索するかを決定し、決定された検索方法で検索する手順
について図18および図19を参照しながら説明する。
図18は従来の検索方法の手順を示すフローチャート、
図19は従来の検索方法における操作画面例を示す図で
ある。
Next, a procedure for deciding which of the plurality of search methods to use for the search according to the user's search purpose and the search situation and performing the search by the determined search method will be described with reference to FIG. 18 and FIG. This will be described with reference to FIG.
FIG. 18 is a flowchart showing the procedure of a conventional search method,
FIG. 19 is a diagram showing an example of an operation screen in the conventional search method.

【0004】ここでは、全文検索、フレーズ検索、概念
検索の3種類の検索モードがあり、これらの検索モード
から、使用する検索モードを決定し、決定された検索モ
ードで検索を行う場合を説明する。
Here, there are three types of search modes: full-text search, phrase search, and concept search. A search mode to be used is determined from these search modes, and a case of performing a search in the determined search mode will be described. .

【0005】検索を行う場合、図18に示すように、ま
ずステップS41において、ユーザにより入力されたク
エリーを取得し、続くステップS42で、ユーザにより
指定された検索モードを取得する。そして、ステップS
43において、上記ステップS41で取得したクエリー
を解析する。
When performing a search, as shown in FIG. 18, first, in step S41, the query input by the user is acquired, and in the subsequent step S42, the search mode specified by the user is acquired. And step S
At 43, the query acquired at step S41 is analyzed.

【0006】次いで、ステップS44において、取得し
たユーザ指定の検索モードが全文検索、フレーズ検索、
概念検索のいずれであるか否かを判別する。ここで、ユ
ーザ指定の検索モードが全文検索である場合、ステップ
S45において、クエリーの解析結果に基づき記憶装置
に格納されている情報に対し全文検索を行い、続くステ
ップS48で、全文検索による検索結果を表示する。そ
して、本処理を終了する。ユーザ指定の検索モードがフ
レーズ検索である場合、ステップS46において、クエ
リーの解析結果に基づき記憶装置に格納されている情報
に対しフレーズ検索を行い、続くステップS48で、フ
レーズ検索による検索結果を表示する。そして、本処理
を終了する。ユーザ指定の検索モードが概念検索である
場合、ステップS47において、クエリーの解析結果に
基づき、記憶装置に格納されている情報に対し概念検索
を行い、続くステップS48で、概念検索による検索結
果を表示する。そして、本処理を終了する。
Then, in step S44, the obtained user-specified search mode is full-text search, phrase search,
It is determined whether it is a concept search. Here, when the user-specified search mode is full-text search, in step S45, full-text search is performed on the information stored in the storage device based on the analysis result of the query, and in subsequent step S48, the search result by full-text search is obtained. Is displayed. Then, this process ends. When the user-specified search mode is phrase search, in step S46 a phrase search is performed on the information stored in the storage device based on the analysis result of the query, and in the subsequent step S48, the search result by the phrase search is displayed. . Then, this process ends. If the user-specified search mode is concept search, a concept search is performed on the information stored in the storage device based on the analysis result of the query in step S47, and the search result by the concept search is displayed in step S48. To do. Then, this process ends.

【0007】検索を行う際には、例えば図19に示すよ
うな操作画面が表示され、この操作画面上でクエリーが
入力される。ここでは、クエリーとして「川崎」が入力
されたとする。次いで、上記操作画面上で、ユーザによ
り検索モードが選択される。ここでは、ユーザの判断に
より、上記クリエートして入力された「川崎」という単
語を含んだ文書あるいは画像などを検索したいという意
図で検索を行う場合に最適な検索モードとして全文検索
が選択されたとする。そして、この全文検索により、記
憶装置に格納されている文書などの中から、「川崎」と
いう単語を含む文書または画像が抽出され、その抽出さ
れた文書または画像の一覧が検索結果として表示され
る。この検索結果の表示の際には、抽出された文書など
を検索順または一致度が高いものから順に一覧表示す
る。
When performing a search, for example, an operation screen as shown in FIG. 19 is displayed, and a query is input on this operation screen. Here, it is assumed that "Kawasaki" is entered as a query. Then, the user selects the search mode on the operation screen. Here, at the user's discretion, it is assumed that the full-text search is selected as the optimum search mode when the search is performed with the intention of searching for a document or an image containing the word "Kawasaki" input after being created. . By this full-text search, documents or images containing the word "Kawasaki" are extracted from the documents stored in the storage device, and a list of the extracted documents or images is displayed as the search result. . When displaying the search results, the extracted documents and the like are displayed in a list in the order of search or those having the highest degree of coincidence.

【0008】[0008]

【発明が解決しようとする課題】上述した従来の検索方
法では、ユーザ自身が意図に応じた最適な検索モードを
選択、決定する必要があるので、意図する検索結果を短
時間で得るためには、ユーザに対し、検索する意図に対
してどのような検索モードが適しているかを判断するた
めの知識または経験が要求される。しかしながら、各検
索モードの特徴に対する知識が不足しているなどの場
合、ユーザにより、意図に応じた検索モードとは異なる
検索モードが選択されることがある。このような場合、
意図に応じた検索結果を得ることができず、他の検索方
法を選択して検索をやり直す必要があるなど、検索に余
分な時間が掛かることがある。
In the above-described conventional search method, the user himself needs to select and determine the optimum search mode according to his intention. Therefore, in order to obtain an intended search result in a short time. , The user is required to have knowledge or experience to determine which search mode is suitable for the search intention. However, when the knowledge about the features of each search mode is insufficient, the user may select a search mode different from the search mode according to the intention. In such cases,
The search may take extra time because it is not possible to obtain a search result according to the intention and it is necessary to select another search method and perform the search again.

【0009】本発明の目的は、ユーザの意図に応じた検
索結果を高い精度でかつ効率良く得ることができる情報
検索装置、情報検索方法、プログラムおよび記憶媒体を
提供することにある。
An object of the present invention is to provide an information search device, an information search method, a program, and a storage medium that can obtain a search result according to a user's intention with high accuracy and efficiency.

【0010】[0010]

【課題を解決するための手段】本発明は、上記目的を達
成するため、方式がそれぞれ異なる複数の検索手段と、
クエリーを入力する入力手段と、前記入力されたクエリ
ーを解析するクエリー解析手段と、検索適用条件に応じ
て前記複数の検索手段の中から、検索に適用する少なく
とも1つ以上の検索手段を決定する決定手段と、前記決
定された少なくとも1つ以上の検索手段により前記入力
されたクエリーに対する解析結果を用いた検索を実行す
る検索実行手段と、前記実行された少なくとも1つ以上
の検索手段による検索結果を表示する表示手段とを備え
ることを特徴とする。
In order to achieve the above object, the present invention provides a plurality of search means each having a different method,
Input means for inputting a query, query analysis means for analyzing the input query, and at least one or more search means to be applied to a search are determined from the plurality of search means according to search application conditions. Determining means, search executing means for executing a search using the analysis result for the input query by the at least one or more determined searching means, and search results by the executed at least one or more searching means And display means for displaying.

【0011】また、上記情報検索装置において、前記検
索適用条件は、前記入力されたクエリーに対する解析結
果であることを特徴とする。
Further, in the above information search apparatus, the search applicable condition is an analysis result for the input query.

【0012】また、上記情報検索装置において、前記ク
エリー解析手段は、前記入力されたクエリーに対して異
なる解析をそれぞれ行う複数の解析手段を含むことを特
徴とする。
Further, in the above information retrieval apparatus, the query analysis means includes a plurality of analysis means for respectively performing different analyzes on the input query.

【0013】また、上記情報検索装置において、前記複
数の解析手段は、前記入力されたクエリーに対する形態
素解析手段、構文解析手段および意味解析手段を含むこ
とを特徴とする。
Further, in the above information retrieval apparatus, the plurality of analyzing means include a morpheme analyzing means, a syntactic analyzing means and a semantic analyzing means for the inputted query.

【0014】また、上記情報検索装置において、前記複
数の検索手段は、少なくとも、全文検索手段、フレーズ
検索手段、概念検索手段のいずれか1つを含むことを特
徴とする。
Further, in the above information retrieval apparatus, the plurality of retrieval means include at least one of a full-text retrieval means, a phrase retrieval means, and a concept retrieval means.

【0015】また、上記情報検索装置において、サーバ
/クライアントシステムにおけるクライアントに組み込
まれていることを特徴とする。
Further, in the above information retrieval apparatus, it is characterized in that it is incorporated in a client in a server / client system.

【0016】また、上記情報検索装置において、前記検
索適用条件は、前記サーバと接続状態にあるクライアン
ト数であることを特徴とする。
Further, in the above information search apparatus, the search applicable condition is the number of clients in a connected state with the server.

【0017】また、上記情報検索装置において、前記検
索適用条件は、前記サーバと接続状態にあるクライアン
ト数と前記入力されたクエリーに対する解析結果である
ことを特徴とする。
Further, in the above information retrieval apparatus, the retrieval applicable condition is the number of clients connected to the server and an analysis result for the inputted query.

【0018】また、上記情報検索装置において、通信網
に接続可能な端末に組み込まれていることを特徴とす
る。
Further, in the above information retrieving apparatus, the information retrieving apparatus is incorporated in a terminal connectable to a communication network.

【0019】また、本発明は、上記目的を達成するた
め、クエリーを入力する入力工程と、前記入力されたク
エリーを解析するクエリー解析工程と、検索適用条件に
応じて、方式がそれぞれ異なる複数の検索手段の中か
ら、検索に適用する少なくとも1つ以上の検索手段を決
定する決定工程と、前記決定された少なくとも1つ以上
の検索手段により前記入力されたクエリーに対する解析
結果を用いた検索を実行する検索実行工程と、前記実行
された少なくとも1つ以上の検索手段による検索結果を
表示手段に表示する表示工程とを備えることを特徴とす
る。
Further, in order to achieve the above-mentioned object, the present invention comprises a step of inputting a query, a step of analyzing a query, a step of analyzing a query, and a plurality of different methods according to search application conditions. A determination step of determining at least one or more search means to be applied to the search from the search means, and a search using the analysis result for the input query by the at least one or more determined search means. And a display step of displaying a search result by the at least one or more executed search means on a display means.

【0020】また、本発明は、情報検索を行うためのコ
ンピュータにより実行可能なプログラムであって、クエ
リーを入力する入力ステップと、前記入力されたクエリ
ーを解析するクエリー解析ステップと、検索適用条件に
応じて、方式がそれぞれ異なる複数の検索モジュールの
中から、検索に適用する少なくとも1つ以上の検索モジ
ュールを決定する決定ステップと、前記決定された少な
くとも1つ以上の検索モジュールにより前記入力された
クエリーに対する解析結果を用いた検索を実行する検索
実行ステップと、前記実行された少なくとも1つ以上の
検索モジュールによる検索結果を表示手段に表示する表
示ステップとを備えることを特徴とする。
Further, the present invention is a computer-executable program for performing information retrieval, comprising an input step of inputting a query, a query analysis step of analyzing the input query, and a search application condition. Accordingly, a determining step of determining at least one search module to be applied to the search from a plurality of search modules having different methods, and the input query by the determined at least one search module. And a display step of displaying a search result by the at least one search module executed on the display means.

【0021】また、本発明は、上記プログラムをコンピ
ュータ読取り可能に格納したことを特徴とする。
Further, the present invention is characterized in that the above program is stored in a computer-readable manner.

【0022】[0022]

【発明の実施の形態】以下、本発明の実施の形態につい
て図面を参照しながら説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.

【0023】(第1の実施形態)図1は本発明の第1の
実施形態に係る情報検索装置の構成を示すブロック図、
図2は図1の情報検索装置がサーバ/クライアントシス
テムに組み込まれている例を示す図、図3は図1の情報
検索装置をインターネット接続端末に組み込まれている
例を示す図である。
(First Embodiment) FIG. 1 is a block diagram showing the arrangement of an information retrieval apparatus according to the first embodiment of the present invention.
2 is a diagram showing an example in which the information search device of FIG. 1 is incorporated in a server / client system, and FIG. 3 is a diagram showing an example in which the information search device of FIG. 1 is incorporated in an Internet connection terminal.

【0024】情報検索装置は、図1に示すように、記憶
装置2に格納されているプログラムに従って処理を実行
する中央処理装置1と、処理を操作するキーボード、マ
ウスなどの入力装置3と、情報検索結果などを表示する
表示装置4と、FD(フロッピー(R)ディスク)、CD
−ROM、磁気テープなどの記憶媒体に記憶されたプロ
グラム、データなどを読み取る記憶媒体読取装置5とを
備える。また、記憶装置2には、検索対象となる文書な
どのデータが格納されており、本情報検索装置は、記憶
装置2に格納されている文書などのデータを、方式がそ
れぞれ異なる複数の検索方法を用いて検索することが可
能である。
As shown in FIG. 1, the information retrieval device includes a central processing unit 1 for executing a process according to a program stored in a storage device 2, an input device 3 such as a keyboard and a mouse for operating the process, and information. Display device 4 for displaying search results, FD (floppy (R) disk), CD
A storage medium reading device 5 for reading programs, data, etc. stored in a storage medium such as a ROM or a magnetic tape. Further, the storage device 2 stores data such as a document to be searched, and the information search device of the present information search device searches the data stored in the storage device 2 for a plurality of methods using different methods. It is possible to search using.

【0025】また、本情報検索装置は、図2に示すよう
に、サーバ/クライアントシステムにおけるネットワー
ク11を介して接続されているサーバ12a,12bま
たはクライアント13a,13b,13c,13dに組
み込むができ、これにより、例えば各クライアン13
a,13b,13c,13dからサーバ12a,12b
が保持する文書、画像などのデータを検索することが可
能になる。さらに、本情報検索装置は、図3に示すよう
に、インターネット22に接続可能な端末21にも適用
することができ、これにより、この端末21からWEB
の検索などを行うことが可能になる。
Further, as shown in FIG. 2, this information retrieval apparatus can be incorporated in the servers 12a, 12b or the clients 13a, 13b, 13c, 13d connected through the network 11 in the server / client system, As a result, for example, each client 13
a, 13b, 13c, 13d to servers 12a, 12b
It becomes possible to retrieve data such as documents and images held by. Furthermore, as shown in FIG. 3, the present information retrieval apparatus can be applied to a terminal 21 that can be connected to the Internet 22, so that the terminal 21 can access the WEB.
It becomes possible to search.

【0026】まず、本情報検索装置において、記録装置
2に検索対象となる文書などのデータを登録する処理に
ついて図4および図5を参照しながら説明する。図4は
検索対象となる文書などのデータを登録するときの処理
手順を示すフローチャート、図5は図4のステップS9
4の概念検索登録処理の詳細な手順を示すフローチャー
トである。
First, a process of registering data such as a document to be searched in the recording device 2 in the information searching apparatus will be described with reference to FIGS. 4 and 5. FIG. 4 is a flowchart showing a processing procedure when registering data such as a document to be searched, and FIG. 5 is step S9 in FIG.
4 is a flowchart showing a detailed procedure of a concept search registration process of No. 4.

【0027】文書などのデータを登録する際には、図4
に示すように、まずステップS91において、登録デー
タ(文書など)を言語解析する。ここでは、具体的に
は、単語辞書などを参照しながら形態素解析を行い、必
要に応じて構文解析や意味解析などを行い、これらの解
析結果から全文検索インデックス情報、フレーズ検索イ
ンデックス情報、概念検索インデックス情報などを作成
する。
When registering data such as a document, FIG.
As shown in, first, in step S91, the registered data (such as a document) is linguistically analyzed. Here, specifically, morphological analysis is performed while referring to a word dictionary, and if necessary, syntactic analysis and semantic analysis are performed. From these analysis results, full-text search index information, phrase search index information, concept search, etc. Create index information etc.

【0028】次いで、ステップS92において、上記ス
テップS91で得られた登録データや解析結果から作成
された全文検索インデックス情報などを記憶装置2のデ
ータベースなどに格納し、続くステップS93で、上記
ステップS91で得られた登録データや解析結果から作
成されたフレーズ検索インデックス情報などを記憶装置
2のデータベースなどに格納する。そして、ステップS
94において、上記ステップS91で得られた登録デー
タや解析結果から作成された概念検索インデックス情報
などを記憶装置2のデータベースなどに格納し、本処理
を終了する。
Next, in step S92, the registration data obtained in step S91 and the full-text search index information created from the analysis result are stored in a database of the storage device 2 or the like, and in the following step S93, in the step S91. The obtained registration data and phrase search index information created from the analysis result are stored in a database of the storage device 2. And step S
At 94, the registration data obtained at step S91 and the concept search index information created from the analysis result are stored in the database of the storage device 2 or the like, and this processing is ended.

【0029】ここで、上記単語辞書としては、例えば表
1に示すような辞書が用いられ、表1に示す辞書には、
表記、読み、品詞、分類(意味)などが対応付けて格納
されている。また、例えば、「画像データベースの動向
画像データベースの動向 1997-08-28 報告書 技術課
川崎 憲二郎」という文書を登録する際には、この文
書に対する言語解析により、表2に示すような結果が得
られる。そして、この解析結果に作成されたインデック
情報を含むデータ(表記、読み、品詞、文書名、出現位
置、関係ID)が、表3に示すようなデータベースとし
て記憶装置2に格納される。
Here, as the word dictionary, for example, the dictionary shown in Table 1 is used, and the dictionary shown in Table 1 is
Notation, reading, part of speech, classification (meaning), etc. are stored in association with each other. In addition, for example, when registering the document “Trends in image databases Trends in image databases 1997-08-28 Report Engineering Section Kenjiro Kawasaki”, the results shown in Table 2 were obtained by linguistic analysis of this document. To be Then, data (notation, reading, part of speech, document name, appearance position, relationship ID) including the index information created in the analysis result is stored in the storage device 2 as a database as shown in Table 3.

【0030】[0030]

【表1】 [Table 1]

【0031】[0031]

【表2】 [Table 2]

【0032】[0032]

【表3】 [Table 3]

【0033】次に、上記ステップS94の概念検索登録
処理を詳細に説明すると、図5に示すように、まずステ
ップS101において、登録文書の言語解析結果を取得
し、続くステップS102で、上記ステップS101で
抽出された単語から辞書を検索し、単語毎の次元別の特
徴量を得て、その総和から文書ベクトルを生成する。そ
して、ステップS103において、上記ステップS10
2で得られた文書ベクトルを登録文書の内容または文書
識別子とともに記憶装置2に登録する。
Next, the concept search registration process of step S94 will be described in detail. As shown in FIG. 5, first, in step S101, the language analysis result of the registered document is acquired, and in step S102, the step S101 is executed. The dictionary is searched from the words extracted in step 1, and the feature quantity for each word is obtained for each dimension, and the document vector is generated from the sum of the feature quantities. Then, in step S103, the above step S10
The document vector obtained in 2 is registered in the storage device 2 together with the content of the registered document or the document identifier.

【0034】ここでは、情報検索装置において、記憶装
置2に検索対象となる文書などのデータを登録する手順
を示したが、検索対象となる文書などのデータを保持す
るサーバなどの情報管理装置においても、上記手順と同
様の手順で文書などのデータが登録される。
Here, the procedure for registering the data such as the document to be searched in the storage device 2 in the information retrieval device has been described, but in the information management device such as the server holding the data such as the document to be retrieved. Also, data such as a document is registered in the same procedure as the above procedure.

【0035】次に、上記概念検索登録処理(ステップS
94)の具体例について表4および表5を参照しながら
説明する。
Next, the concept search registration process (step S
Specific examples of No. 94) will be described with reference to Tables 4 and 5.

【0036】概念検索登録時、まず文書が登録される段
階で、言語解析結果取得ステップ(ステップS101)
で、登録文書に含まれる単語が取得される。そして、文
書ベクトル生成ステップ(ステップ102)で、文書内
に出現する単語から基本ベクトル辞書を用いて文書ベク
トルが算出される。ここで、基本ベクトル辞書は、表4
に示すように、単語毎にベクトル表現時のそれぞれの次
元(Dim.)に応対した特徴量が格納されている。次元とし
ては、その単語本来の意味によって分類された基準や、
その単語の使用分野に応じて分類された基準などが採用
される。例えば表4中の単語1のDim.1の特徴量は0で
あり、Dim.2の特徴量は23であることがわかる。この
ように基本ベクトル辞書から一つの単語におけるそれぞ
れの次元(Dim.)の特徴量を得ることが可能となる。特徴
量はその単語が使用されることにより、その文書がその
分類基準(=次元)をどの程度特徴付ける可能性がある
かを示す値であると解釈することが可能である。文書を
構成する全ての単語から得られた分類基準別(次元別)
の特徴量から、文書全体の特徴量を、分類基準を次元と
するベクトルで表現する。得られたベクトルは、ノルム
=1で正規化され、その値は文書ベクトルとして格納さ
れる。
When registering a concept search, a language analysis result acquisition step (step S101) is first performed when a document is registered.
Then, the words included in the registered document are acquired. Then, in the document vector generation step (step 102), the document vector is calculated from the words appearing in the document using the basic vector dictionary. Here, the basic vector dictionary is shown in Table 4.
As shown in, the feature amount corresponding to each dimension (Dim.) In the vector expression is stored for each word. As a dimension, the criteria classified by the original meaning of the word,
The criteria classified according to the field of use of the word are adopted. For example, it can be seen that the feature amount of Dim.1 of word 1 in Table 4 is 0, and the feature amount of Dim.2 is 23. In this way, it is possible to obtain the feature amount of each dimension (Dim.) In one word from the basic vector dictionary. The feature amount can be interpreted as a value indicating how likely the document is to characterize the classification criterion (= dimension) by using the word. By classification criteria (by dimension) obtained from all the words that make up the document
The feature amount of the entire document is represented by a vector having a classification criterion as a dimension from the feature amount of. The obtained vector is normalized with norm = 1, and its value is stored as a document vector.

【0037】次いで、インデックス登録処理(ステップ
103)において、文書ベクトルが表5のようなインデ
ックスに対応付けて格納される。例えば、表5中の文書
ID=6947の文書に関しては、文書ベクトルのDim.
1の特徴量が0.183であり、Dim.2の特徴量は0.2
14であることがわかる。
Next, in the index registration process (step 103), the document vector is stored in association with the index shown in Table 5. For example, for the document with the document ID = 6947 in Table 5, the document vector Dim.
The feature amount of 1 is 0.183, and the feature amount of Dim.2 is 0.2
It turns out that it is 14.

【0038】[0038]

【表4】 [Table 4]

【0039】[0039]

【表5】 [Table 5]

【0040】本実施形態では、入力されたクエリーの解
析結果に基づき、全文検索、フレーズ検索、概念検索の
3つの検索方法の中から、適切な検索モードを決定す
る。
In this embodiment, an appropriate search mode is determined from among three search methods of full text search, phrase search, and concept search based on the analysis result of the input query.

【0041】まず、本情報検索装置の検索処理の手順に
ついて図6を参照しながら説明する。図6は図1の情報
検索装置による検索処理の手順を示すフローチャートで
ある。
First, the procedure of the search process of this information search apparatus will be described with reference to FIG. FIG. 6 is a flowchart showing the procedure of a search process by the information search device of FIG.

【0042】検索時、図6に示すように、まずステップ
S51において、入力装置3を介して入力されたクエリ
ーを取得し、続くステップS52で、上記ステップS5
1で取得したクエリーに対し言語解析を行う。そして、
ステップS53において、上記ステップS52でのクエ
リーの言語解析結果に基づきいずれの検索モードを適用
するかを判別する。ここでは、いずれの検索モードを適
用するかを決定するための検索適用条件として、クエリ
ー単語数を設定し、クエリー単語数に応じて適用する検
索方法を決定する。例えば、クエリー単語数が1である
ときには、全文検索を適用するとし、クエリー単語数が
1より大きく所定数以下であるときには、フレーズ検索
を適用し、クエリー単語数が上記所定数を超えていると
きには、概念検索を適用するとする。
At the time of retrieval, as shown in FIG. 6, first, in step S51, the query input through the input device 3 is acquired, and in the following step S52, the above-mentioned step S5.
Linguistic analysis is performed on the query acquired in 1. And
In step S53, it is determined which search mode to apply based on the language analysis result of the query in step S52. Here, the number of query words is set as a search application condition for deciding which search mode to apply, and the search method to be applied is determined according to the number of query words. For example, when the number of query words is 1, full-text search is applied, when the number of query words is more than 1 and less than or equal to a predetermined number, phrase search is applied, and when the number of query words exceeds the above-mentioned predetermined number. , Apply concept search.

【0043】ここで、全文検索を適用する場合、ステッ
プS54において、全文検索を行い、続くステップS5
7で、全文検索の検索結果リストを表示装置4に表示す
る。ここでは、検索結果を一致度が高い順に一覧表示す
る。そして、本処理を終了する。上記ステップS53で
フレーズ検索を適用すると判別された場合、ステップ5
5において、フレーズ検索を行い、続くステップS57
で、フレーズ検索の検索リストを表示装置4に表示す
る。ここでも、同様に、検索結果を一致度が高い順に一
覧表示する。そして、本処理を終了する。上記ステップ
S53で概念検索を適用すると判別された場合、ステッ
プ56において、概念検索を行い、続くステップS57
で、概念検索の検索リストを表示装置4に表示する。こ
こでも、同様に、検索結果を一致度が高い順に一覧表示
する。そして、本処理を終了する。
If the full-text search is applied, the full-text search is performed in step S54, and the subsequent step S5.
In step 7, the search result list of the full text search is displayed on the display device 4. Here, the search results are displayed in a list in descending order of coincidence. Then, this process ends. If it is determined that the phrase search is applied in step S53, step 5
5, the phrase search is performed, and the subsequent step S57.
Then, the search list of the phrase search is displayed on the display device 4. Here again, the search results are similarly displayed in a list in descending order of the degree of matching. Then, this process ends. When it is determined that the concept search is applied in step S53, the concept search is performed in step 56, and the subsequent step S57.
Then, the search list of the concept search is displayed on the display device 4. Here again, the search results are similarly displayed in a list in descending order of the degree of matching. Then, this process ends.

【0044】次に、上記ステップS52における入力さ
れたクエリーの言語解析について図7を参照しながら説
明する。図7は図6のステップS52におけるクエリー
の言語解析の詳細な手順を示すフローチャートである。
Next, the linguistic analysis of the input query in step S52 will be described with reference to FIG. FIG. 7 is a flowchart showing a detailed procedure of the query language analysis in step S52 of FIG.

【0045】上記入力されたクエリーの言語解析では、
図7に示すように、まずステップS71において、上記
入力されたクエリーの文字列に対して、単語辞書(表
1)を参照しながら形態素解析を行い、続くステップS
72で、必要に応じて、入力されたクエリーを構文解析
し、係り受け解析などの構文情報を作成する。そして、
ステップS73において、入力されたクエリーの意味情
報などから意味解析を行い、本処理を終了する。
In the language analysis of the above input query,
As shown in FIG. 7, first, in step S71, morphological analysis is performed on the input character string of the query with reference to the word dictionary (Table 1), and then in step S71.
At 72, if necessary, the input query is parsed to create syntax information such as dependency analysis. And
In step S73, semantic analysis is performed from the input semantic information of the query, and this processing ends.

【0046】次に、上記ステップS55のフレーズ検索
の詳細について図8を参照しながら説明する。図8は図
6のステップS55におけるフレーズ検索の詳細な手順
を示すフローチャートである。
Next, details of the phrase search in step S55 will be described with reference to FIG. FIG. 8 is a flowchart showing a detailed procedure of phrase search in step S55 of FIG.

【0047】フレーズ検索では、図8に示すように、ま
ずステップS81において、上記ステップS52での形
態素解析結果からクエリー単語を取得し、続くステップ
S82で、上記ステップS52での形態素解析結果から
クエリー単語の構文情報を取得する。そして、ステップ
S83において、上記ステップS81とステップS82
で取得したクエリー単語とクエリー単語間の関係と文書
単語と文書単語間の関係を比較して類似度を算出し、本
処理を終了する。
In the phrase search, as shown in FIG. 8, first, in step S81, a query word is obtained from the morpheme analysis result in step S52, and then in step S82, the query word is obtained from the morpheme analysis result in step S52. Get syntax information for. Then, in step S83, the above steps S81 and S82.
The relationship between the query word and the query word acquired in step 1 and the relationship between the document word and the document word are compared to calculate the degree of similarity, and the present process ends.

【0048】次に、上記ステップS56の概念検索処理
の詳細について図9を参照しながら説明する。図9は図
6のステップS56における概念検索処理の詳細な手順
を示すフローチャートである。
Next, details of the concept retrieval process in step S56 will be described with reference to FIG. FIG. 9 is a flowchart showing a detailed procedure of the concept search process in step S56 of FIG.

【0049】概念検索処理では、図9に示すように、ま
ずステップS111において、上記ステップ52で生成
したクエリー言語解析結果を取得し、続くステップS1
12において、上記ステップ111で取得した解析結果
からクエリーベクトルを生成する。そして、ステップS
113において、上記ステップS112で得られたクエ
リーベクトルと登録時に記憶装置2に格納された文書毎
の文書ベクトル(表5)とを比較して類似度を算出し、
この類似度を検索結果としてリストアップし、本処理を
終了する。
In the concept search process, as shown in FIG. 9, first, in step S111, the query language analysis result generated in step 52 is acquired, and then in step S1.
At 12, a query vector is generated from the analysis result obtained at step 111. And step S
At 113, the similarity is calculated by comparing the query vector obtained at step S112 with the document vector (Table 5) for each document stored in the storage device 2 at the time of registration,
This similarity is listed as a search result, and this processing ends.

【0050】次に、本情報検索装置による検索例につい
て図10および図11を参照しながら説明する。図10
は図1の情報検索装置により表示されるクエリー入力画
面の一例を示す図、図11は図1の情報検索装置により
表示される検索結果一覧表示画面の一例を示す図であ
る。
Next, a search example by this information search apparatus will be described with reference to FIGS. 10 and 11. Figure 10
Is a diagram showing an example of a query input screen displayed by the information search device of FIG. 1, and FIG. 11 is a diagram showing an example of a search result list display screen displayed by the information search device of FIG.

【0051】検索を行う際には、例えば図10に示すク
エリー入力画面が表示され、この画面上で、入力装置3
を介してクエリーとして入力された入力文字列が表示さ
れる。ここでは、入力文字列として「川崎」が入力され
た場合を示す。この入力されたクエリーは、記憶装置2
に格納される(図6のステップS51)。そして、入力
されたクエリーに対する言語解析が行われる(ステップ
S52)。この言語解析においては、まず、形態素解析
により、記憶装置2に格納された単語辞書(表3に示
す)が検索され、言語解析し、単語「川崎」が作成され
る。
When performing a search, for example, a query input screen shown in FIG. 10 is displayed, and the input device 3 is displayed on this screen.
The input string entered as a query via is displayed. Here, the case where "Kawasaki" is input as the input character string is shown. This input query is stored in the storage device 2
(Step S51 of FIG. 6). Then, language analysis is performed on the input query (step S52). In this linguistic analysis, first, the word dictionary (shown in Table 3) stored in the storage device 2 is searched by morphological analysis, linguistic analysis is performed, and the word "Kawasaki" is created.

【0052】検索方法選択ステップ(ステップS53)
では、上記ステップS52での言語解析結果に基づき適
用する検索方法の選択を行う。ここでは、クエリーの単
語数が1つ(1つの単語「川崎」)であるため、全文検
索を適用すると判定する。全文検索ステップ(ステップ
S54)では、図4に示す登録フローチャートで記憶装
置2に格納された文書または画像のアノテーションなど
の情報と全文検索インデックスから文字列「川崎」を検
索する。そして、この検索による検索結果が図11に示
すように、表示装置4に一致度が高い順に一覧表示され
る(ステップS57)。また、必要に応じて上記検索結
果リストは記憶装置2に格納される。
Search method selection step (step S53)
Then, the search method to be applied is selected based on the language analysis result in step S52. Here, since the number of words in the query is one (one word “Kawasaki”), it is determined that the full-text search is applied. In the full-text search step (step S54), the character string "Kawasaki" is searched from the information such as the annotation of the document or image stored in the storage device 2 and the full-text search index in the registration flowchart shown in FIG. Then, as shown in FIG. 11, the search results of this search are displayed in a list on the display device 4 in descending order of coincidence (step S57). The search result list is stored in the storage device 2 as needed.

【0053】次に、フレーズ検索ステップ(ステップS
55)について図12を参照しながら詳細に説明する。
図12はフレーズ検索のデータ例を示す図である。
Next, a phrase search step (step S
55) will be described in detail with reference to FIG.
FIG. 12 is a diagram showing an example of phrase search data.

【0054】例えば図12(a)に示すように、クエリ
ーとして「画像を印刷する」が入力されると、上記入力
されたクエリーに対する解析から、「画像」、「を」、
「印刷する」がクエリー単語として抽出されるので、こ
のクエリー単語数から、適用する検索方法としてフレー
ズ検索が選択される。そして、フレーズ検索(ステップ
S55)が実行される。このフレーズ検索ステップにお
いては、クエリー単語取得ステップ(ステップS81)
で、上記入力されたクエリーから、「画像」、「を」、
「印刷する」がクエリー単語として取得される。ここ
で、このクエリー単語数から、適用する検索方法として
フレーズ検索が選択される。
For example, as shown in FIG. 12A, when "print an image" is input as a query, "image", "o",
Since "print" is extracted as the query word, the phrase search is selected as the search method to be applied from the number of query words. Then, the phrase search (step S55) is executed. In this phrase search step, a query word acquisition step (step S81)
Then, from the above input query, "image", "o",
"Print" is obtained as the query word. Here, phrase search is selected as the applicable search method from the number of query words.

【0055】次いで、単語間関係取得ステップ(ステッ
プS82)において、「「画像」が「印刷する」に係っ
ている」が取得される。そして、類似度算出ステップ
(ステップS83)で、単語と単語間の関係が類似して
いる度合いが算出される。ここで例えば図12(b)に
示すように、文書1には単語「画像」と単語「印刷す
る」が含まれるとすると、「「画像」が「印刷する」に
係っている」と「「高速」が「印刷する」に係ってい
る」があり、「「画像」が「印刷する」に係っている」
が類似しているので、文書1は類似したフレーズを含ん
でいる類似度=1−単語による減点(0)−関係による
減点(単語間距離1単語なので0.1)=0.9とな
る。これに対し、図12(c)に示す文書2の場合、同
様の算式により、類似度=1−単語による減点(0)−
関係による減点(係り先が違う0.5)=0.5とな
る。
Next, in the inter-word relation acquisition step (step S82), "" the image "is related to" print "" is acquired. Then, in the similarity calculation step (step S83), the degree to which the relationship between words is similar is calculated. Here, for example, as shown in FIG. 12B, if the document 1 includes the word “image” and the word “print”, “the image is related to“ print ”” and “ "High speed is related to" print "" and "Image" is related to "print""
Are similar to each other, the degree of similarity in which the document 1 includes similar phrases = 1-point deduction due to word (0) -point deduction due to relation (0.1 because the distance between words is 1 word) = 0.9. On the other hand, in the case of the document 2 shown in FIG. 12 (c), the similarity is calculated by the same formula, ie, “similarity = 1−point deduction by word (0) −”
Deduction due to the relationship (0.5 with different contact) = 0.5.

【0056】次に、概念検索ステップ(ステップS5
6)の詳細について説明する。
Next, the concept retrieval step (step S5
Details of 6) will be described.

【0057】概念検索時、まずクエリー言語処理結果取
得ステップ(ステップS111)において、クエリーに
含まれる単語が取得される。次いで、クエリーベクトル
生成ステップ(ステップS112)で、文書ベクトル生
成と同様に基本ベクトル辞書を参照してクエリーのベク
トルが生成される。そして、類似度算出ステップ(ステ
ップS113)で、クエリーの特徴ベクトルとそれぞれ
の文書ベクトルの類似度が実際に算出される。
In the concept search, first, in the query language processing result acquisition step (step S111), the words included in the query are acquired. Next, in the query vector generation step (step S112), a query vector is generated by referring to the basic vector dictionary as in the document vector generation. Then, in the similarity calculation step (step S113), the similarity between the query feature vector and each document vector is actually calculated.

【0058】このように、本実施の形態では、入力され
たクエリーの解析結果から得られたクエリー単語数に応
じて適用する検索方法を決定するので、ユーザの意図に
応じた検索結果を高い精度でかつ効率良く得ることがで
きる。
As described above, in this embodiment, since the search method to be applied is determined according to the number of query words obtained from the analysis result of the input query, the search result according to the user's intention is highly accurate. And can be obtained efficiently.

【0059】(第2の実施形態)次に、本発明の第2の
実施形態について図13ないし図16を参照しながら説
明する。図13は本発明の第2の実施形態に係る情報検
索装置の検索手順を示すフローチャート、図14は本発
明の第2の実施形態に係る情報検索装置におけるクエリ
ーの入力画面例を示す図、図15は本発明の第2の実施
形態に係る情報検索装置における検索結果の表示画面例
を示す図、図16は本発明の第2の実施形態に係る情報
検索装置における異なるクエリーを入力した際の入力画
面例を示す図である。
(Second Embodiment) Next, a second embodiment of the present invention will be described with reference to FIGS. 13 to 16. FIG. 13 is a flowchart showing a search procedure of the information search device according to the second embodiment of the present invention, and FIG. 14 is a diagram showing an example of a query input screen in the information search device according to the second embodiment of the present invention. 15 is a diagram showing an example of a display screen of search results in the information search device according to the second embodiment of the present invention, and FIG. 16 is a diagram when a different query is input in the information search device according to the second embodiment of the present invention. It is a figure which shows the example of an input screen.

【0060】本実施形態は、適用する検索方法を1つの
みとする第1の実施形態に対し、1つ以上の検索方法を
適用することが可能である点で異なる。
The present embodiment is different in that one or more search methods can be applied to the first embodiment in which only one search method is applied.

【0061】具体的には、図13に示すように、クエリ
ーが入力されると、まずステップS61において、入力
されたクエリーを取得して記憶装置2に格納し、続くス
テップS62で、取得したクエリーを入力とし、クエリ
ー言語解析を行う。そして、ステップS63において、
上記ステップS63でのクエリー解析に基づき適用する
検索方法として1つ以上の検索方法を決定する。本実施
形態では、検索適用条件として、未知語がなければ全文
検索を、自立語の個数が8個以下ならフレーズ検索を、
自立語が3個以上なら概念検索を適用するという条件を
設定し、この条件に応じて適用する検索方法を決定す
る。
Specifically, as shown in FIG. 13, when a query is input, first, in step S61, the input query is acquired and stored in the storage device 2, and then in step S62, the acquired query is acquired. Is input, and the query language is analyzed. Then, in step S63,
At least one search method is determined as a search method to be applied based on the query analysis in step S63. In the present embodiment, as the search application condition, if there are no unknown words, full-text search is performed, and if the number of independent words is 8 or less, phrase search is performed.
A condition that a concept search is applied when there are three or more independent words is set, and the search method to be applied is determined according to this condition.

【0062】次いで、ステップS64において、ステッ
プS63の判定結果に基づき全文検索を適用するか否か
を判定する。全文検索を適用する場合は、ステップS6
5において、全文検索を行い、ステップS66に進む。
これに対し、全文検索が適用されない場合、ステップS
65をスキップしてステップS66に進む。
Then, in step S64, it is determined based on the determination result in step S63 whether or not the full text search is applied. When applying the full-text search, step S6
In 5, the full text search is performed, and the process proceeds to step S66.
On the other hand, if the full-text search is not applied, step S
Step 65 is skipped and the process proceeds to step S66.

【0063】ステップS66では、フレーズ検索を適用
するか否かを判定する。ここで、フレーズ検索を適用す
る場合は、ステップS67において、フレーズ検索を行
い、ステップS68に進む。これに対し、フレーズ検索
が適用されない場合、上記ステップS67をスキップし
てステップS68に進む。
In step S66, it is determined whether or not the phrase search is applied. If the phrase search is applied, the phrase search is performed in step S67, and the process proceeds to step S68. On the other hand, when the phrase search is not applied, the above step S67 is skipped and the process proceeds to step S68.

【0064】ステップS68では、概念検索を適用する
か否かを判定する。ここで、概念検索を適用する場合、
ステップS69において、概念検索を行い、ステップS
70に進む。これに対し、概念検索が適用されない場合
は、ステップS69をスキップしてステップS70に進
む。
In step S68, it is determined whether or not the concept search is applied. Here, when applying the concept search,
In step S69, a concept search is performed and step S
Proceed to 70. On the other hand, when the concept search is not applied, step S69 is skipped and the process proceeds to step S70.

【0065】ステップS70では、適用された検索方法
により得られた検索結果をマージして表示装置4に一致
度が高いに順に表示し、また必要に応じて検索結果リス
トを記憶装置2に格納する。そして、本処理を終了す
る。
In step S70, the search results obtained by the applied search method are merged and displayed in descending order of coincidence on the display device 4, and the search result list is stored in the storage device 2 as necessary. . Then, this process ends.

【0066】例えば図14に示すように、入力装置3よ
りクエリーとして、入力文字列「日本の経済における金
利の影響について」が入力されると、クエリー言語解析
(ステップS62)で、クエリー単語として、「日
本」、「の」、「経済」、「における」、「金利」、
「の」、「影響」、「について」が獲得される。この場
合、自立語の個数は4個であり、未知語はなしである。
よって、上記入力されたクエリーに対しては、フレーズ
検索、概念検索を適用すると決定され(ステップS6
3)、フレーズ検索および概念検索が行われる(ステッ
プS67およびステップS69)。そして、フレーズ検
索および概念検索による検索結果が、図15に示すよう
に、表示装置4に一致度が高いに順に表示される(ステ
ップS70)。
For example, as shown in FIG. 14, when the input character string "about the effect of interest rates on the Japanese economy" is input as a query from the input device 3, the query language analysis (step S62) determines that the query word is "Japan", "no", "economy", "at", "interest rate",
“Of”, “impact”, and “about” are acquired. In this case, the number of independent words is 4, and there are no unknown words.
Therefore, it is determined that the phrase search and the concept search are applied to the input query (step S6).
3) The phrase search and concept search are performed (steps S67 and S69). Then, the search results of the phrase search and the concept search are displayed on the display device 4 in descending order of coincidence, as shown in FIG. 15 (step S70).

【0067】また、図16に示すように、クエリーとし
て入力文字列「ジュビロのハジェヴスキーについて」が
入力された場合、クエリー言語処理ステップ(ステップ
S62)で、クエリー単語として「ジュビロ」、
「の」、「ハジェヴスキー」、「について」が獲得され
る。この場合、検索決定ステップ(ステップS63)に
より、自立語の個数が2個、未知語が2個、未知語以外
の自立語はなしと判定される。ここで、検索方法の適用
条件として、例えば、未知語がなければ全文検索を行わ
ない、未知語以外の自立語の個数が2個以上8個以下な
らフレーズ検索を行う、自立語が3個以上なら概念検索
を行うとした場合は、上記クエリーに対しては、全文検
索を適用すると決定され(ステップS63)、全文検索
が行われる(ステップS65)。そして、全文検索によ
る検索結果が、表示装置4に一致度が高いに順に表示さ
れる(ステップS70)。
Further, as shown in FIG. 16, when the input character string "about Jubilo's Khajevsky" is input as a query, in the query language processing step (step S62), "Jubilo" as the query word,
"No", "Hadevsky" and "About" are acquired. In this case, the search determination step (step S63) determines that the number of independent words is 2, there are two unknown words, and that there are no independent words other than the unknown words. Here, as a condition for applying the search method, for example, if there are no unknown words, full-text search is not performed, if the number of independent words other than unknown words is 2 or more and 8 or less, phrase search is performed, and independent words are 3 or more. Then, if the concept search is performed, it is determined that the full-text search is applied to the query (step S63), and the full-text search is performed (step S65). Then, the search results obtained by the full-text search are displayed on the display device 4 in the descending order of coincidence (step S70).

【0068】このように、複数の検索方法を適用するこ
とによって、ユーザの意図に応じたより高い精度の検索
結果を得ることができる。
As described above, by applying a plurality of retrieval methods, it is possible to obtain retrieval results with higher accuracy according to the user's intention.

【0069】(第3の実施形態)次に、本発明の第3の
実施形態について図17を参照しながら説明する。図1
7は本発明の第3の実施形態に係る情報検索装置におけ
る検索手順を示すフローチャートである。
(Third Embodiment) Next, a third embodiment of the present invention will be described with reference to FIG. Figure 1
7 is a flowchart showing a search procedure in the information search device according to the third embodiment of the present invention.

【0070】本実施形態は、上述の第1および第2の実
施形態に対し、検索対象となる情報数に応じてどの検索
方法を適用するかを決定する点で異なる。
The present embodiment is different from the above-described first and second embodiments in that which search method is applied is determined according to the number of pieces of information to be searched.

【0071】具体的には、図17に示すように、クエリ
ーが入力されると、まずステップS201において、入
力されたクエリーを取得して記憶装置2に格納し、続く
ステップS202で、取得したクエリーを入力とし、ク
エリー言語解析を行う。そして、ステップS203にお
いて、クエリー言語解析により得られたクエリー単語の
うち、自立語数(検索対象となる情報数)に応じて、全
文検索、フレーズ検索、概念検索の少なくとも1つを適
用する検索方法として決定する。ここでは、検索対象と
なる情報数が所定数以上であれば全文検索のみ、情報数
が所定数より少なければ全ての検索方法を適用するとす
る。
Specifically, as shown in FIG. 17, when a query is input, first in step S201, the input query is acquired and stored in the storage device 2, and in the subsequent step S202, the acquired query is acquired. Is input, and the query language is analyzed. Then, in step S203, among the query words obtained by the query language analysis, at least one of full-text search, phrase search, and concept search is applied according to the number of independent words (the number of information items to be searched) as a search method. decide. Here, it is assumed that only full-text search is applied when the number of information items to be searched is a predetermined number or more, and all search methods are applied when the number of information items is less than the predetermined number.

【0072】次いで、ステップS204において、上記
ステップS203の判定結果に基づき全文検索を適用す
るか否かを判定する。全文検索を適用する場合は、ステ
ップS205において、全文検索を行い、ステップS2
06に進む。これに対し、全文検索が適用されない場
合、上記ステップS205をスキップしてステップS2
06に進む。
Then, in step S204, it is determined whether or not to apply the full-text search based on the determination result in step S203. When applying the full-text search, the full-text search is performed in step S205, and step S2 is performed.
Proceed to 06. On the other hand, if the full-text search is not applied, the above step S205 is skipped and step S2 is performed.
Proceed to 06.

【0073】ステップS206では、フレーズ検索を適
用するか否かを判定する。ここで、フレーズ検索を適用
する場合は、ステップS207において、フレーズ検索
を行い、ステップS208に進む。これに対し、フレー
ズ検索が適用されない場合、上記ステップS207をス
キップしてステップS208に進む。
In step S206, it is determined whether or not the phrase search is applied. If the phrase search is applied, the phrase search is performed in step S207, and the process proceeds to step S208. On the other hand, when the phrase search is not applied, the above step S207 is skipped and the process proceeds to step S208.

【0074】ステップS208では、概念検索を適用す
るか否かを判定する。ここで、概念検索を適用する場
合、ステップS209において、概念検索を行い、ステ
ップS210に進む。これに対し、概念検索が適用され
ない場合は、上記ステップS209をスキップしてステ
ップS210に進む。
In step S208, it is determined whether or not the concept search is applied. Here, when applying the concept search, the concept search is performed in step S209, and the process proceeds to step S210. On the other hand, when the concept search is not applied, the above step S209 is skipped and the process proceeds to step S210.

【0075】ステップS210では、適用された検索方
法により得られた検索をマージして、検索結果リストを
表示装置4に一致度が高いに順に表示し、また必要に応
じて検索結果リストを記憶装置2に格納する。そして、
本処理を終了する。
In step S210, the searches obtained by the applied search method are merged to display the search result list on the display device 4 in descending order of the degree of coincidence, and if necessary, store the search result list in the storage device. Store in 2. And
This process ends.

【0076】このように、本実施形態では、検索対象情
報数が増加した場合でも、プログラム変更なしで一定の
検索時間で検索を行うことができる。
As described above, in this embodiment, even if the number of pieces of information to be searched increases, it is possible to carry out the search in a fixed search time without changing the program.

【0077】また逆に、検索対象となる情報数が少ない
場合は、高速な検索方法で、検索対象となる情報数が多
ければ高度な検索方法(全ての検索方法)を適用するとし
た場合、検索対象情報数が少ない場合より検索時間が短
くなり、検索対象情報数が多くなると、より高精度な検
索で確実に検索を行うことができる。
On the contrary, if the number of information to be searched is small, a high-speed search method is used. If the number of information to be searched is large, an advanced search method (all search methods) is applied. When the number of pieces of target information is small, the search time becomes shorter, and when the number of pieces of search target information is larger, the search can be performed with higher accuracy and certainty.

【0078】なお、上記各実施形態で用いた適用する検
索方法を決定するための検索適用条件(クエリー単語
数、自立語数、未知語数および未知語以外の自立語数の
組み合わせ、自立語数(検索対象情報数))の他に、ク
エリーの文字数、バイト数、単語数、単語頻度の累計、
最大頻度単語、最小頻度単語、単語長、単語長の累計、
最大単語長、最小単語長、自立語頻度、自立語、自立語
頻度の累計、最大頻度自立語、最小頻度自立語、最大自
立語長、最小自立語長、付属語の有無、付属語数、未知
語数、未知語の有無、未知語以外の自立語数、形態素解
析処理のエラーの有無、構文解析処理のエラーの有無、
意味解析処理のエラーの有無、またはそれらを組み合わ
せたものなどを検索適用条件として用いることもでき
る。
The search application conditions (decision of the number of query words, the number of independent words, the number of unknown words and the number of independent words other than unknown words), the number of independent words (the search target information Number)), the number of characters in the query, the number of bytes, the number of words, the cumulative word frequency,
Maximum frequency word, minimum frequency word, word length, cumulative word length,
Maximum word length, minimum word length, independent word frequency, independent word, cumulative independent word frequency, maximum frequency independent word, minimum frequency independent word, maximum independent word length, minimum independent word length, presence of attached words, number of attached words, unknown Number of words, presence / absence of unknown words, number of independent words other than unknown words, presence / absence of morphological analysis processing errors, presence / absence of syntax analysis processing errors,
It is also possible to use the presence or absence of an error in the semantic analysis process or a combination thereof as the search application condition.

【0079】また、クライアントの接続数に応じて、適
用する検索方法を決定するようにしてもよい。例えば、
接続クライアント数が5までは全ての検索方法を適用
し、未知語以外の自立語が5つ以上で接続クライアント
数が100以下であれば概念検索を適用し、クライアン
ト数が50以下ならフレーズ検索は適用するという条件
を設定し、クライアント数が100を超えると全文検索
のみを適用するという条件を設定し、この条件に従い適
用する検索方法を決定するようにしてもよい。
Also, the search method to be applied may be determined according to the number of connected clients. For example,
If the number of connected clients is up to 5, all search methods are applied. If the number of independent words other than unknown words is 5 or more and the number of connected clients is 100 or less, concept search is applied. If the number of clients is 50 or less, phrase search is not performed. It is also possible to set a condition to apply, set a condition to apply only full-text search when the number of clients exceeds 100, and determine a search method to apply according to this condition.

【0080】また、適用条件として、接続クライアント
数のほか、最大接続クライアント数などを用いることも
でき、この最大接続クライアント数に応じて適用するク
ライアントを決定するようにしてもよい。
In addition to the number of connected clients, the maximum number of connected clients can be used as the application condition, and the client to be applied may be determined according to the maximum number of connected clients.

【0081】さらに、検索方法適用判定条件として、言
語解析結果、ハードウェア処理能力、接続クライアント
数などを組み合わせたものを用いることもできる。
Furthermore, a combination of the language analysis result, the hardware processing capacity, the number of connected clients, and the like can be used as the search method application determination condition.

【0082】なお、本発明は、複数の機器から構成され
るシステムに適用しても、一つの機器からなる装置に適
用してもよい。
The present invention may be applied to either a system composed of a plurality of devices or an apparatus composed of a single device.

【0083】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納された
プログラムコードを読み出し実行することによっても、
達成されることはいうまでもない。この場合、記憶媒体
から読み出されたプログラムコード自体が前述した実施
形態の機能を実現することになり、そのプログラムコー
ドを記憶した記憶媒体は本発明を構成することになる。
また、コンピュータが読み出したプログラムコードを実
行することにより、前述した実施形態の機能が実現され
るだけでなく、そのプログラムコードの指示に基づき、
コンピュータ上で稼働しているオペレーティングシステ
ム(OS)などが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることはいうまでもない。
Further, an object of the present invention is to supply a storage medium (or recording medium) recording a program code of software for realizing the functions of the above-described embodiments to a system or apparatus, and to supply a computer of the system or apparatus ( Alternatively, by the CPU or MPU) reading and executing the program code stored in the storage medium,
It goes without saying that it will be achieved. In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the storage medium storing the program code constitutes the present invention.
Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also based on the instruction of the program code,
An operating system (OS) running on the computer does some or all of the actual processing,
It goes without saying that the processing includes the case where the functions of the above-described embodiments are realized.

【0084】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、
その処理によって前述した実施形態の機能が実現される
場合も含まれることはうまでもない。
Furthermore, after the program code read from the storage medium is written in the memory provided in the function expansion card inserted in the computer or the function expansion unit connected to the computer, based on the instruction of the program code. , The CPU provided in the function expansion card or the function expansion unit performs some or all of the actual processing,
It goes without saying that the case where the processing realizes the functions of the above-described embodiments is also included.

【0085】[0085]

【発明の効果】以上説明したように、本発明によれば、
検索適用条件に応じてそれぞれ異なる複数の検索手段の
中から、検索に適用する少なくとも1つ以上の検索手段
を決定するので、ユーザの意図に応じた検索結果を高い
精度でかつ効率良く得ることができる。
As described above, according to the present invention,
Since at least one search means to be applied to the search is determined from among a plurality of different search means according to the search application condition, it is possible to efficiently and efficiently obtain the search result according to the user's intention. it can.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施形態に係る情報検索装置の
構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of an information search device according to a first embodiment of the present invention.

【図2】図1の情報検索装置がサーバ/クライアントシ
ステムに組み込まれている例を示す図である。
FIG. 2 is a diagram showing an example in which the information search device of FIG. 1 is incorporated in a server / client system.

【図3】図1の情報検索装置をインターネット接続端末
に組み込まれている例を示す図である。
FIG. 3 is a diagram showing an example in which the information search device of FIG. 1 is incorporated in an Internet connection terminal.

【図4】検索対象となる文書などのデータを登録すると
きの処理手順を示すフローチャートである。
FIG. 4 is a flowchart showing a processing procedure when registering data such as a document to be searched.

【図5】図4のステップS94の概念検索登録処理の詳
細な手順を示すフローチャートである。
5 is a flowchart showing a detailed procedure of a concept search registration process of step S94 of FIG.

【図6】図1の情報検索装置による検索処理の手順を示
すフローチャートである。
6 is a flowchart showing the procedure of a search process by the information search device of FIG.

【図7】図6のステップS52におけるクエリーの言語
解析の詳細な手順を示すフローチャートである。
FIG. 7 is a flowchart showing a detailed procedure of query language analysis in step S52 of FIG. 6;

【図8】図6のステップS55におけるフレーズ検索の
詳細な手順を示すフローチャートである。
FIG. 8 is a flowchart showing a detailed procedure of phrase search in step S55 of FIG.

【図9】図6のステップS56における概念検索処理の
詳細な手順を示すフローチャートである。
9 is a flowchart showing a detailed procedure of a concept search process in step S56 of FIG.

【図10】図1の情報検索装置により表示されるクエリ
ー入力画面の一例を示す図である。
10 is a diagram showing an example of a query input screen displayed by the information search device of FIG. 1. FIG.

【図11】図1の情報検索装置により表示される検索結
果一覧表示画面の一例を示す図である。
11 is a diagram showing an example of a search result list display screen displayed by the information search device of FIG. 1. FIG.

【図12】フレーズ検索のデータ例を示す図である。FIG. 12 is a diagram showing an example of phrase search data.

【図13】本発明の第2の実施形態に係る情報検索装置
の検索手順を示すフローチャートである。
FIG. 13 is a flowchart showing a search procedure of the information search device according to the second embodiment of the present invention.

【図14】本発明の第2の実施形態に係る情報検索装置
におけるクエリーの入力画面例を示す図である。
FIG. 14 is a diagram showing an example of a query input screen in the information search device according to the second embodiment of the present invention.

【図15】本発明の第2の実施形態に係る情報検索装置
における検索結果の表示画面例を示す図である。
FIG. 15 is a diagram showing an example of a display screen of search results in the information search device according to the second embodiment of the present invention.

【図16】本発明の第2の実施形態に係る情報検索装置
における異なるクエリーを入力した際の入力画面例を示
す図である。
FIG. 16 is a diagram showing an input screen example when a different query is input in the information search device according to the second embodiment of the present invention.

【図17】本発明の第3の実施形態に係る情報検索装置
における検索手順を示すフローチャートである。
FIG. 17 is a flowchart showing a search procedure in the information search device according to the third embodiment of the present invention.

【図18】従来の検索方法の手順を示すフローチャート
である。
FIG. 18 is a flowchart showing the procedure of a conventional search method.

【図19】従来の検索方法における操作画面例を示す図
である。
FIG. 19 is a diagram showing an example of an operation screen in a conventional search method.

【符号の説明】[Explanation of symbols]

1 中央処理装置 2 記憶装置 3 入力装置 4 表示装置 5 記憶媒体読取装置 1 Central processing unit 2 storage devices 3 input devices 4 display device 5 Storage medium reader

Claims (28)

【特許請求の範囲】[Claims] 【請求項1】 方式がそれぞれ異なる複数の検索手段
と、 クエリーを入力する入力手段と、 前記入力されたクエリーを解析するクエリー解析手段
と、 検索適用条件に応じて前記複数の検索手段の中から、検
索に適用する少なくとも1つ以上の検索手段を決定する
決定手段と、 前記決定された少なくとも1つ以上の検索手段により前
記入力されたクエリーに対する解析結果を用いた検索を
実行する検索実行手段と、 前記実行された少なくとも1つ以上の検索手段による検
索結果を表示する表示手段とを備えることを特徴とする
情報検索装置。
1. A plurality of search means each having a different method, an input means for inputting a query, a query analysis means for analyzing the input query, and a plurality of search means among the plurality of search means according to a search application condition. Determining means for determining at least one or more search means to be applied to the search, and search executing means for executing a search using the analysis result of the input query by the at least one or more determined search means. An information search device, comprising: a display unit that displays a search result by the executed at least one search unit.
【請求項2】 前記検索適用条件は、前記入力されたク
エリーに対する解析結果であることを特徴とする請求項
1記載の情報検索装置。
2. The information search device according to claim 1, wherein the search application condition is an analysis result for the input query.
【請求項3】 前記クエリー解析手段は、前記入力され
たクエリーに対して異なる解析をそれぞれ行う複数の解
析手段を含むことを特徴とする請求項1または2記載の
情報検索装置。
3. The information search device according to claim 1, wherein the query analysis unit includes a plurality of analysis units that respectively perform different analyzes on the input query.
【請求項4】 前記複数の解析手段は、前記入力された
クエリーに対する形態素解析手段、構文解析手段および
意味解析手段を含むことを特徴とする請求項3記載の情
報検索装置。
4. The information retrieval apparatus according to claim 3, wherein the plurality of analysis units include a morpheme analysis unit, a syntax analysis unit, and a semantic analysis unit for the input query.
【請求項5】 前記複数の検索手段は、少なくとも、全
文検索手段、フレーズ検索手段、概念検索手段のいずれ
か1つを含むことを特徴とする請求項1または2記載の
情報検索装置。
5. The information search apparatus according to claim 1, wherein the plurality of search means include at least one of a full text search means, a phrase search means, and a concept search means.
【請求項6】 サーバ/クライアントシステムにおける
クライアントに組み込まれていることを特徴とする請求
項1記載の情報検索装置。
6. The information retrieving apparatus according to claim 1, wherein the information retrieving apparatus is incorporated in a client of a server / client system.
【請求項7】 前記検索適用条件は、前記サーバと接続
状態にあるクライアント数であることを特徴とする請求
項6記載の情報検索装置。
7. The information search device according to claim 6, wherein the search application condition is the number of clients that are in connection with the server.
【請求項8】 前記検索適用条件は、前記サーバと接続
状態にあるクライアント数と前記入力されたクエリーに
対する解析結果であることを特徴とする請求項6記載の
情報検索装置。
8. The information search device according to claim 6, wherein the search application condition is the number of clients connected to the server and an analysis result of the input query.
【請求項9】 通信網に接続可能な端末に組み込まれて
いることを特徴とする請求項1記載の情報検索装置。
9. The information search device according to claim 1, wherein the information search device is incorporated in a terminal connectable to a communication network.
【請求項10】 クエリーを入力する入力工程と、 前記入力されたクエリーを解析するクエリー解析工程
と、 検索適用条件に応じて、方式がそれぞれ異なる複数の検
索手段の中から、検索に適用する少なくとも1つ以上の
検索手段を決定する決定工程と、 前記決定された少なくとも1つ以上の検索手段により前
記入力されたクエリーに対する解析結果を用いた検索を
実行する検索実行工程と、 前記実行された少なくとも1つ以上の検索手段による検
索結果を表示手段に表示する表示工程とを備えることを
特徴とする情報検索方法。
10. An input step of inputting a query, a query analysis step of analyzing the input query, and at least a method of applying a search from a plurality of search means having different methods according to search application conditions. A determination step of determining one or more search means, a search execution step of performing a search using an analysis result for the input query by the determined at least one search means, and at least the executed And a display step of displaying a search result by one or more search means on a display means.
【請求項11】 前記検索適用条件は、前記入力された
クエリーに対する解析結果であることを特徴とする請求
項10記載の情報検索方法。
11. The information search method according to claim 10, wherein the search application condition is an analysis result of the input query.
【請求項12】 前記クエリー解析工程では、前記入力
されたクエリーに対して複数の解析をそれぞれ行うこと
を特徴とする請求項10または11記載の情報検索方
法。
12. The information search method according to claim 10, wherein in the query analysis step, a plurality of analyzes are performed on the input query.
【請求項13】 前記複数の解析は、前記入力されたク
エリーに対する形態素解析、構文解析および意味解析を
含むことを特徴とする請求項12記載の情報検索方法。
13. The information search method according to claim 12, wherein the plurality of analyzes include morphological analysis, syntactic analysis, and semantic analysis for the input query.
【請求項14】 前記複数の検索手段は、少なくとも、
全文検索手段、フレーズ検索手段、概念検索手段のいず
れか1つを含むことを特徴とする請求項10または11
記載の情報検索方法。
14. The plurality of search means are at least:
12. Any one of a full-text search means, a phrase search means, and a concept search means is included.
Information retrieval method of the description.
【請求項15】 サーバ/クライアントシステムにおけ
るクライアント上に用いられることを特徴とする請求項
10記載の情報検索方法。
15. The information retrieval method according to claim 10, wherein the information retrieval method is used on a client in a server / client system.
【請求項16】 前記検索適用条件は、前記サーバと接
続状態にあるクライアント数であることを特徴とする請
求項15記載の情報検索方法。
16. The information search method according to claim 15, wherein the search application condition is the number of clients in connection with the server.
【請求項17】 前記検索適用条件は、前記サーバと接
続状態にあるクライアント数と前記入力されたクエリー
に対する解析結果であることを特徴とする請求項15記
載の情報検索方法。
17. The information search method according to claim 15, wherein the search application condition is the number of clients connected to the server and an analysis result of the input query.
【請求項18】 通信網に接続可能な端末に用いられる
ことを特徴とする請求項10記載の情報検索方法。
18. The information retrieval method according to claim 10, wherein the information retrieval method is used in a terminal connectable to a communication network.
【請求項19】 情報検索を行うためのコンピュータに
より実行可能なプログラムであって、 クエリーを入力する入力ステップと、 前記入力されたクエリーを解析するクエリー解析ステッ
プと、 検索適用条件に応じて、方式がそれぞれ異なる複数の検
索モジュールの中から、検索に適用する少なくとも1つ
以上の検索モジュールを決定する決定ステップと、 前記決定された少なくとも1つ以上の検索モジュールに
より前記入力されたクエリーに対する解析結果を用いた
検索を実行する検索実行ステップと、 前記実行された少なくとも1つ以上の検索モジュールに
よる検索結果を表示手段に表示する表示ステップとを備
えることを特徴とするプログラム。
19. A computer-executable program for performing information retrieval, comprising an input step of inputting a query, a query analysis step of analyzing the input query, and a method according to a search application condition. Determining step of determining at least one or more search modules to be applied to the search from a plurality of search modules different from each other, and an analysis result of the input query by the determined at least one or more search modules. A program comprising: a search execution step of executing a search used; and a display step of displaying a search result by the executed at least one or more search modules on a display means.
【請求項20】 前記検索適用条件は、前記入力された
クエリーに対する解析結果であることを特徴とする請求
項19記載のプログラム。
20. The program according to claim 19, wherein the search application condition is an analysis result of the input query.
【請求項21】 前記クエリー解析ステップでは、前記
入力されたクエリーに対して複数の解析をそれぞれ行う
ことを特徴とする請求項19または20記載のプログラ
ム。
21. The program according to claim 19, wherein in the query analysis step, a plurality of analyzes are performed on the input query.
【請求項22】 前記複数の解析は、前記入力されたク
エリーに対する形態素解析、構文解析および意味解析を
含むことを特徴とする請求項21記載のプログラム。
22. The program according to claim 21, wherein the plurality of analyzes include morphological analysis, syntactic analysis, and semantic analysis for the input query.
【請求項23】 前記複数の検索モジュールは、少なく
とも、全文検索モジュール、フレーズ検索モジュール、
概念検索モジュールのいずれか1つを含むことを特徴と
する請求項19または20記載のプログラム。
23. The plurality of search modules are at least a full text search module, a phrase search module,
21. The program according to claim 19, comprising one of the concept search modules.
【請求項24】 サーバ/クライアントシステムにおけ
るクライアント上で実行されることを特徴とする請求項
19記載のプログラム。
24. The program according to claim 19, which is executed on a client in a server / client system.
【請求項25】 前記検索適用条件は、前記サーバと接
続状態にあるクライアント数であることを特徴とする請
求項24記載のプログラム。
25. The program according to claim 24, wherein the search application condition is the number of clients connected to the server.
【請求項26】 前記検索適用条件は、前記サーバと接
続状態にあるクライアント数と前記入力されたクエリー
に対する解析結果であることを特徴とする請求項24記
載のプログラム。
26. The program according to claim 24, wherein the search application condition is the number of clients connected to the server and an analysis result for the input query.
【請求項27】 通信網に接続可能な端末上で実行され
ることを特徴とする請求項19記載のプログラム。
27. The program according to claim 19, which is executed on a terminal connectable to a communication network.
【請求項28】 請求項19記載のプログラムをコンピ
ュータ読取り可能に格納したことを特徴とする記憶媒
体。
28. A storage medium on which the program according to claim 19 is stored so that it can be read by a computer.
JP2002133906A 2002-05-09 2002-05-09 Information retrieval device, method, program, and recording medium Pending JP2003330958A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002133906A JP2003330958A (en) 2002-05-09 2002-05-09 Information retrieval device, method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002133906A JP2003330958A (en) 2002-05-09 2002-05-09 Information retrieval device, method, program, and recording medium

Publications (1)

Publication Number Publication Date
JP2003330958A true JP2003330958A (en) 2003-11-21

Family

ID=29696720

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002133906A Pending JP2003330958A (en) 2002-05-09 2002-05-09 Information retrieval device, method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP2003330958A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092136A (en) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd Document retrieval system and method
JP2006120000A (en) * 2004-10-22 2006-05-11 Sony Corp Information processor, method and program
WO2014136173A1 (en) * 2013-03-04 2014-09-12 三菱電機株式会社 Search device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006092136A (en) * 2004-09-22 2006-04-06 Fuji Xerox Co Ltd Document retrieval system and method
JP4534690B2 (en) * 2004-09-22 2010-09-01 富士ゼロックス株式会社 Document retrieval apparatus and method
JP2006120000A (en) * 2004-10-22 2006-05-11 Sony Corp Information processor, method and program
WO2014136173A1 (en) * 2013-03-04 2014-09-12 三菱電機株式会社 Search device
JP5951105B2 (en) * 2013-03-04 2016-07-13 三菱電機株式会社 Search device

Similar Documents

Publication Publication Date Title
US9817920B1 (en) Locating meaningful stopwords or stop-phrases in keyword-based retrieval systems
KR100962923B1 (en) System of effectively searching text for keyword, and method thereof
CN111046221A (en) Song recommendation method and device, terminal equipment and storage medium
US20160292153A1 (en) Identification of examples in documents
US9798776B2 (en) Systems and methods for parsing search queries
US20180004838A1 (en) System and method for language sensitive contextual searching
JP2013516022A (en) Cluster and present search suggestions
JP7451747B2 (en) Methods, devices, equipment and computer readable storage media for searching content
US20120317125A1 (en) Method and apparatus for identifier retrieval
US20090327877A1 (en) System and method for disambiguating text labeling content objects
US20230409624A1 (en) Multi-modal hierarchical semantic search engine
CN111460177A (en) Method and device for searching film and television expression, storage medium and computer equipment
CN110688559A (en) Retrieval method and device
JP2003330958A (en) Information retrieval device, method, program, and recording medium
KR100659370B1 (en) Method for constructing a document database and method for searching information by matching thesaurus
CN111368036B (en) Method and device for searching information
JP2001101184A (en) Method and device for generating structurized document and storage medium with structurized document generation program stored therein
JP4217410B2 (en) Information retrieval apparatus, control method therefor, and program
JP2006227823A (en) Information processor and its control method
KR100795930B1 (en) Method and system for recommending query based search index
JP2004318381A (en) Similarity computing method, similarity computing program, and computer-readable storage medium storing it
JP2004240769A (en) Information retrieving device
CN113515940B (en) Method and equipment for text search
CN112860940B (en) Music resource retrieval method based on sequential concept space on description logic knowledge base
WO2001024053A2 (en) System and method for automatic context creation for electronic documents