JP2001117939A - Query output device, document retrieval system, query output method, document retrieving method and recording medium - Google Patents
Query output device, document retrieval system, query output method, document retrieving method and recording mediumInfo
- Publication number
- JP2001117939A JP2001117939A JP29779499A JP29779499A JP2001117939A JP 2001117939 A JP2001117939 A JP 2001117939A JP 29779499 A JP29779499 A JP 29779499A JP 29779499 A JP29779499 A JP 29779499A JP 2001117939 A JP2001117939 A JP 2001117939A
- Authority
- JP
- Japan
- Prior art keywords
- query
- term
- unit
- input
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
Description
【0001】[0001]
【発明の属する技術分野】本発明は、検索したい文献を
キーワードではなく文章で指定することができ、当該文
章から検索に適したクエリを生成するのに好適なクエリ
出力装置、クエリ出力方法、文献検索システム、文献検
索方法、並びに、これらを実現するためのプログラムを
記録したコンピュータ読取可能な記録媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a query output device, a query output method, and a document suitable for generating a query suitable for a search from a text, in which a document to be searched can be specified by a sentence instead of a keyword. The present invention relates to a search system, a document search method, and a computer-readable recording medium on which a program for realizing these methods is recorded.
【0002】[0002]
【従来の技術】WWW(World Wide Web)技術の発展に
ともない、多数の文献から所望の文献を検索する文献検
索技術はますますその重要性を増している。2. Description of the Related Art With the development of the World Wide Web (WWW) technology, a document search technology for searching for a desired document from a large number of documents has become more and more important.
【0003】このような文献検索では、従来、以下のよ
うな手法が用いられていた。すなわち、ユーザは、所望
の文献を検索するためのキーワードを指定するか、ある
いは、文献を検索するための条件をより詳細に指定した
クエリを入力する。Conventionally, the following method has been used in such a document search. That is, the user specifies a keyword for searching for a desired document, or inputs a query that specifies conditions for searching for a document in more detail.
【0004】すると、文献検索エンジンは、文献中に当
該キーワードが含まれる個数や、ベクトル空間法により
クエリにより指定された条件と文献との適合度を求め、
これらを元に当該文献の得点を計算する。[0004] Then, the document search engine obtains the number of the keyword included in the document and the degree of conformity between the document and the condition specified by the query by the vector space method.
Based on these, the score of the document is calculated.
【0005】最後に、ユーザに対して、得点の高い文献
を検索結果として順に提示する。[0005] Finally, documents with the highest scores are sequentially presented to the user as search results.
【0006】なお、ベクトル空間法では、クエリに含ま
れる検索用のキーワード(以下「ターム」という。)に
対して適宜重みを付ける手法や、文献検索エンジンの検
索範囲に含まれる文献に対して、それぞれ、当該文献か
ら抽出されたターム(以下「検索用ターム」という。)
を別途記憶しておき、得点計算を高速化する手法も提案
されている。[0006] In the vector space method, a method of appropriately weighting a search keyword (hereinafter, referred to as a "term") included in a query, a method of assigning weights to documents included in a search range of a document search engine, Each term is extracted from the document (hereinafter referred to as “search term”).
Have been proposed to separately store and speed up the score calculation.
【0007】[0007]
【発明が解決しようとする課題】しかしながら、キーワ
ードを入力する手法では、キーワードを複数入力した場
合、当該キーワードをすべて含むものを検索したいの
か、当該キーワードのいずれかを含むものを検索したい
のか、不明確となり、ユーザが期待しない検索結果が得
られるおそれがある。However, in the method of inputting a keyword, when a plurality of keywords are input, it is difficult to search for a keyword including all of the keywords or a keyword including any of the keywords. The search results may be clear, and a search result that the user does not expect may be obtained.
【0008】また、指定されたキーワードが用意された
検索用タームでない場合には、検索結果として有意な結
果が得られないおそれがある。[0008] If the specified keyword is not a prepared search term, a significant result may not be obtained as a search result.
【0009】このほか、文献検索エンジン用のクエリを
一般ユーザが自分で構成したり、クエリが含むタームの
重みを調整したりするのは難しい。In addition, it is difficult for a general user to compose a query for a document search engine by himself or to adjust the weight of terms included in the query.
【0010】さらに、ユーザが自然な文章で検索対象の
文献を特定すると、この文章から自動的に適切なクエリ
を生成する手法が望まれている。[0010] Furthermore, when a user specifies a document to be searched in a natural sentence, a technique for automatically generating an appropriate query from the sentence is desired.
【0011】本発明が解決しようとする課題は、検索し
たい文献をキーワードではなく文章で指定し、当該文章
から検索に適したクエリを生成し、さらには当該クエリ
により文献を検索に行うことにある。The problem to be solved by the present invention is to specify a document to be searched by using a sentence instead of a keyword, to generate a query suitable for the search from the sentence, and to search the document by the query. .
【0012】[0012]
【課題を解決するための手段】上記課題を解決するた
め、本発明の第1の観点にかかるクエリ出力装置は、タ
ームを含むクエリを文献に対して適用して得られた得点
が所定の範囲に含まれる文献を獲得する文献検索エンジ
ンに与えるクエリを出力する。In order to solve the above-mentioned problems, a query output device according to a first aspect of the present invention is arranged such that a score obtained by applying a query including a term to a document is within a predetermined range. Outputs a query to be given to a document search engine that obtains documents included in.
【0013】当該クエリ出力装置は、文字列入力受付部
と、ターム抽出部と、入力制御部と、クエリ生成部と、
メッセージ表示部と、修正入力受付部と、修正制御部
と、クエリ出力部とを備えるように構成する。The query output device includes a character string input receiving unit, a term extracting unit, an input control unit, a query generating unit,
A message display unit, a correction input receiving unit, a correction control unit, and a query output unit are provided.
【0014】ここで、文字列入力受付部は、文字列の入
力を受け付ける。Here, the character string input receiving unit receives a character string input.
【0015】ターム抽出部は、与えられた文字列を形態
素解析し、これに含まれるタームを抽出する。The term extracting unit performs a morphological analysis on a given character string and extracts terms included in the morphological analysis.
【0016】入力制御部は、前記文字列入力受付部によ
り文字列の入力が受け付けられた場合、前記ターム抽出
部に当該文字列を与える。When the input of the character string is received by the character string input receiving section, the input control section supplies the character string to the term extracting section.
【0017】クエリ生成部は、前記ターム抽出部により
抽出されたタームを含むクエリを生成する。The query generation unit generates a query including the terms extracted by the term extraction unit.
【0018】メッセージ表示部は、メッセージ表示条件
が満たされる場合、当該メッセージ表示条件にあらかじ
め対応付けられたメッセージを表示する。When the message display condition is satisfied, the message display unit displays a message previously associated with the message display condition.
【0019】修正入力受付部は、前記メッセージ表示部
によりメッセージが表示された場合、前記文字列入力受
付部により入力された文字列を修正する修正入力を受け
付ける。When a message is displayed on the message display unit, the correction input receiving unit receives a correction input for correcting the character string input by the character string input receiving unit.
【0020】修正制御部は、前記修正入力受付部により
修正入力が受け付けられた場合、当該修正入力により修
正された文字列を、前記ターム抽出部に与える。When the correction input is received by the correction input receiving unit, the correction control unit supplies the character string corrected by the correction input to the term extraction unit.
【0021】クエリ出力部は、クエリ出力条件が満たさ
れる場合、前記クエリ生成部により生成されたクエリを
出力する。The query output section outputs the query generated by the query generation section when the query output condition is satisfied.
【0022】上記クエリ出力装置では、ユーザが自然な
文章で検索対象とする文献を特定すると、当該文章から
検索に適したクエリが生成される。また、たとえば、有
意な検索結果が得られないおそれがある場合には、その
旨をユーザに通知し、さらに詳細な検索条件を入力する
よう求める。このため、ユーザは、自然な文章を入力す
るだけで所望の検索結果を得ることができる。In the above-described query output device, when the user specifies a document to be searched in a natural sentence, a query suitable for the search is generated from the sentence. Further, for example, when there is a possibility that a significant search result cannot be obtained, the user is notified of the possibility and a request is made to input more detailed search conditions. Therefore, the user can obtain a desired search result only by inputting a natural sentence.
【0023】また、上記クエリ出力装置は、ターム記憶
部をさらに備えるように構成することができる。[0023] The query output device can be configured to further include a term storage unit.
【0024】ここで、ターム記憶部は、複数のタームを
記憶する。Here, the term storage unit stores a plurality of terms.
【0025】一方、前記クエリ生成部により生成された
クエリに含まれるタームが前記ターム記憶部に記憶され
た複数のタームのいずれとも一致しない場合に、当該メ
ッセージ表示条件が満たされる。On the other hand, when the terms included in the query generated by the query generation section do not match any of the plurality of terms stored in the term storage section, the message display condition is satisfied.
【0026】上記クエリ出力装置では、ユーザが入力し
た文章から生成されたクエリが検索用タームでないター
ムを含む場合、有意な検索結果が得られないおそれがあ
るため、検索条件を修正するようユーザに促す。このた
め、文献検索エンジンに対する問い合わせを実行する前
にユーザはより詳細な条件を指定することができる。In the above-described query output device, if a query generated from a text input by the user includes a term that is not a search term, a significant search result may not be obtained. Prompt. Therefore, the user can specify more detailed conditions before executing an inquiry to the document search engine.
【0027】また、上記クエリ出力装置は、パラメータ
入力受付部をさらに備えるように構成することができ
る。Further, the query output device can be configured to further include a parameter input receiving unit.
【0028】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives an input of a generation parameter given to the query generating unit.
【0029】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該タームのそれぞれに対応
付けられ、当該得点を得る際に参照される重みを含む。On the other hand, the query generated by the query generation unit includes, in addition to the terms, the weights associated with the respective terms and referred to when obtaining the score.
【0030】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの重みを前記
パラメータ入力受付部により入力を受け付けられた生成
パラメータにより決定し、当該タームと、これに対応付
けて決定された重みと、を含むクエリを生成する。Further, the query generation unit determines the weight of each of the terms extracted by the term extraction unit according to the generation parameter received by the parameter input reception unit, and associates the term with the term. And generating a query including the weight determined by the above.
【0031】上記クエリ出力装置では、クエリ中に含ま
れるタームの重みの調整をするためのパラメータをユー
ザが入力できる。たとえば、パラメータを「ゆるい検
索」とした場合と、「きつい検索」とした場合とで、各
タームに与える重みを、当該タームの係り受け関係や品
詞などの情報から変更することにより、ユーザの要望や
用途に応じた適切なクエリを生成することができる。In the above-described query output device, a user can input a parameter for adjusting the weight of a term included in a query. For example, when the parameter is set to “loose search” or “tight search”, the weight given to each term is changed from the information such as the dependency relation and the part of speech of the term. It is possible to generate an appropriate query according to the application.
【0032】また、上記クエリ出力装置は、パラメータ
入力受付部をさらに備えるように構成することができ
る。Further, the query output device can be configured to further include a parameter input receiving unit.
【0033】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives an input of a generation parameter given to the query generating unit.
【0034】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該文献検索エンジンが獲得
する文献は当該タームを含むものに限るか否かを示す必
須ターム情報を含む。On the other hand, the query generated by the query generator includes, in addition to the terms, essential term information indicating whether or not the documents obtained by the document search engine are limited to those containing the terms.
【0035】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの必須ターム
情報を、前記パラメータ入力受付部により入力を受け付
けられた生成パラメータにより決定し、当該タームと、
これに対応付けて決定された必須ターム情報と、を含む
クエリを生成する。Further, the query generation unit determines the required term information of each of the terms extracted by the term extraction unit according to the generation parameters received by the parameter input reception unit.
A query including essential term information determined in association with this is generated.
【0036】上記クエリ出力装置では、クエリ中に含ま
れるタームが必ず文献に表れることを要する(この場
合、当該タームを「必須ターム」という。)か否かの調
整をするためのパラメータをユーザが入力できる。たと
えば、パラメータを「ゆるい検索」とした場合と、「き
つい検索」とした場合とで、当該タームの係り受け関係
や品詞などの情報から、タームのいずれか、もしくは、
すべてを必須タームとすることにより、ユーザの要望や
用途に応じた適切なクエリを生成することができる。In the above-described query output device, the user must set a parameter for adjusting whether or not the term included in the query must appear in the literature (in this case, the term is referred to as “essential term”). Can be entered. For example, depending on whether the parameter is “loose search” or “tight search”, one of the terms or the term
By making all the terms essential, it is possible to generate an appropriate query according to the user's request and purpose.
【0037】上記の課題を解決するため、第2の観点に
かかる本発明の文献検索システムは、上記のクエリ出力
装置と、文献検索エンジン部と、文献出力部とを備える
ように構成する。In order to solve the above-mentioned problems, a document search system according to a second aspect of the present invention comprises the above-described query output device, a document search engine unit, and a document output unit.
【0038】ここで、文献検索エンジン部は、前記クエ
リ出力装置により出力されたクエリを文献に対して適用
して得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, the document search engine unit obtains documents in which the score obtained by applying the query output by the query output device to the documents falls within a predetermined range.
【0039】一方、文献出力部は、文献出力部と前記文
献検索エンジン部により獲得された文献を出力する。On the other hand, the document output unit outputs the document obtained by the document output unit and the document search engine unit.
【0040】上記文献検索システムでは、上記クエリ出
力装置により生成されたクエリを文献検索エンジンに与
えて、実際の検索を行う。文献検索エンジンでの処理は
長時間を要することがあるが、上記文献検索システムで
は、文献検索エンジンでの処理の前に、クエリ出力装置
によって適切な検索結果が得られると予想されるクエリ
をあらかじめ生成してから文献検索エンジンでの問い合
わせを行う。このため、ユーザが文献検索に要する問い
合わせの回数をきわめて少ないものとすることができ
る。In the document search system, a query generated by the query output device is provided to a document search engine to perform an actual search. The processing by the literature search engine may take a long time, but in the above-mentioned literature search system, before the processing by the literature search engine, a query that is expected to obtain an appropriate search result by the query output device is preliminarily obtained. After it is generated, an inquiry is made on the document search engine. For this reason, the number of inquiries required by the user for document search can be made extremely small.
【0041】上記課題を解決するため、本発明の第3の
観点にかかるクエリ出力方法は、タームを含むクエリを
文献に対して適用して得られた得点が所定の範囲に含ま
れる文献を獲得する文献検索エンジンに与えるクエリを
出力し、文字列入力受付ステップと、ターム抽出ステッ
プと、入力制御ステップと、クエリ生成ステップと、メ
ッセージ表示ステップと、修正入力受付ステップと、修
正制御ステップと、クエリ出力ステップとを備えるよう
に構成する。In order to solve the above problem, a query output method according to a third aspect of the present invention obtains a document in which a score obtained by applying a query including a term to a document falls within a predetermined range. Output a query to be given to a document search engine, and perform a character string input receiving step, a term extraction step, an input control step, a query generation step, a message display step, a correction input reception step, a correction control step, and a query. And an output step.
【0042】ここで、文字列入力受付ステップでは、文
字列の入力を受け付ける。Here, in the character string input receiving step, input of a character string is received.
【0043】ターム抽出ステップでは、与えられた文字
列を形態素解析し、これに含まれるタームを抽出する。In the term extraction step, a given character string is subjected to morphological analysis to extract terms contained therein.
【0044】入力制御ステップでは、前記文字列入力受
付ステップにて文字列の入力が受け付けられた場合、前
記ターム抽出ステップに当該文字列からタームを抽出さ
せる。In the input control step, when the input of the character string is received in the character string input receiving step, the term is extracted from the character string in the term extracting step.
【0045】クエリ生成ステップでは、前記ターム抽出
ステップにて抽出されたタームを含むクエリを生成す
る。In the query generation step, a query including the terms extracted in the term extraction step is generated.
【0046】メッセージ表示ステップでは、メッセージ
表示条件が満たされる場合、当該メッセージ表示条件に
あらかじめ対応付けられたメッセージを表示する。In the message display step, if the message display condition is satisfied, a message previously associated with the message display condition is displayed.
【0047】修正入力受付ステップでは、前記メッセー
ジ表示ステップにてメッセージが表示された場合、前記
文字列入力受付ステップにて入力された文字列を修正す
る修正入力を受け付ける。In the correction input receiving step, when a message is displayed in the message display step, a correction input for correcting the character string input in the character string input receiving step is received.
【0048】修正制御ステップでは、前記修正入力受付
ステップにて修正入力が受け付けられた場合、前記ター
ム抽出ステップに当該修正入力により修正された文字列
からタームを抽出させる。In the correction control step, when a correction input is received in the correction input receiving step, the term extraction step causes the term extraction step to extract a term from the character string corrected by the correction input.
【0049】クエリ出力ステップでは、クエリ出力条件
が満たされる場合、前記クエリ生成ステップにて生成さ
れたクエリを出力する。In the query output step, when the query output condition is satisfied, the query generated in the query generation step is output.
【0050】また、上記クエリ出力方法において、前記
クエリ生成ステップにて生成されたクエリに含まれるタ
ームがあらかじめ記憶された複数のタームのいずれとも
一致しない場合に、当該メッセージ表示条件が満たされ
るように構成することができる。In the above-described query output method, when a term included in the query generated in the query generation step does not match any of a plurality of terms stored in advance, the message display condition is satisfied. Can be configured.
【0051】また、上記クエリ出力方法は、パラメータ
入力受付ステップをさらに備えるように構成することが
できる。Further, the query output method can be configured to further include a parameter input receiving step.
【0052】ここで、パラメータ入力受付ステップで
は、前記クエリ生成ステップにて参照される生成パラメ
ータの入力を受け付ける。Here, in the parameter input receiving step, an input of a generation parameter referred to in the query generating step is received.
【0053】一方、前記クエリ生成ステップにて生成さ
れるクエリは、タームのほか、当該タームのそれぞれに
対応付けられ、当該得点を得る際に参照される重みを含
む。On the other hand, the query generated in the query generating step includes, in addition to the terms, the weights associated with each of the terms and referred to when obtaining the score.
【0054】さらに、前記クエリ生成ステップは、前記
ターム抽出ステップにて抽出されたタームのそれぞれの
重みを前記パラメータ入力受付ステップにて入力を受け
付けられた生成パラメータにより決定し、当該ターム
と、これに対応付けて決定された重みと、を含むクエリ
を生成する。Further, in the query generation step, each weight of the terms extracted in the term extraction step is determined by the generation parameters received in the parameter input reception step, and the term and the A query including a weight determined in association with the query is generated.
【0055】また、上記クエリ出力方法は、パラメータ
入力受付ステップをさらに備えるように構成することが
できる。The query output method can be configured to further include a parameter input receiving step.
【0056】ここで、パラメータ入力受付ステップで
は、前記クエリ生成ステップにて参照される生成パラメ
ータの入力を受け付ける。Here, in the parameter input receiving step, an input of a generation parameter referred to in the query generating step is received.
【0057】一方、前記クエリ生成ステップにて生成さ
れるクエリは、タームのほか、当該文献検索エンジンが
獲得する文献は当該タームを含むものに限るか否かを示
す必須ターム情報を含む。On the other hand, the query generated in the query generating step includes, in addition to the terms, essential term information indicating whether or not the documents obtained by the document search engine are limited to those containing the terms.
【0058】さらに、前記クエリ生成ステップは、前記
ターム抽出ステップにて抽出されたタームのそれぞれの
必須ターム情報を、前記パラメータ入力受付ステップに
て入力を受け付けられた生成パラメータにより決定し、
当該タームと、これに対応付けて決定された必須ターム
情報と、を含むクエリを生成する。Further, in the query generating step, the essential term information of each of the terms extracted in the term extracting step is determined by the generation parameter received in the parameter input receiving step.
A query including the term and essential term information determined in association with the term is generated.
【0059】上記課題を解決するため、本発明の文献検
索方法は、文献検索ステップと、文献出力ステップとを
備えるように構成する。In order to solve the above problems, the document search method of the present invention is configured to include a document search step and a document output step.
【0060】ここで、文献検索ステップでは、上記クエ
リ出力方法により出力されたクエリを文献に対して適用
して得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, in the document retrieval step, documents whose scores obtained by applying the query output by the above-described query output method to the documents are included in a predetermined range are acquired.
【0061】文献出力ステップでは、前記文献検索ステ
ップにて獲得された文献を出力する。In the document output step, the document obtained in the document search step is output.
【0062】上記課題を解決するため、本発明のコンピ
ュータ読取可能な記録媒体は、コンピュータを、文字列
入力受付部、ターム抽出部、入力制御部、クエリ生成
部、メッセージ表示部、修正入力受付部、修正制御部、
および、クエリ出力部として機能させるプログラムを記
録するように構成する。In order to solve the above-mentioned problems, a computer-readable recording medium of the present invention is a computer-readable recording medium comprising: a computer; , Correction control unit,
In addition, a program that functions as a query output unit is recorded.
【0063】ここで、文字列入力受付部は、文字列の入
力を受け付ける。Here, the character string input receiving unit receives a character string input.
【0064】ターム抽出部は、与えられた文字列を形態
素解析し、これに含まれるタームを抽出する。The term extraction unit performs a morphological analysis on the given character string and extracts the terms contained therein.
【0065】入力制御部は、前記文字列入力受付部によ
り文字列の入力が受け付けられた場合、前記ターム抽出
部に当該文字列を与える。When the input of the character string is received by the character string input receiving section, the input control section supplies the character string to the term extracting section.
【0066】クエリ生成部は、前記ターム抽出部により
抽出されたタームを含むクエリを生成する。The query generation unit generates a query including the terms extracted by the term extraction unit.
【0067】メッセージ表示部は、メッセージ表示条件
が満たされる場合、当該メッセージ表示条件にあらかじ
め対応付けられたメッセージを表示する。When the message display condition is satisfied, the message display unit displays a message associated with the message display condition in advance.
【0068】修正入力受付部は、前記メッセージ表示部
によりメッセージが表示された場合、前記文字列入力受
付部により入力された文字列を修正する修正入力を受け
付ける。When a message is displayed on the message display unit, the correction input receiving unit receives a correction input for correcting the character string input by the character string input receiving unit.
【0069】修正制御部は、前記修正入力受付部により
修正入力が受け付けられた場合、当該修正入力により修
正された文字列を、前記ターム抽出部に与える。When the correction input is received by the correction input receiving unit, the correction control unit supplies the character string corrected by the correction input to the term extraction unit.
【0070】クエリ出力部は、クエリ出力条件が満たさ
れる場合、前記クエリ生成部により生成されたクエリを
出力する。[0070] The query output unit outputs the query generated by the query generation unit when the query output condition is satisfied.
【0071】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
ターム記憶部としてさらに機能させるように構成するこ
とができる。Further, in the above-mentioned computer-readable recording medium, the program stores the computer
It can be configured to further function as a term storage unit.
【0072】ここで、ターム記憶部は、複数のタームを
記憶する。Here, the term storage unit stores a plurality of terms.
【0073】一方、前記クエリ生成部により生成された
クエリに含まれるタームが前記ターム記憶部に記憶され
た複数のタームのいずれとも一致しない場合に、当該メ
ッセージ表示条件が満たされる。On the other hand, when the terms included in the query generated by the query generation unit do not match any of the plurality of terms stored in the term storage unit, the message display condition is satisfied.
【0074】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
パラメータ入力受付部としてさらに機能させるように構
成することができる。Further, in the above-mentioned computer-readable recording medium, the program stores the computer
It can be configured to further function as a parameter input receiving unit.
【0075】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives an input of a generation parameter given to the query generating unit.
【0076】一方、前記クエリ生成部により生成される
クエリは、タームのほか、当該タームのそれぞれに対応
付けられ、当該得点を得る際に参照される重みを含む。On the other hand, the query generated by the query generation unit includes, in addition to the terms, the weights associated with each of the terms and referred to when obtaining the score.
【0077】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの重みを前記
パラメータ入力受付部により入力を受け付けられた生成
パラメータにより決定し、当該タームと、これに対応付
けて決定された重みと、を含むクエリを生成する。Further, the query generation unit determines the weight of each of the terms extracted by the term extraction unit based on the generation parameters received by the parameter input reception unit, and associates the term with the relevant term. And generating a query including the weight determined by the above.
【0078】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
パラメータ入力受付部としてさらに機能させるように構
成することができる。Further, in the above-mentioned computer-readable recording medium, the program stores the computer
It can be configured to further function as a parameter input receiving unit.
【0079】ここで、パラメータ入力受付部は、前記ク
エリ生成部に与える生成パラメータの入力を受け付け
る。Here, the parameter input receiving unit receives an input of a generation parameter given to the query generating unit.
【0080】一方、前記クエリ生成部により生成される
クエリは、タームのほか、文献検索エンジンが獲得する
文献は当該タームを含むものに限るか否かを示す必須タ
ーム情報を含む。On the other hand, the query generated by the query generation unit includes, in addition to the terms, essential term information indicating whether or not the documents obtained by the document search engine are limited to those containing the terms.
【0081】さらに、前記クエリ生成部は、前記ターム
抽出部により抽出されたタームのそれぞれの必須ターム
情報を、前記パラメータ入力受付部により入力を受け付
けられた生成パラメータにより決定し、当該タームと、
これに対応付けて決定された必須ターム情報と、を含む
クエリを生成する。Further, the query generation unit determines essential term information of each of the terms extracted by the term extraction unit according to the generation parameters received by the parameter input reception unit.
A query including essential term information determined in association with this is generated.
【0082】また、上記コンピュータ読取可能な記録媒
体において、前記プログラムは、前記コンピュータを、
文献検索エンジン部、文献出力部としてさらに機能させ
るように構成することができる。Further, in the above-mentioned recording medium readable by a computer, the program stores the computer
It can be configured to further function as a document search engine unit and document output unit.
【0083】ここで、文献検索エンジン部は、前記クエ
リ出力部により出力されたクエリを文献に対して適用し
て得られた得点が所定の範囲に含まれる文献を獲得す
る。Here, the document search engine unit obtains documents in which the score obtained by applying the query output by the query output unit to the documents falls within a predetermined range.
【0084】一方、文献出力部は、前記文献検索エンジ
ン部により獲得された文献を出力する。On the other hand, the document output section outputs the document obtained by the document search engine.
【0085】[0085]
【発明の実施の形態】以下、添付図面を参照して、本発
明の実施の形態について説明する。Embodiments of the present invention will be described below with reference to the accompanying drawings.
【0086】(概要構成)図1は、本発明のクエリ出力
装置として機能する典型的な情報処理装置(汎用のコン
ピュータ、各種端末、携帯端末、携帯電話、ゲーム装置
などの専用機器を含む)の概要構成を示す模式図であ
る。以下、図1を参照して説明する。(Schematic Configuration) FIG. 1 shows a typical information processing apparatus (including a dedicated device such as a general-purpose computer, various terminals, a mobile terminal, a mobile phone, and a game device) functioning as a query output device of the present invention. It is a schematic diagram which shows a schematic structure. Hereinafter, description will be made with reference to FIG.
【0087】情報処理装置101は、CPU(Central
Processing Unit;中央処理ユニット)102によって
制御される。情報処理装置101に電源を投入すると、
CPU102は、ROM(Read Only Memory;読出専用
メモリ)103に記憶されたIPL(Initial Program
Loader;初期プログラムローダ)を実行する。The information processing apparatus 101 has a CPU (Central
It is controlled by a processing unit (central processing unit) 102. When the information processing apparatus 101 is powered on,
The CPU 102 executes an IPL (Initial Program) stored in a ROM (Read Only Memory) 103.
Loader (initial program loader).
【0088】IPLは、ハードディスク104、FD
(Floppy Disk;フロッピーディスク)ドライブ110
に装着されたFD、CD−ROM(Compact Disk ROM)
ドライブ111に装着されたCD−ROMなどの記録媒
体に記憶されたOS(Operating System;オペレーティ
ング・システム)プログラムを読み出して実行するプロ
グラムである。The IPL includes the hard disk 104, the FD
(Floppy Disk) drive 110
FD, CD-ROM (Compact Disk ROM)
This is a program for reading and executing an OS (Operating System) program stored in a recording medium such as a CD-ROM mounted on the drive 111.
【0089】OSを起動した後、CPU102は、キー
ボード105やマウス106などにより入力されたユー
ザの指示にしたがって、あるいは、ハードディスクなど
にあらかじめ記述された設定ファイルの内容にしたがっ
て、ハードディスクなどに記憶されたアプリケーション
プログラムを実行する。After activating the OS, the CPU 102 stores the data in the hard disk or the like in accordance with a user's instruction input through the keyboard 105 or the mouse 106 or in accordance with the contents of a setting file previously described in the hard disk or the like. Execute the application program.
【0090】なお、携帯端末などの小規模な情報処理装
置では、IPL自体がOSやアプリケーションプログラ
ムとしての機能を果たすような実施形態も採用すること
ができる。In a small-scale information processing apparatus such as a portable terminal, an embodiment in which the IPL itself functions as an OS or an application program can be adopted.
【0091】CPU102は、プログラムの実行の際
に、RAM(Random Access Memory)107を一時的な
作業用記憶領域として用いる。このほか、一時的な作業
用記憶領域として、CPU102内に設けられたレジス
タやキャッシュ(図示せず)が使われる。The CPU 102 uses a RAM (Random Access Memory) 107 as a temporary work storage area when executing the program. In addition, a register or a cache (not shown) provided in the CPU 102 is used as a temporary work storage area.
【0092】プログラムの実行に伴ない、ユーザに結果
を報告したり、途中経過を見せるため、CPU102
は、液晶ディスプレイやCRT(Cathode Ray Tube)な
どの表示装置108に当該情報を表示することができ
る。マウス106による指示操作では、マウス106を
移動することにより、画面に表示されたカーソルが移動
し、マウス106をクリックすることにより、カーソル
が指すメニュー項目を選択することができる。As the program is executed, the CPU 102 is used to report the result to the user or to show the progress.
Can display the information on a display device 108 such as a liquid crystal display or a CRT (Cathode Ray Tube). In the instruction operation using the mouse 106, the cursor displayed on the screen is moved by moving the mouse 106, and the menu item indicated by the cursor can be selected by clicking the mouse 106.
【0093】情報処理装置101は、NIC(Network
Interface Card)やモデムなどのインターフェース10
9を介してインターネットなどのコンピュータ通信網と
通信を行うことができる。インターフェース109を介
して他のサーバコンピュータ(文献検索エンジン)にク
エリを送信したり、これから応答として送信された検索
結果を受信することができる。また、インターフェース
109を介して受信したプログラムを実行することもで
きる。The information processing apparatus 101 is an NIC (Network
Interface 10 such as Interface Card) and modem
9 can communicate with a computer communication network such as the Internet. A query can be transmitted to another server computer (document search engine) via the interface 109, and a search result transmitted as a response can be received. In addition, a program received via the interface 109 can be executed.
【0094】図2は、上記情報処理装置101が本発明
のクエリ出力装置として機能する場合の、各機能の概要
構成を示す模式図である。FIG. 2 is a schematic diagram showing a schematic configuration of each function when the information processing device 101 functions as a query output device of the present invention.
【0095】クエリ出力装置201は、文字列入力受付
部202と、ターム抽出部203と、入力制御部204
と、クエリ生成部205と、メッセージ表示部206
と、修正入力受付部207と、修正制御部208と、ク
エリ出力部209とを備える。The query output device 201 includes a character string input accepting unit 202, a term extracting unit 203, and an input control unit 204
, A query generation unit 205, and a message display unit 206
And a correction input receiving unit 207, a correction control unit 208, and a query output unit 209.
【0096】さらに、ターム記憶部210、および、パ
ラメータ入力受付部211を、備えるように構成するこ
とができる。以下、これらを備える構成をもとに説明す
る。Further, it can be configured to include a term storage section 210 and a parameter input reception section 211. Hereinafter, description will be made based on a configuration including these.
【0097】文字列入力受付部202は、ユーザから検
索用の自然な文章を表す文字列の入力を受け付ける。し
たがって、キーボード105やマウス106などの入力
装置は、文字列入力受付部202として機能する。The character string input receiving section 202 receives a character string representing a natural sentence for search from the user. Therefore, input devices such as the keyboard 105 and the mouse 106 function as the character string input receiving unit 202.
【0098】ターム抽出部203は、与えられた文字列
を形態素解析し、これに含まれるタームを抽出する。し
たがって、CPU102は、ターム抽出部203として
機能する。[0098] Term extraction unit 203 performs a morphological analysis on the given character string, and extracts the terms included in the character string. Therefore, the CPU 102 functions as the term extraction unit 203.
【0099】入力制御部204は、文字列入力受付部2
02により文字列の入力が受け付けられた場合、ターム
抽出部203に当該文字列を与える。したがって、CP
U102は、キーボード105やマウス106などの入
力装置と共働して、ターム抽出部203として機能す
る。The input control unit 204 is a character string input receiving unit 2
When the input of the character string is accepted by 02, the character string is given to the term extraction unit 203. Therefore, CP
The U 102 functions as a term extraction unit 203 in cooperation with input devices such as a keyboard 105 and a mouse 106.
【0100】クエリ生成部205は、ターム抽出部20
3により抽出されたタームを含むクエリを生成する。し
たがって、CPU102は、クエリ生成部205として
機能する。[0100] The query generation unit 205
3. Generate a query including the terms extracted by 3. Therefore, the CPU 102 functions as the query generation unit 205.
【0101】メッセージ表示部206は、メッセージ表
示条件が満たされる場合、当該メッセージ表示条件にあ
らかじめ対応付けられたメッセージを表示する。したが
って、表示装置108は、CPU102と共働して、メ
ッセージ表示部206として機能する。When the message display condition is satisfied, the message display unit 206 displays a message associated with the message display condition in advance. Therefore, the display device 108 functions as the message display unit 206 in cooperation with the CPU 102.
【0102】修正入力受付部207は、メッセージ表示
部206によりメッセージが表示された場合、文字列入
力受付部202により入力された文字列を修正する修正
入力を受け付ける。したがって、キーボード105やマ
ウス106などの入力装置は、修正入力受付部207と
して機能する。When a message is displayed on message display unit 206, correction input receiving unit 207 receives a correction input for correcting the character string input by character string input receiving unit 202. Therefore, input devices such as the keyboard 105 and the mouse 106 function as the correction input receiving unit 207.
【0103】修正制御部208は、修正入力受付部20
7により修正入力が受け付けられた場合、当該修正入力
により修正された文字列を、ターム抽出部203に与え
る。したがって、CPU102は、修正制御部208と
して機能する。The correction control unit 208 includes a correction input receiving unit 20
When the correction input is received by the user 7, the character string corrected by the correction input is provided to the term extraction unit 203. Therefore, the CPU 102 functions as the correction control unit 208.
【0104】修正入力があった場合は、ターム抽出部2
03が再度駆動される。本実施形態では、メッセージ表
示部206によるメッセージは「有意な検索結果が得ら
れないおそれがある」旨のものであるため、当該メッセ
ージが表示されなった場合に、クエリ出力条件が満たさ
れる。If there is a correction input, the term extraction unit 2
03 is driven again. In the present embodiment, since the message displayed by the message display unit 206 indicates that “a significant search result may not be obtained”, the query output condition is satisfied when the message is not displayed.
【0105】クエリ出力部209は、クエリ出力条件が
満たされる場合、クエリ生成部205により生成された
クエリを出力し、文献検索サーバへ当該クエリを送信す
る。したがって、インターフェース109は、クエリ出
力部209として機能する。When the query output condition is satisfied, the query output unit 209 outputs the query generated by the query generation unit 205 and transmits the query to the document search server. Therefore, the interface 109 functions as the query output unit 209.
【0106】ターム記憶部210は、複数のタームを記
憶する。したがって、ROM103、ハードディスク1
04、FDD110に装着されたFD、CD−ROMド
ライブ111に装着されたCD−ROM、インターフェ
ース109を介して接続された他のコンピュータは、タ
ーム記憶部210として機能する。The term storage section 210 stores a plurality of terms. Therefore, the ROM 103, the hard disk 1
04, the FD mounted on the FDD 110, the CD-ROM mounted on the CD-ROM drive 111, and another computer connected via the interface 109 function as the term storage unit 210.
【0107】本実施形態では、クエリ生成部205によ
り生成されたクエリに含まれるタームがターム記憶部2
10に記憶された複数のタームのいずれとも一致しない
場合、有意な検索結果が得られないおそれがあるため、
当該メッセージ表示条件が満たされる。In this embodiment, the terms included in the query generated by the query generation unit 205 are stored in the term storage unit 2
If the search term does not match any of the terms stored in 10, there is a possibility that a significant search result cannot be obtained.
The message display condition is satisfied.
【0108】パラメータ入力受付部211は、クエリ生
成部205に与える生成パラメータの入力を受け付け
る。したがって、キーボード105やマウス106など
の入力装置は、パラメータ入力受付部211として機能
する。The parameter input receiving section 211 receives an input of a generation parameter given to the query generating section 205. Therefore, input devices such as the keyboard 105 and the mouse 106 function as the parameter input receiving unit 211.
【0109】本実施形態では、クエリ生成部205によ
り生成されるクエリは、タームのほか、当該タームのそ
れぞれに対応付けられ、当該得点を得る際に参照される
重みを含む。In the present embodiment, the query generated by the query generation unit 205 includes, in addition to the terms, the weights associated with the respective terms and referred to when obtaining the score.
【0110】また、クエリ生成部205は、ターム抽出
部203により抽出されたタームのそれぞれの重みをパ
ラメータ入力受付部211により入力を受け付けられた
生成パラメータにより決定し、当該タームと、これに対
応付けて決定された重みと、を含むクエリを生成する。
重みの決定の手法については後述する。The query generation unit 205 determines the weight of each of the terms extracted by the term extraction unit 203 based on the generation parameters whose input has been received by the parameter input reception unit 211, and associates the term with the term. And generating a query including the weight determined by the above.
The method of determining the weight will be described later.
【0111】さらに、クエリ生成部205により生成さ
れるクエリは、タームのほか、当該文献検索エンジンが
獲得する文献は当該タームを含むものに限るか否かを示
す必須ターム情報を含む。Further, the query generated by the query generation unit 205 includes, in addition to the terms, essential term information indicating whether the documents obtained by the document search engine are limited to those containing the terms.
【0112】クエリ生成部205は、ターム抽出部20
3により抽出されたタームのそれぞれの必須ターム情報
を、パラメータ入力受付部211により入力を受け付け
られた生成パラメータにより決定し、当該タームと、こ
れに対応付けて決定された必須ターム情報と、を含むク
エリを生成する。必須ターム情報の生成については後述
する。[0112] The query generation unit 205
The required term information of each of the terms extracted in Step 3 is determined based on the generation parameters received by the parameter input receiving unit 211, and includes the term and the required term information determined in association with the term. Generate a query. Generation of the required term information will be described later.
【0113】このほか、文献検索エンジン部(図示せ
ず)、および、文献出力部(図示せず)をクエリ出力装
置201と同じ情報処理装置101上に構成することが
可能である。ただし、負荷分散や文献データベースの集
中管理の観点からは、これらを分離した態様とすること
が望ましい。In addition, the document search engine unit (not shown) and the document output unit (not shown) can be configured on the same information processing device 101 as the query output device 201. However, from the viewpoint of load distribution and centralized management of the document database, it is desirable that these are separated.
【0114】このほか、ハードディスク104、FDド
ライブ110に装着されたFD、CD−ROMドライブ
111に装着されたCD−ROM、ROM103、RA
M107、および、インターフェース109を介して接
続された他のコンピュータのこれら読み取り可能な情報
記憶装置に相当するものは、CPU102で実行される
プログラムを記録することにより、本発明の記録媒体と
して機能する。In addition, the hard disk 104, the FD mounted on the FD drive 110, the CD-ROM mounted on the CD-ROM drive 111, the ROM 103, the RA
M107 and those corresponding to these readable information storage devices of another computer connected via the interface 109 function as a recording medium of the present invention by recording a program executed by the CPU 102.
【0115】上述のように、図1に示す情報処理装置1
01は、図2に示す本発明のクエリ出力装置201とし
て機能する。これは、本発明のクエリ出力装置201の
典型的な実施態様である。As described above, the information processing apparatus 1 shown in FIG.
01 functions as the query output device 201 of the present invention shown in FIG. This is a typical embodiment of the query output device 201 of the present invention.
【0116】一方、携帯端末等では、外部記憶装置とし
て、不揮発性半導体メモリ(フラッシュメモリカード)
やバッテリバックアップがされたRAMを使用すること
ができる。この場合、必ずしもハードディスク104、
FDドライブ110、CD−ROMドライブ111等は
必要ない。On the other hand, in a portable terminal or the like, a nonvolatile semiconductor memory (flash memory card) is used as an external storage device.
Alternatively, a battery-backed RAM can be used. In this case, the hard disk 104,
The FD drive 110 and the CD-ROM drive 111 are not required.
【0117】(処理の流れ)図3は、図1に示す情報処
理装置101を本発明のクエリ出力装置201として機
能させる場合の処理の手順を示すフローチャートであ
る。(Processing Flow) FIG. 3 is a flowchart showing a processing procedure when the information processing apparatus 101 shown in FIG. 1 functions as the query output apparatus 201 of the present invention.
【0118】まず、CPU102は、ユーザから検索対
象の文書を特定するための検索条件を示す文章の入力を
受け付ける(ステップS301)。ユーザは、たとえ
ば、「日本と中国の合弁企業」のような自然な文章を検
索条件として入力することができる。First, the CPU 102 receives an input of a sentence indicating a search condition for specifying a search target document from the user (step S301). For example, the user can input a natural sentence such as “Joint venture between Japan and China” as a search condition.
【0119】次に、CPU102は、入力された文字列
を形態素解析して、これに含まれるタームを抽出する
(ステップS302)。上記入力例の場合は、タームは
形態素解析の結果は、「日本/と/中国/の/合弁/企
業」のように形態素解析される。ここで/は形態素の区
切りを示す。ここからタームとして「日本」「中国」
「合弁/企業」を抽出する。Next, the CPU 102 performs a morphological analysis on the input character string and extracts terms contained therein (step S302). In the case of the above input example, the term is subjected to morphological analysis such as "Japan /// China // JV / company". Here, / indicates a morpheme break. From here, the terms "Japan" and "China"
Extract "JV / Company".
【0120】タームがほかのタームを含む場合には、こ
れらも抽出する(ステップS303)。他のタームに含
まれるタームを「サブターム」という。たとえば、「合
弁/企業」のサブタームは、「合弁」と「企業」であ
る。If the terms include other terms, they are also extracted (step S303). Terms included in other terms are called “subterms”. For example, the sub-terms of “JV / company” are “JV” and “company”.
【0121】さらに、これらタームやサブタームの同義
語・類義語など、関連するターム(以下「関連ターム」
という。)を、抽出する(ステップS304)。Further, related terms such as synonyms and synonyms of these terms and sub-terms (hereinafter referred to as “related terms”)
That. ) Is extracted (step S304).
【0122】あるタームと、これの関連タームとの情報
は、あらかじめハードディスク104などに記憶してお
くことが望ましい。たとえば、「日本」の関連タームと
して、「日本国」「ニッポン」「ジャパン」「Japa
n」などのほか、「東アジア」「北海道」「九州」「四
国」などが抽出される。It is desirable that information on a certain term and its related terms be stored in advance on the hard disk 104 or the like. For example, as terms related to "Japan", "Japan", "Japan", "Japan", "Japan"
n, etc., "East Asia", "Hokkaido", "Kyushu", "Shikoku", etc. are extracted.
【0123】一方、CPU102は、ユーザから別途入
力された検索パラメータを取得する(ステップS30
5)。この検索パラメータは、たとえば、ステップS3
01において同時に入力されるような実施形態をとるこ
とができる。図4は、ユーザが検索条件文字列と検索パ
ラメータを入力する検索条件入力フォームの表示例であ
る。On the other hand, the CPU 102 acquires a search parameter separately input by the user (step S30).
5). This search parameter is set, for example, in step S3
An embodiment can be adopted in which the data is input simultaneously at 01. FIG. 4 is a display example of a search condition input form in which a user inputs a search condition character string and a search parameter.
【0124】検索条件入力フォーム401のテキストフ
ィールド402は、検索条件文字列の入力を受け付け
る。スライダ403は、検索パラメータの入力を受け付
ける。ユーザは、マウス106やキーボード105を操
作して、これらのフォームにそれぞれの情報を入力す
る。[0124] The text field 402 of the search condition input form 401 receives an input of a search condition character string. The slider 403 receives an input of a search parameter. The user operates the mouse 106 and the keyboard 105 to input respective information into these forms.
【0125】本実施形態では、ユーザがクエリ出力ボタ
ン404をクリックすると、ステップS301以降の処
理が開始される。In the present embodiment, when the user clicks the query output button 404, the processing after step S301 is started.
【0126】ついで、CPU102は、抽出されたター
ムに、あらかじめ定めたタームでないものが含まれてい
るか否かを調べる(ステップS306)。「あらかじめ
定めたターム」は、ハードディスク104やCD−RO
Mなどに記憶されている。これらは、本クエリ出力装置
201が接続される文献検索エンジンで用いることがで
きる検索キーワードである。検索キーワードでないター
ムがある場合(ステップS306;Yes)、「有意な
検索結果が得られないおそれがある」旨のメッセージを
表示し(ステップS307)、ユーザに検索条件の再入
力を促す。Next, the CPU 102 checks whether or not the extracted terms include non-predetermined terms (step S306). The “predetermined terms” are the hard disk 104 and CD-RO
M and the like. These are search keywords that can be used in the document search engine to which the query output device 201 is connected. If there is a term that is not a search keyword (step S306; Yes), a message indicating that "significant search results may not be obtained" is displayed (step S307), and the user is prompted to re-enter search conditions.
【0127】本実施形態では、「検索キーワードでない
タームがある」場合にメッセージ表示条件が満たされる
が、メッセージ表示条件については、適宜変更が可能で
ある。In the present embodiment, the message display condition is satisfied when “there is a term that is not a search keyword”, but the message display condition can be changed as appropriate.
【0128】図5は、このメッセージが表示される様子
を示す表示例である。メッセージ表示フォーム501に
は、当該メッセージが表示されるメッセージ表示領域5
02のほか、再入力をする場合にクリックする再入力ボ
タン503と、強行する場合、すなわち、このままの検
索条件で検索を行う場合にクリックする強行ボタン50
4とが表示される。FIG. 5 is a display example showing how this message is displayed. The message display form 501 includes a message display area 5 where the message is displayed.
02, a re-entry button 503 to be clicked when re-entering, and a forcible button 50 to be clicked when forcing, ie, performing a search with the search conditions as they are.
4 is displayed.
【0129】CPU102は、ユーザが再入力するか否
かを判断し(ステップS308)、再入力する場合(ス
テップS308;Yes)、ステップS301に戻る。The CPU 102 determines whether or not the user inputs again (step S308). When the user inputs again (step S308; Yes), the process returns to step S301.
【0130】一方、タームがすべて検索キーワードであ
る場合(ステップS306;No)、および、ユーザが
強行を選択した場合(ステップS308;No)、CP
U102は、タームと、形態素解析によって得られた当
該タームの品詞情報や係り受けの情報と、検索パラメー
タと、から、クエリを生成する(ステップS309)。On the other hand, if all of the terms are search keywords (step S306; No), and if the user selects forced execution (step S308; No), the CP
U102 generates a query from the term, part-of-speech information or dependency information of the term obtained by the morphological analysis, and the search parameter (step S309).
【0131】ここで生成されるクエリには、以下の情報
が含まれる。 ・ターム。サブタームや関連タームを含む。 ・当該タームの重み。ベクトル空間法で文献の得点を計
算する際に用いる。 ・必須ターム情報。当該タームが必須タームか否かを示
す。[0131] The query generated here includes the following information. ·term. Includes subterms and related terms. -The weight of the term. Used when calculating the score of a document by the vector space method. -Required term information. Indicates whether the term is a mandatory term.
【0132】タームの重みや必須ターム情報の決定の手
法については後述する。The method of determining the term weight and essential term information will be described later.
【0133】最後に、CPU102は、生成されたクエ
リを出力する(ステップS310)。出力先としては、
たとえば、RAM107を採用することができる。出力
されたクエリは、後述するように、文献検索エンジンへ
の問い合わせに用いられる。Finally, CPU 102 outputs the generated query (step S310). As an output destination,
For example, the RAM 107 can be employed. The output query is used for an inquiry to a literature search engine, as described later.
【0134】図6は、出力されたクエリを用いて、文献
検索エンジンへ問い合わせを行う処理の流れを示すフロ
ーチャートである。FIG. 6 is a flowchart showing the flow of a process for making an inquiry to the document search engine using the output query.
【0135】CPU102は、ステップS310におい
て、RAM107に出力されたクエリを、インターフェ
ース109を介して文献検索エンジンサーバへ送信する
(ステップS601)。At step S310, CPU 102 transmits the query output to RAM 107 to document search engine server via interface 109 (step S601).
【0136】文献検索エンジンサーバは、当該クエリを
受信し(ステップS602)、当該クエリに基づいて、
各文献の得点を計算し(ステップS603)、上位の所
定の数の文献を取得し(ステップS604)これらを検
索結果として送信する(ステップS605)。The document search engine server receives the query (step S602), and based on the query,
The score of each document is calculated (step S603), and a predetermined number of upper documents are acquired (step S604), and these are transmitted as search results (step S605).
【0137】CPU102は、インターフェース109
を介して、検索結果の文献を受信し(ステップS60
6)、当該文献を表示装置108に表示して(ステップ
S607)、本処理を終了する。The CPU 102 has an interface 109
Are received via the search result (step S60).
6) The document is displayed on the display device 108 (step S607), and the process ends.
【0138】このように、ユーザは、自然な文章を入力
することで検索の条件を指定することができる一方、有
意な検索結果が得られないおそれがある場合には、その
旨を表示してユーザに再入力を促すことで、所望の検索
結果が得られやすくなり、文献検索エンジンへの問い合
わせ回数を減らすことができる。As described above, the user can specify a search condition by inputting a natural sentence, but if there is a possibility that a significant search result cannot be obtained, a message to that effect is displayed. By prompting the user for re-input, desired search results can be easily obtained, and the number of inquiries to the document search engine can be reduced.
【0139】(重みの決定)クエリ生成部205、およ
び、ステップS309においては、タームと、形態素解
析によって得られた当該タームの品詞情報や係り受けの
情報と、検索パラメータと、から、クエリを生成する。
以下では、このクエリにおけるタームの重みの決定手法
の一例について説明する。(Determination of Weight) In the query generation unit 205 and in step S309, a query is generated from the term, the part of speech information or dependency information of the term obtained by the morphological analysis, and the search parameter. I do.
Hereinafter, an example of a method of determining the term weight in this query will be described.
【0140】日本語では名詞同士の係り受けや複合名詞
が多用されるため、文献検索においてもこれらを考慮す
る必要がある。そこで、これらを検索結果の傾向から以
下のように類型化して、各タームの重みを決定する。In Japanese, dependency between nouns and compound nouns are frequently used, and these must be taken into account in document search. Therefore, these are categorized as follows from the tendency of the search result, and the weight of each term is determined.
【0141】第1の類型は、一般名詞と一般名詞が連接
(助詞「の」を挟んで連なる場合を含む。以下同様。)
する場合である。この場合は、前に配置された一般名詞
が主題となる場合が多い。たとえば、「食事/療法」
「食事/の/療法」「ゴルフ/トーナメント」「ゴルフ
/の/トーナメント」の場合、主題となるのはそれぞれ
「食事」「ゴルフ」である。そこで、これら主題となる
前に配置されたタームの重みを大きくする。The first type is a concatenation of a general noun and a general noun (including a case in which a particle "no" is interposed. The same applies hereinafter).
This is the case. In this case, the general noun placed before is often the subject. For example, "meal / therapy"
In the case of “meal / no / therapy”, “golf / tournament”, and “golf / no / tournament”, the subjects are “meal” and “golf”, respectively. Therefore, the weight of the terms arranged before the subject is increased.
【0142】第2の類型は、サブタームを含むタームの
場合である。サブタームとタームとで、意味が大きく異
なる場合は、サブタームの重みを低くし、全体のターム
の重みを高くする。たとえば、「地方/銀行」「就職/
協定」では、これら全体の重みを高くし、「地方」「銀
行」「就職」「協定」の重みは低くする。A second type is a case of a term including a subterm. If the meaning is significantly different between the sub-term and the term, the weight of the sub-term is reduced and the weight of the entire term is increased. For example, "Region / bank"
In the “Agreement”, the overall weight is increased, and in the “Region”, “Bank”, “Employment” and “Agreement”, the weight is reduced.
【0143】本実施形態では、これらの重み決定の手法
を採用するが、自然言語による研究の成果に応じ、他の
重みの決定のためのヒューリスティックスを採用するこ
とができる。また、他国語についても同様の処理を行う
ことができる。In the present embodiment, these weight determination methods are employed, but other heuristics for determining other weights can be employed in accordance with the results of research in natural language. Similar processing can be performed for other languages.
【0144】(必須ターム情報の決定)クエリ生成部2
05、および、ステップS309においては、ターム
と、形態素解析によって得られた当該タームの品詞情報
や係り受けの情報と、検索パラメータと、から、クエリ
を生成する。以下では、このクエリにおける必須ターム
情報の決定手法の一例について説明する。(Determination of Required Term Information) Query Generation Unit 2
In step 05 and step S309, a query is generated from the term, part-of-speech information or dependency information of the term obtained by morphological analysis, and a search parameter. Hereinafter, an example of a technique for determining the required term information in this query will be described.
【0145】必須タームか否かは、そのタームが主題で
あるか否かに関わる。そこで、上記の重み決定の類型に
おいて、「重みを高くする」としたタームを必須ターム
とすることができる。Whether or not an essential term is related to whether or not the term is a subject. Therefore, in the above-described type of weight determination, a term “increase the weight” can be set as an essential term.
【0146】また、上記第2の類型において、サブター
ム「地方」「銀行」「就職」「協定」を用いずにクエリ
を作成してもよい。In the second type, a query may be created without using the sub-terms “region”, “bank”, “employment”, and “agreement”.
【0147】(検索パラメータによる調整)本実施形態
では、ユーザが入力した検索パラメータに応じてターム
の重みや必須ターム情報を決定する。図4に示す検索条
件入力フォーム401では、スライダ403により「き
つい検索」から「ゆるい検索」まで検索パラメータを数
段階の値として入力することができる。(Adjustment by Search Parameter) In this embodiment, term weights and essential term information are determined according to search parameters input by the user. In the search condition input form 401 shown in FIG. 4, the slider 403 allows the user to input search parameters from "tight search" to "loose search" as values in several stages.
【0148】「きつい検索」の場合には、重みの高低の
差を増し、あるいは、必須タームの割合を増す。一方、
「ゆるい検索」の場合には、重みの高低の差を減らし、
あるいは、必須タームの割合を減らす。In the case of “tight search”, the difference between the weights is increased, or the ratio of essential terms is increased. on the other hand,
In the case of "loose search", reduce the difference between the weights,
Alternatively, reduce the ratio of required terms.
【0149】たとえば、「格安/旅行」(後に配置され
たタームが主題となる場合)について、「ゆるい検索」
から「きつい検索」までクエリに含まれる情報を順に列
挙すると以下のようになる。For example, “loose search” for “cheap / travel” (when a term arranged later is the subject)
The information contained in the query, in order from to "tight search", is listed as follows.
【0150】・「格安」は重み小、「旅行」は重み小“Cheap” is small, “Travel” is small
【0151】・「格安」は重み小、「旅行」は重み大“Cheap” is small weight, “Travel” is large weight
【0152】・「格安」は重み小、「旅行」は重み大か
つ必須"Cheap" is small, "Travel" is large and essential
【0153】・「格安」は重み大、「旅行」は重み大か
つ必須“Cheap” has a large weight, “Travel” has a large weight and is essential
【0154】・「格安」は重み大かつ必須、「旅行」は
重み大かつ必須“Cheap” is heavy and essential, “Travel” is heavy and essential
【0155】これらの検索パラメータと生成されるクエ
リとの関係についても、適宜変更が可能であり、変更し
た実施形態も本発明の範囲に含まれる。The relationship between these search parameters and the generated query can be changed as appropriate, and the changed embodiment is also included in the scope of the present invention.
【0156】[0156]
【発明の効果】本発明により、検索したい文献をキーワ
ードではなく文章で指定することができ、当該文章から
検索に適したクエリを生成するのに好適なクエリ出力装
置、クエリ出力方法、文献検索システム、文献検索方
法、並びに、これらを実現するためのプログラムを記録
したコンピュータ読取可能な記録媒体を提供することが
できる。According to the present invention, a document to be searched can be specified by a sentence instead of a keyword, and a query output device, a query output method, and a document search system suitable for generating a query suitable for a search from the sentence. , A document search method, and a computer-readable recording medium in which a program for realizing the method is recorded.
【図1】本発明のクエリ出力装置として機能する典型的
な情報処理装置の概要構成を示す模式図である。FIG. 1 is a schematic diagram showing a schematic configuration of a typical information processing device functioning as a query output device of the present invention.
【図2】本発明のクエリ出力装置の各機能の概要構成を
示す模式図である。FIG. 2 is a schematic diagram showing a schematic configuration of each function of a query output device of the present invention.
【図3】本発明のクエリ出力装置の処理の手順を示すフ
ローチャートである。FIG. 3 is a flowchart illustrating a procedure of processing of the query output device of the present invention.
【図4】検索条件入力フォームの表示例を示す説明図で
ある。FIG. 4 is an explanatory diagram showing a display example of a search condition input form.
【図5】メッセージ表示フォームの表示例を示す説明図
である。FIG. 5 is an explanatory diagram showing a display example of a message display form.
【図6】本発明のクエリ出力装置により出力されたクエ
リを用いて文献検索を行う処理の手順を示すフローチャ
ートである。FIG. 6 is a flowchart illustrating a procedure of a document search process using a query output by the query output device of the present invention.
101 情報処理装置 102 CPU 103 ROM 104 ハードディスク 105 キーボード 106 マウス 107 RAM 108 表示装置 109 インターフェース 110 FDドライブ 111 CD−ROMドライブ 201 クエリ出力装置 202 文字列入力受付部 203 ターム抽出部 204 入力制御部 205 クエリ生成部 206 メッセージ表示部 207 修正入力受付部 208 修正制御部 209 クエリ出力部 210 ターム記憶部 211 パラメータ入力受付部 401 検索条件入力フォーム 402 テキストフィールド 403 スライダ 404 クエリ出力ボタン 501 メッセージ表示フォーム 502 メッセージ表示領域 503 再入力ボタン 504 強行ボタン Reference Signs List 101 information processing device 102 CPU 103 ROM 104 hard disk 105 keyboard 106 mouse 107 RAM 108 display device 109 interface 110 FD drive 111 CD-ROM drive 201 query output device 202 character string input reception unit 203 term extraction unit 204 input control unit 205 query generation Unit 206 message display unit 207 correction input reception unit 208 correction control unit 209 query output unit 210 term storage unit 211 parameter input reception unit 401 search condition input form 402 text field 403 slider 404 query output button 501 message display form 502 message display area 503 Re-enter button 504 Force button
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B075 ND03 NK32 NK35 PP02 PP03 PP12 PP13 PP25 5E501 AA01 AA04 AA13 AB03 AC33 BA05 CA03 CA04 CB02 CB09 EA05 EA10 FA09 ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5B075 ND03 NK32 NK35 PP02 PP03 PP12 PP13 PP25 5E501 AA01 AA04 AA13 AB03 AC33 BA05 CA03 CA04 CB02 CB09 EA05 EA10 FA09
Claims (15)
て得られた得点が所定の範囲に含まれる文献を獲得する
文献検索エンジンに与えるクエリを出力するクエリ出力
装置であって、 文字列の入力を受け付ける文字列入力受付部と、 与えられた文字列を形態素解析し、これに含まれるター
ムを抽出するターム抽出部と、 前記文字列入力受付部により文字列の入力が受け付けら
れた場合、前記ターム抽出部に当該文字列を与える入力
制御部と、 前記ターム抽出部により抽出されたタームを含むクエリ
を生成するクエリ生成部と、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示部と、 前記メッセージ表示部によりメッセージが表示された場
合、前記文字列入力受付部により入力された文字列を修
正する修正入力を受け付ける修正入力受付部と、 前記修正入力受付部により修正入力が受け付けられた場
合、当該修正入力により修正された文字列を、前記ター
ム抽出部に与える修正制御部と、 クエリ出力条件が満たされる場合、前記クエリ生成部に
より生成されたクエリを出力するクエリ出力部とを備え
ることを特徴とするクエリ出力装置。1. A query output device for outputting a query to be given to a document search engine that obtains a document whose score obtained by applying a query including a term to the document is within a predetermined range, comprising: A character string input receiving unit that receives an input of a character string; a term extracting unit that performs a morphological analysis of a given character string and extracts terms included in the character string; and a case where a character string is received by the character string input receiving unit. An input control unit for providing the character string to the term extraction unit; a query generation unit for generating a query including the term extracted by the term extraction unit; and when the message display condition is satisfied, the message display condition A message display unit for displaying the associated message; and when the message display unit displays the message, the character string input A correction input receiving unit that receives a correction input for correcting a character string input by the receiving unit; and, when the correction input is received by the correction input receiving unit, a character string corrected by the correction input; And a query output unit that outputs a query generated by the query generation unit when a query output condition is satisfied.
ームが前記ターム記憶部に記憶された複数のタームのい
ずれとも一致しない場合に、当該メッセージ表示条件が
満たされることを特徴とする請求項1に記載のクエリ出
力装置。2. A term storage unit for storing a plurality of terms, wherein a term included in a query generated by the query generation unit does not match any of the plurality of terms stored in the term storage unit. The query output device according to claim 1, wherein a message display condition is satisfied.
の入力を受け付けるパラメータ入力受付部をさらに備
え、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該タームのそれぞれに対応付けられ、当該得点
を得る際に参照される重みを含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの重みを前記パラメータ入力受付部
により入力を受け付けられた生成パラメータにより決定
し、当該タームと、これに対応付けて決定された重み
と、を含むクエリを生成することを特徴とする請求項1
に記載のクエリ出力装置。A parameter input receiving unit for receiving an input of a generation parameter given to the query generating unit, wherein the query generated by the query generating unit is associated with each of the terms in addition to the term; The query generation unit includes a weight referred to when obtaining a score, the query generation unit determines each weight of the terms extracted by the term extraction unit according to the generation parameters received by the parameter input reception unit, and 2. A query including a term and a weight determined in association with the term.
2. The query output device according to 1.
の入力を受け付けるパラメータ入力受付部をさらに備
え、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該文献検索エンジンが獲得する文献は当該ター
ムを含むものに限るか否かを示す必須ターム情報を含
み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの必須ターム情報を、前記パラメー
タ入力受付部により入力を受け付けられた生成パラメー
タにより決定し、当該タームと、これに対応付けて決定
された必須ターム情報と、を含むクエリを生成すること
を特徴とする請求項1に記載のクエリ出力装置。4. The apparatus according to claim 1, further comprising a parameter input receiving unit for receiving an input of a generation parameter to be given to the query generating unit, wherein the query generated by the query generating unit is not only a term but also a document obtained by the document search engine. The query generation unit includes essential term information indicating whether or not to include only the term, and the query generation unit receives an input of each of the required term information of the terms extracted by the term extraction unit by the parameter input reception unit. The query output device according to claim 1, wherein the query output device generates a query that is determined by the generated generation parameter and includes the term and essential term information determined in association with the term.
と、 前記クエリ出力装置により出力されたクエリを文献に対
して適用して得られた得点が所定の範囲に含まれる文献
を獲得する文献検索エンジン部と、 前記文献検索エンジン部により獲得された文献を出力す
る文献出力部とを備えることを特徴とする文献検索シス
テム。5. A query output device according to claim 1, further comprising: obtaining a document in which a score obtained by applying a query output by the query output device to the document is within a predetermined range. A document search system, comprising: a document search engine unit; and a document output unit that outputs a document obtained by the document search engine unit.
て得られた得点が所定の範囲に含まれる文献を獲得する
文献検索エンジンに与えるクエリを出力するクエリ出力
方法であって、 文字列の入力を受け付ける文字列入力受付ステップと、 与えられた文字列を形態素解析し、これに含まれるター
ムを抽出するターム抽出ステップと、 前記文字列入力受付ステップにて文字列の入力が受け付
けられた場合、前記ターム抽出ステップに当該文字列か
らタームを抽出させる入力制御ステップと、 前記ターム抽出ステップにて抽出されたタームを含むク
エリを生成するクエリ生成ステップと、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示ステップと、 前記メッセージ表示ステップにてメッセージが表示され
た場合、前記文字列入力受付ステップにて入力された文
字列を修正する修正入力を受け付ける修正入力受付ステ
ップと、 前記修正入力受付ステップにて修正入力が受け付けられ
た場合、前記ターム抽出ステップに当該修正入力により
修正された文字列からタームを抽出させる修正制御ステ
ップと、 クエリ出力条件が満たされる場合、前記クエリ生成ステ
ップにて生成されたクエリを出力するクエリ出力ステッ
プとを備えることを特徴とするクエリ出力方法。6. A query output method for outputting a query to be given to a document search engine for obtaining documents whose scores obtained by applying a query including a term to documents to a document within a predetermined range, comprising: A character string input receiving step of receiving an input of a character string; a morphological analysis of a given character string, and a term extracting step of extracting a term included in the character string; and a character string input is received in the character string input receiving step. In the case, an input control step of causing the term extraction step to extract a term from the character string; a query generation step of generating a query including the term extracted in the term extraction step; A message display step of displaying a message associated in advance with a message display condition; When a message is displayed in the message display step, a correction input receiving step of receiving a correction input for correcting the character string input in the character string input receiving step, and a correction input being received in the correction input receiving step A query control step for causing the term extraction step to extract a term from the character string corrected by the correction input; and a query for outputting the query generated in the query generation step when a query output condition is satisfied. A query output method, comprising: an output step.
エリに含まれるタームがあらかじめ記憶された複数のタ
ームのいずれとも一致しない場合に、当該メッセージ表
示条件が満たされることを特徴とする請求項6に記載の
クエリ出力方法。7. The message display condition is satisfied when a term included in a query generated in the query generation step does not match any of a plurality of terms stored in advance. Query output method described in.
成パラメータの入力を受け付けるパラメータ入力受付ス
テップをさらに備え、 前記クエリ生成ステップにて生成されるクエリは、ター
ムのほか、当該タームのそれぞれに対応付けられ、当該
得点を得る際に参照される重みを含み、 前記クエリ生成ステップは、前記ターム抽出ステップに
て抽出されたタームのそれぞれの重みを前記パラメータ
入力受付ステップにて入力を受け付けられた生成パラメ
ータにより決定し、当該タームと、これに対応付けて決
定された重みと、を含むクエリを生成することを特徴と
する請求項6に記載のクエリ出力方法。8. The apparatus further comprises a parameter input receiving step of receiving an input of a generation parameter referred to in the query generating step, wherein the query generated in the query generating step corresponds to each of the terms in addition to the term. The query generation step includes generating weights of the terms extracted in the term extraction step, the weights of the terms being extracted in the parameter input reception step. The query output method according to claim 6, wherein the query is determined by a parameter, and a query including the term and a weight determined in association with the term is generated.
成パラメータの入力を受け付けるパラメータ入力受付ス
テップをさらに備え、 前記クエリ生成ステップにて生成されるクエリは、ター
ムのほか、当該文献検索エンジンが獲得する文献は当該
タームを含むものに限るか否かを示す必須ターム情報を
含み、 前記クエリ生成ステップは、前記ターム抽出ステップに
て抽出されたタームのそれぞれの必須ターム情報を、前
記パラメータ入力受付ステップにて入力を受け付けられ
た生成パラメータにより決定し、当該タームと、これに
対応付けて決定された必須ターム情報と、を含むクエリ
を生成することを特徴とする請求項6に記載のクエリ出
力方法。9. The system further comprises a parameter input receiving step of receiving an input of a generation parameter referred to in the query generating step, wherein the query generated in the query generating step is obtained by the document search engine in addition to the term. The relevant document contains essential term information indicating whether or not the term is limited to the term containing the term. The query generation step includes: entering the respective essential term information of the terms extracted in the term extracting step into the parameter input receiving step. 7. The query output method according to claim 6, wherein the query is determined by the generation parameter received as input, and the query including the term and the required term information determined in association with the term is generated. .
により出力されたクエリを文献に対して適用して得られ
た得点が所定の範囲に含まれる文献を獲得する文献検索
ステップと、 前記文献検索ステップにて獲得された文献を出力する文
献出力ステップと、を備えることを特徴とする文献検索
方法。10. A document search step of acquiring a document in which a score obtained by applying a query output by the query output method according to claim 6 to a document is within a predetermined range, A document output step of outputting a document obtained in the document search step.
ムを抽出するターム抽出部、 前記文字列入力受付部により文字列の入力が受け付けら
れた場合、前記ターム抽出部に当該文字列を与える入力
制御部、 前記ターム抽出部により抽出されたタームを含むクエリ
を生成するクエリ生成部、 メッセージ表示条件が満たされる場合、当該メッセージ
表示条件にあらかじめ対応付けられたメッセージを表示
するメッセージ表示部、 前記メッセージ表示部によりメッセージが表示された場
合、前記文字列入力受付部により入力された文字列を修
正する修正入力を受け付ける修正入力受付部、 前記修正入力受付部により修正入力が受け付けられた場
合、当該修正入力により修正された文字列を、前記ター
ム抽出部に与える修正制御部、および、 クエリ出力条件が満たされる場合、前記クエリ生成部に
より生成されたクエリを出力するクエリ出力部として機
能させるプログラムを記録することを特徴とするコンピ
ュータ読取可能な記録媒体。11. A character string input receiving unit for receiving a character string input, a term extracting unit for morphologically analyzing a given character string and extracting terms contained therein, and a character string input receiving unit An input control unit that supplies the character string to the term extraction unit when a column input is received; a query generation unit that generates a query including the term extracted by the term extraction unit; A message display unit for displaying a message associated with the message display condition in advance; a correction for correcting a character string input by the character string input reception unit when a message is displayed by the message display unit; An input receiving unit, when a correction input is received by the correction input receiving unit, A modification control unit that gives the modified character string to the term extraction unit, and a program that functions as a query output unit that outputs a query generated by the query generation unit when a query output condition is satisfied. A computer-readable recording medium characterized by the above-mentioned.
を、 複数のタームを記憶するターム記憶部としてさらに機能
させ、 前記クエリ生成部により生成されたクエリに含まれるタ
ームが前記ターム記憶部に記憶された複数のタームのい
ずれとも一致しない場合に、当該メッセージ表示条件が
満たされることを特徴とする請求項11に記載のコンピ
ュータ読取可能な記録媒体。12. The program further causes the computer to function as a term storage unit for storing a plurality of terms, wherein a plurality of terms included in a query generated by the query generation unit are stored in the term storage unit. 12. The computer-readable recording medium according to claim 11, wherein the message display condition is satisfied when any of the terms does not match.
を、 前記クエリ生成部に与える生成パラメータの入力を受け
付けるパラメータ入力受付部としてさらに機能させ、 前記クエリ生成部により生成されるクエリは、タームの
ほか、当該タームのそれぞれに対応付けられ、当該得点
を得る際に参照される重みを含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの重みを前記パラメータ入力受付部
により入力を受け付けられた生成パラメータにより決定
し、当該タームと、これに対応付けて決定された重み
と、を含むクエリを生成することを特徴とする請求項1
1に記載のコンピュータ読取可能な記録媒体。13. The program further causes the computer to function as a parameter input receiving unit that receives an input of a generation parameter to be provided to the query generating unit. The query generated by the query generating unit includes, in addition to the terms, The query generation unit receives the weights of the terms extracted by the term extraction unit by the parameter input reception unit, the weights being associated with each of the terms and being referred to when obtaining the score. 2. A query that is determined by the generated generation parameter and includes the term and a weight determined in association with the term.
2. The computer-readable recording medium according to claim 1.
を、 前記クエリ生成部に与える生成パラメータの入力を受け
付けるパラメータ入力受付部としてさらに機能させ、 前記クエリ生成部により生成されるクエリは、タームの
ほか、文献検索エンジンが獲得する文献は当該タームを
含むものに限るか否かを示す必須ターム情報を含み、 前記クエリ生成部は、前記ターム抽出部により抽出され
たタームのそれぞれの必須ターム情報を、前記パラメー
タ入力受付部により入力を受け付けられた生成パラメー
タにより決定し、当該タームと、これに対応付けて決定
された必須ターム情報と、を含むクエリを生成すること
を特徴とする請求項11に記載のコンピュータ読取可能
な記録媒体。14. The program further causes the computer to function as a parameter input receiving unit that receives an input of a generation parameter to be given to the query generating unit. The query generated by the query generating unit includes, in addition to terms, The document acquired by the search engine includes essential term information indicating whether or not the term is limited to the term containing the term. The query generation unit sets the essential term information of each of the terms extracted by the term extraction unit to the parameter. 12. The computer according to claim 11, wherein the query is determined based on the generation parameter received by the input receiving unit, and the query including the term and essential term information determined in association with the term. A readable recording medium.
を、 前記クエリ出力部により出力されたクエリを文献に対し
て適用して得られた得点が所定の範囲に含まれる文献を
獲得する文献検索エンジン部、および、 前記文献検索エンジン部により獲得された文献を出力す
る文献出力部としてさらに機能させることを特徴とする
請求項11から14のいずれか1項に記載のコンピュー
タ読取可能な記録媒体。15. The program according to claim 1, wherein the computer obtains a document in which a score obtained by applying the query output from the query output unit to the document falls within a predetermined range. The computer-readable recording medium according to any one of claims 11 to 14, further comprising a document output unit that outputs a document obtained by the document search engine unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29779499A JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP29779499A JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001117939A true JP2001117939A (en) | 2001-04-27 |
JP3411246B2 JP3411246B2 (en) | 2003-05-26 |
Family
ID=17851265
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP29779499A Expired - Fee Related JP3411246B2 (en) | 1999-10-20 | 1999-10-20 | Query output device, document search system, query output method, document search method, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3411246B2 (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016089A (en) * | 2001-06-29 | 2003-01-17 | Hitachi Ltd | Information retrieval system and server |
JP2004110835A (en) * | 2002-09-19 | 2004-04-08 | Microsoft Corp | Method and system for retrieving confirmation text |
JP2005538583A (en) * | 2002-08-20 | 2005-12-15 | テレノール アーアスアー | System and method for accessing services, applications and / or content over a communication network |
JP2010538337A (en) * | 2007-03-30 | 2010-12-09 | マイクロソフト コーポレーション | Query generation using environment configuration |
US8386914B2 (en) | 2004-06-30 | 2013-02-26 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63261424A (en) * | 1987-04-17 | 1988-10-28 | Matsushita Electric Ind Co Ltd | Document retrieving device |
JPH0282354A (en) * | 1988-09-20 | 1990-03-22 | Fujitsu Ltd | Retrieving strategy preparing system |
JPH02176868A (en) * | 1988-12-27 | 1990-07-10 | Mitsubishi Heavy Ind Ltd | Data base retrieve device |
JPH03179563A (en) * | 1989-12-08 | 1991-08-05 | Nippon Telegr & Teleph Corp <Ntt> | Data base retrieving method |
JPH05324728A (en) * | 1992-05-18 | 1993-12-07 | Hitachi Ltd | Information retrieving device |
JPH07129622A (en) * | 1993-11-01 | 1995-05-19 | Nippon Steel Corp | Document retrieving device |
JPH07146878A (en) * | 1993-11-25 | 1995-06-06 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device |
JPH10260981A (en) * | 1997-03-19 | 1998-09-29 | Minolta Co Ltd | Information processor and method for processing information |
-
1999
- 1999-10-20 JP JP29779499A patent/JP3411246B2/en not_active Expired - Fee Related
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS63261424A (en) * | 1987-04-17 | 1988-10-28 | Matsushita Electric Ind Co Ltd | Document retrieving device |
JPH0282354A (en) * | 1988-09-20 | 1990-03-22 | Fujitsu Ltd | Retrieving strategy preparing system |
JPH02176868A (en) * | 1988-12-27 | 1990-07-10 | Mitsubishi Heavy Ind Ltd | Data base retrieve device |
JPH03179563A (en) * | 1989-12-08 | 1991-08-05 | Nippon Telegr & Teleph Corp <Ntt> | Data base retrieving method |
JPH05324728A (en) * | 1992-05-18 | 1993-12-07 | Hitachi Ltd | Information retrieving device |
JPH07129622A (en) * | 1993-11-01 | 1995-05-19 | Nippon Steel Corp | Document retrieving device |
JPH07146878A (en) * | 1993-11-25 | 1995-06-06 | Nippon Telegr & Teleph Corp <Ntt> | Information retrieval device |
JPH10260981A (en) * | 1997-03-19 | 1998-09-29 | Minolta Co Ltd | Information processor and method for processing information |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003016089A (en) * | 2001-06-29 | 2003-01-17 | Hitachi Ltd | Information retrieval system and server |
JP2005538583A (en) * | 2002-08-20 | 2005-12-15 | テレノール アーアスアー | System and method for accessing services, applications and / or content over a communication network |
JP2004110835A (en) * | 2002-09-19 | 2004-04-08 | Microsoft Corp | Method and system for retrieving confirmation text |
US7974963B2 (en) | 2002-09-19 | 2011-07-05 | Joseph R. Kelly | Method and system for retrieving confirming sentences |
US8386914B2 (en) | 2004-06-30 | 2013-02-26 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
US9697205B2 (en) | 2004-06-30 | 2017-07-04 | Google Inc. | Enhanced document browsing with automatically generated links to relevant information |
JP2010538337A (en) * | 2007-03-30 | 2010-12-09 | マイクロソフト コーポレーション | Query generation using environment configuration |
Also Published As
Publication number | Publication date |
---|---|
JP3411246B2 (en) | 2003-05-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7526474B2 (en) | Question answering system, data search method, and computer program | |
JP5264892B2 (en) | Multilingual information search | |
US20030126559A1 (en) | Generation of localized software applications | |
US20060195435A1 (en) | System and method for providing query assistance | |
WO2012000335A1 (en) | Input method and device combined with application interfaces | |
JP2000029906A (en) | System for managing document information | |
JP2004086243A (en) | Machine translation system, machine translation method and machine translation program | |
JP4049317B2 (en) | Search support apparatus and program | |
JP3411246B2 (en) | Query output device, document search system, query output method, document search method, and recording medium | |
US20050165712A1 (en) | Method for operating software object using natural language and program for the same | |
JP3444592B2 (en) | Document search device, query output device, document search method, query output method, and recording medium | |
JP2011232855A (en) | Character conversion device, character conversion system, character conversion method and program | |
JP2003296327A (en) | Translation server, genre-classified online machine translation method, and program therefor | |
JPH1145252A (en) | Information retrieval device and computer readable recording medium for recording program for having computer function as the same device | |
JP4617015B2 (en) | Document display device, document display method, and program | |
US6178415B1 (en) | Phrase retrieving/selecting method and a computer-readable recording medium with a program making a computer execute each step in the method recorded therein | |
KR20090072774A (en) | Method, apparatus and computer-readable recording medium for search with image input device | |
JP2001249935A (en) | Document digest preparation method, document retrieval davice and recording medium | |
JP4138048B2 (en) | Information retrieval device and computer-readable recording medium recording a program for causing a computer to function as the device | |
JPH1145269A (en) | Document management support system and computer readable recording medium recorded with program for functioning computer as the system | |
JP4074687B2 (en) | Summary sentence creation support system and computer-readable recording medium recording a program for causing a computer to function as the system | |
JP2002288190A (en) | System, and method for summarizing and program therefor | |
JP2001022787A (en) | Multilinguistic interactive information retrieval system and recording medium where multilinguistic interactive information retrieval program is recorded | |
JPH1145255A (en) | Document retrieval device and computer-readable recording medium where program making computer function as same device is recorded | |
JPH10207904A (en) | System and method for retrieving knowledge information |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090320 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120320 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |