JP4509918B2 - Information retrieval method and apparatus, and computer-readable recording medium - Google Patents
Information retrieval method and apparatus, and computer-readable recording medium Download PDFInfo
- Publication number
- JP4509918B2 JP4509918B2 JP2005340987A JP2005340987A JP4509918B2 JP 4509918 B2 JP4509918 B2 JP 4509918B2 JP 2005340987 A JP2005340987 A JP 2005340987A JP 2005340987 A JP2005340987 A JP 2005340987A JP 4509918 B2 JP4509918 B2 JP 4509918B2
- Authority
- JP
- Japan
- Prior art keywords
- file
- information
- score
- search
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体に係り、特に、利用者の操作履歴情報を管理し、利用者が過去に閲覧した情報を容易に検索することが可能な情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体に関する。 The present invention relates to an information search method and apparatus and a computer-readable recording medium, and in particular, information search capable of managing user operation history information and easily searching for information browsed by the user in the past. The present invention relates to a method and apparatus and a computer-readable recording medium.
従来、利用者の操作履歴を検索する方法としては、利用者端末の詳細な操作履歴を収集し、利用者が過去に閲覧したファイル毎に、利用者が経験した強さを示す経験スコアを算出し、利用者が過去に閲覧したファイルの中から重要なファイルを簡単に探し出す方法がある(例えば、特許文献1参照)。 Conventionally, as a method of searching for user operation history, a detailed operation history of the user terminal is collected, and an empirical score indicating the strength experienced by the user is calculated for each file browsed by the user in the past. In addition, there is a method of easily searching for an important file among files browsed by the user in the past (see, for example, Patent Document 1).
また、利用者が過去に閲覧したファイルの検索結果と、インターネット上のファイルの検索結果を分けて表示するツールが公開されている。
利用者が、“ある事柄についての情報”を得たいと考えており、Google(登録商標)やgoo(登録商標)を用いて検索した場合、検索結果が何百件、何千件とあり、全ての検索結果を確認できないことがある。具体的には、Google(登録商標)やgoo(登録商標)では独自のランキング方法により、検索キーワードへの適合度準に表示する。ランキングは固定的である。 When a user wants to obtain “information about a certain matter” and searches using Google (registered trademark) or goo (registered trademark), there are hundreds or thousands of search results. Not all search results can be confirmed. Specifically, Google (registered trademark) and goo (registered trademark) display in the degree of suitability to the search keyword by a unique ranking method. Ranking is fixed.
しかし、過去に見たWebページの方が利用者にとって有効である場合がある。例えば、過去に見たことがあるWebページは、“ある事柄についての情報”を理解することは、過去に見たことがないWebページに比べて容易である。どんな情報がどこに書いてあるのかをある程度推測できるため、短時間で該Webページ中の“ある事柄についての情報”に辿り着き、ポイントを抑えて、“ある事柄についての情報”を理解できる。そして、過去に利用者が経験した度合いが強いほど、利用者が短時間で理解できる可能性が高い。 However, Web pages viewed in the past may be more effective for the user. For example, a Web page that has been viewed in the past is easier to understand “information about a certain matter” than a Web page that has not been viewed in the past. Since it is possible to guess to some extent what information is written, it is possible to reach “information about a certain matter” in the Web page in a short time, and to understand “information about a certain matter” by suppressing points. And the stronger the degree that the user has experienced in the past, the higher the possibility that the user can understand in a short time.
そして、既存の技術では、過去にみたことがあるページの中から、わずかな操作履歴を利用して検索し、検索結果を表示するか、あるいは、過去に見たことがあるかないかに関わらず検索するが過去に見たページであることを考慮せず検索結果を表示している。つまり、利用者が経験した強さを示す経験スコアを十分に算出できない。 And with existing technology, search from a page you've seen in the past, using a small amount of operation history, and display the search results, or search regardless of whether you've seen it in the past However, the search results are displayed without considering that the page has been viewed in the past. In other words, an experience score indicating the strength experienced by the user cannot be calculated sufficiently.
また、従来の方法では、また、利用者が過去に閲覧したファイルの検索結果と、インターネット上のファイルの検索結果を分けて表示するため、インターネット上の検索結果が示す個々のファイルが、過去に閲覧したファイルとどれだけ関係しているのかがわからない。 Also, in the conventional method, since the search result of the file browsed by the user in the past and the search result of the file on the Internet are displayed separately, each file indicated by the search result on the Internet is displayed in the past. I don't know how related to the file I browsed.
本発明は、上記の点に鑑みなされたもので、再度閲覧することに価値があると思われる過去に強く経験した情報を容易に検索することができる情報検索方法及び装置及びコンピュータ読み取り可能な記録媒体を提供することである。 The present invention has been made in view of the above points, an information search method and apparatus, and a computer-readable record capable of easily searching for information that has been strongly experienced in the past that seems to be valuable for browsing again. To provide a medium.
図1は、本発明の原理を説明するための図である。 FIG. 1 is a diagram for explaining the principle of the present invention.
本発明(請求項1)は、操作履歴情報を検索する情報検索方法であって、
要求元から検索要求を受け取ると、ファイル検索手段が、該検索要求に基づいて、該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索ステップ(ステップ1)と、
スコア算出手段が、ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出ステップ(ステップ2)と、
類似度算出手段が、前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出ステップ(ステップ3,4)と、
検索管理手段が、前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力ステップ(ステップ5,6)と、を行う。
と、を行う。
The present invention (Claim 1) is an information retrieval method for retrieving operation history information,
When a search request is received from the request source, a file search step (step 1) in which the file search means searches for an information body (file) browsed in the past by a user who matches the search request based on the search request. ,
Based on the storage location information of the file, the score calculation means indicates the strength that the user has experienced using the file suitability score indicating the degree of suitability for the search request for each file or the operation history information in the operation history database. A score calculation step (step 2) for calculating an experience score represented for each file operated on the PC, and calculating an integrated score obtained by integrating the file fitness score and the experience score;
Similarity calculation means for calculating a similarity between a file obtained as a result of searching an arbitrary range of information including files not browsed by the user and a file browsed in the past (step 3, 4)
The search management means performs an output step (
And do.
また、本発明(請求項2)は、要求元から、検索要求へのファイル適合スコア、経験スコア及び統合スコアを計算する方法を指定する識別子を受け取るステップと、
スコア算出ステップにおいて、
識別子に応じて、検索要求へのファイル適合スコア、経験スコア及び統合スコアの計算方法を変更し、該ファイル適合スコア、該経験スコア及び該統合スコアの計算を行うステップと、を行う。
The present invention (Claim 2) receives, from the requester, an identifier that specifies a method for calculating a file suitability score, an experience score, and an integrated score for a search request;
In the score calculation step,
According to the identifier, the method of calculating the file suitability score, the experience score, and the integrated score for the search request is changed, and the file suitability score, the experience score, and the integrated score are calculated.
また、本発明(請求項3)は、要求元から、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を受け取るステップと、
表示優先度調整情報を利用して表示優先度を算出するステップと、を行う。
Further, the present invention (Claim 3) receives, from the request source, display priority adjustment information that specifies a method for calculating the display priority from the similarity and the integrated score;
Calculating display priority using display priority adjustment information.
また、本発明(請求項4)は、操作履歴取得手段が、
PC上のメッセージ電文及び、該PC上で作動しているプログラムとの通信を利用して、利用者のPCを操作した履歴を取得するステップと、
利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得するステップと、
利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして操作履歴データベースに保存するステップと、
情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報データベースに保存するステップと、を行う。
In the present invention (Claim 4), the operation history acquisition means includes:
Using a message message on a PC and communication with a program operating on the PC to obtain a history of operating the user's PC;
Obtaining an identifier for identifying information viewed by the user from a history of operating the user's PC;
Based on an identifier for identifying information browsed by the user, obtaining the information body browsed in the past by the user, and storing it in the operation history database as a file;
Acquiring attribute information of the information body and storing it in the file attribute information database as file attribute information.
図2は、本発明の原理構成図である。 FIG. 2 is a principle configuration diagram of the present invention.
本発明(請求項5)は、操作履歴情報を検索する情報検索装置であって、
利用者のパーソナルコンピュータ(PC)を操作した履歴である操作履歴情報を操作履歴データベース109と、
要求元から取得した検索要求に基づいて、該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索手段103と、
ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベース109の操作履歴情報を用いて利用者が経験した強さをPC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出手段112と、
利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出手段107と、
類似度と統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力手段102と、を有する。
The present invention (Claim 5) is an information retrieval apparatus for retrieving operation history information,
The
Based on a search request acquired from a request source, a file search means 103 for searching an information body (file) browsed in the past by a user who matches the search request;
Based on the storage location information of the file, the file conformity score indicating the degree of conformity to the search request for each file or the strength experienced by the user using the operation history information of the
A similarity calculation means 107 for obtaining a similarity between a file as a result of searching information in an arbitrary range including a file that is not browsed by a user and a file browsed in the past;
Output means 102 for outputting a search result based on the display priority obtained from the similarity and the integrated score.
本発明(請求項6)は、コンピュータに、
請求項1乃至4記載の情報検索方法の各ステップを実行させる情報検索プログラムを格納したコンピュータ読み取り可能な記録媒体である。
The present invention (Claim 6) provides a computer with:
A computer-readable recording medium storing an information search program for executing each step of the information search method according to
上記のように本発明によれば、インターネット上の情報を検索するとき、検索結果に示される個々のファイルに対して、過去に経験した強さを考慮しながら、関連する過去に見たことがあるWebページを表示することができる。過去により強く経験したファイルは、過去に行っていた行動を代表的に示すファイルである可能性が高いと考えられるため、例えば、サムネイルを一瞬見るだけで過去に行っていた行為をより短時間に思い出すことも可能となる。また、過去に強く経験した情報は、再度閲覧した場合に、過去に弱く(例えば、短い時間だけ)経験した情報に比べて、比較的短時間で情報の内容が取得できると思われる。本発明により、再度閲覧することに価値があると思われる過去に強く経験した情報を容易に検索することができる。 As described above, according to the present invention, when searching for information on the Internet, the individual files shown in the search results are viewed in the past in consideration of the strength experienced in the past. A certain web page can be displayed. Files that have been experienced more strongly in the past are more likely to be representative files of actions that have been taken in the past. You can also remember. In addition, information that has been strongly experienced in the past can be acquired in a relatively short time when viewed again, compared to information that has been weakly experienced in the past (for example, only for a short time). According to the present invention, it is possible to easily search for information that has been strongly experienced in the past that is considered worthwhile to be browsed again.
また、インターネット上の検索結果の内容やURLに類似した過去に閲覧したファイルを容易に発見することができる。 Further, it is possible to easily find a file browsed in the past similar to the contents of search results on the Internet and URLs.
また、内容やURLの類似性と、過去に経験した強さのどちらを優先して、過去に閲覧したファイルを表示するかを、利用者が簡単に指定することができる。 In addition, the user can easily specify which of the similarities between contents and URL and the strength experienced in the past is prioritized to display a file browsed in the past.
以下、図面と共に本発明の実施の形態を説明する。 Hereinafter, embodiments of the present invention will be described with reference to the drawings.
図3は、本発明の一実施の形態における検索装置の構成を示す。 FIG. 3 shows a configuration of the search device according to the embodiment of the present invention.
同図に示す検索装置100は、情報検索端末(IE)200、外部検索エンジン(goo(登録商標))300、Webサーバ400と接続されている。
A
検索装置100は、情報検索端末200からの検索要求に基づいて、インターネットの上の検索結果の個々のファイルに対して、関係のある過去に閲覧したファイルを付加して提示する。
Based on a search request from the
検索装置100は、操作履歴取得部101、検索管理部102、ファイル検索部103、経験スコア算出部104、統合スコア算出部105、全ページ検索部106、類似度算出部107、表示優先度算出部108、操作履歴DB(データベース)109、ファイル属性情報DB(データベース)110、過去操作ファイル蓄積部111から構成される。
The
操作履歴取得部101は、PC上のメッセージ電文及び、PC上で作動しているプログラムとの通信を利用して、利用者のPCを操作した履歴を取得して、当該利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得し、利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして操作履歴データベース109に保存する。また、操作履歴取得部101は、情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報DB110に保存する。
The operation
検索管理部102は、情報検索端末200より以下の情報を取得する。
・検索要求(検索キーワード);
・検索要求へのファイル適合スコアを計算する方法を指定する識別子;
・検索要求への統合スコアを計算する方法を指定する識別子;
・検索要求への経験スコアを計算する方法を指定する識別子;
・類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報;
検索要求及び、検索要求へのファイル適合スコアを計算する方法を指定する識別子をファイル検索部103に転送する。また、検索要求への経験スコアを計算する方法を指定する識別子を経験スコア算出部104に転送する。また、検索要求への統合スコアを計算する方法を指定する識別子を統合スコア算出部105に転送する。さらに、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を表示優先度算出部108に転送する。また、検索要求を全ページ検索部106に転送する。
The
・ Search request (search keyword);
An identifier that specifies how to calculate the file suitability score for a search request;
An identifier that specifies how to calculate the integrated score for the search request;
An identifier that specifies how to calculate the experience score for a search request;
Display priority adjustment information for specifying a method for calculating the display priority from the similarity and the integrated score;
The search request and an identifier for designating a method for calculating the file suitability score for the search request are transferred to the
また、検索管理部102は、各構成要素とやり取りを行い、総合スコア算出部105から取得した利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果に、表示優先度算出部108から取得した表示優先度が高い過去に閲覧したファイルを関連付けて表示するための検索結果表示ファイルを作成し、それを検索要求元の情報検索端末200に送信する。
In addition, the
ファイル検索部103は、要求元からの検索要求に基づいて、利用者が過去に閲覧した情報本体(ファイル)の格納場所情報を操作履歴データベース109より取得し、格納場所情報に基づいて、利用者が過去に閲覧したファイルを、過去操作ファイル蓄積部111の該ファイル内の文章及びファイル属性によって検索する。また、情報検索端末200から取得した検索要求へのファイル適合スコアを計算する方法を指定する識別子に基づいて、ファイル毎に適合度を表すファイル適合スコアを算出し、メモリ(図示せず)に格納する。
Based on the search request from the request source, the
経験スコア算出部104は、検索管理部102を介して取得した、検索要求への経験スコアを計算する方法を指定する識別子に基づいて、操作履歴データベース109の操作履歴情報より、利用者が経験した強さをPC上で動作させたファイル毎に表す経験スコアを算出し、メモリ(図示せず)に格納する。
The experience
統合スコア算出部105は、検索管理部102を介して取得した検索要求への統合スコアを計算する方法を指定する識別子に基づいて、操作履歴情報を利用して、ファイル検索部103のメモリ(図示せず)に格納されているファイル毎のファイル適合スコアと、経験スコア算出部103のメモリ(図示せず)に格納されているファイル毎の経験スコアを統合した統合スコアを算出し、メモリ(図示せず)に格納する。
The integrated
全ページ検索部106は、外部検索エンジン300から、利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索を行い、検索結果を類似度算出部107に転送する。
The all-
類似度算出部107は、全ページ検索部106から利用者が閲覧していないファイルを含む任意の範囲情報を母集団として検索した結果のファイルを取得し、当該検索した結果のファイル(URL)に基づいてWebサーバ400にアクセスし、結果を取得し、当該結果と過去に閲覧したファイルとの類似度を計算し、メモリ(図示せず)に格納する。
The
表示優先度算出部108は、検索管理部102を介して取得した、類似度と統合スコアから表示優先度を算出する方法を指定する表示優先度調整情報を利用して、類似度算出部107のメモリ(図示せず)に格納されている類似度と、統合スコア算出部105のメモリ(図示せず)に格納されている統合スコアから表示優先度を算出する。
The display
次に、上記の構成における動作を説明する。 Next, the operation in the above configuration will be described.
まず、操作履歴取得部101が操作履歴を取得する方法を説明する。
First, a method in which the operation
操作履歴DB109は、図4、図5に示すように、Web操作履歴テーブル、IME入力テーブル、印刷テーブル、Webファイルテーブル、メールファイルテーブルを有する。
As illustrated in FIGS. 4 and 5, the
Web操作履歴テーブル(図4(a))は、File-Key(情報本体のハッシュ値(MD5))、閲覧開始時間、閲覧終了時間の項目から構成される。 The Web operation history table (FIG. 4A) includes items of File-Key (information body hash value (MD5)), browsing start time, and browsing end time.
IME入力テーブル(図4(b))は、発生時間と入力内容の項目から構成される。 The IME input table (FIG. 4B) is composed of items of occurrence time and input contents.
印刷テーブル(図4(c))、は、発生時間、ファイル種別、File-keyの項目から構成される。 The print table (FIG. 4C) is composed of items of occurrence time, file type, and file-key.
Webファイルテーブル(図5(d))は、Content-Key(情報本体のハッシュ値(MD5))、過去に見たWebページを保存したファイル名、作者、タイトル、更新日、インターネット上で公開されていたURLの項目から構成される。 The web file table (FIG. 5 (d)) is published on the Internet as Content-Key (hash value of information body (MD5)), file name storing the web page seen in the past, author, title, update date. It consists of the items of the URL that has been.
図6は、本発明の一実施の形態における操作履歴取得部における操作履歴情報の登録動作を示す図である。 FIG. 6 is a diagram showing an operation history information registration operation in the operation history acquisition unit according to the embodiment of the present invention.
・Web:
操作履歴取得部101は、キーボードイベントやマウスイベントやアクティブになっているウィンドウの状態変化イベントが生じたときに、Windows(登録商標)OS上でグローバルに通信されているウィンドウメッセージを取得(フック)し(ステップ101)、今どのプログラムがユーザによって操作されているかを特定する(ステップ102)。また、どのウィンドウがアクティブになった、あるいは非アクティブになったということを取得できる。本実施の形態では、Micro Soft Corporationのインターネットエクスプローラ(登録商標)(以下、IEと記す)であったとして説明する。
・ Web:
The operation
次に、プログラム間通信によってIEと通信し(ステップ103)、IEのウィンドウ上で現在表示しているホームページのURLと、表示している情報本体(多くの場合HTMLファイル)を取得する(ステップ104)。 Next, it communicates with the IE through inter-program communication (step 103), and acquires the URL of the home page currently displayed on the IE window and the displayed information body (in many cases, an HTML file) (step 104). ).
次に、当該情報本体のMD5ハッシュ値を計算し、この値を、コンテンツを一意に識別するContent-keyとする(ステップ105)。 Next, the MD5 hash value of the information body is calculated, and this value is set as a Content-key for uniquely identifying the content (step 105).
次に、情報本体をPCの過去操作ファイル蓄積部111に『過去に見たファイル』として保存する(ステップ106)。
Next, the information body is stored in the past operation
次に、上記ウィンドウメッセージに含まれるウィンドウのアクティブ化の時間を当該URLの閲覧開始時間であると推定し(ステップ107)、操作履歴DB109に閲覧開始時間と情報本体のMD5ハッシュ値をWeb操作履歴テーブル(図4(a))に登録する(ステップ108)。
Next, the activation time of the window included in the window message is estimated to be the browsing start time of the URL (step 107), and the browsing start time and the MD5 hash value of the information body are stored in the
次に、操作履歴取得部101は、上記の情報本体を解析した結果と、既に取得した上記の情報を用いて、情報本体の属性情報である、作者、タイトル、更新日、情報本体のMD5ハッシュ値、インターネットで公開されていたURL、当該情報本体を保存したファイル名(フルパス)をWebファイルテーブル(図5(d))に保存する(ステップ109)。その後、操作履歴取得部101が上記のウィンドウメッセージに含まれるウィンドウの非アクティブ化のメッセージを受け取ると(ステップ110)、その時間を当該URLの閲覧終了時間であると推定し(ステップ111)、操作履歴DB109のWeb操作履歴テーブル(図4(a))に閲覧終了時間を登録する(ステップ112)。
Next, the operation
・e−mail:
上記のウィンドウメッセージの取得(フック)により、IME入力をその発生時間と共に操作履歴DBのIME入力テーブル(図4(b))に保存する。
・ E-mail:
By acquiring (hooking) the window message, the IME input is stored in the IME input table (FIG. 4B) in the operation history DB together with the generation time.
・印刷:
また、プリンタスプールへの問い合わせにより、印刷イベントを、その発生時間と共に操作履歴として操作履歴DB109の印刷テーブル(図4(c))に格納する。
·printing:
In response to an inquiry to the printer spool, the print event is stored in the print table (FIG. 4C) of the
次に、検索装置100が検索を行う手順を説明する。以下では、上記のようにして蓄積された操作履歴DB109を利用するものとする。
Next, a procedure in which the
図7は、本発明の一実施の形態における検索動作を示す図である。 FIG. 7 is a diagram showing a search operation in one embodiment of the present invention.
検索管理部102は、情報検索端末200から、検索キーワードと表示優先算出方法指定情報(β=0.6)と統合スコア計算方法識別子(a:『優先作者=太郎:それ以外=デフォルト』、b:『閲覧時間5分以上は切り捨てる;それ以外=デフォルト』、c:『(経験重み係数α,ファイル適合重み係数1−α)=(0.7,0.3)』)を受け取る(ステップ201)。
The
検索管理部102は、操作履歴DB109を検索することにより、過去に見たファイルと過去に見たメールが保存されているContent-keyとファイルパスのリストを取得する(ステップ202)。
The
検索管理部102は、検索キーワードとContent-keyとファイルパスのリストと統合スコア計算方法識別子a『優先作者=太郎:それ以外=デフォルト』とをファイル検索部103に送る(ステップ203)。
The
ファイル検索部103は、検索キーワードとファイルパスのリストを用いて、過去操作ファイル蓄積部111から過去に見たファイルと過去に見たメールを検索し(ステップ204)、ファイル適合スコアを算出する(ステップ205)。このとき、作者が「太郎」であるファイルまたは、メールかどうかをファイル属性で110にアクセスすることで調べ、作者が「太郎」であるファイルのファイル適合スコアを2倍する。また、検索キーワードを含まない(検索にヒットしない)ファイルとメールのファイル適合スコアは“0”とする。ファイル検索部103は、Content-keyとファイル適合スコアのペアのリストを検索管理部102に送信する(ステップ206)。
The
検索管理部102は、Content-keyと統合スコア計算方法識別子b『閲覧時間5分以上は切り捨てる:それ以外=デフォルト』を経験スコア算出部104に送信する(ステップ207)。経験スコア算出部104は、操作履歴DB109にアクセスして、過去に閲覧されたファイルの閲覧時間長さを計算し(ステップ208)、経験スコアを計算する(ステップ209)。この計算は、図9に示す式で計算する。但し、閲覧時間5分以上は切り捨てて閲覧された時間を5分とする。そして、Content-keyと経験スコアと閲覧期間のペアのリスト(例えば
『(Content-key 閲覧監視、閲覧収容時間、経験スコア)=(Fasfasfafadfasdfga, 2004/09/01/09:11:55,2003/09/01/09:12:45,170)』
を検索管理部102に返信する(ステップ210)。
The
Is returned to the search management unit 102 (step 210).
検索管理部102は、Content-keyと経験スコアとファイル適合スコアのペアのリスト、計算方法識別子=『(経験重み係数α、ファイル適合重み係数1−α)=(0.7,0.3)』を統合スコア算出部105に送信する(ステップ211)。
The
統合スコア算出部105は、Content-keyと経験スコアとファイル適合スコアのペアのリスト、計算方法識別子=『(経験重み係数α、ファイル適合重み係数1−α)=(0.7,0.3)』を利用して統合スコアを算出する(ステップ212)。この統合スコアの算出は、経験スコアにα=0.7を乗じた値と、ファイル適合スコアに(1−α)=0.3を乗じた値との和を計算し、統合スコアとする。統合スコア時間関数は、任意の時間にキーワードに適合したファイルをどれだけ深く経験していたかを示す指標である。統合スコア算出部105は、Content-keyと統合スコアのペアのリストを検索管理部102に送信する(ステップ213)。
The integrated
検索管理部102は、全ページ検索部106に検索キーワードを送信する(ステップ214)。
The
全ページ検索部106は、ユーザが過去に閲覧していないファイルを含むインターネット上の検索可能な全ての範囲のファイルを検索できる外部検索エンジン300(例えば、goo(登録商標)、Google(登録商標)等と通信し、検索キーワードに適合するURL、要約文、タイトルを上位100件分取得する(ステップ215)。
The all-
全ページ検索部106は、該検索キーワードに適合するURL、要約文、タイトルを検索管理部102に送信する(ステップ216)。
The all-
検索管理部102は、当該URL(100件分)、過去に閲覧したファイルのContent-keyと、当該Content-keyの情報本体を保存したファイル名(フルパス)を類似度算出部107に送信する(ステップ217)。
The
類似度計算部107は、当該URL(100件分)を利用してWebサーバ400にアクセスし、URLの示すファイル(100件分)を取得する(ステップ218)。次に、各ファイルと過去に閲覧したそれぞれのContent-keyのファイルとのテキスト類似度を算出する(ステップ219)。これは、文書内に出現する単語ベクトルのコサイン類似度を用いて行うなど、既存の技術で実現できる。
The
次に、そのファイルと過去に閲覧したそれぞれのContent-keyのファイルのURLの類似度(=URL類似度)を計算する(ステップ220)。例えば、URL類似度は、URLが完全に一致すれば、1ポイント、サイトのみが同じであれば、0.5ポイント、URLのサイトとそれ以下の一部のパスが同じであれば0.5ポイント、別のサイトであれば、0ポイントとする。 Next, the URL similarity (= URL similarity) between the file and each Content-key file browsed in the past is calculated (step 220). For example, the URL similarity is 0.5 points if the URLs completely match and 0.5 points if only the site is the same, and 0.5 points if the URL site and the part of the path below it are the same. Points, 0 points for other sites.
類似度は、テキスト類似度と、URL類似度の和とする。 The similarity is the sum of the text similarity and the URL similarity.
類似度算出部107は、100件の各URLと過去に閲覧したそれぞれのContent-key
のファイルとの類似度を検索管理部102に送信する(ステップ221)。
The
The similarity to the file is transmitted to the search management unit 102 (step 221).
検索管理部102は、100件のURLと過去に閲覧したContent-keyのファイルとの類似度と、Content-keyとのリストと、表示優先度算出方法指定情報(β=0.6)を表示優先度算出部108に送信する(ステップ222)。
The
表示優先度算出部108は、類似度算出部107から100件のURLと過去に閲覧したContent-keyのファイルとの類似度とContent-keyとのリストと、検索管理部102から表示優先度算出方法指定情報(β=0.6)を受け取る。表示優先度算出部108は、各URLに表示する、過去に閲覧したContent-keyのファイルの表示優先度を算出する(ステップ223)。算出方法を図10に示す。表示優先度算出部108は、URLと、それぞれのURLに対する過去に閲覧したContent-keyのファイルの優先度を検索管理部102に送信する(ステップ224)。
The display
検索管理部102は、それぞれのURLに対し、過去に閲覧したContent-keyのファイルのうち表示優先度の高い3件のファイルを選択し、それぞれのURLに対して、表示優先度の高い順に表示する検索結果表示ファイルを作成する(ステップ225)。次に、情報検索端末200に検索結果表示ファイルを送信する(ステップ226)。情報検索端末200に表示する画面イメージを図11に示す。
For each URL, the
情報検索端末200を操作するユーザは、検索要求を行う際に、検索キーワードを入力できる。また、コンテンツの類似度と、過去に経験した度合いである経験スコアの重み付けを調整し、それぞれのURLに対し、過去に閲覧したContent-keyのファイルの中で実際に表示する表示優先度の高い3件のファイルを変更する表示優先度情報を調節するバーと、統合スコア計算のための経験スコアとファイル適合スコアの重み付けを調節するバーを操作できる。
A user who operates the
また、利用者の操作履歴は、操作履歴取得部101より取得される場合もあれば、インターネットエクスプローラ(登録商標)などの他の利用者端末のアプリケーションからの登録要求により登録される場合もある。また、利用者が閲覧したい情報を要求したWebサーバから登録される場合もある。
The user's operation history may be acquired from the operation
なお、上記の実施の形態における検索装置100の動作をプログラムとして構築し、単独のサーバ、あるいは、既存のサーバ、あるいは、利用者端末にインストールする、または、ネットワークを介して流通させることができる。
Note that the operation of the
また、構築されたプログラムを、ハードディスク装置や、フレキシブルディスク・CD−ROM等の可搬記憶媒体に格納しておき、単独のサーバ、あるいは、既存のサーバ、あるいは、利用者端末にインストールする、または、配布することが可能である。 In addition, the constructed program is stored in a portable storage medium such as a hard disk device or a flexible disk / CD-ROM, and installed in a single server, an existing server, or a user terminal, or It is possible to distribute.
なお、本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。 The present invention is not limited to the above-described embodiment, and various modifications and applications can be made within the scope of the claims.
本発明は、利用者のPCの操作内容を検索する技術に適用可能である。 The present invention can be applied to a technique for searching for operation contents of a user's PC.
100 情報検索装置
101 操作履歴取得部
102 検索管理手段、検索管理部
103 ファイル検索手段、ファイル検索部
104 経験スコア算出手段、経験スコア算出部
105 統合スコア算出手段、統合スコア算出部
106 全ページ検索手段、全ページ検索部
107 類似度算出手段、類似度算出部
108 表示優先度算出手段、表示優先度算出部
109 操作履歴DB(データベース)
110 ファイル属性DB(データベース)
111 過去操作ファイル蓄積部
112 スコア算出手段
200 情報検索端末(IE)
300 外部検索エンジン
400 Webサーバ
DESCRIPTION OF
110 File attribute DB (database)
111 Past operation
300
Claims (6)
要求元から検索要求を受け取ると、ファイル検索手段が、該検索要求に基づいて該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索ステップと、
スコア算出手段が、ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコア、または、操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出ステップと、
類似度算出手段が、前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出ステップと、
検索管理手段が、前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力ステップと、
を行うことを特徴とする情報検索方法。 An information search method for searching operation history information,
When receiving a search request from the request source, the file search means searches for an information body (file) browsed in the past by a user who matches the search request based on the search request;
Based on the storage location information of the file, the score calculation means indicates the strength that the user has experienced using the file suitability score indicating the degree of suitability for the search request for each file or the operation history information in the operation history database. A score calculation step of calculating an experience score represented for each file operated on the PC, and calculating an integrated score obtained by integrating the file suitability score and the experience score;
Similarity calculation means, a similarity calculation step for obtaining a similarity between a file as a result of searching information in an arbitrary range including a file that the user has not browsed as a population, and a file browsed in the past,
An output step for the search management means to output a search result based on the display priority obtained from the similarity and the integrated score;
An information retrieval method characterized by:
前記スコア算出ステップにおいて、
前記識別子に応じて、前記検索要求への前記ファイル適合スコア、前記経験スコア及び前記統合スコアの計算方法を変更し、該ファイル適合スコア、該経験スコア及び該統合スコアの計算を行うステップと、
を行う請求項1記載の情報検索方法。 Receiving from the requester an identifier specifying a method for calculating a file conformity score to the search request, the experience score, and the integrated score;
In the score calculating step,
According to the identifier, changing the calculation method of the file suitability score, the experience score, and the integrated score for the search request, and calculating the file suitability score, the experience score, and the integrated score;
The information search method according to claim 1, wherein:
前記表示優先度調整情報を利用して表示優先度を算出するステップと、
を行う請求項1記載の情報検索方法。 Receiving display priority adjustment information for designating a method for calculating the display priority from the similarity and the integrated score from the requester;
Calculating display priority using the display priority adjustment information;
The information search method according to claim 1, wherein:
前記PC上のメッセージ電文及び、該PC上で作動しているプログラムとの通信を利用して、前記利用者のPCを操作した履歴を取得するステップと、
前記利用者のPCを操作した履歴から、該利用者が閲覧した情報を特定する識別子を取得するステップと、
前記利用者が閲覧した情報を特定する識別子に基づいて、該利用者が過去に閲覧した情報本体を取得し、ファイルとして前記操作履歴データベースに保存するステップと、
前記情報本体の属性情報を取得し、ファイル属性情報としてファイル属性情報データベースに保存するステップと、
を行う請求項1記載の情報検索方法。 The operation history acquisition means
Obtaining a history of operating the user's PC using communication with a message message on the PC and a program operating on the PC;
Obtaining an identifier for identifying information viewed by the user from a history of operating the user's PC;
Based on an identifier for identifying information browsed by the user, obtaining an information body browsed in the past by the user, and storing it in the operation history database as a file;
Obtaining attribute information of the information body and storing it in a file attribute information database as file attribute information;
The information search method according to claim 1, wherein:
利用者のパーソナルコンピュータ(PC)を操作した履歴である操作履歴情報を操作履歴データベースと、
要求元から取得した検索要求に基づいて、該検索要求に基づいて該検索要求に適合する利用者が過去に閲覧した情報本体(ファイル)を検索するファイル検索手段と、
ファイルの格納場所情報に基づいて、ファイル毎に検索要求への適合度を表すファイル適合スコアまたは、前記操作履歴データベースの操作履歴情報を用いて前記利用者が経験した強さを前記PC上で動作させたファイル毎に表す経験スコアを算出し、該ファイル適合スコアと該経験スコアを統合した統合スコアを算出するスコア算出手段と、
前記利用者が閲覧していないファイルを含む任意の範囲の情報を母集団として検索した結果のファイルと、過去に閲覧したファイルとの類似度を求める類似度算出手段と、
前記類似度と前記統合スコアから求めた表示優先度に基づいて、検索結果を出力する出力と、
を有することを特徴とする情報検索装置。 An information retrieval device for retrieving operation history information,
Operation history information, which is a history of operating a user's personal computer (PC), an operation history database,
Based on a search request acquired from a request source, a file search means for searching an information body (file) browsed in the past by a user who matches the search request based on the search request;
Based on the storage location information of the file, the file conformity score indicating the degree of conformity to the search request for each file or the strength experienced by the user using the operation history information of the operation history database is operated on the PC. A score calculation means for calculating an experience score represented for each file and calculating an integrated score obtained by integrating the file conformity score and the experience score;
Similarity calculation means for obtaining a similarity between a file as a result of searching an arbitrary range of information including a file that is not browsed by the user and a file browsed in the past,
Based on the display priority obtained from the similarity and the integrated score, an output for outputting a search result;
An information retrieval apparatus comprising:
請求項1乃至4記載の情報検索方法の各ステップを実行させる情報検索プログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。 On the computer,
5. A computer-readable recording medium storing an information search program for executing each step of the information search method according to claim 1.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005340987A JP4509918B2 (en) | 2005-11-25 | 2005-11-25 | Information retrieval method and apparatus, and computer-readable recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005340987A JP4509918B2 (en) | 2005-11-25 | 2005-11-25 | Information retrieval method and apparatus, and computer-readable recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007148688A JP2007148688A (en) | 2007-06-14 |
JP4509918B2 true JP4509918B2 (en) | 2010-07-21 |
Family
ID=38210049
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005340987A Active JP4509918B2 (en) | 2005-11-25 | 2005-11-25 | Information retrieval method and apparatus, and computer-readable recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4509918B2 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4510109B2 (en) * | 2008-03-24 | 2010-07-21 | 富士通株式会社 | Target content search support program, target content search support method, and target content search support device |
JP5504722B2 (en) | 2009-07-15 | 2014-05-28 | 富士ゼロックス株式会社 | Information processing apparatus and computer program |
JP5478530B2 (en) * | 2011-02-15 | 2014-04-23 | 日本電信電話株式会社 | Presentation method, apparatus, and program |
JP5891875B2 (en) | 2012-03-19 | 2016-03-23 | 富士ゼロックス株式会社 | Information processing apparatus and information processing program |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099568A (en) * | 2000-09-22 | 2002-04-05 | Yafoo Japan Corp | WWW server with personal bookmark automatic creation function |
JP2003178094A (en) * | 2001-12-12 | 2003-06-27 | Sharp Corp | Information processor, information processing program therefor and recording medium with the program recorded thereon |
JP2004070390A (en) * | 2002-08-01 | 2004-03-04 | Nippon Telegr & Teleph Corp <Ntt> | Device and program for assisting reuse of message and medium recording this program |
JP2004279049A (en) * | 2003-03-12 | 2004-10-07 | Matsushita Electric Ind Co Ltd | Camera position calculation system |
JP2005174138A (en) * | 2003-12-12 | 2005-06-30 | Nippon Telegr & Teleph Corp <Ntt> | Content retrieval method, system, and program, and program recording medium |
-
2005
- 2005-11-25 JP JP2005340987A patent/JP4509918B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002099568A (en) * | 2000-09-22 | 2002-04-05 | Yafoo Japan Corp | WWW server with personal bookmark automatic creation function |
JP2003178094A (en) * | 2001-12-12 | 2003-06-27 | Sharp Corp | Information processor, information processing program therefor and recording medium with the program recorded thereon |
JP2004070390A (en) * | 2002-08-01 | 2004-03-04 | Nippon Telegr & Teleph Corp <Ntt> | Device and program for assisting reuse of message and medium recording this program |
JP2004279049A (en) * | 2003-03-12 | 2004-10-07 | Matsushita Electric Ind Co Ltd | Camera position calculation system |
JP2005174138A (en) * | 2003-12-12 | 2005-06-30 | Nippon Telegr & Teleph Corp <Ntt> | Content retrieval method, system, and program, and program recording medium |
Also Published As
Publication number | Publication date |
---|---|
JP2007148688A (en) | 2007-06-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4908094B2 (en) | Information processing system, information processing method, and information processing program | |
US7890485B2 (en) | Knowledge management tool | |
JP4638439B2 (en) | Personalized web search | |
US7783644B1 (en) | Query-independent entity importance in books | |
JP5384837B2 (en) | System and method for annotating documents | |
JP5074378B2 (en) | Fact Query Engine user interface with snippets from information sources including query terms and response terms | |
US7730054B1 (en) | Systems and methods for providing searchable prior history | |
JP5222581B2 (en) | System and method for annotating documents | |
US20120124038A1 (en) | Variable Length Snippet Generation | |
JP2007517308A (en) | Method and system for improving search ranking using article information | |
US9361375B2 (en) | Building a research document based on implicit/explicit actions | |
JP2004213675A (en) | Search of structured document | |
JP2008507041A (en) | Personalize the ordering of place content in search results | |
JP2007188352A (en) | Page reranking device, page reranking program | |
JP2009282957A (en) | Document processing system and document processing method | |
JP2010128928A (en) | Retrieval system and retrieval method | |
JP5194731B2 (en) | Document relevance calculation system, document relevance calculation method, and document relevance calculation program | |
JP4750628B2 (en) | Information ranking method and apparatus, program, and computer-readable recording medium | |
JP4610543B2 (en) | Period extracting device, period extracting method, period extracting program implementing the method, and recording medium storing the program | |
JP4509918B2 (en) | Information retrieval method and apparatus, and computer-readable recording medium | |
JP4445849B2 (en) | File search method, file search device, and file search program | |
JP4567581B2 (en) | Operation search method and apparatus, and computer-readable recording medium | |
JP2002049638A (en) | Document information search device, method, document information search program, and computer-readable recording medium storing document information search program | |
JP4528203B2 (en) | File search method, file search device, and file search program | |
JP2007310808A (en) | Browsing place retrieval method, device and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100408 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100427 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100428 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130514 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4509918 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140514 Year of fee payment: 4 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |