JP2005099964A - Retrieval classifying system, retrieval classifying server, program and recording medium - Google Patents
Retrieval classifying system, retrieval classifying server, program and recording medium Download PDFInfo
- Publication number
- JP2005099964A JP2005099964A JP2003330849A JP2003330849A JP2005099964A JP 2005099964 A JP2005099964 A JP 2005099964A JP 2003330849 A JP2003330849 A JP 2003330849A JP 2003330849 A JP2003330849 A JP 2003330849A JP 2005099964 A JP2005099964 A JP 2005099964A
- Authority
- JP
- Japan
- Prior art keywords
- search
- category
- log
- unit
- retrieval
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、検索分類システム、検索分類サーバ、プログラムおよび記録媒体に関し、具体的には、ネットワーク上に存在する情報を検索するときに人気のある情報を容易に入手できる検索技術に関し、特に、企業や団体が自分のWWWサイトやイントラネット専用の検索エンジンを構築する場合に利用して好適である。 The present invention relates to a search classification system, a search classification server, a program, and a recording medium. More specifically, the present invention relates to a search technique that can easily obtain popular information when searching for information existing on a network. It is suitable for use when a search engine dedicated to a WWW site or an intranet is constructed by a group or organization.
従来、WWW(World Wide Web)上のウェブページを検索するときには、検索ロボットを用いて収集したウェブページをデータベース化しておく。つぎに、このデータベースに対して、ネットワークを介してユーザが検索条件を入力すると、この入力した単語とマッチングしたウェブページがどのサイトにあるかを提供してくれる。あるいは、検索エンジンを提供する会社が収集したウェブページを分類しておき、この分類ツリーを辿るようにして、所望のウェブページを捜し出す。 Conventionally, when searching web pages on the WWW (World Wide Web), web pages collected using a search robot are stored in a database. Next, when the user inputs a search condition to the database via the network, the database provides the site where the web page matching the input word is located. Alternatively, web pages collected by a company that provides a search engine are classified, and a desired web page is searched by following the classification tree.
このように多々あるウェブページの中からみんながよく利用している人気のあるウェブページを知るには、
(1)ウェブページをよく知る人からの評判・評価を聞くか、
(2)ウェブページがアクセスされたアクセス回数によるか、
(3)ウェブページの管理者が恣意的に付けた人気度マークによるか
によって知ることができる。
To find out which of these many web pages are popular,
(1) Ask about reputation and evaluation from people who know web pages well,
(2) Depending on the number of times the web page was accessed,
(3) It is possible to know whether it is based on a popularity mark arbitrarily given by the administrator of the web page.
例えば、特許文献1では、複数のホームページが登録されたサーチエンジンシステムにおいて、前記ホームページごとの人気度を取得し、ホームページごとのURLと検索用文書と前記人気度とをデータベースに蓄え、検索用キーワードをサーチエンジンの利用者から受信し、検索用キーワードがURL(Uniform Resource Locator)または検索用文書とマッチングするウェブページを抽出し、この抽出されたウェブページを人気度に基づいて順序づけを行い、この順序づけられた結果をサーチエンジンの利用者へ送信することにより、知りたい情報のあるウェブページの中から、みんながよく利用している人気のページを初心者にも容易に検索できるようにしている。
For example, in
また、特許文献2では、データベースに格納されている文書に対する利用情報から各文書の実績スコアを算出し、各文書について、その文書に対する利用情報を包含するような利用情報を持つ他の文書の部分集合の平均実績スコアを期待スコアとし、部分集合の大きさにより実績スコアと期待スコアをそれぞれの重要度で重み付けした組み合わせで文書スコアを算出して文書スコアデータベースに格納しておき、利用者から検索要求を受けた文書集合に対して文書スコアデータベース中にある各文書の文書スコアを使って順位付けを行って利用者に送信する。これにより、利用情報の偏りの影響を受けにくく、情報の少ない文書に対しても精度の高い人気度順位付けを行うことができる。
しかしながら、上述のような従来技術では、検索結果の個々のウェブページや文書等の人気度は分かるが、人気のあるウェブページや文書等が属する分野(分類カテゴリ)自体が人気のあるものであるという保証はない。
したがって、上述の従来技術では、現在どのような分野(分類カテゴリ)に人気があって、その分野の中でもどのウェブページや文書等に人気があるのかを知ることはできない。
However, in the conventional techniques as described above, the popularity of individual web pages and documents in the search results can be understood, but the field (classification category) to which the popular web pages and documents belong is popular. There is no guarantee.
Therefore, in the above-described conventional technology, it is impossible to know which field (classification category) is currently popular and which web page or document is popular in that field.
本発明は、上述のような実情を考慮してなされたものであって、人気のあるカテゴリに属する情報を入手しやすくした検索分類システム、検索分類サーバ、プログラムおよび記録媒体を提供することを目的とする。 The present invention has been made in consideration of the above-described circumstances, and an object thereof is to provide a search classification system, a search classification server, a program, and a recording medium that make it easy to obtain information belonging to a popular category. And
上述した課題を解決するために、請求項1の発明は、カテゴリに分類された情報を保持管理するデータベースを有する検索分類サーバと複数の端末装置とをネットワークで接続し、前記端末装置から要求される条件に応じた情報を前記データベースから抽出して該端末装置へ出力する検索分類システムにおいて、前記検索分類サーバは、過去に検索したときの検索ログから頻度の高い検索語をカテゴリとして抽出する検索語ランキング部と、前記端末装置の画面に表示された前記カテゴリの中からユーザにカテゴリを選択させるカテゴリ選択部と、前記選択されたカテゴリを検索条件として前記データベースを検索する検索部と、前記検索結果を前記端末装置へ送信して画面へ表示させる出力部とを有することを特徴とする。
In order to solve the above-described problem, the invention of
また、請求項2の発明は、請求項1に記載の検索分類システムにおいて、前記検索ログは、ユーザが入力した検索要求のカテゴリや検索条件に、検索要求のあった日時情報を付加し、時系列で記憶するようにしたことを特徴とする。
The invention according to
また、請求項3の発明は、請求項1または2に記載の検索分類システムにおいて、前記検索語ランキング部は、前記検索ログのカテゴリや検索条件を単語に分割してから、出現頻度の高い該単語をカテゴリとして抽出することを特徴とする。
Further, the invention of claim 3 is the search classification system according to
また、請求項4の発明は、請求項1、2または3に記載の検索分類システムにおいて、前記検索ログに対して期間が指定された場合、該検索ログからこの指定された期間内の検索ログを得るログ範囲取得部とを有し、前記検索語ランキング部は前記ログ範囲取得部で抽出した検索ログをもとにカテゴリを抽出することを特徴とする。 According to a fourth aspect of the present invention, in the search classification system according to the first, second, or third aspect, when a period is specified for the search log, a search log within the specified period is specified from the search log. The search term ranking unit extracts a category based on the search log extracted by the log range acquisition unit.
また、請求項5の発明は、複数の端末装置とネットワークで接続し、前記端末装置から要求される条件に応じた情報を、カテゴリに分類された情報を保持管理するデータベースから抽出して該端末装置へ出力する検索分類サーバにおいて、過去に検索したときの検索ログから頻度の高い検索語をカテゴリとして抽出する検索語ランキング部と、前記端末装置の画面に表示された前記カテゴリの中からユーザにカテゴリを選択させるカテゴリ選択部と、前記選択されたカテゴリを検索条件として前記データベースを検索する検索部と、前記検索結果を前記端末装置へ送信して画面へ表示させる出力部とを有することを特徴とする。
The invention according to
また、請求項6の発明は、コンピュータを、請求項1乃至4のいずれかに記載の検索分類システムまたは請求項5に記載の検索分類サーバとして機能させるためのプログラムである。
また、請求項7の発明は、請求項6に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体である。
The invention of
A seventh aspect of the present invention is a computer-readable recording medium on which the program according to the sixth aspect is recorded.
本発明によれば、ユーザは人気のあるカテゴリを知ることができ、そのカテゴリを使って検索することによって、そのカテゴリに属する情報を容易に入手することができる。 According to the present invention, a user can know a popular category and can easily obtain information belonging to the category by searching using the category.
以下、本発明の検索分類システムに係る好適な実施形態について説明する。
図1は、本発明に係る実施形態の全体構成を示すブロック図である。同図において、検索分類システムは、検索分類サーバ1、複数台のユーザの端末装置2、コンテンツを提供するDB(データベース)サーバ3を、ネットワーク4を介して接続している。
Hereinafter, a preferred embodiment according to the search classification system of the present invention will be described.
FIG. 1 is a block diagram showing the overall configuration of an embodiment according to the present invention. In the figure, the search classification system connects a
検索分類サーバ1は、DBサーバ3に保持管理された複数の情報に対するリンク情報を管理するデータベースを同サーバ1内に保持しており、端末装置2からの検索要求に合致した情報をデータベースを参照して選出し、その情報に関するリストを返信する。このリストは、検索要求に合致した合致度、人気度および情報の所在やタイトル、登録日等の書誌事項である。
The
また、検索分類サーバ1に対してなされた検索要求をログとして記憶させておいて、このログから出現頻度の大きい(人気がある)分類・カテゴリを抽出する。さらに、この抽出した分類・カテゴリをもとにしてデータベースを検索し、検索結果の情報リストをユーザの端末装置2へ出力する。
Further, a search request made to the
ユーザの端末装置2は、ネットワーク4に接続可能なコンピュータ、PDA(Personal digital Assistant)や携帯電話等であって、ネットワーク4に接続可能で検索分類サーバ1およびDBサーバ3へアクセスできるものであればよい。例えば、検索要求の指示および検索結果を表示できる検索分類システムのクライアント側ソフトウェアが動作できるか、または、WWWブラウザ(WWW browser)を用いて検索分類サーバ1やDBサーバ3とアクセスできるものであればよい。
以下、本実施形態では、端末装置2がWWWブラウザの動作するコンピュータとして説明する。
The
Hereinafter, in the present embodiment, the
DB(データベース)サーバ3は、検索分類サーバ1で検索されたウェブページや文書等のコンテンツを保持管理するデータベースサーバである。検索分類サーバ1は、ネットワーク4上に存在する複数のDBサーバ3が保持するコンテンツに対するURI(Uniform Resource Identifier)、カテゴリ、書誌事項(タイトル、著者、キーワードや登録日、文書サイズ、要約など)人気度などをデータベースとして保持管理する。
また、検索分類サーバ1に、DBサーバ3に保持するようなコンテンツをデータベースとして保持している場合には、DBサーバ3がない構成もあり得る。
The DB (database) server 3 is a database server that holds and manages contents such as web pages and documents searched by the
Further, in the case where the
ネットワーク4は、これらのユーザの端末装置2と検索分類サーバ1とDBサーバ3を結合するための伝送路であって、一般には、ケーブルで実現され、通信プロトコルにはTCP/IPが使われる。但し、伝送路としてはケーブルだけではなく、それらの間の通信プロトコルが一致するものであれば有線または無線を使ったものであってもよい。
このネットワーク4としては、例えば、企業内ネットワークとしてのイントラネットやインターネット、携帯電話網、衛星通信網等を用いることができる。
The network 4 is a transmission path for connecting the
As this network 4, for example, an intranet as an in-company network, the Internet, a mobile phone network, a satellite communication network, or the like can be used.
このような構成の検索分類システムを使って検索する方法として、次のような2つの方法がある。
(1)カテゴリや検索条件を指定して、通常の検索をする方法。
ユーザは端末装置2のWWWブラウザを用いて検索分類サーバ1にアクセスすると、図2に示したような検索画面が表示される。
図2において、100はカテゴリを選択するフィールドであり、予め決められているカテゴリの中から選択するか、または、直接、所望のカテゴリを入力する。カテゴリを入力しないときには、そのカテゴリ100に何も入力しないか、または、「カテゴリなし」を選択する。101は、検索条件をキーワードまたはキーワードの組み合わせで入力するフィールドである。102は、人気度を評価する期間(説明は後述)を指定するラジオボタン等である。この期間を指定することにより、人気のあるカテゴリが分かり、そのカテゴリで検索するのに使用する。103は、検索条件(100,101または102)を設定した後、検索分類サーバ1に対して、検索実行を要求する検索ボタンである。
There are the following two methods for searching using the search classification system having such a configuration.
(1) A method of performing a normal search by specifying a category and a search condition.
When the user accesses the
In FIG. 2,
ユーザは、カテゴリ100のカテゴリを選択または検索条件101を入力してから、検索ボタン103をクリック(押下)する。ここで、カテゴリおよび検索条件をともに入力してもよい。
検索分類サーバ1は、指定されたカテゴリや検索条件に合致する情報を検索し、検索結果を端末装置2のWWWブラウザへ返信して、WWWブラウザはその結果を表示する。このとき、ユーザが指定したカテゴリや検索条件が検索ログとして、検索分類サーバ1に累積記録される。
The user selects the
The
(2)人気のあるカテゴリを選択して検索する方法。
どのようなカテゴリに属する情報に人気があり、そのカテゴリに含まれる情報に何があるかをユーザが知りたいときには、図2のような画面が表示されたときに、まず、人気度を評価する期間をラジオボタン等102内のいずれかのラジオボタンで選択する。
(2) A method of searching by selecting a popular category.
When the user wants to know what category information is popular and what information is included in the category, when the screen as shown in FIG. 2 is displayed, the popularity is first evaluated. The period is selected with any radio button in the
図2では、期間限定なし、過去1週間以内、過去1ヶ月以内、または、指定した所定期間内(日付指定)を選択することができる。ここで、日付指定の場合には、開始日と終了日も入力するが、開始日を省略すると終了日以前の全ての検索ログが対象となり、終了日を省略すると開始日から現在時間までの検索ログが対象となる。 In FIG. 2, it is possible to select no time limit, within the past week, within the past month, or within a specified period (date designation). Here, in the case of date specification, the start date and end date are also entered. If the start date is omitted, all search logs before the end date are targeted, and if the end date is omitted, search from the start date to the current time is performed. Log is targeted.
次に、カテゴリ100や検索条件101を入力せずに、検索ボタン103をクリック(押下)する。
検索分類サーバ1は、指定された期間の検索ログを取り出して、頻度の高いカテゴリや検索条件を抽出し、端末装置2のWWWブラウザへ表示させる。(本実施形態では、人気度の高さは、検索要求の頻度の高さに比例するものと定義する。)
ユーザは、表示されたカテゴリや検索条件から興味のあるものを選択して検索分類サーバ1へ送信する。
検索分類サーバ1は、選択されたカテゴリや検索条件で検索を実行し、その検索結果を返信し、端末装置2のWWWブラウザはこの検索結果を表示させる。このとき、選択されたカテゴリや検索条件が検索ログとして、検索分類サーバ1に累積記録される。
Next, the
The
The user selects an item of interest from the displayed categories and search conditions and transmits it to the
The
このように構成することによって、ユーザは人気のあるカテゴリを知ることができ、そのカテゴリを使って検索することによって、そのカテゴリに属する情報を容易に入手することができる。
以下、本発明の実施形態について詳細に説明する。
With this configuration, the user can know a popular category, and can easily obtain information belonging to the category by searching using the category.
Hereinafter, embodiments of the present invention will be described in detail.
<実施形態1>
図3は、実施形態1の検索分類サーバ1の機能構成を示すブロック図である。同図において、検索分類サーバ1は、制御部10、検索語ランキング部20、カテゴリ選択部30、検索部40、出力部50、検索ログ記憶部70、DB(データベース)80からなっている。
<
FIG. 3 is a block diagram illustrating a functional configuration of the
検索ログ記憶部70は、ユーザから検索要求のあったカテゴリや検索条件を累積記憶する。記憶内容としては、図4に示すように、検索要求のカテゴリや検索条件(単一の検索語や検索語の組み合わせ)に累積記憶するときの日時を付加し、この日時による時系列として累積記憶する。
The search
DB(データベース)80は、DBサーバ3に記憶されたウェブページや文書に関する次のような情報を記憶する。記憶する項目は、DBサーバ3が保持するコンテンツ(ウェブページや文書等)ごとに、コンテンツの所在を示すURI、コンテンツのカテゴリ、コンテンツに対する人気度あるいはコンテンツの書誌事項(タイトル、著者、キーワードや登録日、文書サイズ、要約等)などである。 The DB (database) 80 stores the following information related to web pages and documents stored in the DB server 3. The items to be stored are the URI indicating the location of the content, the category of the content, the popularity of the content, or the bibliographic items of the content (title, author, keyword, registration) for each content (web page, document, etc.) held by the DB server 3 Day, document size, summary, etc.).
本実施形態では、Webサーバ(例えば、httpd)を用いて制御部10を構成するものとし、端末装置2とのデータの送受信、検索語ランキング部20、カテゴリ選択部30、検索部40、出力部50等を制御する。
また、制御部10は、端末装置2のWWWブラウザを介して、ユーザの端末装置2から検索分類サーバ1へアクセスがあると、図2に示したような検索条件を入力する画面を送信する。
In the present embodiment, the
Further, when the
次に、制御部10は、端末装置2のWWWブラウザから受信した検索要求がカテゴリや検索条件であれば、検索部40を起動してこの検索要求を渡す。一方、受信した検索要求が人気度を知るための要求である場合には、検索語ランキング部20を起動してこの検索要求を渡す。
Next, if the search request received from the WWW browser of the
また、制御部10は、カテゴリ選択画面(後述)がカテゴリ選択部30から渡されると、そのカテゴリ選択画面をユーザの端末装置2へ送って、その選択結果が返信されると、再度カテゴリ選択部30を起動して、その選択結果を渡す。
さらに、制御部10は、検索結果の出力形式が出力部50から渡されると、その検索結果をユーザの端末装置2のWWWブラウザへ送信する。
In addition, when the category selection screen (described later) is passed from the
Furthermore, when the output format of the search result is passed from the
検索語ランキング部20は、制御部10から人気度を評価する期間を受け取る。本実施形態1では、「限定なし」が選択されている場合について説明する。
検索語ランキング部20は、図4に示したような検索ログ記憶部70から検索ログを読み込み、1回の検索要求におけるカテゴリや検索条件を1纏まりの文字列(以下、カテゴリ等という)として、この文字列に対する検索ログ記憶部70中での頻度を計算して、頻度表を作成する。例えば、図4における検索ログの場合には、図5に示すような頻度表になる。
The search
The search
次に、この頻度表を頻度の大きい順にソートする。図5の場合には、図6のような結果となる。この頻度表の中から頻度の高い所定個数(本例では、3個としたが、任意に設定することができる)を抽出する(図7参照)。このとき頻度が同位のものが複数ある場合には、抽出個数が所定個数になったときに抽出を終了する。
検索語ランキング部20は、カテゴリ選択部30を起動して、以上のようにして抽出した所定個数のカテゴリ等を渡す。
Next, this frequency table is sorted in descending order of frequency. In the case of FIG. 5, the result is as shown in FIG. From this frequency table, a predetermined number having a high frequency (in this example, three is used, but can be arbitrarily set) is extracted (see FIG. 7). At this time, if there are a plurality of frequencies with the same frequency, the extraction ends when the number of extractions reaches a predetermined number.
The search
カテゴリ選択部30は、検索語ランキング部20で抽出されたカテゴリ等を受け取り、図8に示すようなカテゴリ等の選択画面を作成して、制御部10を介してユーザの端末装置2のWWWブラウザへ送信する。図8に示したカテゴリ等の選択画面は、先に抽出したカテゴリ等に番号を付したリスト(104)と、所望の番号を入力するフィールド105と、送信ボタン106とからなっている。
The
ユーザは、表示された選択画面から所望のカテゴリ等に付けられた番号をフィールド105へ入力して送信ボタン106をクリック(押下)して検索分類サーバ1へ送信する。
制御部10は、選択結果のカテゴリ等を受信すると検索部40を起動して、選択結果のカテゴリ等を渡す。
The user inputs a number assigned to a desired category or the like from the displayed selection screen into the
Upon receiving the selection result category or the like, the
検索部40は、制御部10から渡されたカテゴリ等(例えば、図8で「2」を入力したときには、「デバイス ドライバ」)を検索条件とし、DB80の書誌事項等に合致する情報を検索し、合致度が高くしかも情報として人気度の高い順に所定個数抽出し、出力部50を起動してこの検索結果と検索結果の個数とを渡す。ここで、検索結果の各情報は、合致度、人気度、URI、書誌事項(カテゴリ、タイトル、著者、キーワードや登録日、文書サイズ、要約等)である。
The
また、検索部40は、ユーザの端末装置2から送信されたカテゴリや検索条件(カテゴリ等)と書き込み時間とを合わせて検索ログ記憶部70へ時系列順に累積して書き込む。
例えば、図4の検索ログ記憶部70の内容に対して、カテゴリ等として「新製品」を受信したときには、書込み時間(Tue Aug 26 09:18:18 GMT 2003)とこの「新製品」とを合わせて書き込むことにより、図9のように検索ログが累積される。
Further, the
For example, when “new product” is received as a category or the like for the contents of the search
出力部50は、渡された検索結果から図10に示すような検索結果表示画面を作成し、ユーザの端末装置2のWWWブラウザへ送信する。
図10において、合致度が高く、人気度の高い順に、情報の所在(URI)へのリンク付のタイトル107やその他の書誌事項108の各情報を表示する。
ユーザが図10のように表示されたリストのうち所望のタイトル107をクリックすると、このタイトルにリンクされているURIで示されたリンク先の情報の内容がWWWブラウザへ取り込まれて表示される。
The
In FIG. 10, each piece of information such as the
When the user clicks a desired
以上のように構成することによって、検索ログにおいて頻度の高い検索文字列をカテゴリとみなすことで、人気のある情報をカテゴリの形で知り、そのカテゴリに含まれる情報の一覧を得ることができる。 By configuring as described above, it is possible to know popular information in the form of a category and obtain a list of information included in the category by regarding a search character string having a high frequency in the search log as a category.
<実施形態2>
実施形態1の検索語ランキング部20では、検索ログ記憶部70に記憶していた1度の検索要求に対するカテゴリや検索条件を一纏まりの文字列と解釈して、頻度表を作成していた。本実施形態2では、この1纏まりの文字列を複数の単語に分割し、この分割した単語(以下、検索語という)について、実施形態1と同様にして頻度表を作成する。
<
In the search
本実施形態2における機能構成は実施形態1と同じであるから、相違点についてのみ説明する。
本実施形態2の検索語ランキング部20では、例えば、図4の検索ログに対して、1度の検索要求のカテゴリや検索条件を個々の検索語に分割して、それらの検索語の頻度を求めて図11のような頻度表を作成する。
さらに、図11を頻度の大きい順にソートすると図12のような頻度表となる。このうち頻度の高い順に所定個数(ここでは3個)を抽出する。
図13のように抽出された3つの検索語を人気度の高いカテゴリとみなして、カテゴリ選択部30へ渡す。
Since the functional configuration of the second embodiment is the same as that of the first embodiment, only the differences will be described.
In the search
Furthermore, when FIG. 11 is sorted in descending order of frequency, a frequency table as shown in FIG. 12 is obtained. Among these, a predetermined number (here, 3) is extracted in order of frequency.
The three search terms extracted as shown in FIG. 13 are regarded as categories with high popularity, and are passed to the
カテゴリ選択部30では、この渡された3つのカテゴリ(検索語)から図14のようなカテゴリ選択画面を作成して、制御部10を介してユーザの端末装置2のWWWブラウザへ表示させる。
このカテゴリ選択画面からユーザが「ドライバ」を選択すると、このカテゴリを検索文字列とみなし、検索部40ではDB80を検索し、出力部50で合致する情報を図15のような形式にした後、制御部10を介してユーザの端末装置2のWWWブラウザへ送信する。
The
When the user selects “driver” from this category selection screen, this category is regarded as a search character string, the
以上のように構成すると、検索ログのカテゴリや検索条件が複数の単語から構成されていても、それぞれの単語についての人気度を知ることができる。この人気度を参考にして、ユーザは興味のある単語に対する情報を検索することができる。 If comprised as mentioned above, even if the category and search condition of a search log are comprised from several words, the popularity degree about each word can be known. With reference to this popularity, the user can search for information on a word of interest.
<実施形態3>
以下、人気度を評価する期間(1週間以内、1ヶ月以内、日付指定)を指定した場合を本実施形態3として説明する。
図16は、本実施形態3の検索分類サーバ1の機能構成を示すブロック図である。同図において、検索分類サーバ1は、制御部10、検索語ランキング部20、カテゴリ選択部30、検索部40、出力部50、ログ範囲取得部60、検索ログ記憶部70、DB(データベース)80からなっている。
実施形態1および実施形態2と同じ機能については同じ符号を付し、その機能については相違点についてのみ説明する。
<Embodiment 3>
Hereinafter, a case where a period for evaluating popularity (within one week, within one month, date designation) is designated will be described as the third embodiment.
FIG. 16 is a block diagram illustrating a functional configuration of the
The same functions as those in the first and second embodiments are denoted by the same reference numerals, and only the differences will be described.
ユーザの端末装置2のWWWブラウザから人気度を評価する期間を限定した検索要求が受信されると、制御部10はログ範囲取得部60を起動して、指定された期間を渡す。
ログ範囲取得部60は、検索ログ記憶部70に記憶された各検索ログの書込み時間を参照して、指定された期間内の検索ログを抽出して、検索語ランキング部20を起動して、この抽出した検索ログを渡す。
When a search request with a limited period for evaluating the degree of popularity is received from the WWW browser of the
The log range acquisition unit 60 refers to the writing time of each search log stored in the search
例えば、過去4日間という期間内における人気度の高いカテゴリを抽出する場合には、図4の検索ログに対して、現在時間より3日前の日付を開始日とし、今日の日付を終了日として、検索ログを抽出する。この場合、図17に示すように8月22日から8月25日までの検索ログが抽出される。 For example, when extracting a category with high popularity within the past four days, a date three days before the current time is set as the start date, and today's date is set as the end date for the search log in FIG. Extract search logs. In this case, as shown in FIG. 17, the search logs from August 22 to August 25 are extracted.
検索語ランキング部20では、抽出された検索ログに対して、実施形態1における検索語ランキング部20と同様に、カテゴリや検索条件を一纏まりの文字列(以下、カテゴリ等という)と解釈して、この文字列に対する頻度表を作成する。または、実施形態2における検索語ランキング部20と同様に、この1纏まりの文字列を複数の単語に分割し、この分割した単語(以下、検索語という)について、頻度表を作成する。
例えば、図17の検索ログに対して、実施形態1と同様に頻度表を作成し、頻度の大きい順にソートすると図18のような頻度表となる。このうち頻度の高い順に所定個数(ここでは3個)を抽出し、図19のように抽出された3つのカテゴリ等を人気度の高いカテゴリとみなして、カテゴリ選択部30へ渡す。
The search
For example, if a frequency table is created for the search log in FIG. 17 as in the first embodiment and sorted in descending order of frequency, a frequency table as shown in FIG. 18 is obtained. Among these, a predetermined number (three in this case) is extracted in order of frequency, and the extracted three categories and the like as shown in FIG.
カテゴリ選択部30では、この渡された3つのカテゴリから図20のようなカテゴリ選択画面を作成して、制御部10を介してユーザの端末装置2のWWWブラウザへ表示させる。
検索部40では、このカテゴリ選択画面でユーザが選択したカテゴリを検索文字列とみなし、DB80を検索して合致した情報を出力部50で表示形式に変換した後、制御部10を介してユーザの端末装置2のWWWブラウザへ送信する。
The
The
以上のように構成することによって、指定した期間内の検索ログをもとにカテゴリを作るので、週間人気ランキングや月間人気ランキングでの傾向などをカテゴリとして知り、そのカテゴリに含まれる文書の一覧を得ることができる。 By configuring as above, categories are created based on the search logs within the specified period, so you can know the trends in the weekly popularity ranking and monthly popularity ranking as categories, and list the documents included in that category. Can be obtained.
<他の実施形態>
さらに、本発明は、上述した実施形態のみに限定されたものではなく、上述した実施形態の各装置の機能をそれぞれプログラム化し、あらかじめCD−ROM等の記録媒体に書き込んでおき、コンピュータに搭載したCD−ROMドライブのような媒体駆動装置にこのCD−ROM等を装着し、これらのプログラムをインストールして、実行することによっても、本発明の目的が達成されることは言うまでもない。
この場合、記録媒体から読出されたプログラム自体が上述した実施形態を実現することになり、そのプログラムおよびそのプログラムを記録した記録媒体も本発明を構成することになる。
<Other embodiments>
Furthermore, the present invention is not limited only to the above-described embodiments, but the functions of the devices of the above-described embodiments are each programmed, written in a recording medium such as a CD-ROM in advance, and mounted on a computer. It goes without saying that the object of the present invention can also be achieved by installing the CD-ROM or the like in a medium driving device such as a CD-ROM drive, and installing and executing these programs.
In this case, the program read from the recording medium itself realizes the above-described embodiment, and the program and the recording medium on which the program is recorded also constitute the present invention.
なお、記録媒体としては半導体媒体(例えば、ROM、不揮発性メモリカード等)、光媒体(例えば、DVD、MO、MD、CD−R等)、磁気媒体(例えば、磁気テープ、フレキシブルディスク等)のいずれであってもよい。
あるいは、サーバコンピュータの記憶装置に格納された上記プログラムをインターネット等の通信網を介して直接供給を受けるようにしてもよい。この場合、このサーバコンピュータの記憶装置も本発明の記録媒体に含まれる。
As a recording medium, a semiconductor medium (for example, ROM, nonvolatile memory card, etc.), an optical medium (for example, DVD, MO, MD, CD-R, etc.), a magnetic medium (for example, magnetic tape, flexible disk, etc.) Either may be sufficient.
Alternatively, the program stored in the storage device of the server computer may be directly supplied via a communication network such as the Internet. In this case, the storage device of this server computer is also included in the recording medium of the present invention.
また、ロードしたプログラムを実行することにより上述した実施形態が実現されるだけでなく、そのプログラムの指示に基づき、オペレーティングシステム等が実際の処理の一部を行い、その処理によって上述した実施形態が実現される場合も含まれる。 Further, not only the above-described embodiment is realized by executing the loaded program, but the operating system or the like performs a part of the actual processing based on the instruction of the program, and the above-described embodiment is performed by the processing. The case where it is realized is also included.
1…検索分類サーバ、2…端末装置、3…DBサーバ、4…ネットワーク、10…制御部、20…検索語ランキング部、30…カテゴリ選択部、40…検索部、50…出力部、60…ログ範囲取得部、70…検索ログ記憶部、80…データベース(DB)、100…カテゴリ、101…検索条件、102…ラジオボタン等、103…検索ボタン、104…カテゴリのリスト、105…番号入力フィールド、106…送信ボタン、107…タイトル、108…書誌事項。
DESCRIPTION OF
Claims (7)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003330849A JP2005099964A (en) | 2003-09-24 | 2003-09-24 | Retrieval classifying system, retrieval classifying server, program and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003330849A JP2005099964A (en) | 2003-09-24 | 2003-09-24 | Retrieval classifying system, retrieval classifying server, program and recording medium |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005099964A true JP2005099964A (en) | 2005-04-14 |
Family
ID=34459662
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003330849A Pending JP2005099964A (en) | 2003-09-24 | 2003-09-24 | Retrieval classifying system, retrieval classifying server, program and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005099964A (en) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323790A (en) * | 2005-05-20 | 2006-11-30 | Navitime Japan Co Ltd | Poi information providing system, poi information providing method, information distribution server, and terminal equipment |
JP2009104607A (en) * | 2007-10-22 | 2009-05-14 | Gmarket Inc | Website management method and online system |
JP2012527038A (en) * | 2009-05-12 | 2012-11-01 | アリババ グループ ホールディング リミテッド | Method for generating search results and system for information retrieval |
JP2014522009A (en) * | 2011-04-25 | 2014-08-28 | アルカテル−ルーセント | Privacy protection in recommended services |
CN109241383A (en) * | 2018-07-20 | 2019-01-18 | 北京开普云信息科技有限公司 | A kind of type of webpage intelligent identification Method and system based on deep learning |
CN117743606A (en) * | 2024-02-21 | 2024-03-22 | 天云融创数据科技(北京)有限公司 | Intelligent retrieval method and system based on big data |
-
2003
- 2003-09-24 JP JP2003330849A patent/JP2005099964A/en active Pending
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006323790A (en) * | 2005-05-20 | 2006-11-30 | Navitime Japan Co Ltd | Poi information providing system, poi information providing method, information distribution server, and terminal equipment |
JP2009104607A (en) * | 2007-10-22 | 2009-05-14 | Gmarket Inc | Website management method and online system |
JP2012527038A (en) * | 2009-05-12 | 2012-11-01 | アリババ グループ ホールディング リミテッド | Method for generating search results and system for information retrieval |
US8849822B2 (en) | 2009-05-12 | 2014-09-30 | Alibaba Group Holding Limited | Method for generating search result and system for information search |
US9672290B2 (en) | 2009-05-12 | 2017-06-06 | Alibaba Group Holding Limited | Method for generating search result and system for information search |
JP2014522009A (en) * | 2011-04-25 | 2014-08-28 | アルカテル−ルーセント | Privacy protection in recommended services |
CN109241383A (en) * | 2018-07-20 | 2019-01-18 | 北京开普云信息科技有限公司 | A kind of type of webpage intelligent identification Method and system based on deep learning |
CN109241383B (en) * | 2018-07-20 | 2019-06-21 | 北京开普云信息科技有限公司 | A kind of type of webpage intelligent identification Method and system based on deep learning |
CN117743606A (en) * | 2024-02-21 | 2024-03-22 | 天云融创数据科技(北京)有限公司 | Intelligent retrieval method and system based on big data |
CN117743606B (en) * | 2024-02-21 | 2024-04-30 | 天云融创数据科技(北京)有限公司 | Intelligent retrieval method and system based on big data |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5015935B2 (en) | Mobile site map | |
US6983320B1 (en) | System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages | |
CN103339597B (en) | Transforming search engine queries | |
US7657504B2 (en) | User interface for displaying images of sights | |
JP4991289B2 (en) | A search engine supplemented with a URL that gives access to search results from a predefined search query | |
US8745039B2 (en) | Method and system for user guided search navigation | |
JP5116593B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND SEARCH PROGRAM USING PUBLIC SEARCH ENGINE | |
US7707208B2 (en) | Identifying sight for a location | |
US7013323B1 (en) | System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria | |
JP5105802B2 (en) | Information processing device | |
US7107264B2 (en) | Content bridge for associating host content and guest content wherein guest content is determined by search | |
US9069771B2 (en) | Music recognition method and system based on socialized music server | |
KR20070098521A (en) | A system and method for prioritizing websites during a webcrawling process | |
JP4430598B2 (en) | Information sharing system and information sharing method | |
JP2010128928A (en) | Retrieval system and retrieval method | |
JP4769822B2 (en) | Information search service providing server, method and system using page group | |
US8868551B2 (en) | Method for storing bookmarks for search results from previously submitted search queries by a user and storing links to selected documents by the user | |
JP2009015589A (en) | System and program for presenting related document | |
US20060116992A1 (en) | Internet search environment number system | |
JP2005099964A (en) | Retrieval classifying system, retrieval classifying server, program and recording medium | |
JP2007128367A (en) | Information retrieval knowhow management system | |
JP2009205588A (en) | Page search system and program | |
JPH11143885A (en) | Method and device for information retrieval, storage medium for storing information retrieval program, method and device for information transmission, and storage medium for storing information transmission program | |
US20080114786A1 (en) | Breaking documents | |
JP2001357055A (en) | Method and system for managing bookmark |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051025 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081226 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090519 |