Nothing Special   »   [go: up one dir, main page]

JP3671368B2 - WEB information search apparatus, WEB information search method, and program for causing computer to execute the method - Google Patents

WEB information search apparatus, WEB information search method, and program for causing computer to execute the method Download PDF

Info

Publication number
JP3671368B2
JP3671368B2 JP2001162487A JP2001162487A JP3671368B2 JP 3671368 B2 JP3671368 B2 JP 3671368B2 JP 2001162487 A JP2001162487 A JP 2001162487A JP 2001162487 A JP2001162487 A JP 2001162487A JP 3671368 B2 JP3671368 B2 JP 3671368B2
Authority
JP
Japan
Prior art keywords
data
user
search
web site
bookmark
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001162487A
Other languages
Japanese (ja)
Other versions
JP2002351916A (en
Inventor
信也 武井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MARS FLAG CORPORATION
Original Assignee
MARS FLAG CORPORATION
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MARS FLAG CORPORATION filed Critical MARS FLAG CORPORATION
Priority to JP2001162487A priority Critical patent/JP3671368B2/en
Publication of JP2002351916A publication Critical patent/JP2002351916A/en
Application granted granted Critical
Publication of JP3671368B2 publication Critical patent/JP3671368B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ユーザから入力されたキーワードに基づいてインターネット上のWEBサイトを検索するWEB情報検索装置、WEB情報検索方法及びその方法をコンピュータに実行させるプログラムに関するものである。
【0002】
【従来の技術】
ユーザの検索指示によりインターネット上のWEBサイト(WEBページ)を全文検索する検索エンジンとしては、ロボット型検索エンジン、ディレクトリ型検索エンジン及びメタ検索エンジンが従来から一般的に知られている。
【0003】
ロボット型検索エンジンは、検索したい情報に関連するキーワードを指定すると、WEBロボットやスパイダーと呼ばれる WWW探索プログラムを用いて,インターネット上で見つけることのできる全WWWサーバ上の情報を定期的に収集し、その情報の索引付けを自動的に行うものである。このロボット型検索エンジンは,コンピュータによって自動的に全世界のWEBサイトのデータを収集しているため、情報量が多いという利点を有している。
【0004】
ディレクトリ型検索エンジンは、作業者が予めWEBサイトのURL(Universal Resource Locator)を、芸術、ビジネス、教育等のように分野別に人為的に分類しておき、ユーザは分野別にキーワードを指定して検索するものである。このディレクトリ型検索エンジンでは情報を分野別に分類しているので、ユーザは職業別電話帳のような使い方ができ、分野を決めてから探す場合に便利であるという利点を有している。
【0005】
【発明が解決しようとする課題】
しかしながら、このような従来の検索エンジンには次のような問題がある。ロボット型検索エンジンの場合には、収集した情報量が多いという利点をもつ反面、検索ロボットは収集したWEBサイト情報に出てくる単語から単純に索引付けを行うため、キーワード検索した場合にWEBサイトが何万件と出てしまう場合が多い。このため、ユーザとは本来関係無いようなサイトまで検索結果として表示されてしまい、検索結果の品質が低く、ユーザは目的のWEBサイトを絞り込むのに膨大な時間を要してしまうという問題がある。
【0006】
また、検索ロボットが検索を行うので、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。
【0007】
ディレクトリ型検索エンジンの場合には、WEBサイトのデータ入力及び分類を基本的に人手で行っているため、ロボット型検索エンジンによるサービスと比較して情報量が2、3桁少なく、有名なWEBサイト以外を探すことが出来ないという問題がある。また、WEBサイトのデータ入力と分類を作業者の事務処理能力に頼っているため、情報量を増大するのにも限界がある。
【0008】
また、ディレクトリ型エンジンの場合には、単に収集したWEBサイトの情報を分野別に分類しているだけなので、ロボット型検索エンジンと同様に、異なるユーザが検索した場合でも同一キーワードで検索する限り常に同じ検索結果しか得られず、異なるプロフィールや嗜好等を有するユーザの全てに対して満足のいく検索結果が得られることは少ないという問題がある。
【0009】
本発明はこのような問題点に鑑みてなされたものであり、多大なWEBサイトの情報量を検索対象としながらも、検索を行うユーザにとって必要なWEBサイト情報の検索結果を最適な形式で提供することができるWEB情報検索装置およびWEB情報検索方法を提供することを主な目的とする。本発明の別の目的は、多大なWEBサイトの情報量を検索対象としながらも、WEBサイト情報の検索結果をWEBサイトに対する利用状況を反映した形式でユーザに提供することができるWEB情報検索装置およびWEB情報検索方法を提供することである。
【0010】
【課題を解決するための手段】
上述の目的を達成するため、発明は、ユーザ端末から入力された検索キーワードに基づいてインターネット上のWEBサイトを検索して検索結果をユーザ端末に送信するWEB情報検索装置において、ユーザごとに、ユーザ固有データを予め登録したユーザファイルと、ユーザがアクセスするWEBサイトの識別情報を含むブックマークを記録する記憶手段と、前記記憶手段から全てのユーザのブックマークを収集して、ユーザのブックマーク利用情報とWEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むブックマーク分析データを生成してブックマーク分析ファイルに登録する分析手段と、全ての前記ブックマーク分析データに基づいて、インターネット上のWEBサイトからデータを収集し、検索用ファイルに登録するデータ収集手段と、所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、WEBサイトに対するユーザ全体の利用状況を記録したマクロプロファイルを生成するマクロプロファイル作成手段と、所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、ユーザごとのWEBサイトの利用状況を記録したミクロプロファイルを生成するミクロプロファイル作成手段と、ユーザ端末から検索キーワードによる検索指示が入力されたときに、前記キーワードに基づいて検索用ファイルからデータを検索する検索手段と、前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データ及び/又は前記マクロプロファイル及び/又は前記ミクロプロファイルとに基づいて評価する評価手段と、前記評価手段による評価に基づいて前記検索されたデータから検索結果データを生成してユーザ端末に送信する検索結果生成手段と、を備え、前記マクロプロファイルにおける前記ユーザ全体の利用状況には、WEBサイト毎に、前記ユーザ全体のうち該WEBサイトの参照回数が最も多いユーザの特定のユーザ固有データが該WEBサイトと関連づけられて含まれており、前記評価手段は、前記検索指示を行ったユーザの前記ユーザ固有データに、前記マクロプロファイルに含まれる前記特定のユーザ固有データと一致する特定のユーザ固有データが含まれる場合に、該特定のユーザ固有データに関連するWEBサイトと対応する前記検索されたデータに重み付け値を付与し、前記検索結果生成手段は、前記検索されたデータを前記重み付け値に基づいた順番でソートして検索結果データを生成することを特徴とする。
【0011】
【発明の実施の形態】
本発明では、ユーザ端末から入力された検索キーワードに基づいてインターネット上のWEBサイトを検索して検索結果をユーザ端末に送信するWEB情報検索装置において、ユーザごとに、ユーザ固有データを予め登録したユーザファイルと、ユーザがアクセスするWEBサイトの識別情報を含むブックマークを記録する記憶手段と、記憶手段から全てのユーザのブックマークを収集して、ユーザのブックマーク利用情報とWEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むブックマーク分析データを生成してブックマーク分析ファイルに登録する分析手段と、全ての前記ブックマーク分析データに基づいて、インターネット上のWEBサイトからデータを収集し、検索用ファイルに登録するデータ収集手段と、所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、WEBサイトに対するユーザ全体の利用状況を記録したマクロプロファイルを生成するマクロプロファイル作成手段と、所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、ユーザごとのWEBサイトの利用状況を記録したミクロプロファイルを生成するミクロプロファイル作成手段と、ユーザ端末から検索キーワードによる検索指示が入力されたときに、前記キーワードに基づいて検索用ファイルからデータを検索する検索手段と、前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データ及び/又は前記マクロプロファイル及び/又は前記ミクロプロファイルとに基づいて評価する評価手段と、前記評価手段による評価に基づいて前記検索されたデータから検索結果データを生成してユーザ端末に送信する検索結果生成手段と、を備えたことを特徴とする。
本発明では、ユーザのブックマークを、ユーザ端末側ではなく検索装置側(即ち検索サーバ側)の記憶手段に格納しているので、全ユーザが使用するブックマークの情報を収集することが可能である。本発明では、この検索装置側の記憶手段から全てのユーザのブックマークを収集して分析し、ユーザのブックマーク利用情報、WEBサイトの識別情報、WEBサイトに対するアクセス情報とを含むブックマーク分析データを生成してブックマーク分析ファイルに登録する。更に、所定時期に、作成された全てのブックマーク分析データとユーザ固有データからマクロプロファイル作成手段によって全てのブックマーク分析データと前記ユーザ固有データとからマクロプロファイルを生成し、またミクロプロファイル作成手段によってミクロプロファイルを生成し、検索手段によって検索されたデータの夫々に対して、評価手段により検索指示を行ったユーザのユーザ固有データとマクロプロファイル及び/又はミクロプロファイルとに基づいて評価する。ここで、マクロプロファイルはWEBサイトに対するユーザ全体の利用状況を記録したものであり、ミクロプロファイルはユーザごとのWEBサイトの利用状況を記録したものであるため、検索されたデータは、WEBサイトに対するユーザ全体の利用状況とユーザごとのWEBサイトの利用状況に基づいて評価されて検索結果データが生成されユーザ端末に送信される。
【0012】
このように本発明では、ユーザ固有データとWEBサイトに対するユーザ全体の利用状況とユーザごとのWEBサイトの利用状況を利用して検索されたデータを評価し、その評価結果に基づいて検索されたデータから検索結果データを生成してユーザ端末に送信しているので、多大なWEBサイトの情報量を検索対象としながらも、検索結果としてユーザに必要な情報をユーザにとって最適な形式で提供することが可能となる。
【0013】
即ち、本発明では、ユーザ固有データとマクロプロファイルのWEBサイトに対する全ユーザの利用状況を利用して検索されたデータを評価しているので、WEBサイトにアクセスするユーザの傾向や偏りを提供する検索結果に反映することができる。また、本発明ではマクロプロファイルのWEBサイトに対する全ユーザの利用状況を利用して検索されたデータを評価しているので、人気のあるWEBサイトやアクセスの多いWEBサイトを中心に検索結果を提供することができ、リンク切れやアクセス頻度の少ないWEBサイトのデータを提供してしまうことを防止できる。更に、本発明では、ユーザ固有データとミクロプロファイルのユーザごとのWEBサイトの利用状況を利用して評価しているので、同一キーワードでもユーザが異なれば各ユーザごとに異なる最適な検索結果を提供することができる。
【0014】
また、本発明では、マクロプロファイル作成手段とミクロプロファイル作成手段により、所定の時期にマクロプロファイルとミクロプロファイルを生成しているので、刻々と変化するユーザ全体の利用状況やユーザごとのWEBサイトの利用状況を逐次取得して検索されたデータの評価に用いることができ、同一キーワードでも検索する時期に最も適した検索結果をユーザに提供することができる。
【0015】
さらに、ユーザのブックマークを検索装置上の記憶手段に格納しているために、このようなブックマークの分析や検索されたWEBサイトのデータの評価をユーザに全く意識させずに行うことができ、ユーザ自らWEBサイトの分類や評価を行う必要がなく、ユーザの便宜となる。
【0016】
本発明におけるユーザ固有データは、各ユーザに固有の情報であれば任意のデータを用いることができ、例えば、ユーザ名若しくはユーザID、パスワード、職業、学歴、趣味等をが該当する。また、WEBサイトの識別情報は、WEBサイトをインターネット上で識別できるものであればいずれの情報も該当し、例えばURL,IPアドレス等が該当する。また、本発明におけるブックマークは、このWEBサイト識別情報を含むものであれば良く、更にタイトル名等他のデータを含めた情報としても良い。
【0017】
本発明におけるブックマーク利用情報は、ユーザのブックマークの利用状況に関する情報であり、上述のブックマークの情報の他、更にブックマークの登録数、ブックマーク作成日時、最終訪問日時等を含めることが可能である。また、本発明におけるWEBサイトのアクセス情報とは、各WEBサイトに対する参照回数、アクセス頻度、アクセス数が一定数以上となる時間帯等、アクセスしたユーザ名若しくはユーザID等アクセスに関する全ての情報が該当する。
【0018】
本発明のマクロプロファイル作成手段及びミクロプロファイル作成手段が各ファイルを生成する「所定の時期」としては、例えば、一定時間毎、ユーザのブックマーク登録時、ブックマークに記録されたWEBサイトへいずれかのユーザがアクセスしたとき、ユーザにより検索指示時等、任意に定めることができる。
【0019】
本発明のマクロプロファイル及びミクロプロファイルは、所定時期に生成されるものであれば良く、メモリ等の主記憶装置に一時的に生成する他、ハードディスク等の外部記憶装置に生成して格納したり、更にデータベースファイルとして生成することも可能である。この場合には、次回の検索時に反映することが可能となる。
【0020】
本発明におけるマクロプロファイルの「WEBサイトに対するユーザ全体の利用状況」は、例えば、WEBサイトに対するユーザのブックマーク総登録数、WEBサイトに対してアクセスしたユーザの偏り、WEBサイトに対する全ユーザのアクセス数、WEBサイトに対するアクセス時間帯の偏り。特定のユーザのWEBサイトに対するアクセス数等が該当するがユーザ全体の利用状況を示すものであれば任意の情報とすることができる。
【0021】
また、本発明におけるミクロプロファイルの「各ユーザのWEBサイトに対する利用状況」は、例えば ユーザ情報、ユーザが利用したWEBサイト統計、WEBサイト統計による偏り、ユーザのWEBサイトに対するアクセス時間、ユーザの検索キーワードの統計及び各キーワードにより検索されたWEBサイトの履歴情報等が該当するが、ユーザ個人の利用状況を示すものであれば任意の情報とすることができる。
【0022】
データ収集手段によってWEBサイトから収集して検索用ファイルに登録するデータは全文データとすることが好ましいが、キーワードのみのデータ、あるいは収集したデータを要約したデータとすることも可能である。
【0023】
本発明における評価手段は、検索手段により検索されたデータをユーザ固有データと前記マクロプロファイル及び/又は前記ミクロプロファイルとに基づいて評価するものであれば良く、その評価方法及び評価結果の利用方法としては本発明では特に限定しない。例えば、WEBサイトをランキングしたり、所定のWEBサイトのみをフィルタリングする等は任意に行うことができる。
【0024】
尚、本発明のユーザファイル、ブックマーク分析ファイルは、通常ファイルとすることもできるが、データベース形式のファイルとすることが好ましい。
【0025】
本発明のWEB情報検索装置において、前記マクロプロファイル作成手段は、前記ブックマーク分析データと前記ユーザ固有データとから、各WEBサイトにアクセスしたユーザを特定のユーザ固有データ別に統計したユーザ統計情報を含むマクロプロファイルを生成するものであり、前記評価手段は、前記検索されたデータの夫々を、前記検索指示を行ったユーザの特定のユーザ固有データと前記ユーザ統計情報とに基づいて評価するものであることを特徴とする。
【0026】
本発明では、マクロプロファイル作成手段によって各WEBサイトにアクセスしたユーザを特定のユーザ固有データ別に統計したユーザ統計情報を含むマクロプロファイルを生成しているので、各WEBサイトごとにアクセスするユーザの特定のユーザ固有データに基づいた偏りを求めることができる。このため、検索指示を行ったユーザの特定のユーザ固有データとユーザ統計情報とに基づいて、検索されたデータを評価することにより、多大なWEBサイトの情報量を検索対象としながらも、ユーザの興味の対象となるWEBサイトのデータを優先的に検索結果として提供することが可能となる。
【0027】
本発明における「特定のユーザ固有データ」とは、ユーザ名やパスワード等の管理情報を除いた固有情報であり、例えば年齢、職業、学歴、趣味等が該当する。例えば、マクロプロファイル作成手段によって「職業」という特定のユーザ固有データに基づいてユーザ統計情報を作成することより、同一又は類似の「職業」を有するユーザがよくアクセスするWEBサイトの偏りを求めることができる。このとき、このユーザ統計情報によってある職業のユーザにアクセス数の多いWEBサイトが存在している場合において、この職業データを有するユーザからの検索指示により検索されたデータに当該WEBサイトが含まれていた場合には、このWEBサイトのデータに対し優先的な評価を行い、検索結果のWEBページに当該WEBサイトを最初にランキングして検索結果データを生成するように構成すれば、ユーザにとって最適な検索結果を提供することが可能となる。
【0028】
本発明のWEB情報検索装置において、前記マクロプロファイル作成手段は、前記ブックマーク分析データと前記ユーザ固有データとから、各WEBサイトに対するアクセスの統計情報を含むマクロプロファイルを生成するものであり、前記評価手段は、前記検索されたデータの夫々を、前記アクセス統計情報に基づいて評価するものであることを特徴とする。
【0029】
本発明では、マクロプロファイル作成手段によって各WEBサイトに対するアクセス統計情報を含むマクロプロファイルを生成しているので、各WEBサイトのアクセス状況をを求めることができる。このため、このアクセス状況に基づいて検索されたデータを評価することができ、多大なWEBサイトの情報量を検索対象としながらも、ユーザにアクセス数やアクセス頻度の高いWEBサイトのデータを優先的に検索結果として提供することが可能となる。
【0030】
例えば、アクセス統計情報としてWEBサイトに対する総参照回数を求め、総参照回数の多いWEBサイトを人気度の高いサイトであると評価するように構成する。そして、検索結果生成手段を、アクセス回数の多いWEBサイト順にソートして検索結果データを生成したり、アクセス回数が一定以上のWEBサイトのみを選択して検索結果データを生成するように構成することにより、人気度の高いWEBサイトのデータのみをユーザに提供することが可能となる。
【0031】
本発明におけるアクセス統計情報は、例えば、WEBサイトの総参照回数の他、WEBサイトに対する参照時間、アクセス数の高い時間帯等が該当するが、アクセスに関する統計情報であれば特に限定されるものではない。
【0032】
本発明の別の態様としては、WEB情報検索装置において、前記マクロプロファイル作成手段は、前記検索用ファイルと前記ブックマーク分析データとから、各WEBサイトに対する過去の検索で使用されたキーワードと過去に検索されたWEBサイトの識別情報からなる履歴データを含むマクロプロファイルを生成するものであり、前記評価手段は、前記検索されたデータの夫々を、前記検索キーワードと前記履歴データとに基づいて評価するものであることを特徴とする。この発明によれば、過去の検索キーワードと履歴データに基づいて検索結果を評価するので、過去の検索状況を反映して全く関係のないWEBサイトの検索結果を提供してしまうことを防止することができる。
【0033】
本発明のWEB情報検索装置において、前記ミクロプロファイル作成手段は、前記ブックマーク分析データと前記ユーザ固有データとから、各ユーザのWEBサイトに対するアクセスのサイト統計情報を含むミクロプロファイルを生成するものであり、前記評価手段は、前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データと前記サイト統計情報に基づいて評価するものであることを特徴とする。
【0034】
本発明では、ミクロプロファイル作成手段によってユーザの各WEBサイトに対するサイト統計情報を含むミクロプロファイルを生成しているので、各ユーザのWEBサイトに対する偏りを求めることができる。このため、検索指示を行ったユーザの固有データ(ユーザ名、ユーザID等)とそのユーザのサイト統計情報とによるWEBサイトの偏りに基づいて検索されたデータを評価することにより、多大なWEBサイトの情報量を検索対象としながらも、ユーザの過去のアクセス状況を反映した検索結果を提供することが可能となる。
【0035】
本発明におけるサイト統計情報とは、例えば各WEBサイトに対するアクセス回数(参照回数)、参照後滞在時間、参照した時間帯等が該当するが、これに限定されるものではない。
【0036】
本発明のWEB情報検索装置において、前記ミクロプロファイル作成手段は、前記ブックマーク分析データと前記ユーザ固有データとから、各ユーザが過去に使用したキーワードとその検索結果によりアクセスしたWEBサイトの識別情報からなる履歴データを含むミクロプロファイルを生成するものであり、前記評価手段は、前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データと前記履歴データに基づいて評価するものであることを特徴とする。
【0037】
本発明では、ミクロプロファイル作成手段によって各ユーザが過去に使用したキーワードとその検索結果によりアクセスしたWEBサイトの識別情報からなる履歴データを含むミクロプロファイルを生成しているので、ユーザの使用したキーワードに基づくアクセスの傾向を求めることができる。このため、検索指示を行ったユーザの固有データ(ユーザ名、ユーザID等)とそのユーザの履歴データとによるWEBサイトに対するアクセス傾向に基づいて検索されたデータを評価することにより、ユーザの過去のアクセス傾向を反映した検索結果を提供することが可能となる。
【0038】
例えば、評価手段により、検索指示を行ったユーザの履歴データに現在指定されている検索キーワードが存在していると判断した場合には、検索結果生成手段によって検索されたデータの中でその検索キーワードに基づいて過去にアクセスしたWEBサイトを優先的に検索結果データに取り込むように構成することができる。この場合には、ユーザにとってある関連のあるWEBサイトのデータを優先的に検索結果として提供することができ、無関係なサイトを検索結果として表示してしまうことを回避することができる。
【0039】
本発明のWEB情報検索装置において、前記評価手段は、前記検索されたデータの夫々を評価した後、前記検索されたデータの夫々に対し評価結果に基づいて重み付け値を付与するものであり、前記検索結果生成手段は、前記検索されたデータを前記重み付け値に基づいた順番でソートして検索結果データを生成するものであることを特徴とする。
【0040】
検索手段によって検索されたWEBサイトのデータは、いずれも同じレベルで重要であるとは限らない。このため、本発明では、評価手段によって検索されたデータの夫々に対し、ユーザ固有データとマクロプロファイルのユーザ全体の利用状況及びミクロプロファイルの各ユーザの利用状況とによる評価結果に基づいて重み付け値を付与して検索されたデータをランク付けし、検索結果生成手段によって前記重み付け値に基づいた順番でソートして検索結果データを生成しているので、多大なWEBサイトの情報量を検索対象としながらも、ユーザにとって必要性の高いWEBサイトから順に表示した検索結果を提供することが可能となる。
【0041】
このような評価手段としては、例えば、重要性の高い順若しくはアクセス頻度の高い順に高い重み付けを付与しておき、検索結果生成手段によって重み付け値の昇順に検索されたデータを表示するように構成することができる。この場合には、ユーザにとって重要なサイトやアクセス頻度の高いサイトから表示されるので、何度も検索結果のページを表示させなくても目的のWEBサイトへたどり着けユーザの便宜となるという利点がある。この場合の評価手段による重み付け値の付与は、マクロプロファイルのアクセス頻度、アクセス回数やミクロプロファイルの職業、趣味等のユーザ固有データに基づいて行うことが可能である。
【0042】
本発明のWEB情報検索装置において、前記評価手段は、前記検索されたデータの夫々を評価した後、前記検索されたデータの夫々を評価結果に基づいて分類するものであり、前記検索結果生成手段は、所定の分類に属する前記検索されたデータのみを選択して検索結果データを生成するものであることを特徴とする。
【0043】
検索手段によって検索されたWEBサイトのデータは、全てユーザに必要であるとは限られず、ユーザによっては不要なデータも多数存在する。このため、本発明では、評価手段によって検索されたデータを、ユーザ固有データとマクロプロファイルのユーザ全体の利用状況及びミクロプロファイルの各ユーザの利用状況とによる評価結果に基づいて分類し、検索結果生成手段によって所定の分類に属するデータのみから検索結果データを生成しているので、多大なWEBサイトの情報量を検索対象としながらも、ユーザにとって必要性のあるWEBサイトのデータのみからなる検索結果を提供することが可能となる。
【0044】
このような評価手段としては、ユーザのアクセス数が一定数以上のユーザ固有データごとに検索されたデータを分類しておき、検索結果生成手段によって検索指示を行ったユーザのユーザ固有データの属する分類のデータのみを選択して検索結果データを生成するように構成することができる。この場合には、ユーザの職業や嗜好等に最も適したサイトのみが表示されるので、何度も検索結果のページを表示させなくても目的のWEBサイトへたどり着けユーザの便宜となるという利点がある。この場合の評価手段による分類は、マクロプロファイルのWEBサイトにアクセスするユーザの偏り、ユーザ固有データに基づいて行うことが可能である。
【0045】
本発明のWEB情報検索装置において、前記ブックマーク分析ファイルは、ブックマーク利用情報を含むブックマークデータを登録したブックマークファイルと、WEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むサイトデータを登録したサイトファイルとを有するものであることを特徴とする。
【0046】
本発明では、ブックマーク分析ファイルを、ブックマーク利用情報を含むブックマークデータを登録したブックマークファイルと、WEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むサイトデータを登録したサイトファイルとを含むように構成しているので、各ファイルの管理が容易となる。
【0060】
以下に添付図面を参照して、本発明に係るWEB情報検索装置、WEB情報検索方法及びWEB情報検索プログラムの好適な実施の形態を詳細に説明する。本実施形態は、本発明のWEB情報検索システムは、ユーザがユーザ端末からインターネットを介してWEB情報検索サーバにキーワードによる検索指示を行い、このキーワードによってインターネット上のWEBサイトのデータの全文メタ検索を行うものである。
【0061】
(WEB情報検索サーバのハードウェア構成)
図1は本実施形態に係るWEB情報検索サーバのシステム構成を示すブロック図である。図1に示すように、このWEB情報検索サーバ101には、インターネットを介して検索指示を行うユーザの端末がTCP/IP等の公知の通信プロトコルによって接続される。
【0062】
本サーバには、CPU、グラフィックボード、ROM等の制御装置103、メインメモリ(RAM)等の主記憶装置104と、ハードディスク(HD)、CD−ROM、フロッピーディスク等の記憶媒体及び各記憶媒体に対するREAD/WRITEを制御するドライブ装置等の外部記憶装置105と、イーサネットボードやモデム等の通信装置102と、ディスプレイ装置やプリンタ装置等の出力装置107と、キーボードやマウス等の入力装置106とが主に接続されており、ワークステーション(WS)、パーソナルコンピュータ(PC)等のコンピュータを利用した通常の構成となっている。
【0063】
本実施形態のWEB情報検索サーバ101では、外部記憶装置105としてのハードディスクに、後述するユーザデータベース(ユーザDB)110、設定データベース(設定DB)112、ブックマークデータベース(ブックマークDB)109、URLデータベース(URL DB)111、全文メタ検索用データベース(全文メタ検索用DB)113が格納されている。また、本実施形態では、ユーザがアクセスするWEBサイトのブックマークがユーザごとにハードディスクに格納され、各ユーザがインターネットを介して更新、削除等が可能となっている。
【0064】
また、本実施形態のWEB情報検索サーバ101では、主記憶装置104としてのメインメモリにに、後述するマクロプロファイル208とミクロプロファイル209とこれら各ファイルを作成するための一時データが格納される。なお、外部記憶装置105と主記憶装置は本発明の記憶手段を構成する。
【0065】
本実施形態のWEB情報検索サーバ101で実行されるWEB情報検索プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フロッピーディスク(FD)等の記憶媒体で提供される。そして、WEB情報検索プログラムは、本装置における起動により主記憶装置104上にロードされるようになっている。なお、本実施形態のWEB情報検索プログラムを、ネットワークを介したダウンロードにより提供するような形態とすることも可能である。
【0066】
尚、ユーザ端末114は、それぞれインターネットに接続可能なPC、WS等の通常のコンピュータであるが、この他インターネットに接続可能な携帯電話、PHS、携帯情報端末(PDA)等の携帯端末を使用することも可能である。
【0067】
(WEB情報検索サーバの機能的構成)
次に本実施形態に係るWEB情報検索サーバ101のソフトウェア構成(機能的構成)について説明する。図2は、本実施形態に係るWEB情報検索サーバ101のソフトウェア構成を示す機能ブロック図である。図2に示す各部は、本実施形態のWEB情報検索プログラムをサーバ上で実行することにより主記憶装置104上に生成されるものである。
【0068】
図2に示すように、本実施形態に係るWEB情報検索サーバ101は、分析部201と、データ収集部202と、マクロプロファイル作成部203と、ミクロプロファイル作成部204と、検索部205と、評価部206と、検索結果生成部207とから主に構成される。図2において、矢印線はこれら各部間の各種データの流れを示している。なお、本実施形態では、各部が一つのWEB情報検索サーバ内に存在する構成としているが、これに限られるものではなく、データ収集部202及び検索部205と、他の各部とを別々のコンピュータに設けるようなハードウェア構成とすることも可能である。
【0069】
分析部201は、外部記憶装置105のユーザのブックマークディレクトリ108から全てのブックマークを収集して、後述するブックマークデータを生成し各ブックマークデータを1レコードとしてブックマークデータベース109に登録すると共に、WEBサイトの後述するURL情報とWEBサイトに対するアクセス情報とを含むURLデータを生成して各URLデータを1レコードとしてURLデータベース111に登録するものである。
【0070】
データ収集部202は、URLデータベース111に登録されたすべてのURLデータを参照して、そのURL情報からインターネット上に存在するWEBサイトにアクセスし、各WEBサイトの全文データを収集する。そして、収集したデータに対して索引付けを行って各WEBサイトごとに全文メタ検索用データベース113に登録する。
【0071】
マクロプロファイル作成部203は、URLデータベース111に登録されている全てのURLデータを参照し、各URLデータ中に記録されているユーザIDのユーザ固有データをユーザデータベース110から抽出する。そして、URLデータと抽出したユーザ固有データから、WEBサイトに対するユーザ全体の利用状況を示す後述する各種統計データを生成し、マクロプロファイル208として主記憶装置104上に格納するものである。本実施形態の検索サーバ101では、マクロプロファイル作成部203によるマクロファイルの生成が一定時間ごとに行われるようになっている。なお、この他、ユーザのブックマーク登録時または更新時や、ユーザのブックマークによるWEBサイトへのアクセス時にマクロプロファイル作成処理を実行するように構成してもよい。
【0072】
ミクロプロファイル作成部204は、ブックマークデータベース109に登録されている全てのブックマークデータを参照し、各ブックマークデータ中に記録されているユーザIDのユーザ固有データをユーザデータベース110から抽出する。そして、ブックマークデータと抽出したユーザ固有データから、ユーザごとのWEBサイトの利用状況を示す後述する各種統計データを生成し、ミクロプロファイル209として主記憶装置104上に格納するものである。
【0073】
検索部205は、ユーザ端末114からインターネットを介して検索キーワードによる検索指示を受付け、検索指示があったときに検索キーワードにより全文メタ検索用データベース113から索引付けされたデータを検索するものである。
【0074】
評価部206は、検索部205により検索されたデータの各々に対し、検索指示を行ったユーザの固有データと、マクロプロファイル、ミクロプロファイルとを参照して、重み付け値を付与したり、フィルタリング(所定条件のサイトのデータのみを選択)する等の評価を行うものである。
【0075】
検索結果生成部207は、検索されたWEBサイトのデータを、評価部206によって重み付け値の順番でソートして検索結果データを生成してユーザ端末114に送信したり、一定のフィルタリングされたデータのみから検索結果データを生成してユーザ端末114に送信するものである。
【0076】
(ブックマークの構造)
本実施形態においてブックマークはユーザにより作成、更新されるが、従来の検索システムとは異なり、ブックマークはすべて検索サーバ101の外部記憶装置105(ハードディスク)にユーザごとに作成される。図3(a)は本実施形態のWEB情報検索サーバ101におけるブックマークのディレクトリ構造図であり、図3(b)は各ブックマークのデータ構造図である。
【0077】
図3(a)に示す通り、ブックマークはユーザごとのディレクトリツリー(以下、ブックマークディレクトリという)の中にあり、ブックマークディレクトリ108の直下に作成しても、カテゴリごとにブックマークディレクトリ108の下にフォルダを作成し、そのフォルダの下に作成してもよい。
【0078】
各ブックマークは、図3(b)に示すように、主としてブックマーク名、URL、作成日時、編集日時、最終参照時間、参照回数等から構成され、これ以外のデータを含めることも可能である。
【0079】
このブックマークはユーザ端末114には次のように表示される。図19に示す初期画面の左端のボタンをマウスでクリックすると、図20に示すように、画面左側にブックマーク用フォルダの一覧がツリー形式で表示された検索画面が表示される。ユーザは、所望のフォルダをクリックすると、そのフォルダに格納されているブックマーク一覧が表示されるようになっている。なお、図20に示すように、複数の外部メタ検索エンジン名と各外部メタ検索エンジンに対応してチェックボックス10が表示されている。このチェックボックス10は、全文メタ検索用データベース113からの検索の他、外部メタ検索エンジンを利用して検索を行うことを指定するためのものであり、後述するように、チェックボックス10にチェックされた外部メタ検索エンジンによっても指定した検索キーワードによる検索処理が行われるようになっている。
【0080】
(データベースファイルの構造)
次に、本実施形態のWEB情報検索サーバ101で使用される各種データベースについて説明する。本実施形態では、ユーザデータベース110と、設定データベース112と、ブックマークデータベース109と、URLデータベース111と、全文メタ検索用データベース113とを外部記憶装置105に格納して使用している。尚、図1に示すように本実施形態ではこれらのデータベースを一つの外部記憶装置105(ハードディスク)に記録しているが、各データベース毎に異なる外部記憶装置105に格納して構成しても良い。
【0081】
ユーザデータベース110は、WEB情報検索サーバ101を使用するユーザを管理するものであり、ユーザごとのユーザ固有データを1レコードとして予め登録したものである。図4はユーザデータベース110に登録されるユーザ固有データの構造図である。
【0082】
図4に示すように、ユーザ固有データは主として、ユーザID、パスワード(暗号化データ)、最終アクセス日時、国籍、誕生日、性別、氏名、住所、E-mailアドレス、ホームページURL、電話番号、インターネット歴、職業(例えば、システムエンジニア、セールス、会社経営者、研究職等)、趣味、学歴(例えば、文系/理系や、大学卒/高卒等)等から構成され、ユーザIDがキーとなっている。尚、ユーザ固有データにはさらにユーザに関する情報を含む他のデータを含めてもよい。ここで、ユーザデータベース110は本発明におけるユーザファイルを構成する。
【0083】
ブックマークデータベース109は、ユーザのブックマークの利用状況を示すブックマークデータを1レコードとして登録したものであり、各ブックマークデータは分析部201によりユーザのブックマークディレクトリ108からブックマークを収集して分析することにより生成される。図5は、本実施形態のブックマークデータベース109に登録されるブックマークデータの構造図である。
【0084】
図5に示すように、ブックマークデータは、主としてブックマークIDと、ブックマーク名と、URL、最終参照日時と、ブックマークの作成日時および編集日時と、IPアドレスと、参照回数等から構成される。尚、ブックマークデータにはこの他のデータを含めて構成してもよい。
【0085】
「ブックマークID」は、収集した全てのブックマークについて一意的な識別子である。「ブックマーク名」は、ブックマークディレクトリ108に格納されたブックマークのファイル名である。「ユーザID」はブックマークを所有するユーザのIDであり、後述するユーザデータベース110に登録されているものである。「URL」は、ブックマークを指定したときにアクセスされるWEBサイトのURLであり、URLのIPアドレスが「IPアドレス」して登録される。「参照回数」は、URLの示すWEBサイトに対するユーザの参照回数である。これらの各データの中で、「ブックマーク名」、「URL」、「最終参照日時」、「作成日時」、「編集日時」、「参照回数」の各データは、ブックマークディレクトリ108のブックマークの同一名のフィールドから分析部201によってそのままコピーされ、ユーザIDは、ブックマークディレクトリ108の所有者からユーザデータベース110を参照してユーザIDを取得して生成される。「ブックマークID」は、分析部201によってブックマークデータを登録する際に自動生成され付与される。ここで、ブックマークデータベース109は本発明におけるブックマークファイルを構成する。
【0086】
URLデータベース111は、WEBサイトのURL情報とWEBサイトに対するアクセス情報とを含むURLデータを1レコードとして登録したものであり、各URLデータは分析部201によりユーザのブックマークディレクトリ108からブックマークを収集して分析することにより生成される。図6は,URLデータベース111に登録されるURLデータの構造図である。
【0087】
図6に示すように、URLデータは、主として,作成日時、最終編集日時、URL、タイトル、参照回数、ユーザID等から構成され、URLとユーザIDがキーとなっている。尚、URLデータにはこの他のデータを含めて構成してもよい。また、URLデータベース111にはURLデータが追加されて登録されるようになっており、同一のURLをキーとするURLデータを登録する場合にも既存のURLデータは更新されずに新規のURLデータを追加するようになっている。
【0088】
これらの各データの中で、「URL」、「最終編集日時」、「参照回数」の各データは、ブックマークディレクトリ108のブックマークの同一名のフィールドから分析部201によってそのままコピーされ、「ユーザID」は、ブックマークディレクトリ108のあるユーザディレクトリ名から生成される。
【0089】
ここで、URLデータは本発明におけるサイトデータを構成し、URLデータベース111は本発明におけるサイトファイルを構成する。また、ブックマークデータとURLデータとは本発明におけるブックマーク分析データを構成し、ブックマークデータベース109とURLデータベース111は本発明におけるブックマーク分析ファイルを構成する。
【0090】
設定データベース112は、各ユーザのブックマーク表示画面の各種設定を設定データとしてユーザごとに登録したものである。図7は設定データベース112に登録される設定データの構造図である。この設定データはユーザの指定により変更が可能である。設定データは、図7に示すように、主としてユーザID、スキン(壁紙)設定、所有者、高さ、幅、フォント等から構成され、この他ブックマーク表示に関する設定項目を含めてもよい。
【0091】
全文メタ検索用データベース113は、メタ検索エンジン用の情報を記録するものであり、データ収集部202によりインターネット上のWEBサイトから収集した検索データが登録される。図8は全文メタ検索用データベース113に登録される検索データの構造図である。図8に示すように、検索データは主としてID,ユーザが入力したキーワード、属性、データ取得時間、データ取得URL、URLのタイトル、全文データ(Description)等から構成されるが、この他のデータを含めてもよい。ここで、「ID」は各検索データの識別情報であり、データ収集部202によって検索データの登録時に自動生成されて付与される。また「全文データ」に収集したデータが格納される。
【0092】
(ブックマーク分析処理)
次に以上のように構成された本実施形態のWEB情報検索サーバ101の分析部201によるブックマーク分析処理について説明する。図9は、ブックマーク分析処理のフローチャートである。
【0093】
分析部201では、まずハードディスクのユーザのブックマークディレクトリ108を参照し(ステップS901)、このディレクトリに保存されているブックマークを読み込み、図3(b)に示す各種データを取得する(ステップS902)。このとき、ブックマークがユーザのブックマークディレクトリ108のトップディレクトリではなく、トップディレクトリ中のフォルダに存在している場合には、そのフォルダを参照しフォルダに格納されているブックマークを読み込む。
【0094】
次いで、このブックマークディレクトリ108の所有者をユーザIDとしてユーザデータベース110を検索し、検索されたユーザIDのユーザ固有データを取得する(ステップS903)。そして、ブックマークデータを生成しブックマークデータベース109に登録する(ステップS904)。ここで、ブックマークデータは次のように生成される。
【0095】
ブックマークデータの「ブックマーク名」、「URL」、「最終参照日時」、「作成日時」、「編集日時」、「参照回数」の各データは、ブックマークディレクトリ108のブックマークからコピーされる。「ユーザID」は、ユーザ固有データのユーザIDからコピーされる。「ブックマークID」は、一意的な識別番号が生成されて付与される。尚、他のフィールドは現時点では空である。
【0096】
ブックマークデータの生成及び登録が終了したら、次にURLデータを生成してURLデータベース111へ登録する(ステップS905)。このとき、同一のURLが既に存在するか否かを問わずにURLデータはURLデータベース111へ追加登録される。ここで、URLデータの生成は次のように行われる。
【0097】
URLデータの「URL」、「最終編集日時」、「参照回数」の各データは、ブックマークディレクトリ108のブックマークからコピーされ、「ユーザID」は既に取得したユーザ固有データのユーザIDからコピーされる。尚、他のフィールドは現時点では空である。
【0098】
URLデータの生成及び登録が終了したら、ブックマークディレクトリ108に存在する全てのブックマークについて、ステップS902から905までの処理を繰り返す(ステップS906)。そして、全てのブックマークに対する分析処理が終了したら、次のユーザのブックマークへブックマークディレクトリ108についてステップS901からステップS906までの処理を繰り返す(ステップS907)。これにより、全ユーザの全ブックマークに対してブックマークデータとURLデータが生成され、ブックマークデータはブックマークデータベース109へ、URLデータはURLデータベース111へ登録される。
【0099】
(データ収集処理)
図10は、データ収集部202によるWEBサイトからのデータ収集処理のフローチャートである。データ収集部202では、まずURLデータベース111を参照し(ステップS1001)、登録されているURLデータを読み込む(ステップS1002)。次いで、URLデータのURLフィールドに格納されているURLを指定してWEBサイトにアクセスし(ステップS1003)、WEBサイトのURL、URLタイトル及び全文データを収集すると共に(ステップS1004)、現在日時を取得し、さらに一意的な識別番号を生成する(ステップS1005)。そして、識別番号、現在時刻、URL、タイトル、全文データを、それぞれ検索用データのID、データ取得日時、取得URL、URLタイトル、全文データの各フィールドにコピーすることにより検索用データを生成し、全文メタ検索用データベース113に登録する(ステップS1006)。以上のステップS1001からステップS1006までの処理を、URLデータベース111に登録されている全てのURLデータを参照して行う(ステップS1007)。
【0100】
(マクロプロファイル作成処理)
次に、マクロプロファイル作成部203によるマクロプロファイルの作成処理について説明する。図11は、マクロプロファイル作成処理のフローチャートである。図12は、マクロプロファイル作成部203により作成されるマクロプロファイルの一例を示す説明図である。マクロプロファイル作成部203は、まずURLデータベース111を参照して先頭レコードからURLデータを読み込み、このURLデータから、URL、ユーザID,参照回数、最終参照日時を取得するとともに、取得したURLに対して過去に入力されたすべての入力キーワードを、全文メタ検索用データベース113から検索して抽出する(ステップS1101)。そして、主記憶装置104(メインメモリ)上にマクロプロファイルが作成されているか否かをチェックし(ステップS1102)、未だ作成されていない場合には、マクロプロファイルを主記憶装置104上に生成し(ステップS1103)、その先頭に現在日時を作成日時として記録する(ステップS1104)。
【0101】
次いで、取得したURLが既にマクロプロファイルに記録されているか否かをチェックして(ステップS1105)、未だ記録されていない場合には、取得したURLを記録する。そして、そのURLのブロック内に、ブックマークの総登録数として「1」を記録すると共に、取得した参照回数を総参照回数として記録する。また、取得した最終参照日時の時刻が属する時間帯を定め(例えば、最終参照時刻が1:20の場合、時間帯「0:00〜1:00」とする等)、URLブロック内に参照時間帯として記録する。更に、更に取得したキーワードをURLブロック内に記録する(ステップS1107)。
【0102】
一方、既に取得したURLがマクロプロファイルに記録されている場合には、該当するURLのブロック内の総登録数をインクリメントし、かつ総参照回数に取得した参照回数を加算することにより、URLブロック内総登録数と総参照回数を集計する。また、取得した最終参照日時の時刻が属する時間帯を定めてURLブロック内の参照時間帯に追加し、取得したキーワードをURLブロック内のキーワードに追加する(ステップS1106)。
【0103】
次いで、取得したユーザIDをキーとしてユーザデータベース110を検索し、ユーザ固有データを読み込み、このユーザ固有データから職業、学歴、趣味等の特定の固有データを取得する(ステップS1108)。尚、取得する固有データは一例であり、他の固有データ、例えば年齢等を取得してもよい。
【0104】
次いで、URLブロック内で、職業別登録数(ブックマークの登録数)、職業別参照回数、学歴別登録数、学歴別参照回数、趣味別登録数、趣味別参照回数を集計して、集計したデータをマクロプロファイルのURLブロック内に記録する(ステップS1109)。ここで、集計は、取得した職業等と同一データの職業等の登録数をインクリメントし(最初の記録時には「1」に設定し)、また取得した職業等と同一データの職業等の参照回数を加算する(最初の記録時には参照回数を記録する)ことにより行う。例えば、取得した職業が「システムエンジニア」である場合には、職業「システムエンジニア」のブックマークの登録数をインクリメントすると共に職業「システムエンジニア」の参照回数に取得した参照回数を加算し、他の職業、例えば「セールス」等の登録数及び参照回数は変更しない。
【0105】
このようなステップS1101からステップS1109までの処理を全てのURLデータに対して実行する(ステップS1110)。これにより、ブックマークの総登録数、参照回数、キーワードのアクセス統計データと、参照時間帯、職業別の登録数及び参照回数、学歴別の登録数及び参照回数、趣味別の登録数及び参照回数のユーザ統計データが、URLデータごとに生成される。
【0106】
次いで、これらの統計データから、ブックマーク登録数が最大となる職業データ、参照回数が最大となる職業データを、それぞれ職業別登録数特性データ、職業別参照回数特性データとしてマクロプロファイルに記録する。例えば、ブックマーク登録数が最大となる職業データが「システムエンジニア」の場合には、職業別登録数データを「システムエンジニア」とし、参照回数が最大となる職業データが「セールス」の場合には、職業別参照回数特性データは「セールス」としてマクロプロファイルに記録される。同様に、学歴別登録数特性データ、学歴別参照回数特性データ、趣味別登録数特性データ、趣味別参照回数特性データも求めて、それぞれマクロプロファイルに記録する(ステップS1111)。このような特性データは、それぞれブックマーク登録及びWEBサイトへの参照回数のユーザの偏りを示すものとなる。
【0107】
以上の処理により図12に示すようなマクロプロファイルが作成される。図12に示すように、マクロプロファイルにはURLごとにブロック化され、各ブロック内に、ブックマークの総登録数、職業別登録数、学歴別登録数、趣味別登録数、WEBサイトの総参照回数、職業別参照回数、学歴別参照回数、趣味別参照回数、最多参照時間帯、キーワード等が記録されている。
【0108】
マクロプロファイルの作成について更に一例をあげて説明する。例えば、図13(a)に示すように、URL「http://xxx.xxx.co.jp」についての3個のURLデータと、URL「http://yyy.yyy.com」についての3個のURLデータと、URL「http://zzz.zzz.ne.jp」についての2個のURLデータがURLデータベース111に登録されている場合を考える。ここで、説明の都合上、各URLデータではユーザIDと参照回数のみについて図13(a)に示す値を有する場合を考える。
【0109】
また、図13(b)に示すように、ユーザID「AAA」、「BBB」、「CCC」、「DDD」、「EEE」の5名のユーザ固有データがユーザデータベース110に登録されている場合を考える。ここで、説明の都合上、各ユーザ固有データではユーザIDと職業と学歴のみについて図13(b)に示す値を有する場合を考える。
【0110】
かかる場合、マクロプロファイルには図13(c)に示すデータが記録される。例えば、URL「http://xxx.xxx.co.jp」については、ユーザ「AAA」、「CCC」、「DDD」の3名がアクセスしており、その総参照回数は3名の参照回数の合計である「5回」が記録される。そして、職業別の参照回数をみると、職業「システムエンジニア」の参照回数については、ユーザ「AAA」、「CCC」の2名の参照回数の合計である「3回」が記録され、職業「セールス」の参照回数についてはユーザ「DDD」1名の参照回数である「2回」が記録される。従って、職業別参照回数特性データは、参照回数の多い職業を選択し、「システムエンジニア」として記録される。また、学歴別参照回数特性データも同様に求め、参照回数の多い学歴である「文系」としてマクロプロファイルに記録される。他のURLの総参照回数、職業別の参照回数と職業別参照回数特性データ、学歴別の参照回数と学歴別参照回数特性データについても同様の方法で統計されて、図13(c)に示すように記録される。
【0111】
尚、図12及び図13(c)はマクロプロファイルの一例を示すものであり、ユーザ全体のWEBサイトの利用状況に応じて任意の構造を有するマクロプロファイルを作成することが可能である。また、本実施形態では、マクロプロファイルに職業データごとの登録数や参照回数等のユーザ固有データごとの登録数や参照回数を記録しているが、これらのデータはメモリ上に保持しておくだけとし、最終的な職業別登録数特性データ、職業別参照回数特性データ等の特性データのみをマクロプロファイルに記録するように構成してもよい。
【0112】
尚、本実施形態では、特性データを職業、学歴、趣味について求めているが、他のユーザ固有データについての特性データを更に求めてもよい。
【0113】
(ミクロプロファイル作成処理)
次に、ミクロプロファイル作成部204によるミクロプロファイルの作成処理について説明する。図14は、ミクロプロファイル作成処理のフローチャートである。図15は、ミクロプロファイル作成部204により作成されるミクロプロファイルの一例を示す説明図である。ミクロプロファイル作成部204は、まずユーザデータベース110を参照してユーザ固有データを先頭レコードから読み込み、読み込んだユーザ固有データからユーザIDを取得する(ステップS1401)。
【0114】
そして、主記憶装置104(メインメモリ)上にミクロプロファイルが作成されているか否かをチェックし(ステップS1402)、未だ作成されていない場合には、ミクロプロファイルを主記憶装置104上に生成し(ステップS1403)、その先頭に現在日時を作成日時として記録する(ステップS1404)。
【0115】
次いで、取得したユーザIDをキーとしてブックマークデータベース109からブックマークデータを検索する(ステップS1405)。そして、検索されたブックマークデータを読み込み、URL、最終参照日時、参照回数を取得するとともに、取得したURLに対して過去に入力されたすべての入力キーワードを、全文メタ検索用データベース113から検索して抽出する(ステップS1406)。次いで、取得したURLと参照回数とをミクロファイルのユーザIDのブロック内に記録すると共に、取得した最終参照日時の時刻が属する時間帯を定めて(例えば、最終参照時刻が1:20の場合、時間帯「0:00〜1:00」を選択)、参照時間帯としてミクロプロファイルのユーザIDのブロック内に記録する(ステップS1407)。
【0116】
このようなステップS1406及びステップS1407の処理を、ステップS1405で検索された、同一ユーザIDを有する全てのブックマークデータに対して行う(ステップS1408)。検索された全てのブックマークデータに対する処理が終了したら、以上のステップS1401からステップS1408までの処理を全てのユーザ固有データに対して実行する(ステップS1409)。
【0117】
以上の処理により図15に示すようなミクロプロファイルが作成される。図15に示すように、ミクロプロファイルにはユーザIDごとに、URLごとの参照回数、URLごとの参照時間帯が記録されている。ここで、URLごとの参照回数、URLごとの参照時間帯は本発明におけるサイト統計データを構成する。
【0118】
尚、図15はミクロプロファイルの一例を示すものであり、各ユーザのWEBサイトの利用状況に応じて任意の構造を有するミクロプロファイルを作成することが可能である。
【0119】
(検索処理、評価処理及び検索結果生成処理)
次に、本実施形態のWEB情報検索サーバ101による検索処理、評価処理及び検索結果生成処理について説明する。図16は、検索、評価及び検索結果生成処理のフローチャートである。
【0120】
ユーザ端末114からインターネットを介してキーワードによる検索指示があると、まず検索部205は、ユーザ端末114から図20の画面で各外部メタ検索エンジンのチェックボックス10にチェックがされているか否かを確認することにより、外部メタ検索エンジンを利用するか否かを確認する(ステップS1601)。
【0121】
そして、いずれかの外部メタ検索エンジンがチェックされていれば、チェックされている外部メタ検索エンジンを利用すると判断し、ユーザ端末114から指示された検索キーワードを指定された外部メタ検索エンジンごとにその外部メタ検索エンジン用のキーワードの形式に加工する(ステップS1602)。キーワードの加工は、例えば、AND条件、OR条件の指定形式等を外部メタ検索エンジン用に変更することにより行う。
【0122】
ついで、加工したキーワードをそれぞれ各外部メタ検索エンジンに渡し(ステップS1603)、各外部メタ検索エンジンで同時に検索を実行させる。そして、各外部メタ検索エンジンからの検索結果を全文メタ検索用データベース113に登録することによりマージする(ステップS1604)。そして、ステップS1605で、全文メタ検索用データベース113を検索することにより、結果的に、ユーザは全文メタ検索用データベース113だけでなく、外部メタ検索エンジンによるリアルタイムな検索結果を利用することが可能となる。一方、ステップS1601において、いずれの外部メタ検索エンジンも利用しないと判断した場合には、ステップS1605で全文メタ検索用データベースからの検索を行う。
【0123】
ステップS1605では、公知の手法で全文メタ検索用データベース113から指定されたキーワードに基づいた検索を行い、検索条件に合致するデータ(以下、「検索データ」という)を取得する。そして、検索指示を行ったユーザのログイン情報等からユーザIDを取得して、このユーザIDをキーとしてユーザデータベース110からユーザ固有データを検索して取得する(ステップS1606)。
【0124】
次いで、評価部206によってマクロプロファイルに基づく検索データの評価処理を行う(ステップS1607)。図17は、マクロプロファイルに基づく評価処理のフローチャートである。
【0125】
評価部206では、まず検索データを読み込み、WEBサイトのURLを取得する(ステップS1701)。そして、主記憶装置104上のマクロプロファイルを参照し、検索データのURLと同一URLのブロックに記録されているアクセス統計データ及びユーザ統計データを取得する(ステップS1702)。
【0126】
次いで、ユーザ固有データの職業、学歴、趣味等の各固有データと、URLに対する職業別登録数特性データ、学歴別登録数特性データ、趣味別登録数特性データ等の各固有データ別登録数特性データとをそれぞれ比較する(ステップS1703)。そして、各固有データが各特性データと一致する場合には、現在処理している検索データに対する重み付け値をインクリメントすると共に、この検索データを選択対象とする旨を主記憶装置104上に記憶しておく(ステップS1704)。かかる処理は、職業等の各データと固有データ別の参照回数特性データについても行う(ステップS1705、S1706)。
【0127】
次いで、現在時刻がマクロプロファイルのURLブロックに記録された参照時間帯に含まれているか否かを判断し(ステップS1707)、含まれている場合には現在処理中の検索データに対して重み付け値をインクリメントすると共に、この検索データを選択対象とする旨を主記憶装置104上に記憶しておく(ステップS1708)。更に、指定されたキーワードがマクロプロファイルのURLブロックに記録されたキーワードに含まれているか否かを判断し(ステップS1709)、含まれている場合には現在処理中の検索データに対して重み付け値をインクリメントすると共に、この検索データを選択対象とする旨を主記憶装置104上に記憶しておく(ステップS1710)。
【0128】
以上のステップS1701からステップS1710までの処理を、検索された全ての検索データに対して順次行う(ステップS1711)。これにより、各検索データに重み付け値が付与されると共に、一定の検索データが選択対象となる。
【0129】
尚、本実施態様では各検索データに対して重み付け値を付与すると共に、選択対象とするか否かを判断してるが、いずれかのみを行うように構成してもよい。
【0130】
マクロプロファイルに基づく評価処理が終了したら、図16に戻り、ユーザIDから検索指示を行っているユーザがすでにユーザデータベース110に登録されているユーザか、一時的に検索システムを利用しているゲストユーザかを判断する(ステップS1608)。検索指示を行ったユーザがゲストユーザでない場合には、評価部206によってミクロプロファイルに基づく検索データの評価処理を行う(ステップS1609)。一方、検索指示を行ったユーザがゲストユーザである場合には、ミクロプロファイルに基づく評価処理を行わない。図18は、ミクロプロファイルに基づく評価処理のフローチャートである。
【0131】
評価部206では、まず検索データを読み込み、WEBサイトのURLを取得する(ステップS1801)。そして、主記憶装置104上のミクロプロファイルを参照し、図16のステップS1606で取得したユーザIDのブロック中で、検索データのURLと同一URLのブロック内のサイト統計データを取得する(ステップS1802)。
【0132】
次いで、現在時刻を取得して、現在時刻がミクロプロファイルの前記URLブロック内の参照時間帯に含まれるか否かを判断し(ステップS1803)、含まれる場合には現在処理中の検索データに対する重み付けをインクリメントすると共に、この検索データを選択対象とする旨を主記憶装置104上に記憶しておく(ステップS1804)。更に、指定されたキーワードがミクロプロファイルに記録されたURLに対するキーワードに含まれているか否かを判断し(ステップS1805)、含まれている場合には現在処理中の検索データに対して重み付け値をインクリメントすると共に、この検索データを選択対象とする旨を主記憶装置104上に記憶しておく(ステップS1806)。次いで、ミクロプロファイルに記録されている前記URLブロック内の参照回数を、現在処理中の検索データに対する重み付け値に加算する(ステップS1807)。
【0133】
以上のステップS1801からステップS1807までの処理を、検索された全ての検索データに対して順次行う(ステップS1808)。これにより、更に各検索データに重み付け値が付与されると共に、一定の検索データが選択対象となる。
【0134】
尚、本実施態様では各検索データに対して重み付け値を付与すると共に、選択対象とするか否かを判断してるが、いずれかのみを行うように構成してもよい。
【0135】
マクロプロファイル及びミクロプロファイルに基づく評価処理が終了したら、図16に戻り、検索結果生成部207による検索結果データの生成処理が行われる。検索結果生成部207では、選択対象とされている検索データのみを抽出(フィルタリング)し(ステップS1610)、更にフィルタリングされた検索データを、重み付け値の高い順番にソート(昇順ソート)する(ステップS1611)。そして、ソートされた検索データを一覧表示するための検索結果データを生成し、生成された検索結果データをユーザ端末114に送信する(ステップS1612)。図21に、ユーザ端末114に表示される検索結果一覧画面の一例を示す。これにより、ユーザ端末114には、WEBサイトのユーザ全体の利用状況とユーザのWEBサイトの利用状況が反映された検索結果が表示されることになる。
【0136】
このように本実施形態のWEB情報検索サーバ101では、マクロプロファイルのWEBサイトに対する全ユーザの利用状況を利用して検索データに対し重み付け値の付与やフィルタリング処理を行っているので、WEBサイトにアクセスするユーザの傾向や偏りを検索結果一覧に反映することができ、また人気のあるWEBサイトやアクセスの多いWEBサイトを中心に検索結果一覧を提供することが可能となる。また、本実施形態のWEB情報検索サーバ101では、ミクロプロファイルのユーザごとのWEBサイトの利用状況を利用して検索データに対し重み付け値の付与やフィルタリング処理を行っているので、同一キーワードでもユーザが異なったり検索時刻が異なれば、各ユーザごとに時刻による最適な検索結果を提供することが可能となる。
【0137】
以上説明したとおり、発明によれば、多大なWEBサイトの情報量を検索対象としながらも、検索結果としてユーザに必要な情報をユーザにとって最適な形式で提供することができるという効果を奏する。また、本発明によれば、刻々と変化するユーザ全体の利用状況やユーザごとのWEBサイトの利用状況を逐次取得して検索されたデータの評価に用いることができ、同一キーワードでも検索する時期に最も適した検索結果をユーザに提供することができるという効果を奏する。さらに、本発明によれば、ブックマークの分析や検索されたWEBサイトのデータの評価をユーザに全く意識させずに行うことができ、ユーザ自らWEBサイトの分類や評価を行う必要がなく、ユーザの便宜が図られるという効果を奏する。特に、本発明によれば、WEBサイトにアクセスするユーザの傾向や偏りを検索結果に反映することができ、また人気のあるWEBサイトやアクセスの多いWEBサイトを中心に検索結果の提供を行えるという効果を奏する。更に、同一キーワードでもユーザが異なったり、検索時刻が異なれば各ユーザごとに時刻による最適な検索結果を提供できるという効果を奏する。
【0138】
また、本発明によれば、各WEBサイトごとにアクセスするユーザの特定のユーザ固有データに基づいた偏りを求めることができ、多大なWEBサイトの情報量を検索対象としながらも、ユーザの興味の対象となるWEBサイトのデータを優先的に検索結果として提供することができるという効果を奏する。
【0139】
また、本発明によれば、各WEBサイトのアクセス状況を求めることができ、多大なWEBサイトの情報量を検索対象としながらも、ユーザにアクセス数やアクセス頻度の高いWEBサイトのデータを優先的に検索結果として提供することができるという効果を奏する。
【0140】
また、本発明によれば、各ユーザのWEBサイトに対する偏りを求めることができ、多大なWEBサイトの情報量を検索対象としながらも、ユーザの過去のアクセス状況を反映した検索結果を提供することができるという効果を奏する。
【0141】
また、本発明によれば、多大なWEBサイトの情報量を検索対象としながらも、ユーザにとって必要性の高いWEBサイトから順に一覧表示した検索結果を提供することができるという効果を奏する。
【0142】
また、本発明によれば、多大なWEBサイトの情報量を検索対象としながらも、ユーザにとって必要性のあるWEBサイトのデータのみからなる検索結果を提供することができるという効果を奏する。
【0143】
また、本発明によれば、ブックマーク分析ファイルをブックマークファイルとサイトファイルとを含むように構成して各ファイルの管理が容易となるという効果を奏する。
【0144】
【発明の効果】
本発明によれば、多大なWEBサイトの情報量を検索対象としながらも、検索結果としてユーザに必要な情報をユーザにとって最適な形式で提供することができるという効果を奏する。
【図面の簡単な説明】
【図1】本実施形態のWEB情報検索サーバのハードウェア構成図である。
【図2】本実施形態のWEB情報検索サーバのソフトウェア構成を示す機能ブロック図である。
【図3】図3(a)は本実施形態のWEB情報検索サーバにおけるブックマークのディレクトリ構造図であり、図3(b)は各ブックマークのデータ構造図である。
【図4】本実施形態のWEB情報検索サーバにおけるユーザデータベースのデータ構造図である。
【図5】本実施形態のWEB情報検索サーバにおけるブックマークデータベースのデータ構造図である。
【図6】本実施形態のWEB情報検索サーバにおけるURLデータベースのデータ構造図である。
【図7】本実施形態のWEB情報検索サーバにおける設定データベースのデータ構造図である。
【図8】本実施形態のWEB情報検索サーバにおける全文メタ検索用データベースのデータ構造図である。
【図9】本実施形態のWEB情報検索サーバにおけるブックマーク分析処理のフローチャートである。
【図10】本実施形態のWEB情報検索サーバにおけるデータ収集処理のフローチャートである。
【図11】本実施形態のWEB情報検索サーバにおけるマクロプロファイル作成処理のフローチャートである。
【図12】本実施形態のWEB情報検索サーバにおけるマクロプロファイルの構造の一例を示す説明図である。
【図13】本実施形態のWEB情報検索サーバにおけるマクロプロファイル作成過程の一例を示す説明図である。
【図14】本実施形態のWEB情報検索サーバにおけるミクロプロファイル作成処理のフローチャートである。
【図15】本実施形態のWEB情報検索サーバにおけるミクロプロファイルの構造の一例を示す説明図である。
【図16】本実施形態のWEB情報検索サーバにおける検索、評価及び検索結果表示の全体処理のフローチャートである。
【図17】本実施形態のWEB情報検索サーバにおけるマクロプロファイルを使用した評価処理のフローチャートである。
【図18】本実施形態のWEB情報検索サーバにおけるミクロプロファイルを使用した評価処理のフローチャートである。
【図19】本実施形態のWEB情報検索サーバを使用するユーザ端末に表示される初期画面を示す模式図である。
【図20】本実施形態のWEB情報検索サーバを使用するユーザ端末に表示されるブックマークの例を示す検索画面の模式図である。
【図21】本実施形態のWEB情報検索サーバを使用するユーザ端末に表示される検索結果表示画面の一例を示す模式図である。
【符号の説明】
101 情報検索サーバ、102 通信装置、103 制御装置、104 主記憶装置、105 外部記憶装置、106 入力装置、107 出力装置、108 ブックマークディレクトリ、109 ブックマークデータベース、110 ユーザデータベース、111 URLデータベース、112 設定データベース、113 全文メタ検索用データベース、114 ユーザ端末、201 分析部、202 データ収集部、203 マクロプロファイル作成部、204 ミクロプロファイル作成部、205 検索部、206 評価部、207 検索結果生成部、208 マクロプロファイル、209 ミクロプロファイル、10 外部メタ検索エンジン指定用チェックボックス
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a WEB information search apparatus, a WEB information search method, and a program for causing a computer to execute the method, which search a WEB site on the Internet based on a keyword input by a user.
[0002]
[Prior art]
Conventionally known robot search engines, directory search engines, and meta search engines are known as search engines that perform full-text search of WEB sites (WEB pages) on the Internet according to user search instructions.
[0003]
When a keyword related to information to be searched is specified, the robot-type search engine periodically collects information on all WWW servers that can be found on the Internet using a WWW search program called a WEB robot or spider. The information is automatically indexed. Since this robot type search engine automatically collects data of WEB sites all over the world by a computer, it has an advantage of a large amount of information.
[0004]
The directory-type search engine allows the operator to categorize the URL (Universal Resource Locator) of the WEB site in advance, such as art, business, education, etc. To do. Since this directory type search engine classifies information by field, the user can use it like an occupational telephone book, and has the advantage that it is convenient when searching after determining a field.
[0005]
[Problems to be solved by the invention]
However, such a conventional search engine has the following problems. In the case of a robot-type search engine, there is an advantage that a large amount of information is collected. On the other hand, since the search robot simply indexes the words that appear in the collected WEB site information, the WEB site In many cases, there are tens of thousands of cases. For this reason, there is a problem that a site that is not originally related to the user is displayed as a search result, the quality of the search result is low, and the user needs an enormous amount of time to narrow down the target WEB site. .
[0006]
In addition, since the search robot performs a search, even if different users search, as long as the search is performed with the same keyword, only the same search result is always obtained, and a satisfactory search result is obtained for all users having different profiles and preferences. There is a problem that it is rarely obtained.
[0007]
In the case of a directory-type search engine, the data input and classification of the WEB site is basically performed manually, so the amount of information is two to three orders of magnitude less than the service provided by the robot-type search engine. There is a problem that you can not find anything other than. In addition, since the data input and classification of the WEB site depend on the business processing ability of the worker, there is a limit in increasing the amount of information.
[0008]
In the case of a directory-type engine, the collected WEB site information is simply classified according to the field. Therefore, as with the robot-type search engine, even if a different user searches, the same keyword is always used. There is a problem that only search results can be obtained, and satisfactory search results are rarely obtained for all users having different profiles and preferences.
[0009]
The present invention has been made in view of such problems, and provides a search result of WEB site information necessary for a user who performs a search in an optimum format while targeting a large amount of information on the WEB site. It is a main object of the present invention to provide a WEB information search apparatus and a WEB information search method that can be performed. Another object of the present invention is to provide a WEB information search apparatus capable of providing a user with a search result of WEB site information in a form reflecting a use situation with respect to the WEB site while searching for a large amount of information on the WEB site. And providing a web information retrieval method.
[0010]
[Means for Solving the Problems]
  To achieve the above objective,BookThe present invention relates to a user file in which user-specific data is registered in advance for each user in a WEB information search apparatus that searches a WEB site on the Internet based on a search keyword input from a user terminal and transmits a search result to the user terminal. Storage means for recording a bookmark including identification information of a WEB site accessed by a user;SaidAnalyzing means for collecting bookmarks of all users from the storage means, generating bookmark analysis data including user bookmark usage information, WEB site identification information, and WEB site access information, and registering the bookmark analysis data in a bookmark analysis file; Based on all the bookmark analysis data, data is collected from a web site on the Internet and registered in a search file, and at a predetermined time, from all the bookmark analysis data and the user-specific data , A macro profile creating means for generating a macro profile that records the usage status of the entire user for the WEB site, and the usage status of the WEB site for each user from all the bookmark analysis data and the user-specific data at a predetermined time Recorded Miku A micro-profile creating means for generating a profile; a search means for searching for data from a search file based on the keyword when a search instruction based on a search keyword is input from a user terminal; and each of the searched data Evaluation means for evaluating based on user-specific data and / or the macro profile and / or the micro profile of the user who has made the search instruction, and a search result from the searched data based on the evaluation by the evaluation means Search result generation means for generating data and transmitting it to the user terminal.The usage status of the entire user in the macro profile includes, for each WEB site, specific user-specific data of the user who has the highest number of times of reference to the WEB site among the entire user in association with the WEB site. The evaluation means includes the specific user-specific data that matches the specific user-specific data included in the macro profile in the user-specific data of the user who has made the search instruction. And assigning a weighting value to the searched data corresponding to the WEB site related to the user-specific data, and the search result generating means sorts the searched data in an order based on the weighting value to obtain a search result Generate dataIt is characterized by that.
[0011]
DETAILED DESCRIPTION OF THE INVENTION
  In the present invention, in a WEB information search apparatus that searches a WEB site on the Internet based on a search keyword input from a user terminal and transmits a search result to the user terminal, a user who has previously registered user-specific data for each user A file, a storage unit for recording a bookmark including identification information of a WEB site accessed by the user, a bookmark of all users from the storage unit, and the user's bookmark usage information, the identification information of the WEB site, and the WEB site Analysis means for generating bookmark analysis data including access information and registering it in a bookmark analysis file, and data for collecting data from a web site on the Internet and registering it in a search file based on all the bookmark analysis data Collecting means and predetermined A macro profile creating means for generating a macro profile that records the usage status of the entire user for the WEB site from all the bookmark analysis data and the user-specific data, and all the bookmark analysis data at a predetermined time And the user-specific data, a micro-profile creating means for generating a micro-profile that records the usage status of the WEB site for each user, and when a search instruction based on a search keyword is input from the user terminal, based on the keyword Retrieval means for retrieving data from a retrieval file, and each of the retrieved data is evaluated based on user-specific data and / or the macro profile and / or the micro profile of the user who has made the retrieval instruction. Evaluation means and the evaluation Characterized in that and a search result generating means for transmitting to the user terminal generates a search result data from the retrieved data based on the evaluation by the stage.
  In the present invention, since the bookmarks of the user are stored in the storage means on the search device side (that is, the search server side) instead of the user terminal side, it is possible to collect bookmark information used by all users. In the present invention, bookmarks of all users are collected and analyzed from the storage means on the search device side, and bookmark analysis data including user bookmark usage information, WEB site identification information, and WEB site access information is generated. To register in the bookmark analysis file. Further, at a predetermined time, a macro profile is generated from all the bookmark analysis data and the user-specific data from the created bookmark analysis data and the user-specific data, from the bookmark analysis data and the user-specific data, and the micro profile is generated by the micro profile generation means. Are evaluated based on the user-specific data and the macro profile and / or micro profile of the user who has instructed the search by the evaluation means for each of the data searched by the search means. Here, since the macro profile records the usage status of the entire user for the WEB site, and the micro profile records the usage status of the WEB site for each user, the retrieved data is the user for the WEB site. Evaluation is performed based on the overall usage status and usage status of the WEB site for each user, and search result data is generated and transmitted to the user terminal.
[0012]
As described above, in the present invention, the user-specific data, the usage status of the entire user with respect to the WEB site, and the data searched using the usage status of the WEB site for each user are evaluated, and the data searched based on the evaluation result Since search result data is generated and transmitted to the user terminal, information necessary for the user as a search result can be provided in a format optimal for the user, while a large amount of information on the WEB site is a search target. It becomes possible.
[0013]
That is, in the present invention, the user-specific data and the data retrieved using the macro profile WEB site are evaluated, so that the search that provides the tendency and bias of users accessing the WEB site is evaluated. It can be reflected in the results. Further, in the present invention, since the searched data is evaluated by using the usage status of all users for the macro profile WEB site, the search result is provided mainly on the popular WEB site and the frequently accessed WEB site. Therefore, it is possible to prevent LINK site data that is less frequently accessed or less frequently accessed from being provided. Furthermore, in the present invention, evaluation is performed using the user-specific data and the usage status of the WEB site for each user of the micro profile, so even if the same keyword is used, different optimum search results are provided for each user. be able to.
[0014]
In the present invention, since the macro profile and the micro profile are generated at a predetermined time by the macro profile creation means and the micro profile creation means, the usage situation of the entire user which changes every moment and the use of the WEB site for each user. The situation can be sequentially obtained and used for evaluation of the searched data, and the search result most suitable for the time of searching even with the same keyword can be provided to the user.
[0015]
Further, since the user's bookmark is stored in the storage means on the search device, such bookmark analysis and evaluation of the data of the searched WEB site can be performed without making the user aware of it at all. There is no need to classify and evaluate the WEB site by itself, which is convenient for the user.
[0016]
As the user-specific data in the present invention, any data can be used as long as it is information specific to each user. For example, the user name or user ID, password, occupation, educational background, hobby, etc. are applicable. Further, the identification information of the WEB site corresponds to any information as long as the WEB site can be identified on the Internet, for example, a URL, an IP address, or the like. In addition, the bookmark in the present invention only needs to include this WEB site identification information, and may further include information including other data such as a title name.
[0017]
The bookmark usage information in the present invention is information regarding the usage status of the user's bookmark, and can include the number of bookmark registrations, the bookmark creation date and time, the last visit date and time, etc. in addition to the above-described bookmark information. In addition, the access information of the WEB site in the present invention includes all information related to the access such as the accessed user name or the user ID, such as the number of times of reference to each WEB site, the access frequency, and the time period when the access number is a certain number or more. To do.
[0018]
The “predetermined time” when the macro profile creation means and the micro profile creation means of the present invention generate each file is, for example, any user to the WEB site recorded in the bookmark when the user registers the bookmark at regular intervals. Can be arbitrarily determined when a search instruction is given by the user.
[0019]
The macro profile and the micro profile of the present invention only need to be generated at a predetermined time, and in addition to temporarily generating in a main storage device such as a memory, generating and storing in an external storage device such as a hard disk, Further, it can be generated as a database file. In this case, it can be reflected at the next search.
[0020]
The macro profile “usage status of all users for the WEB site” in the present invention includes, for example, the total number of bookmarks registered by the user for the WEB site, the bias of users accessing the WEB site, the number of accesses of all users for the WEB site, Access time zone bias for WEB sites. The number of accesses to the WEB site of a specific user corresponds, but any information can be used as long as it indicates the usage status of the entire user.
[0021]
In addition, the “use status of each user with respect to the WEB site” of the micro profile in the present invention includes, for example, user information, WEB site statistics used by the user, bias due to WEB site statistics, user access time to the WEB site, user search keywords The history information of the WEB site searched by each of the statistics and each keyword is applicable, but any information can be used as long as it indicates the usage status of the individual user.
[0022]
The data collected from the WEB site by the data collecting means and registered in the search file is preferably full-text data, but it is also possible to use only keyword data or summarized data.
[0023]
  The evaluation means in the present invention may be any means that evaluates the data retrieved by the retrieval means based on the user-specific data and the macro profile and / or the micro profile. Is not particularly limited in the present invention. For example, ranking a WEB site, filtering only a predetermined WEB site, and the like can be arbitrarily performed.
[0024]
The user file and bookmark analysis file of the present invention can be regular files, but are preferably database format files.
[0025]
  Of the present inventionIn the WEB information search device, the macro profile creation means generates a macro profile including user statistical information obtained by statistically analyzing users accessing each WEB site according to specific user specific data from the bookmark analysis data and the user specific data. The evaluation means evaluates each of the searched data based on specific user-specific data of the user who has made the search instruction and the user statistical information. To do.
[0026]
In the present invention, since a macro profile including user statistical information obtained by statistically analyzing users accessing each WEB site by specific user-specific data is generated by the macro profile creation means, a specific user who accesses each WEB site is specified. A bias based on user-specific data can be determined. For this reason, by evaluating the searched data based on the specific user-specific data and user statistical information of the user who made the search instruction, the user's It becomes possible to preferentially provide the data of the WEB site to be interested as a search result.
[0027]
The “specific user specific data” in the present invention is specific information excluding management information such as a user name and a password, and includes, for example, age, occupation, educational background, hobbies, and the like. For example, by creating user statistical information based on specific user-specific data such as “occupation” by the macro profile creation means, it is possible to obtain a bias of a WEB site that is frequently accessed by users having the same or similar “occupation”. it can. At this time, when there is a WEB site with a large number of accesses for a user of a certain occupation according to this user statistical information, the WEB site is included in the data retrieved by the retrieval instruction from the user having this occupation data. In such a case, it is most suitable for the user if the WEB site data is preferentially evaluated, and the WEB site is first ranked on the WEB page of the search result to generate the search result data. Search results can be provided.
[0028]
  Of the present inventionIn the WEB information search device, the macro profile creation means generates a macro profile including statistical information of access to each WEB site from the bookmark analysis data and the user specific data, and the evaluation means Each of the retrieved data is evaluated based on the access statistical information.
[0029]
In the present invention, since the macro profile including access statistical information for each WEB site is generated by the macro profile creating means, the access status of each WEB site can be obtained. For this reason, it is possible to evaluate the searched data based on the access status, and while giving a large amount of information on the WEB site as a search target, priority is given to the data on the WEB site having a high number of accesses and frequent access to the user. Can be provided as a search result.
[0030]
For example, the total number of times of reference to the WEB site is obtained as the access statistical information, and the WEB site having a large total number of references is evaluated as a highly popular site. The search result generation means is configured to generate search result data by sorting in the order of the WEB sites having the highest number of accesses, or to select only WEB sites with a certain number of accesses or more to generate search result data. Accordingly, it is possible to provide only data of a highly popular WEB site to the user.
[0031]
The access statistical information in the present invention corresponds to, for example, the total reference count of the WEB site, the reference time for the WEB site, the time zone when the number of accesses is high, and the like. Absent.
[0032]
  As another aspect of the present invention, in a WEB information retrieval apparatusThe macro profile creating means includes a macro including history data including keywords used in a past search for each WEB site and identification information of the WEB site searched in the past from the search file and the bookmark analysis data. A profile is generated, and the evaluation means evaluates each of the searched data based on the search keyword and the history data. According to the present invention, since the search result is evaluated based on the past search keyword and the history data, it is possible to prevent providing the search result of the WEB site that has nothing to do with reflecting the past search situation. Can do.
[0033]
  Of the present inventionIn the WEB information retrieval apparatus, the micro profile creating means generates a micro profile including site statistical information of access to each user's WEB site from the bookmark analysis data and the user-specific data, and the evaluation means Is characterized in that each of the searched data is evaluated based on user-specific data of the user who has made the search instruction and the site statistical information.
[0034]
In the present invention, since the micro profile including the site statistical information for each WEB site of the user is generated by the micro profile creating means, it is possible to obtain the bias of each user with respect to the WEB site. For this reason, a large number of WEB sites can be obtained by evaluating the data retrieved based on the bias of the WEB site based on the unique data (user name, user ID, etc.) of the user who issued the search instruction and the site statistical information of the user. It is possible to provide a search result reflecting the past access status of the user while making the amount of information to be searched.
[0035]
Examples of the site statistical information in the present invention include, but are not limited to, the number of accesses to each WEB site (reference count), the staying time after reference, the referenced time zone, and the like.
[0036]
  Of the present inventionIn the WEB information search device, the micro profile creating means obtains historical data including keywords used by each user in the past and identification information of a WEB site accessed based on the search result from the bookmark analysis data and the user specific data. The evaluation unit is configured to evaluate each of the searched data based on the user-specific data of the user who issued the search instruction and the history data. And
[0037]
In the present invention, the micro profile creation means generates a micro profile including historical data including keywords used by each user in the past and identification information of the WEB site accessed based on the search results. Based on the access tendency can be determined. For this reason, by evaluating the data searched based on the access tendency to the WEB site based on the unique data (user name, user ID, etc.) of the user who made the search instruction and the history data of the user, It becomes possible to provide a search result reflecting the access tendency.
[0038]
For example, if the evaluation means determines that the currently specified search keyword exists in the history data of the user who has given the search instruction, the search keyword in the data searched by the search result generation means Based on the above, it is possible to preferentially capture the WEB site accessed in the past into the search result data. In this case, it is possible to preferentially provide data of a related WEB site for the user as a search result, and it is possible to avoid displaying an irrelevant site as a search result.
[0039]
  Of the present inventionIn the WEB information search apparatus, the evaluation means evaluates each of the searched data, and then assigns a weight value to each of the searched data based on an evaluation result, and generates the search result The means is characterized in that the search data is generated by sorting the searched data in an order based on the weighting value.
[0040]
The data on the WEB site searched by the search means are not all important at the same level. For this reason, in the present invention, for each of the data searched by the evaluation means, a weighting value is set based on the evaluation result based on the user-specific data, the usage status of the entire macro profile user and the usage status of each user of the micro profile. The search result data is generated by ranking the data that has been assigned and searched, and sorted in the order based on the weighting values by the search result generation means, so that a large amount of information on the WEB site is targeted for search. In addition, it is possible to provide search results displayed in order from the WEB site that is highly necessary for the user.
[0041]
As such an evaluation means, for example, a high weight is given in the order of importance or in the order of high access frequency, and the data searched by the search result generation means in ascending order of the weight value is displayed. be able to. In this case, since it is displayed from a site important for the user or a site with high access frequency, there is an advantage that it is convenient for the user to reach the target WEB site without displaying the search result page many times. . In this case, the weighting value can be assigned by the evaluation means based on user-specific data such as macro profile access frequency, access count, micro profile occupation, and hobbies.
[0042]
  Of the present inventionIn the WEB information search device, the evaluation means evaluates each of the searched data, and then classifies each of the searched data based on an evaluation result. The search result generation means The search result data is generated by selecting only the searched data belonging to the category.
[0043]
The data on the WEB site searched by the search means is not always necessary for the user, and there are many unnecessary data depending on the user. Therefore, in the present invention, the data searched by the evaluation means is classified based on the evaluation result based on the user-specific data, the usage status of the entire macro profile user, and the usage status of each user of the micro profile, and the search result generation Since the search result data is generated only from the data belonging to the predetermined classification by the means, the search result consisting only of the data of the WEB site that is necessary for the user can be obtained while making the amount of information of the WEB site a search target. It becomes possible to provide.
[0044]
As such an evaluation means, the data searched for each user-specific data having a certain number of user accesses or more is classified, and the classification to which the user-specific data of the user instructed to search by the search result generation means belongs The search result data can be generated by selecting only the data. In this case, since only the site most suitable for the user's occupation and preference is displayed, there is an advantage that it is convenient for the user to reach the target WEB site without displaying the search result page many times. is there. The classification by the evaluation means in this case can be performed based on the bias of users accessing the WEB site of the macro profile and user-specific data.
[0045]
  Of the present inventionIn the WEB information retrieval apparatus, the bookmark analysis file includes a bookmark file in which bookmark data including bookmark usage information is registered, and a site file in which site data including identification information of the WEB site and access information to the WEB site is registered. It is characterized by being.
[0046]
In the present invention, the bookmark analysis file is configured to include a bookmark file in which bookmark data including bookmark use information is registered, and a site file in which site data including identification information of the WEB site and access information to the WEB site is registered. This makes it easy to manage each file.
[0060]
  With reference to the attached drawings below,DESCRIPTION OF EMBODIMENTS Preferred embodiments of a WEB information retrieval apparatus, a WEB information retrieval method, and a WEB information retrieval program according to the present invention will be described in detail. In this embodiment, the WEB information search system of the present invention is such that a user instructs a WEB information search server from a user terminal via the Internet using a keyword, and performs a full-text meta search of data on a WEB site on the Internet using this keyword. Is what you do.
[0061]
(Hardware configuration of WEB information search server)
FIG. 1 is a block diagram showing a system configuration of a WEB information search server according to the present embodiment. As shown in FIG. 1, a terminal of a user who issues a search instruction via the Internet is connected to the WEB information search server 101 by a known communication protocol such as TCP / IP.
[0062]
The server includes a control device 103 such as a CPU, graphic board, and ROM, a main storage device 104 such as a main memory (RAM), a storage medium such as a hard disk (HD), a CD-ROM, and a floppy disk, and each storage medium. Mainly an external storage device 105 such as a drive device for controlling READ / WRITE, a communication device 102 such as an Ethernet board or a modem, an output device 107 such as a display device or a printer device, and an input device 106 such as a keyboard or a mouse. And is a normal configuration using a computer such as a workstation (WS) or a personal computer (PC).
[0063]
In the WEB information search server 101 of this embodiment, a user database (user DB) 110, a setting database (setting DB) 112, a bookmark database (bookmark DB) 109, a URL database (URL), which will be described later, are stored in a hard disk as the external storage device 105. DB) 111 and a full text meta search database (full text meta search DB) 113 are stored. In this embodiment, a bookmark of a WEB site accessed by the user is stored in the hard disk for each user, and each user can update, delete, etc. via the Internet.
[0064]
Further, in the WEB information search server 101 of the present embodiment, a main memory as the main storage device 104 stores a macro profile 208 and a micro profile 209 described later, and temporary data for creating these files. The external storage device 105 and the main storage device constitute storage means of the present invention.
[0065]
The WEB information search program executed by the WEB information search server 101 of the present embodiment is a file in an installable format or an executable format and is provided on a storage medium such as a CD-ROM or a floppy disk (FD). The WEB information search program is loaded on the main storage device 104 upon activation of this apparatus. Note that the WEB information search program according to the present embodiment may be provided by downloading via a network.
[0066]
The user terminal 114 is an ordinary computer such as a PC or WS that can be connected to the Internet. However, a mobile terminal such as a mobile phone, PHS, or personal digital assistant (PDA) that can be connected to the Internet is used. It is also possible.
[0067]
(Functional configuration of WEB information search server)
Next, a software configuration (functional configuration) of the WEB information search server 101 according to the present embodiment will be described. FIG. 2 is a functional block diagram showing a software configuration of the WEB information search server 101 according to the present embodiment. Each unit shown in FIG. 2 is generated on the main storage device 104 by executing the WEB information search program of this embodiment on the server.
[0068]
As shown in FIG. 2, the WEB information search server 101 according to the present embodiment includes an analysis unit 201, a data collection unit 202, a macro profile creation unit 203, a micro profile creation unit 204, a search unit 205, and an evaluation unit. The unit 206 and the search result generation unit 207 are mainly configured. In FIG. 2, the arrow lines indicate the flow of various data between these units. In the present embodiment, each unit exists in one WEB information search server. However, the present invention is not limited to this, and the data collection unit 202 and the search unit 205 and the other units are configured as separate computers. It is also possible to adopt a hardware configuration as provided in FIG.
[0069]
The analysis unit 201 collects all bookmarks from the user's bookmark directory 108 in the external storage device 105, generates bookmark data to be described later, registers each bookmark data as one record in the bookmark database 109, and describes later on the WEB site. URL data including URL information to be executed and access information to the WEB site is generated, and each URL data is registered in the URL database 111 as one record.
[0070]
The data collection unit 202 refers to all the URL data registered in the URL database 111, accesses the WEB site existing on the Internet from the URL information, and collects the full text data of each WEB site. Then, the collected data is indexed and registered in the full-text meta search database 113 for each WEB site.
[0071]
The macro profile creation unit 203 refers to all URL data registered in the URL database 111 and extracts user-specific data of the user ID recorded in each URL data from the user database 110. Then, various statistical data, which will be described later, showing the usage status of the entire user for the WEB site is generated from the URL data and the extracted user-specific data, and stored as a macro profile 208 on the main memory 104. In the search server 101 of this embodiment, the macro profile creation unit 203 generates a macro file at regular intervals. In addition, a macro profile creation process may be executed when a user bookmark is registered or updated, or when a user accesses a WEB site using a bookmark.
[0072]
The micro profile creation unit 204 refers to all bookmark data registered in the bookmark database 109 and extracts user-specific data of the user ID recorded in each bookmark data from the user database 110. Then, various statistical data, which will be described later, showing the usage status of the WEB site for each user is generated from the bookmark data and the extracted user-specific data, and stored as a micro profile 209 on the main storage device 104.
[0073]
The search unit 205 receives a search instruction based on a search keyword from the user terminal 114 via the Internet, and searches for data indexed from the full text meta search database 113 using the search keyword when the search instruction is issued.
[0074]
The evaluation unit 206 assigns a weighting value to each piece of data searched by the search unit 205, performs filtering (predetermined) with reference to the specific data of the user who has made the search instruction, the macro profile, and the micro profile. (E.g., select only data on the site of the condition).
[0075]
The search result generation unit 207 generates the search result data by sorting the searched WEB site data in the order of the weighting values by the evaluation unit 206 and transmits the search result data to the user terminal 114 or only certain filtered data. The search result data is generated from and transmitted to the user terminal 114.
[0076]
(Bookmark structure)
In the present embodiment, bookmarks are created and updated by the user. Unlike conventional search systems, all bookmarks are created for each user in the external storage device 105 (hard disk) of the search server 101. FIG. 3A is a directory structure diagram of bookmarks in the WEB information search server 101 of this embodiment, and FIG. 3B is a data structure diagram of each bookmark.
[0077]
As shown in FIG. 3A, a bookmark is in a directory tree for each user (hereinafter referred to as a bookmark directory). Even if the bookmark is created directly under the bookmark directory 108, a folder is created under the bookmark directory 108 for each category. You may create and create under that folder.
[0078]
As shown in FIG. 3B, each bookmark is mainly composed of a bookmark name, a URL, a creation date / time, an edit date / time, a final reference time, a reference count, and the like, and can include other data.
[0079]
This bookmark is displayed on the user terminal 114 as follows. When the button at the left end of the initial screen shown in FIG. 19 is clicked on with a mouse, as shown in FIG. 20, a search screen in which a list of bookmark folders is displayed in a tree format is displayed on the left side of the screen. When the user clicks on a desired folder, a bookmark list stored in the folder is displayed. As shown in FIG. 20, a plurality of external meta search engine names and check boxes 10 are displayed corresponding to the respective external meta search engines. This check box 10 is used to specify that the search is performed using the external meta search engine in addition to the search from the full text meta search database 113. As will be described later, the check box 10 is checked. A search process using a specified search keyword is also performed by an external meta search engine.
[0080]
(Database file structure)
Next, various databases used in the WEB information search server 101 of this embodiment will be described. In the present embodiment, the user database 110, the setting database 112, the bookmark database 109, the URL database 111, and the full text meta search database 113 are stored in the external storage device 105 and used. As shown in FIG. 1, in this embodiment, these databases are recorded in one external storage device 105 (hard disk), but each database may be stored in a different external storage device 105. .
[0081]
The user database 110 manages users who use the WEB information search server 101, and stores user-specific data for each user as one record in advance. FIG. 4 is a structural diagram of user-specific data registered in the user database 110.
[0082]
As shown in FIG. 4, the user-specific data mainly includes user ID, password (encrypted data), last access date, nationality, birthday, gender, name, address, e-mail address, home page URL, telephone number, Internet It is composed of history, occupation (for example, system engineer, sales, company manager, research position, etc.), hobby, educational history (for example, liberal arts / science, university graduate / high school graduate, etc.), and the user ID is the key. The user specific data may further include other data including information related to the user. Here, the user database 110 constitutes a user file in the present invention.
[0083]
The bookmark database 109 registers bookmark data indicating the usage status of the user's bookmarks as one record, and each bookmark data is generated by collecting and analyzing bookmarks from the user's bookmark directory 108 by the analysis unit 201. The FIG. 5 is a structural diagram of bookmark data registered in the bookmark database 109 of this embodiment.
[0084]
As shown in FIG. 5, the bookmark data mainly includes a bookmark ID, a bookmark name, a URL, a last reference date, a bookmark creation date and edit date, an IP address, a reference count, and the like. The bookmark data may include other data.
[0085]
“Bookmark ID” is a unique identifier for all the collected bookmarks. “Bookmark name” is the file name of the bookmark stored in the bookmark directory 108. “User ID” is the ID of the user who owns the bookmark, and is registered in the user database 110 described later. “URL” is the URL of the WEB site accessed when a bookmark is designated, and the IP address of the URL is registered as “IP address”. “Reference count” is the reference count of the user with respect to the WEB site indicated by the URL. Among these data, “bookmark name”, “URL”, “last reference date”, “creation date”, “edit date”, “reference count” data are the same names of bookmarks in the bookmark directory 108. The user ID is generated by referring to the user database 110 from the owner of the bookmark directory 108 from the owner of the bookmark directory 108. The “bookmark ID” is automatically generated and assigned when bookmark data is registered by the analysis unit 201. Here, the bookmark database 109 constitutes a bookmark file in the present invention.
[0086]
The URL database 111 registers URL data including URL information of the WEB site and access information to the WEB site as one record. Each URL data is collected by the analysis unit 201 from the bookmark directory 108 of the user. Generated by analysis. FIG. 6 is a structure diagram of URL data registered in the URL database 111.
[0087]
As shown in FIG. 6, the URL data is mainly composed of creation date / time, last edit date / time, URL, title, reference count, user ID, and the like, and the URL and user ID are keys. The URL data may include other data. In addition, URL data is added and registered in the URL database 111. When URL data with the same URL as a key is registered, the existing URL data is not updated and new URL data is registered. Is supposed to be added.
[0088]
Among these data, the data of “URL”, “Last Edit Date”, and “Reference Count” are copied as they are from the field of the same name of the bookmark in the bookmark directory 108 by the analysis unit 201 and are “User ID”. Is generated from the name of the user directory in which the bookmark directory 108 is located.
[0089]
Here, the URL data constitutes site data in the present invention, and the URL database 111 constitutes a site file in the present invention. Bookmark data and URL data constitute bookmark analysis data in the present invention, and bookmark database 109 and URL database 111 constitute a bookmark analysis file in the present invention.
[0090]
The setting database 112 registers various settings on the bookmark display screen of each user as setting data for each user. FIG. 7 is a structure diagram of setting data registered in the setting database 112. This setting data can be changed by user designation. As shown in FIG. 7, the setting data mainly includes a user ID, a skin (wallpaper) setting, an owner, a height, a width, a font, and the like, and may include setting items relating to bookmark display.
[0091]
The full-text meta search database 113 records information for the meta search engine, and the search data collected from the WEB site on the Internet by the data collection unit 202 is registered. FIG. 8 is a structural diagram of search data registered in the full text meta search database 113. As shown in FIG. 8, the search data mainly includes an ID, a keyword input by the user, an attribute, a data acquisition time, a data acquisition URL, a URL title, a full-text data (Description), and the like. May be included. Here, “ID” is identification information of each search data, and is automatically generated and assigned by the data collection unit 202 when the search data is registered. The collected data is stored in “full text data”.
[0092]
(Bookmark analysis processing)
Next, bookmark analysis processing by the analysis unit 201 of the WEB information search server 101 of the present embodiment configured as described above will be described. FIG. 9 is a flowchart of the bookmark analysis process.
[0093]
The analysis unit 201 first refers to the bookmark directory 108 of the user on the hard disk (step S901), reads the bookmark stored in this directory, and acquires various data shown in FIG. 3B (step S902). At this time, if the bookmark exists in the folder in the top directory instead of the top directory of the user's bookmark directory 108, the bookmark stored in the folder is read by referring to the folder.
[0094]
Next, the user database 110 is searched using the owner of the bookmark directory 108 as a user ID, and user-specific data of the searched user ID is acquired (step S903). Then, bookmark data is generated and registered in the bookmark database 109 (step S904). Here, the bookmark data is generated as follows.
[0095]
The bookmark data “bookmark name”, “URL”, “last reference date / time”, “creation date / time”, “edit date / time”, and “reference count” data are copied from the bookmark in the bookmark directory 108. “User ID” is copied from the user ID of the user-specific data. The “bookmark ID” is generated by giving a unique identification number. Other fields are currently empty.
[0096]
When the generation and registration of bookmark data are completed, URL data is then generated and registered in the URL database 111 (step S905). At this time, the URL data is additionally registered in the URL database 111 regardless of whether or not the same URL already exists. Here, generation of URL data is performed as follows.
[0097]
The URL data “URL”, “last edited date”, and “reference count” data are copied from the bookmark in the bookmark directory 108, and “user ID” is copied from the user ID of the user-specific data already acquired. Other fields are currently empty.
[0098]
When the generation and registration of the URL data is completed, the processing from step S902 to step 905 is repeated for all bookmarks existing in the bookmark directory 108 (step S906). When the analysis processing for all bookmarks is completed, the processing from step S901 to step S906 is repeated for the bookmark directory 108 for the next user's bookmark (step S907). Thereby, bookmark data and URL data are generated for all bookmarks of all users, and the bookmark data is registered in the bookmark database 109 and the URL data is registered in the URL database 111.
[0099]
(Data collection process)
FIG. 10 is a flowchart of data collection processing from the WEB site by the data collection unit 202. The data collection unit 202 first refers to the URL database 111 (step S1001) and reads the registered URL data (step S1002). Next, the URL stored in the URL field of the URL data is designated to access the WEB site (step S1003), and the WEB site URL, URL title and full-text data are collected (step S1004), and the current date and time are acquired. Further, a unique identification number is generated (step S1005). Then, search data is generated by copying the identification number, current time, URL, title, and full text data to the respective fields of search data ID, data acquisition date, acquisition URL, URL title, and full text data. The full text meta search database 113 is registered (step S1006). The processes from step S1001 to step S1006 are performed with reference to all URL data registered in the URL database 111 (step S1007).
[0100]
(Macro profile creation process)
Next, macro profile creation processing by the macro profile creation unit 203 will be described. FIG. 11 is a flowchart of the macro profile creation process. FIG. 12 is an explanatory diagram illustrating an example of a macro profile created by the macro profile creation unit 203. First, the macro profile creation unit 203 reads the URL data from the top record by referring to the URL database 111, acquires the URL, user ID, reference count, and last reference date from this URL data, and for the acquired URL All input keywords input in the past are searched and extracted from the full text meta search database 113 (step S1101). Then, it is checked whether or not a macro profile has been created on the main storage device 104 (main memory) (step S1102). If the macro profile has not been created yet, a macro profile is generated on the main storage device 104 ( In step S1103), the current date and time is recorded as the creation date and time at the top (step S1104).
[0101]
Next, it is checked whether or not the acquired URL has already been recorded in the macro profile (step S1105). If it has not been recorded yet, the acquired URL is recorded. In the URL block, “1” is recorded as the total number of bookmark registrations, and the acquired reference count is recorded as the total reference count. In addition, a time zone to which the acquired time of the last reference date belongs is determined (for example, when the last reference time is 1:20, the time zone is set to “0: 00 to 1:00”), and the reference time is included in the URL block. Record as a strip. Further, the acquired keyword is recorded in the URL block (step S1107).
[0102]
On the other hand, when the already acquired URL is recorded in the macro profile, the total number of registrations in the block of the corresponding URL is incremented, and the acquired reference count is added to the total reference count, so that Aggregate the total number of registrations and the total number of references. Further, a time zone to which the acquired time of the last reference date belongs is determined and added to the reference time zone in the URL block, and the acquired keyword is added to the keyword in the URL block (step S1106).
[0103]
Next, the user database 110 is searched using the acquired user ID as a key, user-specific data is read, and specific specific data such as occupation, educational background, hobbies, etc. are acquired from the user-specific data (step S1108). The specific data to be acquired is an example, and other specific data such as age may be acquired.
[0104]
Next, in the URL block, the number of registrations by occupation (bookmark registration number), the number of reference by occupation, the number of registration by educational background, the number of reference by educational background, the number of registration by hobby, the number of reference by hobby, and the aggregated data Is recorded in the URL block of the macro profile (step S1109). Here, the counting is performed by incrementing the registered number of occupations, etc. of the same data as the acquired occupations (set to “1” at the first recording), and the reference number of occupations of the same data as the acquired occupations, etc. This is done by adding (recording the reference count at the first recording). For example, if the acquired occupation is “system engineer”, the registered number of bookmarks for occupation “system engineer” is incremented, and the acquired reference count is added to the reference count of occupation “system engineer” to obtain another occupation. For example, the number of registrations and the number of references such as “sales” are not changed.
[0105]
Such processing from step S1101 to step S1109 is executed for all URL data (step S1110). Thus, the total number of bookmark registrations, reference counts, keyword access statistical data, reference time zones, registration counts and reference counts by occupation, registration counts and reference counts by educational background, registration counts and reference counts by hobby User statistical data is generated for each URL data.
[0106]
Next, from these statistical data, occupation data with the maximum number of bookmark registrations and occupation data with the maximum number of references are recorded in the macro profile as occupation registration number characteristic data and occupation reference number characteristic data, respectively. For example, if the occupation data with the maximum number of bookmark registrations is “system engineer”, the registration data by occupation is “system engineer”, and if the occupation data with the maximum number of references is “sales”, The reference frequency characteristic data by occupation is recorded in the macro profile as “sales”. Similarly, the registration number characteristic data by educational background, the reference number characteristic data by educational background, the registration number characteristic data by hobby, and the reference number characteristic data by hobby are also obtained and recorded in the macro profile, respectively (step S1111). Such characteristic data indicates the user's bias in the number of bookmark registrations and the number of references to the WEB site, respectively.
[0107]
The macro profile as shown in FIG. 12 is created by the above processing. As shown in FIG. 12, the macro profile is divided into blocks for each URL, and in each block, the total number of bookmark registrations, the number of registrations by occupation, the number of registrations by educational background, the number of registrations by hobby, the total number of references to the WEB site The number of times of reference by occupation, the number of times of reference by educational background, the number of times of reference by hobby, the most frequent reference time zone, keywords, etc. are recorded.
[0108]
The creation of a macro profile will be described with an example. For example, as shown in FIG. 13A, three URL data for the URL “http://xxx.xxx.co.jp” and three for the URL “http://yyy.yyy.com”. Consider a case in which two pieces of URL data and two pieces of URL data for the URL “http://zzz.zzz.ne.jp” are registered in the URL database 111. Here, for convenience of explanation, a case is considered in which each URL data has values shown in FIG. 13A for only the user ID and the number of references.
[0109]
Further, as shown in FIG. 13B, when five user-specific data of user IDs “AAA”, “BBB”, “CCC”, “DDD”, and “EEE” are registered in the user database 110 think of. Here, for convenience of explanation, it is assumed that each user-specific data has values shown in FIG. 13B for only the user ID, occupation, and educational background.
[0110]
In such a case, data shown in FIG. 13C is recorded in the macro profile. For example, the URL “http://xxx.xxx.co.jp” is accessed by three users “AAA”, “CCC”, and “DDD”, and the total reference count is the reference count of three users. “5 times” is recorded. Looking at the number of references by occupation, the reference number of occupation “system engineer” is recorded as “3 times”, which is the sum of the reference times of two users “AAA” and “CCC”. As for the reference count of “Sales”, “2 times” which is the reference count of one user “DDD” is recorded. Therefore, in the occupation-specific reference frequency characteristic data, an occupation with a high reference frequency is selected and recorded as “system engineer”. Similarly, the number-of-references-by-education characteristic data is also obtained and recorded in the macro profile as “sentences” that have a high number of references. The total number of reference times of other URLs, the number of reference times by occupation and the reference number of times characteristic data by occupation, the reference number of times by educational background and the characteristic number of reference times by educational background are also statistically analyzed in the same manner, and are shown in FIG. As recorded.
[0111]
FIG. 12 and FIG. 13C show an example of a macro profile, and it is possible to create a macro profile having an arbitrary structure according to the usage status of the entire user's WEB site. In this embodiment, the number of registrations and the number of references for each user-specific data such as the number of registrations and the number of references for each occupation data are recorded in the macro profile, but these data are only stored in the memory. Only the characteristic data such as the final registered number characteristic data by occupation and the reference frequency characteristic data by occupation may be recorded in the macro profile.
[0112]
In this embodiment, characteristic data is obtained for occupation, educational background, and hobbies, but characteristic data for other user-specific data may be further obtained.
[0113]
(Micro profile creation process)
Next, micro profile creation processing by the micro profile creation unit 204 will be described. FIG. 14 is a flowchart of the micro profile creation process. FIG. 15 is an explanatory diagram showing an example of a micro profile created by the micro profile creation unit 204. The micro profile creation unit 204 first reads the user specific data from the top record with reference to the user database 110, and acquires the user ID from the read user specific data (step S1401).
[0114]
Then, it is checked whether or not a micro profile has been created on the main storage device 104 (main memory) (step S1402). If it has not been created yet, a micro profile is generated on the main storage device 104 ( In step S1403), the current date and time is recorded as the creation date and time at the top (step S1404).
[0115]
Next, the bookmark data is searched from the bookmark database 109 using the acquired user ID as a key (step S1405). Then, the retrieved bookmark data is read to acquire the URL, the last reference date and the reference count, and all input keywords input in the past with respect to the acquired URL are searched from the full text meta search database 113. Extract (step S1406). Next, the acquired URL and the number of references are recorded in the user ID block of the microfile, and the time zone to which the acquired time of the last reference date belongs is determined (for example, when the last reference time is 1:20, The time zone “0: 00 to 1: 00” is selected), and is recorded in the block of the micro-profile user ID as the reference time zone (step S1407).
[0116]
Such processes of step S1406 and step S1407 are performed on all bookmark data having the same user ID searched in step S1405 (step S1408). When the processing for all searched bookmark data is completed, the processing from step S1401 to step S1408 is executed for all user-specific data (step S1409).
[0117]
The micro profile as shown in FIG. 15 is created by the above processing. As shown in FIG. 15, in the micro profile, the reference count for each URL and the reference time zone for each URL are recorded for each user ID. Here, the reference count for each URL and the reference time zone for each URL constitute the site statistical data in the present invention.
[0118]
FIG. 15 shows an example of a micro profile, and it is possible to create a micro profile having an arbitrary structure according to the usage status of each user's WEB site.
[0119]
(Search process, evaluation process and search result generation process)
Next, search processing, evaluation processing, and search result generation processing by the WEB information search server 101 of this embodiment will be described. FIG. 16 is a flowchart of search, evaluation, and search result generation processing.
[0120]
When there is a keyword search instruction from the user terminal 114 via the Internet, the search unit 205 first checks whether the check box 10 of each external meta search engine is checked on the screen of FIG. 20 from the user terminal 114. This confirms whether or not to use the external meta search engine (step S1601).
[0121]
If any of the external meta search engines is checked, it is determined that the checked external meta search engine is used, and the search keyword instructed from the user terminal 114 is determined for each specified external meta search engine. It is processed into a keyword format for the external meta search engine (step S1602). The keyword processing is performed, for example, by changing the specification format of the AND condition, the OR condition, and the like for the external meta search engine.
[0122]
Next, the processed keywords are respectively passed to each external meta search engine (step S1603), and the search is simultaneously executed by each external meta search engine. Then, the search results from the external meta search engines are merged by registering them in the full text meta search database 113 (step S1604). In step S1605, by searching the full-text meta search database 113, the user can use not only the full-text meta search database 113 but also a real-time search result by an external meta search engine. Become. On the other hand, if it is determined in step S1601 that no external meta search engine is used, a search from the full text meta search database is performed in step S1605.
[0123]
In step S1605, a search based on a keyword designated from the full text meta search database 113 is performed by a known method, and data matching the search condition (hereinafter referred to as “search data”) is acquired. Then, the user ID is acquired from the login information of the user who has instructed the search, and the user unique data is searched and acquired from the user database 110 using the user ID as a key (step S1606).
[0124]
Next, the evaluation unit 206 performs search data evaluation processing based on the macro profile (step S1607). FIG. 17 is a flowchart of the evaluation process based on the macro profile.
[0125]
The evaluation unit 206 first reads the search data and acquires the URL of the WEB site (step S1701). Then, referring to the macro profile on the main storage device 104, the access statistical data and user statistical data recorded in the block having the same URL as the URL of the search data are acquired (step S1702).
[0126]
Next, each unique data such as occupation, educational background, hobbies, etc. of user specific data, and registered number characteristic data for each unique data such as registered number characteristic data by occupation, registered number characteristic data by educational background, registered number characteristic data by hobby, etc. Are respectively compared (step S1703). If each unique data matches each characteristic data, the weighting value for the currently processed search data is incremented and the fact that this search data is to be selected is stored in the main storage device 104. (Step S1704). Such processing is also performed for each data such as occupation and reference frequency characteristic data for each unique data (steps S1705 and S1706).
[0127]
Next, it is determined whether or not the current time is included in the reference time zone recorded in the URL block of the macro profile (step S1707). If it is included, the search data currently being processed is weighted. And the fact that this search data is to be selected is stored on the main storage device 104 (step S1708). Further, it is determined whether or not the designated keyword is included in the keyword recorded in the URL block of the macro profile (step S1709). If it is included, the search data being processed is weighted. And the fact that this search data is to be selected is stored on the main storage device 104 (step S1710).
[0128]
The above-described processing from step S1701 to step S1710 is sequentially performed on all searched search data (step S1711). As a result, a weighting value is assigned to each search data, and certain search data is selected.
[0129]
In this embodiment, a weighting value is assigned to each search data, and it is determined whether or not to be selected. However, only one of them may be configured.
[0130]
When the evaluation process based on the macro profile is completed, the process returns to FIG. 16, and the user who has made a search instruction from the user ID is already registered in the user database 110, or is a guest user who is temporarily using the search system Is determined (step S1608). If the user who has issued the search instruction is not a guest user, the evaluation unit 206 performs search data evaluation processing based on the micro profile (step S1609). On the other hand, when the user who issued the search instruction is a guest user, the evaluation process based on the micro profile is not performed. FIG. 18 is a flowchart of an evaluation process based on a micro profile.
[0131]
The evaluation unit 206 first reads the search data and acquires the URL of the WEB site (step S1801). Then, referring to the micro profile on the main storage device 104, the site statistical data in the block of the same URL as the URL of the search data in the block of the user ID acquired in step S1606 in FIG. 16 is acquired (step S1802). .
[0132]
Next, the current time is acquired, and it is determined whether or not the current time is included in the reference time zone in the URL block of the micro profile (step S1803). If included, weighting is applied to the search data currently being processed. And the fact that this search data is to be selected is stored on the main storage device 104 (step S1804). Further, it is determined whether or not the designated keyword is included in the keyword for the URL recorded in the micro profile (step S1805). If it is included, a weighting value is assigned to the currently processed search data. At the same time, the fact that the search data is to be selected is stored on the main storage device 104 (step S1806). Next, the number of references in the URL block recorded in the micro profile is added to the weighting value for the currently processed search data (step S1807).
[0133]
The above-described processing from step S1801 to step S1807 is sequentially performed on all searched search data (step S1808). As a result, each search data is given a weighting value, and certain search data is selected.
[0134]
In this embodiment, a weighting value is assigned to each search data, and it is determined whether or not to be selected. However, only one of them may be configured.
[0135]
When the evaluation process based on the macro profile and the micro profile is completed, the process returns to FIG. 16 and the search result data generation process by the search result generation unit 207 is performed. The search result generation unit 207 extracts (filters) only search data to be selected (step S1610), and further sorts the filtered search data in descending order of weighting values (ascending sort) (step S1611). ). Then, search result data for displaying the sorted search data as a list is generated, and the generated search result data is transmitted to the user terminal 114 (step S1612). FIG. 21 shows an example of a search result list screen displayed on the user terminal 114. As a result, the user terminal 114 displays search results reflecting the usage status of the entire WEB site user and the usage status of the user's WEB site.
[0136]
As described above, in the WEB information search server 101 of this embodiment, the weighted value is assigned to the search data and the filtering process is performed on the search data by using the usage status of all users with respect to the WEB site of the macro profile. It is possible to reflect the tendency and bias of the user who performs the search result list, and it is possible to provide a search result list centering on popular WEB sites and frequently accessed WEB sites. Further, in the WEB information search server 101 of the present embodiment, the weighting value is given to the search data and filtering processing is performed on the search data using the usage status of the WEB site for each user of the micro profile. If it is different or the search time is different, it is possible to provide an optimum search result based on the time for each user.
[0137]
  As explained above,BookAccording to the invention, there is an effect that information necessary for the user can be provided as a search result in a format optimal for the user while a large amount of information on the WEB site is a search target. Further, according to the present invention, the usage status of the entire user changing every moment and the usage status of the WEB site for each user can be sequentially obtained and used for evaluation of the retrieved data. There is an effect that the most suitable search result can be provided to the user. Furthermore, according to the present invention, it is possible to perform bookmark analysis and evaluation of searched WEB site data without making the user aware of it at all, and it is not necessary for the user to classify and evaluate the WEB site himself. There is an effect that convenience is achieved. In particular, according to the present invention, it is possible to reflect the tendency and bias of users accessing the WEB site in the search result, and to provide the search result mainly on the popular WEB site and the frequently accessed WEB site. There is an effect. Further, even if the same keyword is used, if the users are different or the search times are different, it is possible to provide an optimum search result based on the time for each user.
[0138]
  Also bookAccording to the present invention, it is possible to obtain a bias based on specific user-specific data of a user who accesses each WEB site, and the search target is a great amount of information on the WEB site. There is an effect that the data on the WEB site can be preferentially provided as a search result.
[0139]
  Also bookAccording to the invention, the access status of each WEB site can be obtained, and the search result is given to the data of the WEB site with high access frequency and high access frequency to the user while searching for a large amount of information on the WEB site. The effect that it can be provided as.
[0140]
  Also bookAccording to the invention, it is possible to obtain a bias of each user with respect to the WEB site, and to provide a search result reflecting the past access status of the user while making a search target a large amount of information on the WEB site. There is an effect.
[0141]
  Also bookAccording to the invention, it is possible to provide a search result in which a list is displayed in order from a WEB site that is highly necessary for the user, while a large amount of information on the WEB site is a search target.
[0142]
  Also bookAccording to the present invention, it is possible to provide a search result including only data of a WEB site that is necessary for the user, while a large amount of information on the WEB site is a search target.
[0143]
  Also bookAccording to the invention, the bookmark analysis file is configured to include the bookmark file and the site file, and the effect of facilitating the management of each file is achieved.
[0144]
【The invention's effect】
According to the present invention, there is an effect that information necessary for a user can be provided as a search result in a format optimal for the user while a large amount of information on the WEB site is a search target.
[Brief description of the drawings]
FIG. 1 is a hardware configuration diagram of a WEB information search server according to an embodiment.
FIG. 2 is a functional block diagram showing a software configuration of a WEB information search server according to the present embodiment.
FIG. 3 (a) is a directory structure diagram of bookmarks in the WEB information search server of the present embodiment, and FIG. 3 (b) is a data structure diagram of each bookmark.
FIG. 4 is a data structure diagram of a user database in the WEB information search server of the present embodiment.
FIG. 5 is a data structure diagram of a bookmark database in the WEB information search server of the present embodiment.
FIG. 6 is a data structure diagram of a URL database in the WEB information search server of the present embodiment.
FIG. 7 is a data structure diagram of a setting database in the WEB information search server of the present embodiment.
FIG. 8 is a data structure diagram of a full-text meta search database in the WEB information search server of the present embodiment.
FIG. 9 is a flowchart of bookmark analysis processing in the WEB information search server of the present embodiment.
FIG. 10 is a flowchart of data collection processing in the WEB information search server of the present embodiment.
FIG. 11 is a flowchart of macro profile creation processing in the WEB information search server of the present embodiment.
FIG. 12 is an explanatory diagram showing an example of a structure of a macro profile in the WEB information search server of the present embodiment.
FIG. 13 is an explanatory diagram showing an example of a macro profile creation process in the WEB information search server of the present embodiment.
FIG. 14 is a flowchart of micro profile creation processing in the WEB information retrieval server of the present embodiment.
FIG. 15 is an explanatory diagram showing an example of the structure of a micro profile in the WEB information search server of the present embodiment.
FIG. 16 is a flowchart of overall processing of search, evaluation, and search result display in the WEB information search server of the present embodiment.
FIG. 17 is a flowchart of an evaluation process using a macro profile in the WEB information search server of the present embodiment.
FIG. 18 is a flowchart of an evaluation process using a micro profile in the WEB information search server of the present embodiment.
FIG. 19 is a schematic diagram showing an initial screen displayed on a user terminal that uses the WEB information search server of the present embodiment.
FIG. 20 is a schematic diagram of a search screen showing an example of a bookmark displayed on a user terminal that uses the WEB information search server of the present embodiment.
FIG. 21 is a schematic diagram showing an example of a search result display screen displayed on a user terminal that uses the WEB information search server of the present embodiment.
[Explanation of symbols]
101 Information Search Server, 102 Communication Device, 103 Control Device, 104 Main Storage Device, 105 External Storage Device, 106 Input Device, 107 Output Device, 108 Bookmark Directory, 109 Bookmark Database, 110 User Database, 111 URL Database, 112 Setting Database , 113 Full-text meta search database, 114 User terminal, 201 Analysis unit, 202 Data collection unit, 203 Macro profile creation unit, 204 Micro profile creation unit, 205 Search unit, 206 Evaluation unit, 207 Search result generation unit, 208 Macro profile , 209 Micro profile, 10 External meta search engine specification check box

Claims (11)

ユーザ端末から入力された検索キーワードに基づいてインターネット上のWEBサイトを検索して検索結果をユーザ端末に送信するWEB情報検索装置において、
ユーザごとに、ユーザ固有データを予め登録したユーザファイルと、
ユーザがアクセスするWEBサイトの識別情報を含むブックマークを記録する記憶手段と、
前記記憶手段から全てのユーザのブックマークを収集して、ユーザのブックマーク利用情報とWEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むブックマーク分析データを生成してブックマーク分析ファイルに登録する分析手段と、
全ての前記ブックマーク分析データに基づいて、インターネット上のWEBサイトからデータを収集し、検索用ファイルに登録するデータ収集手段と、
所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、WEBサイトに対するユーザ全体の利用状況を記録したマクロプロファイルを生成するマクロプロファイル作成手段と、
ユーザ端末から検索キーワードによる検索指示が入力されたときに、前記キーワードに基づいて検索用ファイルからデータを検索する検索手段と、
前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データ及び前記マクロプロファイルに基づいて評価する評価手段と、
前記評価手段による評価に基づいて前記検索されたデータから検索結果データを生成してユーザ端末に送信する検索結果生成手段と、
を備え
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、WEBサイト毎に、前記ユーザ全体のうち該WEBサイトの参照回数が最も多いユーザの特定のユーザ固有データが該WEBサイトと関連づけられて含まれており、
前記評価手段は、前記検索指示を行ったユーザの前記ユーザ固有データに、前記マクロプロファイルに含まれる前記特定のユーザ固有データと一致する特定のユーザ固有データが含まれる場合に、該特定のユーザ固有データに関連するWEBサイトと対応する前記検索されたデータに重み付け値を付与し、
前記検索結果生成手段は、前記検索されたデータを前記重み付け値に基づいた順番でソートして検索結果データを生成することを特徴とするWEB情報検索装置。
In a WEB information search apparatus for searching a WEB site on the Internet based on a search keyword input from a user terminal and transmitting a search result to the user terminal,
For each user, a user file pre-registered with user-specific data,
Storage means for recording a bookmark including identification information of a WEB site accessed by a user;
Collect bookmarks all users from the storage means and analyzing means for registering and generates bookmark analytical data including the access information to the identification information and the WEB site of the user's bookmark usage information and WEB site bookmark analysis file ,
Data collecting means for collecting data from a web site on the Internet based on all the bookmark analysis data and registering it in a search file;
Macro profile creation means for creating a macro profile that records the usage status of the entire user for the WEB site from all the bookmark analysis data and the user-specific data at a predetermined time;
Search means for searching for data from a search file based on the keyword when a search instruction using a search keyword is input from a user terminal;
Evaluation means for evaluating each of the searched data based on the user-specific data of the user who has made the search instruction and the macro profile ;
Search result generation means for generating search result data from the searched data based on the evaluation by the evaluation means and transmitting it to a user terminal;
Equipped with a,
The usage status of the entire user in the macro profile includes, for each WEB site, specific user-specific data of the user who has the highest number of times of reference to the WEB site among the entire user in association with the WEB site. And
The evaluation means is specific to the specific user when the user specific data of the user who has made the search instruction includes specific user specific data that matches the specific user specific data included in the macro profile. Assigning a weight to the retrieved data corresponding to the WEB site associated with the data;
The WEB information search device, wherein the search result generation means generates search result data by sorting the searched data in an order based on the weighting value .
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、WEBサイト毎に、前記ユーザ全体のうち該WEBサイトの前記ブックマークへの登録数が最も多いユーザの特定のユーザ固有データが該WEBサイトと関連づけられて更に含まれており、In the usage status of the entire user in the macro profile, for each WEB site, specific user-specific data of the user who has the largest number of registrations in the bookmark of the WEB site among the entire user is associated with the WEB site. It is further included,
前記評価手段は、前記検索指示を行ったユーザの前記ユーザ固有データに、前記マクロプロファイルに含まれる前記特定のユーザ固有データと一致する特定のユーザ固有データが含まれる場合に、該特定のユーザ固有データに関連するWEBサイトと対応する前記検索されたデータに重み付け値を更に付与することを特徴とする請求項1に記載のWEB情報検索装置。The evaluation means is specific to the specific user when the user specific data of the user who has made the search instruction includes specific user specific data that matches the specific user specific data included in the macro profile. The WEB information search device according to claim 1, further comprising assigning a weighting value to the searched data corresponding to a WEB site related to data.
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、前記WEBサイト毎の最後に参照された時間に関する参照時間情報が更に含まれ、The usage status of the entire user in the macro profile further includes reference time information related to the last referenced time for each WEB site,
前記評価手段は、前記マクロプロファイルに含まれる前記参照時間情報と、前記検索指示が行われた時刻とに基づいて、前記検索されたデータに重み付け値を更に付与することを特徴とする請求項1又は2に記載のWEB情報検索装置。2. The evaluation unit further adds a weight value to the searched data based on the reference time information included in the macro profile and a time when the search instruction is performed. Or the WEB information search device according to 2;
前記評価手段は、前記検索されたデータの夫々を評価した後、前記検索されたデータの夫々を評価結果に基づいて分類するものであり、
前記検索結果生成手段は、所定の分類に属する前記検索されたデータのみを選択して検索結果データを生成するものである
ことを特徴とする請求項1〜のいずれか1項に記載のWEB情報検索装置。
The evaluation means is for classifying each of the searched data based on an evaluation result after evaluating each of the searched data,
The search result generating means, WEB according to any one of claims 1 to 3, characterized in that to produce the search result data the retrieved data alone by selecting belonging to a predetermined classification Information retrieval device.
前記ブックマーク分析ファイルは、ブックマーク利用情報を含むブックマークデータを登録したブックマークファイルと、WEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むサイトデータを登録したサイトファイルとを有するものであることを特徴とする請求項1〜のいずれか1項に記載のWEB情報検索装置。The bookmark analysis file includes a bookmark file in which bookmark data including bookmark use information is registered, and a site file in which site data including identification information of a WEB site and access information to the WEB site is registered. The WEB information search device according to any one of claims 1 to 4 . ユーザ端末から入力された検索キーワードに基づいてインターネット上のWEBサイトを検索して検索結果をユーザ端末に送信するWEB情報検索方法において、
ユーザ固有データを予め登録したユーザファイルに登録された全てのユーザに対して、記憶手段に格納されたWEBサイトの識別情報を含むブックマークを収集して、ユーザのブックマーク利用情報とWEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むブックマーク分析データをブックマーク分析ファイルに登録する分析ステップと、
予め全ての前記ブックマーク分析データに基づいて、インターネット上のWEBサイトからデータを収集して検索用ファイルに登録するデータ収集ステップと、
所定の時期に、全ての前記ブックマーク分析データと前記ユーザ固有データとから、WEBサイトに対するユーザ全体の利用状況を記録したマクロプロファイルを生成するマクロプロファイル作成ステップと、
ユーザ端末から検索キーワードによる検索指示が入力されたときに、前記キーワードに基づいて検索用ファイルからデータを検索する検索ステップと、
前記検索されたデータの夫々を、前記検索指示を行ったユーザのユーザ固有データ及び前記マクロプロファイルに基づいて評価する評価ステップと、
前記評価手段ステップにおける評価に基づいて前記検索されたデータから検索結果データを生成し、ユーザ端末に送信する検索結果生成ステップとを備え、
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、WEBサイト毎に、前記ユーザ全体のうち該WEBサイトの参照回数が最も多いユーザの特定のユーザ固有データが該WEBサイトと関連づけられて含まれており、
前記評価ステップでは、前記検索指示を行ったユーザの前記ユーザ固有データに、前記マクロプロファイルに含まれる前記特定のユーザ固有データと一致する特定のユーザ固有データが含まれる場合に、該特定のユーザ固有データに関連するWEBサイトと対応する前記検索されたデータに重み付け値が付与され、
前記検索結果生成ステップでは、前記検索されたデータが前記重み付け値に基づいた順番でソートされて検索結果データが生成されることを特徴とするWEB情報検索方法。
In a WEB information search method for searching a WEB site on the Internet based on a search keyword input from a user terminal and transmitting a search result to the user terminal.
For all users registered in a user file in which user-specific data is registered in advance, bookmarks including WEB site identification information stored in the storage means are collected, and the user's bookmark usage information and WEB site identification information are collected. And an analysis step of registering bookmark analysis data including access information to the WEB site in the bookmark analysis file;
A data collection step of collecting data from a web site on the Internet and registering it in a search file based on all the bookmark analysis data in advance;
A macro profile creating step for creating a macro profile that records the usage status of the entire user for the WEB site from all the bookmark analysis data and the user-specific data at a predetermined time;
A search step of searching data from a search file based on the keyword when a search instruction based on a search keyword is input from the user terminal;
An evaluation step of evaluating each of the searched data based on the user-specific data of the user who made the search instruction and the macro profile ;
A search result generation step of generating search result data from the searched data based on the evaluation in the evaluation means step , and transmitting to the user terminal ;
The usage status of the entire user in the macro profile includes, for each WEB site, specific user-specific data of the user who has the highest number of times of reference to the WEB site among the entire user in association with the WEB site. And
In the evaluation step, when the user-specific data of the user who has made the search instruction includes specific user-specific data that matches the specific user-specific data included in the macro profile, the specific user-specific data A weight is assigned to the retrieved data corresponding to the WEB site associated with the data,
In the search result generation step, the search data is generated by sorting the searched data in an order based on the weighting value .
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、WEBサイト毎に、前記ユーザ全体のうち該WEBサイトの前記ブックマークへの登録数が最も多いユーザの特定のユーザ固有データが該WEBサイトと関連づけられて更に含まれており、In the usage status of the entire user in the macro profile, for each WEB site, specific user-specific data of the user who has the largest number of registrations in the bookmark of the WEB site among the entire user is associated with the WEB site. It is further included,
前記評価ステップは、前記検索指示を行ったユーザの前記ユーザ固有データに、前記マクロプロファイルに含まれる前記特定のユーザ固有データと一致する特定のユーザ固有データが含まれる場合に、該特定のユーザ固有データに関連するWEBサイトと対応する前記検索されたデータに重み付け値が更に付与されるIn the evaluation step, when the user-specific data of the user who made the search instruction includes specific user-specific data that matches the specific user-specific data included in the macro profile, the specific user-specific data A weight is added to the retrieved data corresponding to the WEB site associated with the data.
ことを特徴とする請求項6に記載のWEB情報検索方法。The WEB information search method according to claim 6.
前記マクロプロファイルにおける前記ユーザ全体の利用状況には、前記WEBサイト毎の最後に参照された時間に関する参照時間情報が更に含まれ、The usage status of the entire user in the macro profile further includes reference time information related to the last referenced time for each WEB site,
前記評価ステップでは、前記マクロプロファイルに含まれる前記参照時間情報と、前記検索指示が行われた時刻とに基づいて、前記検索されたデータに重み付け値が更に付与されることを特徴とする請求項6又は7に記載のWEB情報検索方法。The weighting value is further given to the searched data based on the reference time information included in the macro profile and a time when the search instruction is performed in the evaluation step. 8. The web information search method according to 6 or 7.
前記評価ステップは、前記検索されたデータの夫々評価された後、前記検索されたデータの夫々を評価結果に基づいて分類されるものであり、
前記検索結果生成ステップは、所定の分類に属する前記検索されたデータのみ選択されて検索結果データ生成されるものである
ことを特徴とする請求項6〜8のいずれか1項に記載のWEB情報検索方法。
In the evaluation step, after each of the retrieved data is evaluated, the each of the retrieved data is shall be classified based on the evaluation result,
The search result generation step, according to any one of claims 6-8, characterized in that only the retrieved data belonging to a predetermined category is shall be generated the selected search results data WEB information search method.
前記ブックマーク分析ファイルは、ブックマーク利用情報を含むブックマークデータを登録したブックマークファイルと、WEBサイトの識別情報とWEBサイトに対するアクセス情報とを含むサイトデータを登録したサイトファイルとを有するものであることを特徴とする請求項6〜9のいずれか1項に記載のWEB情報検索方法。The bookmark analysis file includes a bookmark file in which bookmark data including bookmark usage information is registered, and a site file in which site data including identification information of a WEB site and access information to the WEB site is registered. The WEB information search method according to any one of claims 6 to 9. 請求項6〜10のいずれか1項に記載のWEB情報検索方法を、コンピュータに実行させるためプログラム。 The program for making a computer perform the WEB information search method of any one of Claims 6-10 .
JP2001162487A 2001-05-30 2001-05-30 WEB information search apparatus, WEB information search method, and program for causing computer to execute the method Expired - Fee Related JP3671368B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001162487A JP3671368B2 (en) 2001-05-30 2001-05-30 WEB information search apparatus, WEB information search method, and program for causing computer to execute the method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001162487A JP3671368B2 (en) 2001-05-30 2001-05-30 WEB information search apparatus, WEB information search method, and program for causing computer to execute the method

Publications (2)

Publication Number Publication Date
JP2002351916A JP2002351916A (en) 2002-12-06
JP3671368B2 true JP3671368B2 (en) 2005-07-13

Family

ID=19005598

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001162487A Expired - Fee Related JP3671368B2 (en) 2001-05-30 2001-05-30 WEB information search apparatus, WEB information search method, and program for causing computer to execute the method

Country Status (1)

Country Link
JP (1) JP3671368B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140525B2 (en) 2007-07-12 2012-03-20 Ricoh Company, Ltd. Information processing apparatus, information processing method and computer readable information recording medium

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1628253A4 (en) * 2003-05-07 2008-04-16 Takafumi Terasawa Schedule creation method, schedule creation system, unexperienced schedule prediction method, and leaning schedule evaluation display method
JP4571648B2 (en) * 2004-12-17 2010-10-27 株式会社マーズフラッグ WEB information providing apparatus, method thereof, and program
JP4527770B2 (en) * 2005-03-07 2010-08-18 株式会社マーズフラッグ Information retrieval apparatus, computer program, and storage medium
US7933917B2 (en) * 2005-05-06 2011-04-26 Nhn Corporation Personalized search method and system for enabling the method
US20070005587A1 (en) * 2005-06-30 2007-01-04 Microsoft Corporation Relative search results based off of user interaction
US20100063976A1 (en) * 2005-09-20 2010-03-11 France Telecom Method for accessing data concerning at least one user enabling said user to be contacted subsequently
JP4718291B2 (en) * 2005-10-03 2011-07-06 株式会社オービック Information sharing system
US20080010252A1 (en) * 2006-01-09 2008-01-10 Google, Inc. Bookmarks and ranking
JP4840914B2 (en) * 2006-05-31 2011-12-21 株式会社Access System, terminal, server, and dynamic information providing method
JP2008015988A (en) * 2006-07-10 2008-01-24 Nippon Telegr & Teleph Corp <Ntt> Content display method, device, program and computer readable recording medium
US20080104042A1 (en) * 2006-10-25 2008-05-01 Microsoft Corporation Personalized Search Using Macros
JP2009140108A (en) * 2007-12-04 2009-06-25 Yahoo Japan Corp Utility evaluation method for bookmark
CN101911065B (en) 2007-12-30 2012-11-21 友翼有限公司 Access subject information retrieval device
WO2009110253A1 (en) * 2008-03-06 2009-09-11 日本電気株式会社 Information recommendation system, information recommendation server device, and information recommendation method
JP2010277543A (en) * 2009-06-01 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> Device, method and program for creating correct-answer database, and recording medium recording the program
JP5640833B2 (en) * 2011-03-10 2014-12-17 富士通株式会社 SEARCH METHOD, SEARCH PROGRAM, AND SEARCH DEVICE
JP2014071645A (en) * 2012-09-28 2014-04-21 Ntt Docomo Inc Server device, information processing method and program
JP5937939B2 (en) * 2012-09-28 2016-06-22 株式会社Nttドコモ Server apparatus and information processing method
KR101488980B1 (en) * 2013-07-24 2015-02-04 동명대학교산학협력단 System and method for providing personalized internet information

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000187666A (en) * 1998-12-22 2000-07-04 Ntt Data Corp Related information providing system and taste similarity evaluating system and its method information introducing system and related information obtaining method and recording medium

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8140525B2 (en) 2007-07-12 2012-03-20 Ricoh Company, Ltd. Information processing apparatus, information processing method and computer readable information recording medium

Also Published As

Publication number Publication date
JP2002351916A (en) 2002-12-06

Similar Documents

Publication Publication Date Title
JP3671368B2 (en) WEB information search apparatus, WEB information search method, and program for causing computer to execute the method
US6983320B1 (en) System, method and computer program product for analyzing e-commerce competition of an entity by utilizing predetermined entity-specific metrics and analyzed statistics from web pages
US7013323B1 (en) System and method for developing and interpreting e-commerce metrics by utilizing a list of rules wherein each rule contain at least one of entity-specific criteria
US7644101B2 (en) System for generating and managing context information
US6401118B1 (en) Method and computer program product for an online monitoring search engine
RU2382400C2 (en) Construction and application of web-catalogues for focused search
US20070067217A1 (en) System and method for selecting advertising
JP5133946B2 (en) Information search apparatus and information search method
KR100509276B1 (en) Method for searching web page on popularity of visiting web pages and apparatus thereof
CN102446225A (en) Real-time search method, device and system
JP2007323334A (en) Web page extraction system, advertisement distribution system using the same, and advertising distribution program
CN104834739B (en) Internet information storage system
JP4769822B2 (en) Information search service providing server, method and system using page group
US6711569B1 (en) Method for automatic selection of databases for searching
KR20000054312A (en) Establishing provide Method for ordered web information
KR101122737B1 (en) Apparatus and method for establishing search database for knowledge node coupling structure
JP2009026249A (en) Browsing-history-editing terminal, program, and its method
WO2001055909A1 (en) System and method for bookmark management and analysis
KR100557874B1 (en) Method of scientific information analysis and media that can record computer program thereof
JP4430598B2 (en) Information sharing system and information sharing method
KR101248186B1 (en) System for generating blog using each content in search result page and method thereof
JP2008234231A (en) Retrieval keyword management system for navigation through site
KR20020014026A (en) News tracker and analysis service based on web personalization
KR101132431B1 (en) System and method for providing interest information
KR20080028031A (en) System extracting and displaying keyword and contents related with the keyword and method using the system

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040914

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20041015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20041015

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041115

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050318

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050412

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050407

R150 Certificate of patent or registration of utility model

Ref document number: 3671368

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110428

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees