以下、特許検索式生成装置等の実施形態について図面を参照して説明する。なお、実施の形態において同じ符号を付した構成要素は同様の動作を行うので、再度の説明を省略する場合がある。
(実施の形態)
図1は、本実施の形態における特許検索式生成装置1のブロック図である。
特許検索式生成装置1は、関連用語情報格納部101、キーワード受付部102、候補キーワード取得部103、候補キーワード表示部104、指定指示受付部105、検索指定管理情報格納部106、特許検索式生成部107、特許検索式出力部108、用語記憶部109、特許分類コード情報検索部110、および特許分類コード情報選択部111を備える。
関連用語情報格納部101には、関連用語情報が1以上格納される。関連用語情報は、用語と、この用語に関連する用語である関連用語とを有する情報である。用語とは、例えば、技術に関する用語である。技術に関する用語とは、例えば、技術用語や専門用語である。関連用語は、例えば、用語についての類義語や、上位語や、下位語等である。上位語とは、例えば、上位概念の用語、下位語とは、例えば、下位概念の用語である。ここでの類義語は、用語を省略した省略語や、用語を他の言語に翻訳した用語や、その読みを示す用語等も含む概念である。関連用語情報は、例えば、用語についての類義語辞書や、上位語辞書や、下位語辞書等の辞書の情報と考えても良い。この場合、関連用語と対応付けられている技術に関する用語は、検索キーに利用される見出し語等と考えても良い。
関連用語情報格納部101に関連用語情報が記憶される過程は問わない。例えば、記録媒体を介して関連用語情報が関連用語情報格納部101で記憶されるようになってもよく、通信回線等を介して送信された関連用語情報が関連用語情報格納部101で記憶されるようになってもよく、あるいは、入力デバイスを介して入力された関連用語情報が関連用語情報格納部101で記憶されるようになってもよい。
また、関連用語情報に含まれる各情報、例えば、用語や関連用語は、それらの情報そのものであってもよく、あるいは、その情報を特定可能な情報であってもよい。後者の場合には、関連用語情報に含まれる用語等は、例えば、用語等が格納されている領域を示すポインタやアドレスであってもよいし、用語の識別情報であっても良い。このことは、後述する他の2つの情報を有する情報についても同様であるとする。
関連用語情報格納部101は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
キーワード受付部102は、1以上のキーワードを受け付ける。キーワード受付部102が受け付けるキーワードは、ユーザが検索しようと考える検索目的に応じて入力される1以上のキーワードである。キーワード受付部102が受け付けるキーワードは、例えば、検索式等で用いられるいわゆるフリーキーワードである。キーワードは1文字以上の文字列で構成される。なお、ここでは、キーワード受付部102が受け付けたキーワードを、適宜、受付キーワードと呼ぶ。
キーワード受付部102が複数のキーワードを受け付けた場合、これらのキーワードは、AND条件として入力されたキーワードと考えても良いし、OR条件として入力されたキーワードと考えても良い。AND条件するか、OR条件とするかについては、キーワード入力時等に、キーワード受付部102等が検索記号等によってユーザから指定を受け付けるようにしても良いし、デフォルトやユーザ設定等で指定されていてもよい。
ここで述べる受け付けとは、キーボードやマウス、タッチパネルなどの入力デバイスから入力された情報の受け付け、有線もしくは無線の通信回線を介して送信された情報の受信、光ディスクや磁気ディスク、半導体メモリなどの記録媒体から読み出された情報の受け付けなどを含む概念である。入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。キーワード受付部102は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
候補キーワード取得部103は、候補キーワードを取得する。候補キーワードとは、特許検索式に含まれるキーワードの候補となるキーワードである。候補キーワード取得部103は、例えば、関連用語情報格納部101に格納されている関連用語情報から、キーワード受付部102が受け付けた各キーワードと一致する用語と対応付けられた関連用語であって、各キーワードと一致する文字列を含まない関連用語を、候補キーワードとして取得する。
候補キーワード取得部103がどのように候補キーワードを取得するかは問わない。例えば、候補キーワード取得部103は、関連用語情報から、各受付キーワードと一致する用語と対応付けられた関連用語を検索により取得し、この検索により取得した関連用語の中から各キーワードと一致する文字列を含まない関連用語を取得しても良い。なお、関連用語情報から検索を行う際においては、さらに、関連用語情報の関連用語を用語として用いるとともに、関連用語情報の用語を関連用語として用いるようにして、各受付キーワードと一致する用語と対応付けられた関連用語を検索するようにしても良いことはいうまでもない。ここでは、関連用語情報から検索によって取得された、各受付キーワードと一致する用語と対応付けられた関連用語を、取得関連用語と呼ぶ。各受付キーワードと一致する文字列を含まない関連用語を取得するためには、例えば、検索により取得した取得関連用語に、各受付キーワードと一致する文字列を含むか否かを判断して、含まない場合のみ、関連用語を取得する。また、検索により取得した関連用語から、各受付キーワードと一致する文字列を含む関連用語を削除することで、残った関連用語を各受付キーワードと一致する文字列を含まない関連用語として取得しても良い。また、削除の代わりに、検索により取得した関連用語のうちの各受付キーワードと一致する文字列を含む関連用語を検索し、検出した関連用語に取得対象でないことを示すフラグ情報等の情報を付与するようにし、この情報が付与されていない関連用語だけを取得しても良い。あるいは、検索により取得した関連用語のうちの各受付キーワードと一致する文字列を含まない関連用語を検索し、検出した関連用語に取得対象であることを示すフラグ情報等の情報を付与して、この情報が付与されている関連用語だけを取得しても良い。なお、一旦、検索により取得された取得関連用語については、候補キーワードの再取得の際に利用できるよう、後述する検索指定管理情報格納部106に保持するようにしても良く、上述したフラグ等の情報も、取得関連用語と対応付けて検索指定管理情報格納部106等の記憶媒体に保持するようにしても良い。なお、ここでの各受付キーワードと一致する用語と対応付けられた関連用語とは、具体的には、各受付キーワードのいずれか一つと一致する用語と対応付けられた関連用語である。また、ここでの各キーワードと一致する文字列を含まない関連用語とは、具体的には、各受付キーワードのいずれに対しても一致する文字列を含まない関連用語である。また、ここでの一致は、各受付キーワードとの完全一致とすることが好ましいが、部分一致としてもよい。
なお、候補キーワード取得部103は、例えば、関連用語情報から、各受付キーワードのいずれに対しても一致する文字列を含まない関連用語を検索により取得し、この検索により取得した関連用語の中から各受付キーワードのいずれかと一致する用語と対応付けられた関連用語を取得しても良い。
また、候補キーワード取得部103は、各受付キーワードのいずれか一つと一致する用語と対応付けられた関連用語であって、各受付キーワードのいずれに対しても一致する文字列を含まない関連用語を、関連用語情報から検索により取得しても良い。
なお、本実施の形態においては、候補キーワード取得部103が、関連用語情報から、各キーワードと一致する用語と対応付けられた関連用語である取得関連用語を検索により取得し、この検索により取得した取得関連用語の中から各キーワードと一致する文字列を含まない取得関連用語を候補キーワードとして取得する場合を例に挙げて説明する。
また、本実施の形態においては、候補キーワード取得部103は、関連用語情報から取得した候補キーワードから、後述する指定指示受付部105が受け付けた指定指示により検索キーワードに指定された候補キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得してもよい。検索キーワードに指定された候補キーワードをここでは指定済検索キーワードと呼ぶ。例えば、候補キーワード取得部103は、関連用語情報からキーワード受付部102が受け付けたキーワードと一致する用語と対応付けられた関連用語であって、キーワードと一致する文字列を含まない関連用語を候補キーワードとして関連用語情報から取得し、この候補キーワードのうちの、指定済検索キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得する。あるいは、直前に取得した候補キーワードの中から、指定済検索キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得してもよい。候補キーワードが、検索キーワードに指定されたものであるか否かを示す情報は、例えば、後述するように、候補キーワードに対応する取得関連用語や受付キーワードと対応付けられて後述する検索指定管理情報格納部106に蓄積される。
具体的には、関連用語情報から取得した候補キーワードの中から、指定済検索キーワードと一致する文字列を有する候補キーワードを検索し、検出した候補キーワードを除外して候補キーワードを取得しても良い。ここでの除外は、取得した候補キーワードから除外の対象となる候補キーワードを削除や破棄することと考えても良いし、除外の対象となる候補キーワードに除外されたことを示すフラグ等の情報を付与することでも良いし、除外の対象となる候補キーワード以外の候補キーワードを取得することと考えても良い。なお、上記のように、各キーワードと一致する用語と対応付けられた関連用語を取得関連用語として検索により取得してメモリ等の記憶媒体に蓄積している場合においては、候補キーワードを除外する際に、除外する候補キーワードに対応する取得関連用語に、上述したような候補キーワードとして取得しないことを示すフラグ等の情報を付与してもよい。あるいは、除外することとなった候補キーワードから、上述したような候補キーワードとして取得しないことを示すフラグ等の情報を削除してもよい。
候補キーワード取得部103が、関連用語情報から取得した候補キーワードから、指定済検索キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得するタイミングやトリガー等は問わない。例えば、指定指示受付部105が指定指示を受け付けたことをトリガーとして上記の処理を実行しても良いし、ユーザ等から図示しない受付部等を介して処理を実行する命令を受け付けた場合に処理を実行しても良い。
なお、ここでは、関連用語情報から取得した候補キーワードとして、キーワード受付部102が受け付けた各キーワードと一致する用語と対応付けられた関連用語であって、各受付キーワードと一致する文字列を含まない関連用語を用いた場合について説明したが、候補キーワード取得部103は、関連用語情報から、各受付キーワードと一致する用語と対応付けられた関連用語を、特許検索式に用いられるキーワードの候補となる候補キーワードとして取得するようにして、上記と同様の処理、例えば、指定指示受付部105が上記のような指定指示を受け付けた場合に、取得した候補キーワードから、指定指示により指定された候補キーワードと一致する文字列を含む候補キーワードを除外する処理等を行うようにしても良い。
なお、候補キーワード取得部103は、キーワード受付部102が受け付けた受付キーワードを、後述する指定指示により指定された候補キーワードと同様の、検索キーワードに指定済の候補キーワードとして取得するようにしても良い。この指定済の候補キーワードとして取得された受付キーワードは、関連用語情報から取得した候補キーワードではないため、指定済検索キーワードと一致する文字列を有する候補キーワードの検索対象に含めないようにして、常時、候補キーワード取得部103によって、候補キーワードの一つとして取得されるようにすることが好ましい。このようにすることで、ユーザが入力したキーワードを常に優先的に候補キーワードの一つとして取り扱えるようにするためである。なお、候補キーワードとして取得された受付キーワードも、検索キーワードに指定済の(あるいは指定が解除された)候補キーワードとなり得る。また、キーワード受付部102が受け付けた受付キーワードは、取得関連用語と同様に、後述する検索指定情報と対応付けて、検索指定管理情報格納部106に蓄積することが好ましい。
また、候補キーワード取得部103は、関連用語情報から取得した候補キーワードから、後述する指定指示受付部105が受け付けた解除指示によって、検索キーワードとする指定が解除されずに残った指定済検索キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得するようにしても良い。具体的には、指定済検索キーワードから、解除指示によって検索キーワードとする指定が解除された結果、指定済検索キーワードではなくなったものを除外し、この除外によって残った指定済検索キーワードと一致する文字列を有する候補キーワードを関連用語情報から取得した候補キーワードの中から検索し、検出した候補キーワードを除外して候補キーワードを取得しても良い。
候補キーワード取得部103は、通常、MPUやメモリ等から実現され得る。候補キーワード取得部103の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
候補キーワード表示部104は、候補キーワード取得部103が取得した候補キーワードを表示する。また、候補キーワード表示部104は、例えば、候補キーワード取得部103が、候補キーワードを取得する処理を行うごとに、新たに取得された候補キーワードを用いて表示を更新する。例えば、候補キーワード表示部104は、後述する指定指示の受け付けに応じて候補キーワード取得部103が取得した候補キーワードで表示を更新する。また、例えば、後述する解除指示の受け付けに応じて候補キーワード取得部103が取得した候補キーワードを含む候補キーワードを表示する。例えば、候補キーワード表示部104は、解除指示の受け付けに応じて候補キーワード取得部103が取得した候補キーワードを追記しても良いし、既に表示されている候補キーワードに解除指示の受け付けに応じて候補キーワード取得部103が取得した候補キーワードを加えた候補キーワードを再描画するようにしてもよい。
また、候補キーワード表示部104は、後述する指定指示等により検索キーワードに指定された候補キーワードの表示を、検索キーワードに指定されていない候補キーワードとは異なる表示態様に変更して表示指定も良い。ここでの異なる表示態様とは、指定済検索キーワードと、検索キーワードに指定されていない候補キーワードとが、視覚的に識別可能なものであれば、どのような表示態様の違いであってもよい。例えば、候補キーワードの文字属性(例えば、フォントやフォントカラーや、フォントサイズや文字の背景色等)の違いであっても良い。また、候補キーワードの前後や上下に配置される記号や、オブジェクト等の有無の違いであっても良い。また、候補キーワードの前後に配置されたチェックボックスやラジオボタン等のチェックの有無が異なることであっても良い。あるいは、候補キーワードの配置される位置が、異なる領域となることであっても良い。
候補キーワード表示部104は、候補キーワード取得部103が取得した候補キーワードのそれぞれが、指定済検索キーワードであるか否かを判断し、指定済検索キーワードであるか否かの判断結果に応じて予め指定された表示態様となるよう各候補キーワードを表示する。各候補キーワードが、検索キーワードに指定されたものであるか否かの判断は、どのように行っても良い。例えば、候補キーワード表示部104は、後述する検索指定管理情報格納部106に格納されているような、候補キーワード取得部103が関連用語情報から取得した取得関連用語および受付キーワードと、検索キーワードに指定された情報であるか否かを示す情報である検索指定情報とを有する検索指定管理情報から、候補キーワードに対応する検索指定情報を検索により取得し、取得した検索指定情報が、検索キーワードであることを示す情報である場合は、検索キーワードに指定された候補キーワードであると判断し、取得した検索指定情報が、検索キーワードでないことを示す情報である場合は、検索キーワードに指定されていない候補キーワードであると判断する。検索指定管理情報等については後述する。
候補キーワード表示部104は、ディスプレイデバイスを含むと考えても含まないと考えても良い。候補キーワード表示部104は、ディスプレイデバイスのドライバーソフトまたは、ディスプレイデバイスのドライバーソフトとディスプレイデバイス等で実現され得る。また、候補キーワード表示部104は、判断の処理等を行うためのMPUやメモリ等を備えていても良い。
指定指示受付部105は、候補キーワード取得部103が取得した候補キーワードの1以上を、特許検索式に用いるキーワードである検索キーワードに指定する指示である指定指示を受け付ける。指定指示受付部105は、どのように指定指示を受け付けても良い。指定指示受付部105は、例えば、候補キーワード表示部104が表示している候補キーワードに対して指定指示を受け付ける。例えば、候補キーワード表示部104が、各候補キーワードの横に指定指示を受け付けるためのチェックボックスやボタン等のインターフェースを表示するようにして、このインターフェースに対して予め指定された操作(例えば、チェックボックスにチェックを入れる操作や、ボタンを押す操作)等が行われたことをトリガーとして、指定指示受付部105は、指定指示を受け付けるようにしても良い。
指定指示受付部105は、例えば、指定指示受付部105が一の候補キーワードに対して指定指示を受け付けた場合、後述する検索指定管理情報格納部106に既に蓄積されているこの候補キーワードに対応した検索指定管理情報の検索指定情報を、検索キーワードに指定されたことを示す情報、即ち、指定済検索キーワードであることを示す情報に更新する。検索指定情報は、取得関連情報が、検索キーワードであるか否かを示す情報、即ち、指定済検索キーワードであるか否かを示す情報である。例えば、対応する取得関連情報が指定済検索キーワードであることを示すフラグ等の情報である。また、対応する取得関連情報が指定済検索キーワードでないことを示すフラグ等の情報でも良い。
指定指示受付部105は、候補キーワードの指定を解除する指示である解除指示を更に受け付けるようにしてもよい。指定指示受付部105は、例えば、候補キーワード表示部104が表示している指定済検索キーワードに対して解除指示を受け付ける。例えば、候補キーワード表示部104が、指定済検索キーワードの横に解除指示を受け付けるためのチェックボックス(例えば、チェック済のチェックボックス)や指定を解除するためのボタン等のインターフェースを表示するようにするとともに、このインターフェースに対して予め指定された操作(例えば、チェックボックスのチェックを外す操作や、ボタンを押す操作)等が行われたことをトリガーとして、指定指示受付部105は、解除指示を受け付けるようにしても良い。
指定指示受付部105が一の候補キーワードに対して解除指示を受け付けた場合、後述する検索指定管理情報格納部106に既に蓄積されているこの候補キーワードに対応した検索指定管理情報の検索指定情報を、検索キーワードに指定されていないことを示す情報、即ち、指定済検索キーワードでないことを示す情報に更新しても良い。
なお、候補キーワード取得部103が、受付キーワードを候補キーワードとして取得する場合、この候補キーワードについては、既に検索キーワードに指定済の候補キーワードとして取得することが好ましく、この候補キーワードについて蓄積される検索指定管理情報においては、検索指定情報を、検索キーワードであることを示す情報とすることが好ましい。
指定指示や解除指示の入力手段は、テンキーやキーボードやマウスやメニュー画面によるもの等、何でも良い。指定指示受付部105は、テンキーやキーボード等の入力手段のデバイスドライバーや、メニュー画面の制御ソフトウェア等で実現され得る。
検索指定管理情報格納部106には、候補キーワード取得部103が取得した取得関連用語と、検索キーワードに指定された情報であるか否かを示す情報である検索指定情報とを対応付けて有する1以上の検索指定管理情報が格納される。また、検索指定管理情報は、取得関連用語を検索する際に用いた受付キーワードの識別情報を対応付けて有していてもよい。さらに、検索指定管理情報は、取得関連用語を取得する際に用いられた受付キーワードと、この受付キーワードが検索キーワードに指定された情報であるか否かを示す情報である検索指定情報とを対応付けて有していてもよい。この場合、検索指定管理情報は、受付キーワードを受付キーワード自身の識別情報と対応付けて有していても良い。ここでは、検索指定管理情報格納部106に格納される取得関連用語と、受付キーワードとを、取得用語と呼ぶ。この取得用語の中から候補キーワード取得部103によって候補キーワードが取得される。また、検索指定管理情報には、取得用語が、取得関連用語であるか、受付キーワードであるかを示す情報である用語判定情報が含まれていても良い。用語判定情報は、検索指定情報と同様の情報である。検索指定管理情報は、候補キーワード取得部103や指定指示受付部105等により蓄積されたり更新されたりする。検索指定管理情報格納部106は、不揮発性の記録媒体でも、揮発性の記録媒体でも良い。
特許検索式生成部107は、指定指示により検索キーワードに指定された候補キーワード、即ち指定済検索キーワードを含む特許検索式を生成する。特許検索式とは、特許公報の検索に利用される検索式である。特許検索式は、例えば、検索キーワードに指定された候補キーワードを含む1以上の検索キーと、一以上の検索キーの組合せかたや検索キーによる検索順序等を指定するための演算子等の組合せにより構成される論理式を示す情報である。特許検索式は、検索のための検索クエリと考えても良い。複数の検索キーを組み合わせかたを指定する演算子は、例えば、複数の検索キーのうちの、どの検索キーがヒットし、どの検索キーがヒットしないものを検索結果とするか等を指定する演算子である。演算子は、例えば、検索が、AND検索であるかOR検索であるかNOT検索であるか等を指定する演算子であり、例えば「*」や「+」や、「−」、「(」、「)」等の記号が用いられる。特許検索式生成部107は、例えば、特許検索式を生成する時点での指定済検索キーワードを取得して、この指定済検索キーワードを含む特許検索式を生成する。指定済検索キーワードとは、例えば、検索キーワードであることを示す検索指定情報と対応付けられている候補キーワードである。具体的には、特許検索式生成部107は、各候補キーワードに対応する検索指定管理情報に含まれる検索指定情報が、検索キーワードであることを示す情報であるか否かを判断し、検索キーワードであることを示す候補キーワードであれば、この候補キーワードを指定済検索キーワードとして取得する。また、検索キーワードであることを示す候補キーワードでなければ、この候補キーワードは取得しない。そして、取得した候補キーワードを用いて特許検索式を生成する。各候補キーワードに対応する検索指定管理情報とは、具体的には、各候補キーワードと一致する取得用語情報または受付キーワードを有する検索指定管理情報である。
特許検索式を生成する際において、キーワード受付部102が受け付けた一のキーワードを用いて取得された検索キーワードに指定された候補キーワードが複数である場合、これらはOR条件として用いることが好ましい。また、キーワード受付部102が受け付けたキーワードが複数である場合、各キーワードを用いて取得された検索キーワードに指定された候補キーワード(もしくは候補キーワード群)同士は、キーワード受付部102がキーワードを受け付けた際の、キーワード間の論理条件に沿った条件で検索式に利用されるようにすることが好ましい。例えば、AND条件として用いることが指定されているキーワードAとキーワードBとをキーワード受付部102が受け付けた場合において、最終的にキーワードAについて、検索キーワードに指定された候補キーワードとして、候補キーワードA1および候補キーワードA2が得られ、キーワードBについて、検索キーワードに指定された候補キーワードとして、候補キーワードB1、候補キーワードB2および候補キーワードB3が得られたとすると、特許検索式生成部107は、例えば、(A1+A2)*(B1+B2+B3)という特許検索式を取得する。なお、「+」はOR条件として検索を行うことを指定する演算子、「*」はAND条件として検索を行うことを指定する演算子を示すものとする。
なお、ここでは、キーワード受付部102が受け付けたキーワードが複数である場合、各キーワードを用いて取得された検索キーワードに指定された候補キーワード(もしくは候補キーワード群)同士をどのような条件として論理式に用いるかについては、キーワード受付部102が受け付けた候補キーワード間の関連度に従って決定されるようにしてもよい。例えば、関連度が高ければ、候補キーワード同士を、AND条件とし、関連度が低ければ、候補キーワード同士を、OR条件として特許検索式を生成してもよい。
また、特許検索式生成部107は、後述する特許分類コード情報検索部110が検索した特許分類コード情報の少なくとも一部を更に含む特許検索式を生成してもよい。特に、特許検索式生成部107は、後述する特許分類コード情報選択部111が選択した特許分類コード情報等を更に含む特許検索式を生成してもよい。具体的には、検索キーワードに指定された候補キーワードに加えて、特許分類コード情報の少なくとも一部を、さらに検索キーとして用いた特許検索式を生成してもよい。ここで生成する特許検索式においては、取得した特許分類コード情報が複数である場合、複数の特許分類コード情報は、OR条件となるように特許検索式に加えられる。また、取得した特許分類コード情報(または特許分類コード情報群)は、例えば、指定済検索キーワード(または指定済検索キーワード群)に対してAND条件となるように特許検索式に加えられる。
例えば、AND条件として用いられることが指定されているAというキーワードと、Bというキーワードとを、キーワード受付部102が受け付け、Aというキーワードについて、検索キーワードに指定された候補キーワードとして、a1,a2,a3という候補キーワードを特許検索式生成部107が取得し、Bというキーワードについては、検索キーワードに指定された候補キーワードとして、b1,b2,b3という候補キーワードを特許検索式生成部107が取得したとする。また、これらの候補キーワード情報を用いてc1、c2という特許分類コード情報が取得されたとする。この場合、生成される検索式は、例えば、「(a1+a2+a3)*(b1+b2+b3)*(c1+c2)」となる。
なお、ここで述べる特許検索式は、実質的に検索エンジンに検索式に相当するものとして入力可能なものであれば、演算子等を含まない情報であっても良い。例えば、特許検索式は、候補キーワード等の検索キーのみで構成された情報であっても良い。
特許検索式生成部107が特許検索式を生成するトリガーやタイミング等は問わない。例えば、ユーザにより特許検索式を生成する指示を受け付けた場合に特許検索式を生成してもよい。また、指定指示や解除指示等を受け付けた場合に特許検索式を生成してもよい。
特許検索式生成部107は、通常、MPUやメモリ等から実現され得る。特許検索式生成部107の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
特許検索式出力部108は、特許検索式生成部107が生成した特許検索式を出力する。ここで述べる出力とは、ディスプレイへの表示、プロジェクターを用いた投影、プリンタへの印字、音出力、外部の装置への送信、記録媒体への蓄積、他の処理装置や他のプログラムなどへの処理結果の引渡しなどを含む概念である。例えば、特許検索式出力部108は、特許検索式を、特許公報の検索を行う検索エンジンや検索装置等に入力するようにしてもよい。
特許検索式出力部108は、ディスプレイやスピーカーや通信装置等の出力デバイスを含むと考えても含まないと考えても良い。特許検索式出力部108は、出力デバイスのドライバーソフトまたは、出力デバイスのドライバーソフトと出力デバイス等で実現され得る。
用語記憶部109には、技術的な文書を示す情報である技術文書情報に含まれる1以上の用語と、技術文書情報についての特許の分類を示すコードの情報である1以上の特許分類コード情報とが、技術文書情報ごとに対応付けて記憶される。
技術文書情報は、具体的には、特許公報や論文などの技術の内容を説明する情報が記載された文書を示す情報である。一の技術文書情報は、予め一以上の項目により項目分けされていても良い。例えば、特許公報の場合、「特許請求の範囲」や「明細書」等の項目や、「発明の名称」、「技術分野」等の項目で分類されていると考えても良い。技術文書情報に含まれる用語とは、技術文書情報に含まれる1以上の文字列により構成される情報、例えば、単語である。用語は、例えば、上述した用語と同様のものであり、例えば、「MPEG」や「ボルト」、「ナット」、「加熱コイル」などの技術タームなどである。また、用語は、いわゆる形態素解析で取得可能な単語の1以上の組合せと考えても良い。
特許分類コード情報は、例えば、階層化された特許の分類を表すことが可能なコード情報である。特許分類コード情報は、具体的には、IPC(国際特許分類)やFターム、FIターム、テーマコード、ファセット、USクラス等である。
用語と特許分類コード情報とが、技術文書情報ごとに対応付けられるということは、例えば、1以上の技術文書情報に含まれる各技術文書情報に含まれる用語と、この技術文書情報についての特許分類コード情報とが、それぞれ技術文書情報別に対応付けられていることである。技術文書情報ごとに対応付けられるということは、対応する技術文書情報との対応関係が分かるか否かを問わないことを指す。ここで述べる用語と技術文書情報との対応付けは、直接的に対応付けられていても、間接的に対応付けられていても良い。用語と特許分類コード情報とが、技術文書情報ごとに対応付けられるということは、例えば、1以上の技術文書情報に含まれる各技術文書情報と、この技術文書情報に含まれる用語と、この技術文書情報についての特許分類コード情報とが対応付けられていることである。また、例えば、技術文書情報が、この技術文書情報内に含まれる1以上の用語群と対応付けられ、さらに、技術文書情報が、この技術文書情報についての1以上の特許分類コード情報群と対応付けられていても良い。用語および特許分類コード情報が、技術文書情報と対応付けられるとは、例えば、用語および特許分類コード情報が、技術文書情報を識別する情報、例えば技術文書情報に割り当てられたIDや、技術文書情報の名前等と、対応付けられることである。技術文書情報に割り当てられた識別情報は、技術文書情報に一定のルールや無作為等により割り当てられたIDであっても良いし、技術文書情報が特許公報等であれば、公開番号や出願番号等であってもよい。あるいは、技術文書情報のファイル名等であっても良い。用語と特許分類コード情報とが、技術文書情報毎に対応付けられているということは、例えば、一の技術文書情報に含まれる一の用語と一の特許分類コード情報が、データベースの一のレコードの複数のフィールドの値として管理されることと考えても良い。あるいは、技術文書情報と、この技術文書情報に含まれる用語とを対応付ける管理情報と、技術文書情報と、この技術文書情報に含まれる特許分類コード情報とを対応付ける管理情報との組み合わせにより、リレーショナルデータベース等で、用語と特許分類コード情報とを、技術文書情報毎に管理されても良い。なお、一の技術文書情報に対応付けられた用語や特許分類コードについては、重複する値は削除されていることが好ましい。なお、用語記憶部109は、物理的に複数の記憶媒体等で構成されていても良い。
なお、用語記憶部109には、技術文書情報に含まれる上述したような1以上の用語と、当該用語の当該技術文書情報内における出現頻度を示す情報である出現頻度情報と、当該技術文書情報についての上述したような1以上の特許分類コード情報とが、技術文書情報ごとに対応付けて記憶され得るようにしてもよい。出現頻度情報は、用語の出現頻度を表すことが可能な情報であれば、出現頻度を示す値であっても良いし、出現頻度の高低等を示す文字列の情報等であっても良い。出現頻度情報は、例えば、一の用語が一の技術文書情報内に出現する回数を、当該技術文書情報内に含まれる用語の数、当該技術文書情報内に含まれる形態素の数で除算して得られた値、または当該技術文書情報内に含まれる文字数で除算して得られた値を示す情報である。形態素の数は、技術文書情報を形態素解析することで取得可能である。用語の数は、用語記憶部109に記憶される各用語と一致する用語の数をそれぞれカウントすることで取得可能である。なお、出現頻度情報は、除算して得られた値を、適宜パーセント表示にしたり、除算して得られた値を、パーセントで表したり、標準化等の統計処理をしたりして得られた値であっても良い。また、除算して得られた値を、1以上のしきい値を用いて分別することで、出現頻度が「高い」、「低い」等の文字列の出現頻度情報に変換しても良い。また、出現頻度情報は、出現回数を示す情報であってもよい。なお、用語記憶部109に記憶される出現頻度情報は、どのように取得されたものであっても良い。例えば、複数の技術文書情報から形態素解析等により用語を取得後、各用語に一致する用語の数を、用語を取得した技術文書情報内において検索を行う、もしくは用語を取得する際に取得された重複する用語の数をカウントすること等で取得する。さらに、技術文書情報内に含まれる全て(あるいは予め指定された一部)の用語の数、形態素の数、または文字数等のいずれかを取得する。そして、取得した技術文書情報内の用語の数等で、各用語に一致する用語の数を除算する、もしくは除算した値を分別すること等により出現頻度情報を取得するようにすればよい。
用語記憶部109に用語や特許分類コード情報が蓄積される過程等は問わない。用語記憶部109は、不揮発性の記録媒体が好適であるが、揮発性の記録媒体でも実現可能である。
特許分類コード情報検索部110は、指定指示により指定された候補キーワードを検索キーとし、用語記憶部109から検索キーと一致する用語に対応付けられた特許分類コード情報を検索する。指定指示により指定された候補キーワードとは、例えば、特許分類コード情報を検索する時点において候補キーワード取得部103が取得している指定済検索キーワードである。特許分類コード情報検索部110は、具体的には、用語記憶部109に技術文書情報ごとに対応付けて記憶されている用語について、指定済検索キーワードと一致する用語を検索し、検索により検出された用語と同じ技術文書情報に対応付けられて用語記憶部109に記憶されている特許分類コード情報をそれぞれ取得する。ここで述べる一致は、完全一致であっても部分一致であっても良い。
特許分類コード情報検索部110が検索に用いる指定済検索キーワードが複数ある場合、これらの指定済検索キーワードをどのように組み合わせて検索を行っても良い。例えば、複数の指定済検索キーワードを検索キーとして用いて、AND検索やOR検索やNOT検索等のどのような検索を行っても良い。指定済検索キーワードの組み合わせについては、上述したような特許検索式生成部107が、指定済検索キーワードを用いて特許検索式を生成する際の、指定済検索キーワードの組み合わせに従うことが好ましい。例えば、同じ受付キーワードについて取得された指定済検索キーワード同士はOR条件とし、異なる受付キーワードについて取得された指定済検索キーワード(群)同士は、AND条件として組みあわせて検索することが好ましい。例えば、AND検索の場合、対応付けられている1以上の用語の中に、全ての検索キーのそれぞれと一致するものが存在するような特許分類コード情報を検索する。また、OR検索の場合、対応付けられている1以上の用語の中に、全ての検索キーのいずれかと一致するものが一以上存在するような特許分類コード情報を検索する。具体的には、「地図」と「自動車」という候補キーワードが検索キーワードに指定されている場合、特許分類コード情報検索部110は、「地図」と「自動車」というキーワード情報でAND検索「地図AND自動車」を行うようにしても良いし、OR検索「地図OR自動車」を行うようにしても良い。ただし、複数のキーワード情報をどのように組み合わせて検索を行うかは、例えばデフォルトで設定されていても良いし、予めユーザ等により指定可能となるようにしても良い。
以下に、特許分類コード情報検索部110の処理の一例を挙げる。ここでは、AND検索を行う場合について説明する。例えば、用語記憶部109に、一以上の技術文書情報にそれぞれ含まれる1以上の用語(用語群)と、各技術文書情報についての1以上の特許分類コード情報(特許分類コード情報群)とがそれぞれ対応付けて記憶されているとすると、特許分類コード情報検索部110は、検索キーである候補キーワードの全てと一致する1以上の用語を含む用語群を検索し、検出した用語群に対応付けられた特許分類コード情報群を取得する。このとき異なる2以上の技術文書情報に対応付けられた用語群が、それぞれ、検索キーである候補キーワードの全てと一致する1以上の用語を含む用語群として検出された場合、それぞれの技術文書情報に対応する特許分類コード情報を両方とも取得する。なお、OR検索を行う場合は、上記の処理において、検索キーである候補キーワードの全てと一致する1以上の用語を含む用語群を検索する代わりに、検索キーであるキーワード情報のいずれか一つと一致する1以上の用語を含む用語群を検索すればよい。
なお、用語記憶部109に、上述したように技術文書情報に含まれる1以上の用語と、当該用語の当該技術文書情報内における出現頻度を示す情報である出現頻度情報と、当該技術文書情報についての上述したような1以上の特許分類コード情報とが、技術文書情報ごとに対応付けて記憶されている場合、特許分類コード情報検索部110は、用語記憶部109から、検索キーと一致する用語と対応付けられた特許分類コード情報と、出現頻度情報との組みを検索してもよい。特許分類コード情報と出現頻度情報との組みを検索、とは、検索キーと一致する用語に対応付けられた、出現頻度情報と特許分類コード情報とを、対応付けた状態で取得することと考えても良い。
特許分類コード情報検索部110は、通常、MPUやメモリ等から実現され得る。特許分類コード情報検索部110の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した特許分類コード情報から、同じ特許分類コード情報の出現回数を用いて特許分類コード情報を選択する。ここでの出現回数は、検索により検出された同じ特許分類コード情報が対応する技術文書情報の数に相当する。
出現回数を用いて特許分類コード情報を選択するとは、例えば、出現回数の値に応じて特許分類コード情報を選択することである。特許分類コード情報選択部111は、例えば、特許分類コード情報検索部110が検索した特許分類コード情報について、同じ特許分類コード情報の出現回数をカウントし、カウント結果を用いて出現回数の高さが所定の順位までの特許分類コード情報を取得しても良い。
また、出現回数が予め指定したしきい値を超える特許分類コード情報だけを取得するようにしても良い。例えば、特許分類コード情報が10個検索され、その内訳が「A:3個、B:3個、C:3個、D:1個」(A〜Dは異なる特許分類コード情報とする)であった場合、予め指定されているしきい値「2」以下の特許分類コード情報であるDを除いた3つの特許分類コード情報だけを選択するようにしても良い。あるいは、この場合、出現回数が一位である特許分類コード情報である「A」から「C」までの三つの特許分類コード情報だけを選択するようにしても良い。
また、出現回数を用いて取得するということは、出現回数の比率を用いて取得することと考えても良い。具体的には、出現回数の比率に応じて特許分類コード情報を取得することと考えても良い。比率に応じてとは、比率の多い順に特許分類コード情報を取得することや、比率が所定の閾値を超える特許分類コード情報を取得することと等である。例えば、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した各特許分類コード情報の数の、検索キーと一致する用語を含む技術文書情報数、または技術文書情報に対応付けられた特許分類コード情報数に対する比率に応じて特許分類コード情報を選択するようにしても良い。ここで述べる検索キーは、上述した検索キーワードに指定された候補キーワードである。検索キーと一致する用語を含む技術文書情報に対する比率とは、具体的には、用語記憶部109に格納されている用語が含まれていた技術文書情報のうちの、検索キーと一致する用語を含む技術文書情報数に対する比率である。ここでの検索キーと一致する用語を含む技術文書情報数は、例えば、用語記憶部109に記憶されている用語のうちの、検索キーの少なくともいずれかと一致する用語が対応付けられている技術文書情報の数と考えても良い。具体的には、検索キーを用いて用語記憶部109を検索した結果として検出される、検索キーと一致する用語と対応付けられた技術文書情報の数である。また、上記の比率は、全検索結果における各特許分類コード情報と対応付けられた技術文書情報の出現頻度と考えても良い。特許分類コード情報選択部111は、例えば、特許分類コード情報検索部110の検索結果から、検索キーと一致する用語と対応付けられた技術文書情報の数をカウントし、このカウント結果に対する各特許分類コード情報数の比率を算出する。そして、例えば、その比率が高いものから順番に所定の順位までの特許分類コード情報を選択する。また、比率が予め指定された所定の値以上の特許分類コード情報だけを選択するようにしてもよい。なお、処理等を簡略化するために、検索キーと一致する用語を含む全ての技術文書情報数の代わりに、特許分類コード情報検索部110が検索した各特許分類コード情報の数を用いるようにしても良い。
また、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した各特許分類コード情報の数の、検索キーと一致する用語を含む技術文書情報に対応付けられた特許分類コード情報数に対する比率に応じて特許分類コード情報を選択しても良い。具体的には、特許分類コード情報検索部110が検索した、検索キーの少なくともいずれかと一致する用語と対応付けられた特許分類コード情報の数をカウントし、このカウント数に対する各特許分類コード情報数の比率を、上記の比率と同様に用いても良い。
また、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した各特許分類コード情報の数の、用語記憶部109に記憶されている同じ特許分類コード情報と対応付けられた技術文書情報数に対する比率に応じて、特許分類コード情報を選択してもよい。この比率は、検索された各特許分類コード情報と対応付けられた技術文書情報の、同じ特許分類コード情報と対応付けられた技術文書情報に対する出現頻度と考えても良い。例えば、予め、用語記憶部109に記憶されている特許分類コード情報と対応付けられた技術文書情報について、その数を、各特許分類コード情報別にカウントして図示しない記憶媒体等に予め蓄積しておく。そして、特許分類コード情報検索部110が検索した特許分類コード情報について、その特許分類コード情報の数をカウントし、このカウント値と、予め蓄積された同じ特許分類コード情報と対応付けられた技術文書情報の数についてのカウント値をとの比率を算出する。そして、例えば、その比率が高いものから順番に所定の順位までの特許分類コード情報を選択する。また、比率が予め指定された所定の値以上の特許分類コード情報だけを選択するようにしてもよい。なお、特許分類コード情報検索部110が検索した特許分類コード情報と同じ特許分類コード情報と対応付けられた技術文書情報の数については、検索により特許分類コード情報が検出された後に算出を行うようにしても良い。
なお、上述した2以上の特許分類コード情報を選択する方法を適宜組み合わせて利用しても良い。
なお、特許分類コード情報選択部111は、通常は、特許分類コード情報検索部110が検索した特許分類コード情報の全てから、出現回数に応じて特許分類コード情報を選択するが、検索した特許分類コード情報の一部から出現回数に応じて特許分類コード情報を選択してもよい。なお、出現回数を特許技術文書数で標準化した値を出現頻度と考えるようにして、出現回数に応じて特許分類コード情報を取得することを、特許分類コード情報の出現頻度に応じて特許分類コード情報を取得することと考えるようにしても良い。例えば、出現頻度の高い特許分類コード情報を取得するようにしても良い。
なお、特許分類コード情報選択部111は、上述した出現頻度や出現回数に、検索キーと一致する用語の出現回数に応じた重み付けを行って得られた値に応じて特許分類コード情報を選択して取得しても良い。例えば、用語記憶部109に、上述したように、技術文書情報に含まれる1以上の用語と、当該用語の当該技術文書情報内における出現頻度を示す情報である出現頻度情報と、当該技術文書情報についての前記1以上の特許分類コード情報とが、技術文書情報ごとに対応付けて記憶され得るようにし、特許分類コード情報検索部110が、用語記憶部109から、検索キーと一致する用語と対応付けられた特許分類コード情報と、出現頻度情報との組みを検索するようにして、特許分類コード情報選択部111が、特許分類コード情報検索部110が検索した特許分類コード情報の各特許分類コード情報別の出現回数を、検索された特許分類コード情報と組みをなす前記出現頻度情報を用いて重み付けを行って取得し、当該取得した出現回数に応じて、特許分類コード情報を選択するようにしてもよい。重み付けを行う、とは、例えば重み付けのための値(重み付け値)を重み付けの対象となる値(例えば特許分類コード情報をカウントする単位となる値等)に乗算したり、加算したりすることである。ここで述べる出現頻度情報を用いて重み付けを行う、とは、具体的には、出現頻度情報が示す出現頻度に応じて、重み付けを行うことである。ここで行われる重み付けは、具体的には、用語の出現頻度が高いことを示す出現頻度情報ほど、重み付けが重くなるような重み付けである。例えば、重み付けが、乗算や加算により行われる場合、出現頻度が高いことを示す出現頻度情報ほど、重み付けに用いられる値が、大きいことを意味する。なお、出現頻度情報を用いて重み付けを行う、ということは、出現頻度情報が、出現頻度を示す値である場合、この値を用いて、重み付けを行うことと考えても良い。あるいは、予め出現頻度情報と対応づけて用意された出現頻度を示す値を、特許分類コード情報と組みをなす出現頻度情報を検索キーとして取得し、取得した値を用いて重み付けを行うこととと考えてもよい。
例えば、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した各特許分類コード情報の出現回数を、特許分類コード情報別に集計する際に、各特許分類コードの数を、当該特許分類コード情報と組みをなす出現頻度情報が示す値で重み付けを行って集計してもよい。具体的には、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した各特許分類コード情報について、同じ特許分類コード情報の出現回数をカウントする際に、一の特許分類コード情報を「一回」等の同じ値でカウントせずに、各特許分類コード情報と組みをなす出現頻度情報が示す値で重み付けを行った値でカウントするようにしても良い。例えば、一の特許分類コード情報を、これと組みをなす出現頻度情報で重み付けを行ってカウントした値(出現回数)は、「1×出現頻度情報が示す値」回となる。この「1」は、一の特許分類コード情報の出現数である。従って、同じ特許分類コード情報の出現回数を、それぞれと組みをなす出現頻度情報が示す重み付けを行ってカウントした値は、例えば、各特許分類コード情報の出現回数である「1×各特許分類コード情報と組みをなす出現頻度情報が示す値」回の合計となる。
従って、特許分類コード情報選択部111は、特許分類コード情報検索部110により検索された各特許分類コード情報と組みをなす出現頻度情報が示す値の、各特許分類コード情報別の合計を、上述した特許分類コード情報別の出現回数として取得してもよい。
このように用語の出現頻度に応じて重み付けを行うことで、検索キーと一致する用語の出現頻度が高い技術文書情報に対応する特許分類コード情報を、検索キーとの関連が強い特許分類コード情報として扱って、特許分類コードを選択することが可能となる。これにより、検索キーに対するこの特許分類コード情報の関連の強さを、特許分類コードの選択に反映させることができ、精度の良い選択が可能となる。
なお、出現頻度情報が示す値、とは、具体的には、出現頻度情報が出現頻度を示す値である場合、その値そのもの、あるいはその値に対して所定の演算を行って得られた値であっても良い。また、出現頻度情報が出現頻度を示す文字列等である場合、予め出現頻度情報として利用可能な文字列と対応付けて用意された重み付けに用いられる値のうちの、出現頻度情報の文字列を検索キーとして用いて取得した値が、出現頻度情報に応じた値である。
特許分類コード情報選択部111は、上記と同様に、特許分類コード情報検索部110が検索した特許分類コード情報について、重み付けを行って取得した出現回数の値の高さで示した順位が、所定の順位までの特許分類コード情報を選択するようにしても良い。また、重み付けを行って取得した出現回数が予め指定したしきい値を超える特許分類コード情報だけを取得するようにしても良い。
また、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した特許分類コード情報の数を、検索された特許分類コード情報と組みをなす出現頻度情報を用いて重み付けを行って取得し、当該取得した特許分類コード情報の数に対する、上述した各特許分類コード情報別の出現回数の比率に応じて、特許分類コード情報を選択するようにしてもよい。ここでの、組みをなす出現頻度情報を用いて重み付けを行って取得した特許分類コード情報検索部110が検索した特許分類コード情報の数とは、具体的には、特許分類コード情報検索部が検索した各特許分類コード情報と組みをなす出現頻度情報が示す値の合計である。出現回数の比率に応じてとは、例えば、その比率が高いものから順番に所定の順位までの特許分類コード情報を選択することである。また、比率が予め指定された所定の値以上の特許分類コード情報だけを選択することであってもよい。重み付けを行って算出した比率を用いることで、検索キーに対するこの特許分類コード情報の関連の強さを、特許分類コード情報の選択に反映させることができ、精度の良い選択が可能となる。
なお、出現回数等を用いて特許分類コード情報を選択する、ということは、上述したように、特許分類コード情報選択部111が、出現回数等に応じて自動的に特許分類コード情報を選択することであっても良いし、特許分類コード情報選択部111が、図示しない表示部等を介して、特許分類コード情報を出現回数等に応じて配列して表示し、上述した指定指示受付部105等を介して指定を受け付けた特許分類コード情報を選択的に取得することであっても良い。特許分類コード情報を出現回数等に応じて配列して表示するということは、例えば、出現回数や、出現頻度や、重み付けを行った出現頻度の値の昇順や、降順に配列して表示することや、あるいは、出現回数や、出現頻度や、重み付けを行った出現頻度の値を各特許分類コード情報と対応付けて表示することである。このように、出現回数等に応じて配列した特許分類コード情報を表示することで、ユーザが、特許分類コード情報を選択しやすくなる。
特許分類コード情報選択部111は、通常、MPUやメモリ等から実現され得る。特許分類コード情報選択部111の処理手順は、通常、ソフトウェアで実現され、当該ソフトウェアはROM等の記録媒体に記録されている。但し、ハードウェア(専用回路)で実現しても良い。
図2は、本実施の形態に係る、特許検索式生成装置1の動作を示すフローチャートである。以下、図2のフローチャートを用いて特許検索式生成装置1の動作について説明する。
(ステップS201)特許検索式生成装置1は、一以上のキーワードを受け付けたか否かを判断する。キーワードの受け付けは、インターネット等のネットワークを介した端末装置等からの受け付けであっても良い。ここで受け付けたキーワードが受付キーワードである。受け付けた場合、ステップS202に進み、受け付けていない場合、ステップS201に戻る。
(ステップS202)候補キーワード取得部103は、カウンターmに1を代入する。
(ステップS203)候補キーワード取得部103は、ステップS201で受け付けたキーワード(受付キーワード)のうちのm番目の受付キーワードを検索キーとして用いて、検索により取得関連用語を取得する。具体的には、関連用語情報格納部101に格納されている一以上の関連用語情報のそれぞれについて、m番目の受付キーワードと一致する用語を検索し、検出された用語と対応付けられた関連用語(取得関連用語)を取得する。
(ステップS204)候補キーワード取得部103は、ステップS203で取得した取得関連用語およびm番目の受付キーワードである取得用語と、それぞれについての検索指定情報とを有する検索指定管理情報を、検索指定管理情報格納部106に蓄積する。既に検索指定管理情報が格納されている場合、ここでは、新たに取得された検索指定情報を追記する。なお、取得関連用語に対応する検索指定情報の初期値は、検索キーワードに指定された情報でないことを示す情報とし、受付キーワードに対応する検索指定情報の初期値は、検索キーワードに指定された情報であることを示す情報とする。検索指定管理情報は、受付キーワード別に管理することが好ましい。例えば、ここで蓄積される各検索指定管理情報は、m番目の受付キーワードの識別情報を有していても良い。また、検索指定管理情報には、取得用語が取得関連情報であるか受付キーワードであるかを示す情報を含まれるようにしても良い。
(ステップS205)候補キーワード取得部103は、m番目の受付キーワードに対応付けて管理されている検索指定管理情報から、m番目の受付キーワードと一致する文字列を含まない取得関連情報を検索により取得する。なお、取得関連情報ととともに、取得関連情報と対応付けられた検索指定情報も取得するようにしても良い。
(ステップS206)候補キーワード取得部103は、ステップS205で取得した取得関連用語を、m番目の受付キーワードとともに候補キーワードとして、図示しない記憶媒体等に一時記憶する。なお、既に、候補キーワードが格納されている場合、ここでは新たに取得された候補キーワードを追記する。なお、候補キーワードは、m番目の受付キーワードと対応付けて管理されているようにすることが好ましく、例えば、m番目の受付キーワードの識別情報対応付けて管理する。
(ステップS207)候補キーワード取得部103は、カウンターmの値を1インクリメントする。
(ステップS208)候補キーワード取得部103は、ステップS201で受け付けた受付キーワードにm番目のキーワードがあるか否かを判断する。ある場合、ステップS203に戻り、ない場合、ステップS209に進む。
(ステップS209)候補キーワード取得部103は、ステップS206で蓄積された候補キーワードを取得する。
(ステップS210)候補キーワード表示部104は、ステップS209で取得した候補キーワードをモニタ等に表示する。なお、候補キーワード表示部104が、ステップS204で蓄積した検索指定管理情報から、各候補キーワードと一致する取得用語と対応付けられた検索指定情報を読み出して、この検索指定情報に応じた表示態様で、各候補キーワードの表示を行うようにしても良い。例えば、一の候補キーワードについて取得した取得関連情報が、検索キーワードに指定された候補キーワードであることを示すものである場合、この候補キーワードの横に、チェックの入ったチェックボックスを表示し、取得した取得関連情報が、検索キーワードに指定されていない候補キーワードであることを示すものである場合、この候補キーワードの横に、チェックの入っていないチェックボックスを表示するようにしてもよい。なお、ステップS205において、取得関連情報ととともに、取得関連情報と対応付けられた検索指定情報も取得している場合、この検索指定情報の値に応じて表示態様を変更するようにしても良い。
(ステップS211)指定指示受付部105は、候補キーワードについて指定指示または解除指示を受け付けたか否かを判断する。受け付けた場合、ステップS212に進み、受け付けていない場合、ステップS219に進む。
(ステップS212)候補キーワード取得部103は、指定指示または解除指示が示す候補キーワードに対応する取得用語の検索指定情報を、ステップS211で受け付けた指定指示または解除指示に応じて更新する。具体的には、指定指示または解除指示が示す候補キーワードと一致する取得用語を有する検索指定管理情報を、検索指定管理情報格納部106から検索し、検出された検索指定管理情報に含まれる検索指定情報を、指定指示または解除指示に応じて更新する。指定指示を受け付けた場合、検索指定情報を、検索キーワードに指定されたものであることを示す情報に更新する。また、解除指示を受け付けた場合、検索指定情報を、検索キーワードに指定されていないものであることを示す情報に更新する。
(ステップS213)候補キーワード取得部103は、検索指定管理情報格納部106に格納されている検索指定管理情報の中から、指定指示または解除指示を受け付けた候補キーワードと同じ受付キーワードについて取得された取得関連用語および受付キーワードを含む検索指定管理情報をメモリ等の記憶媒体に読み出す。例えば、指定指示または解除指示を受け付けた候補キーワードと同じ受付キーワードの識別情報と対応付けて管理されている検索指定管理情報を読み出す。
(ステップS214)候補キーワード取得部103は、カウンターnに1を代入する。
(ステップS215)候補キーワード取得部103は、ステップS213で読み出した検索指定管理情報内に、検索指定情報が検索キーワードに指定されていることを示しているn番目の検索指定管理情報があるか否かを判断する。ある場合、ステップS216に進み、ない場合、ステップS218に進む。
(ステップS216)候補キーワード取得部103は、n番目の検索指定管理情報から、取得用語を読み出し、ステップS213で読み出した検索指定管理情報(あるいは、ステップS213で取得した検索指定管理情報のうちの、除外されずに残ったもの)から、n番目の検索指定管理情報から読み出した取得用語と一致する文字列を含む取得関連用語を含む検索指定管理情報を除外する。ここで除外されずに残った検索指定管理情報に含まれる取得関連用語と受付キーワードとが、更新された候補キーワードである。なお、取得用語のうちの取得関連用語は、ステップS204等において取得用語と対応付けられて検索指定管理情報に格納される用語判定情報等から判断可能である。
(ステップS217)候補キーワード取得部103は、カウンターnの値を1インクリメントする。そして、ステップS215に戻る。
(ステップS218)候補キーワード取得部103は、ステップS216で除外されずに残った検索指定管理情報に含まれる取得用語や検索指定情報等を用いて、ステップS206で蓄積された候補キーワードのうちの、指定指示または解除指示が示す候補キーワードと同じ受付キーワードと対応付けて蓄積されている候補キーワードを更新する。そして、ステップS209に進む。
(ステップS219)特許検索式生成装置1は、特許検索式を生成する指示を図示しない受付部等が受け付けたか否かを判断する。受け付けた場合、ステップS219に進み、受け付けていない場合、ステップS211に戻る。
(ステップS220)特許分類コード情報検索部110は、候補キーワード取得部103が取得している候補キーワードのうちの検索キーワードに指定されたもの、即ち指定済検索キーワードを取得する。ここでの候補キーワードは、通常は、直前のステップS210で表示された候補キーワードである。具体的には、候補キーワードと一致する取得用語を有する検索指定管理情報を、検索指定管理情報格納部106に格納されている検索指定管理情報について検索し、さらに、検出された検索指定管理情報のうちの、検索指定情報が、検索キーワードであることを示す値のものを検索し、検出された検索指定管理情報に含まれる取得用語を、指定済検索キーワードとして取得する。
(ステップS221)特許分類コード情報検索部110は、ステップS220で取得した特許分類コード情報を用いて、用語記憶部109から特許分類コード情報を検索する。
(ステップS222)特許分類コード情報選択部111は、ステップS221で検出した特許分類コード情報を、出現回数を用いて選択する。
(ステップS223)特許分類コード情報選択部111は、ステップS220で取得した指定済検索キーワードと、ステップS222で選択された特許分類コード情報とを用いて特許検索式を生成する。
(ステップS224)特許検索式出力部108は、ステップS223で取得した特許検索式を出力する。そして処理を終了する。
以下、本実施の形態における特許検索式生成装置1の具体的な動作について説明する。
(具体例1)
図3は、関連用語情報格納部101に予め格納されている一以上の関連用語情報の一例を示す図である。関連用語情報は、用語を示す「用語」と、関連用語を示す「関連用語」という項目を有している。ここでは、各レコードがそれぞれ関連用語情報を示し、一のレコードに含まれる用語と関連用語とは対応付けられているものとする。
図4は、特許検索に用いるキーワードの入力画面の一例を示す図である。
まず、ユーザが図4に示すような入力画面をモニタ40に表示して、検索したいキーワードとして、「道路」と「GPS」というキーワードを、キーボード等を用いてキーワード入力用フィールド41に入力し、類義語検索を行うためのボタン42を、マウス等を操作してクリックしたとする。ここでの入力用フィールド41に入力される複数のキーワードは、一例として、AND条件として用いられるキーワードであるとする。
ボタン42がクリックされると、入力用フィールド41に入力された「道路」と「GPS」というキーワードが、キーワード受付部102に出力され、キーワード受付部102は、「道路」と「GPS」というキーワードを受け付ける。これらのキーワードが受付キーワードである。
候補キーワード取得部103は、まず、受付キーワードのうちの、一番目の受付キーワードとして「道路」を取得し、図4に示した関連用語情報から、「用語」の値が「道路」と完全一致する関連用語情報を検索し、検出した関連用語情報の関連用語を取得関連情報として取得する。なお、図4に示した関連用語情報の「関連用語」を用語として、また、図4に示した関連用語情報の「用語」を関連用語として更に用いて、図4に示した関連用語情報から、「関連用語」の値が「道路」と完全一致する関連用語情報の「用語」の値を取得関連用語として取得するようにしても良いことはいうまでものない。このようにすることで関連用語情報格納部101に格納される関連用語情報数を削減することができる。
図5は、候補キーワード取得部103が受付キーワード「道路」について取得した取得関連用語を示す図である。
候補キーワード取得部103は、一番目の受付キーワードおよび上記で取得した取得関連用語と、一番目の受付キーワードの識別情報と、検索指定情報と、取得関連用語であるか否かを示す情報である用語判定情報と、を対応付けて有する検索指定管理情報を取得して、検索指定管理情報格納部106に蓄積する。一番目の受付キーワードの識別情報は、一番目の受付キーワードを、他の受付キーワードと識別可能な情報であればよく、受付キーワード自身であっても良いし、一番目の受付キーワードであることを示す「1」等の値であっても良いし、その他のユニークな値であっても良い。ここでは、この一番目の受付キーワードの識別情報として「001」を用いる。また、ここでは、取得関連用語と対応付けられた検索指定情報は、予め指定されている設定に従って、検索キーワードに指定されていないことを示す値「0」とし、受付キーワードと対応付けられた検索指定情報は、検索キーワードに指定されていることを示す値「1」とする。また、取得関連用語を示す用語判定情報を「1」、受付キーワードを示す用語判定情報を「0」とする。
図6は、検索指定管理情報格納部106に蓄積された検索指定管理情報を示す図である。検索指定管理情報は、「キーワード識別情報」と、「取得用語」と、「検索指定情報」と、「用語判定」という項目を有している。「キーワード識別情報」は、キーワード受付部102が受け付けたキーワードを識別する情報であり、「001」は、一番目のキーワード「道路」を識別する情報である。「取得用語」は、候補キーワードとなりうる取得関連用語および受付キーワードである。「検索指定情報」は、対応する「取得用語」が検索キーワードに指定された情報であるか否かを示す情報であり、「1」は、検索キーワードに指定されたことを示し、「0」は指定されていないことを示す。「用語判定」は、対応する「取得用語」の値が、取得関連用語であるか否かを示す情報であり、「1」であれば、取得関連用語であることを示し、「0」であれば受付キーワードであることを示す。
次に、候補キーワード取得部103は、検索指定管理情報格納部106に格納されている一番目のキーワードに対応している検索指定管理情報で管理されている取得関連用語において、一番目のキーワードと一致する文字列を含まないものを順次検索する。具体的には、「キーワード識別情報」が「001」である検索指定管理情報のうちの「用語判定」が「1」である検索指定管理情報の「取得用語」において、一番目のキーワードと一致する文字列を含まないものを検出する。
そして、候補キーワード取得部103は、検索した取得関連用語と、一番目の受付キーワードとを候補キーワードとして取得する。また、この候補キーワードと対応付けられたキーワード識別情報「001」と検索指定情報も検索指定管理情報から取得する。取得した候補キーワード、キーワード識別情報および検索指定情報は図示しない記憶媒体等に蓄積する。
図7は、候補キーワード取得部103が第一の受付キーワードについて取得して図示しない記憶媒体に蓄積した候補キーワードを管理する候補キーワード管理表を示す図である。候補キーワード管理表の各項目は、図6の検索指定管理情報と同様であるのでここでは説明を省略する。
さらに、候補キーワード取得部103は、二番目の受付キーワード「GPS」についても一番目の受付キーワードと同様に検索指定管理情報を取得し、検索指定管理情報格納部106に蓄積する。ここでの蓄積は追記とする。
図8は、候補キーワード取得部103が二番目の受付キーワードについて取得して検索指定管理情報格納部106に追記した検索管理指定情報を示す図である。二番目の受付キーワードの識別情報は、ここでは「002」としている。
さらに、一番目の受付キーワードの場合と同様に、二番目のキーワード識別情報と対応付けられた検索指定管理情報から二番目のキーワードと一致する文字列を含まない取得関連用語を取得し、取得した取得関連用語と二番目の受付キーワードとを含む候補キーワードを取得して、図示しない記憶媒体等に蓄積(追記)する。
図9は、候補キーワード取得部103が二番目の受付キーワードについて取得して図示しない記憶媒体に追記した候補キーワードを管理する候補キーワード管理表を示す図である。
全ての受付キーワードについて候補キーワード取得部103が候補キーワードを取得する処理が終了したので、候補キーワード表示部104は、図示しない記憶媒体に蓄積された候補キーワードを、受付キーワードの識別情報別に表示する。
図10は、候補キーワード表示部104による候補キーワードの表示例を示す図である。ここでは、リスト11は、一番目の受付キーワードに対応する候補キーワードであり、リスト12は、二番目の受付キーワードに対応する候補キーワードである。また、各候補キーワードの横のチェックボックス13は、検索キーワードに指定されている候補キーワードであるか否かを示すチェックボックスであり、チェックの有無によって、検索に指定されたキーワードであるか否かの違いによる表示形態の違いを表現している。具体的には、候補キーワードに対応する検索指定情報の値が「1」である場合には、候補キーワード表示部104によってチェックが入ったチェックボックスが表示され、候補キーワードに対応する検索指定情報の値が「0」である場合には、候補キーワード表示部104によってチェックが入らないチェックボックスが表示される。このチェックボックス13は、候補キーワードに対する指定指示や解除指示を受け付けるためのインターフェースとしても利用される。また、ここでは、受付キーワードの横には、受付キーワードであることを示す「ユーザ指定キーワード」という文字を表示している。ここでは、デフォルトの設定によって、受付キーワードのチェックボックス13にだけチェックが入っている。
このように、受付キーワードと同じ文字列を含む候補キーワードを表示しないようにすることで、受付キーワードを用いて検索する場合と同じ検索結果が得られると考えられるキーワードを、候補キーワードから外して、非表示とすることができる。これにより、ユーザが不必要なキーワード選択を行わないようにすることができる。また、候補キーワードが、不必要に増大することを防ぐことができる。
次に、ユーザが、図10に示した表示画面において、マウス等を操作して、一番目の受付キーワードの候補の一つである「歩道」を、検索キーワードに指定するために、「歩道」の横のチェックボックス131にチェックを入れたとする。チェックボックスにチェックが入れられると指定指示受付部105は、「歩道」という候補キーワードについての指定指示を受け付ける。
候補キーワード取得部103は、図8に示した検索指定管理情報のうちの、指定指示の対象となる「歩道」という候補キーワードに対応する検索指定管理情報の「検索指定情報」の値を「1」に置換して検索指定情報を更新する。例えば、「取得用語」の値が「歩道」という候補キーワードと一致する検索指定管理情報を検索し、検出した検索指定管理情報の検索指定情報の値を「1」に置換する。
図11は、候補キーワード取得部103により更新された検索指定管理情報を示す図である。
次に、候補キーワード取得部103は、図11に示した検索指定管理情報から、指定指示の対象となる候補キーワード「歩道」と同じキーワード識別情報「001」と対応付けられた取得検索指定管理情報を読み出して、図示しない記憶媒体等に一時記憶する。つまり、指定指示を受け付けた候補キーワードと同じ受付キーワードから取得された取得関連用語、及び指定指示を受け付けた候補キーワードと同じ受付キーワードを含む検索指定管理情報を読み出す。
次に、候補キーワード取得部103は、読み出した検索指定管理情報において、検索指定情報の値が「1」である検索指定管理情報のうちの一番目の検索指定管理情報に含まれる「取得用語」の値を取得する。そして、上記で読み出した検索指定管理情報の中から、「用語判定」の値が「1」であって、「取得用語」の値が、上記で取得した「取得用語」の値と一致する文字列を含む検索指定管理情報を検索する。そして、検出した検索指定管理情報を、読み出した検索指定管理情報から除外(例えば消去)する。これにより、指定済検索キーワードと同じ文字列を含む候補キーワードが除外されることとなる。
続いて、二番目の以降の検索指定情報の値が「1」である検索指定管理情報についても同様の処理を繰り返す。なお、処理の繰り返しの過程で、既に、検索指定管理情報が読み出した検索指定管理情報から削除されている検索指定情報の値が「1」である検索指定管理情報については、この検索指定管理情報に含まれる「取得用語」の値を用いて、検索指定管理情報を除外する処理は行わないようにしてもよいし、行うようにしてもよい。
例えば、ここでは、新たに「歩道」という取得関連用語の検索指定情報の値が「1」に変更されているため、このような処理を行うことで、「横断歩道」や「歩道橋」という「歩道」という文字列を含む「取得用語」を有する検索指定管理情報が除外されることになる。
そして、最終的に除外されずに残った検索指定管理情報の「取得用語」が新たな候補キーワードである。そして、この最終的に除外されずに残った検索指定管理情報の「取得用語」の値と、検索指定情報と、キーワード識別情報の値とを用いて、図示しない記憶媒体に蓄積されている図9に示した候補キーワードのうちの、指定指示の対象となる候補キーワード「歩道」と同じキーワード識別情報「001」と対応付けられた候補キーワード等を上書きして更新する。
図12は更新した候補キーワード管理表を示す図である。
そして、候補キーワード表示部104は、更新された候補キーワード管理表を用いて、候補キーワードを表示する。
このように、指定済検索キーワードと同じ文字列を含む候補キーワードを表示しないようにすることで、指定済検索キーワードを用いて検索する場合と同じ検索結果が得られると考えられるキーワードを、候補キーワードから外して、非表示とすることができる。これにより、ユーザが不必要なキーワード選択を行わないようにすることができる。また、候補キーワードが、不必要に増大することを防ぐことができる。
図13は、候補キーワードの表示例を示す図である。「歩道」という候補キーワードの検索指定情報が「1」であるため、「歩道」の横のチェックボックスには、チェックが入ることとなる。また、図10と比べると、「横断歩道」や「歩道橋」という候補キーワードが除外されていることが分かる。
ここで、仮に、ユーザが、図13に示した表示画面において、マウス等を操作して、一番目の受付キーワードの受付キーワードである「道路」を、検索キーワードから解除するために、「道路」の横のチェックボックス131のチェックを外したとする。チェックボックスからチェックを外すと、指定指示受付部105は、「道路」という候補キーワードについての解除指示を受け付ける。
候補キーワード取得部103は、図11に示した検索指定管理情報のうちの、解除指示の対象となる「道路」という候補キーワードに対応する検索指定管理情報の「検索指定情報」の値を「0」に置換して検索指定情報を更新する。例えば、「取得用語」の値が「道路」という候補キーワードと一致する検索指定管理情報を検索し、検出した検索指定管理情報の検索指定情報の値を「0」に置換する。
図14は、候補キーワード取得部103により更新された検索指定管理情報を示す図である。
次に、候補キーワード取得部103は、図14に示した検索指定管理情報から、解除指示の対象となる候補キーワード「道路」と同じキーワード識別情報「001」と対応付けられた取得検索指定管理情報を読み出して、図示しない記憶媒体等に一時記憶する。つまり、解除指示を受け付けた候補キーワードと同じ受付キーワードから取得された取得関連用語、及び解除指示を受け付けた候補キーワードと同じ受付キーワードを含む検索指定管理情報を読み出す。
次に、候補キーワード取得部103は、読み出した検索指定管理情報において、検索指定情報の値が「1」である検索指定管理情報のうちの一番目の検索指定管理情報に含まれる「取得用語」の値を取得する。そして、上記で読み出した検索指定管理情報の中から、「用語判定」の値が「1」であって、「取得用語」の値が、上記で取得した「取得用語」の値と一致する文字列を含む検索指定管理情報を検索する。そして、検出した検索指定管理情報を、読み出した検索指定管理情報から除外(例えば消去)する。
続いて、二番目の以降の検索指定情報の値が「1」である検索指定管理情報についても同様の処理を繰り返す。なお、処理の繰り返しの過程で、既に、検索指定管理情報が読み出した検索指定管理情報から削除されている、検索指定情報の値が「1」である検索指定管理情報については、この検索指定管理情報に含まれる「取得用語」の値を用いて、検索指定管理情報を除外する処理は行わないようにしてもよいし、行うようにしてもよい。
例えば、ここでは、新たに「道路」という受付キーワードの検索指定情報の値が「1」から「0」に変更されているため、「高速道路」や「高架道路」という「道路」という文字列を含む「取得用語」を有する検索指定管理情報が除外されずに残ることになる。なお、「取得用語」の値が、受付キーワードである「道路」である検索指定管理情報については、「用語判定」の値が「0」であり、取得関連用語を示す「1」ではないため、この検索指定管理情報は除外対象とはならない。従って、仮に、受付キーワードが、他の取得関連用語と一致する文字列を含んでいたとしても、受付キーワードは、常に候補キーワードとして表示されることとなる。
そして、最終的に除外されずに残った検索指定管理情報の「取得用語」が新たな候補キーワードである。そして、この最終的に除外されずに残った検索指定管理情報の「取得用語」の値と、検索指定情報と、キーワード識別情報の値とを用いて、図12に示した候補キーワードのうちの、指定指示の対象となる候補キーワード「歩道」と同じキーワード識別情報「001」と対応付けられた候補キーワード等を上書きして更新する。
図15は更新した候補キーワード管理表を示す図である。
そして、候補キーワード表示部104は、更新された候補キーワード管理表を用いて、候補キーワードを表示する。
図16は、候補キーワードの表示例を示す図である。「道路」という候補キーワードの検索指定情報が「0」であるため、「歩道」の横のチェックボックスには、チェックが外れることとなる。また、図13と比べると、「高速道路」や「高架道路」という候補キーワードに加わっていることが分かる。
このように、指定済検索キーワードについての検索キーワードの指定が解除されると、この指定済検索キーワードによって、表示しないようにされていた候補キーワードが復活する。
ここで、図13に示すような状態において(即ち、「道路」というキーワードのチェックを外す前の状態において)、ユーザがマウス等を操作して、検索式を生成するためのボタン160をクリックしたとすると、指定指示受付部105や図示しない受付部等が指定指示を受け付ける。そして、特許分類コード情報検索部110は、特許分類コード情報の検索を開始する。
図17は、用語記憶部109に記憶されている用語と、当該用語の取得元となる技術文書情報である特許公報の公開番号とを対応付けて管理する用語管理表を示す図である。「公開番号」は、特許公報の公開番号を示す。また、「用語」は、特許公報に含まれる用語を示す。
図18は、用語記憶部109に格納されている、用語の取得元となった技術文書情報である特許公報の公開番号と、当該特許公報に対応付けられている特許分類コード情報である国際特許分類とを対応付けて管理する特許分類コード情報管理表を示す図である。
次に、特許分類コード情報検索部110は、図12に示すような候補キーワード管理表から、検索指定情報が「1」である候補キーワードを取得して、取得した候補キーワードと一致する用語と対応付けられた公開番号の検索を、図17に示した用語管理表を用いて行う。ここでは、一例として、同じ受付キーワードについて取得された候補キーワード同士は、OR条件として検索に用いるようにし、対応する受付キーワードが異なる候補キーワード群同士は、AND条件として検索を行うものとする。すなわち、図12に示した候補キーワード管理表において、候補キーワード「道路」と「歩道」のいずれかと一致する「用語」と対応付けられた「公開番号」であって、なおかつ、候補キーワード「GPS」と一致する「用語」と対応付けられた「公開番号」を検索する。なお、ここでは、例として、一致が部分一致である場合について説明する。
この検索の結果、「JP2004−146…」、「JP2004−87…」等の複数の公開番号が検出されたとする。
次に、特許分類コード情報検索部110は、図18に示した特許分類コード情報管理表において、「公開番号」の値が、図17に示した用語管理表で管理される公開番号と一致するレコードを検出し、そのレコードの「国際特許分類」の値を取得する。ここでの一致は、例えば、完全一致とする。
図19は、特許分類コード情報検索部110が取得した国際特許分類を示す図である。なお、ここでは、説明の便宜上、国際特許分類と対応付けられていた公開番号を、国際特許分類と並べて示しているが、省略しても良い。
次に、特許分類コード情報選択部111は、図19に示した国際特許分類の検出結果において、各国際特許分類の出現頻度を算出する。ここでは、一例として、図19に示した検出結果に含まれる各国際特許分類のそれぞれの出現数の、特許分類コード情報検索部110が図17の用語管理表を用いて検索した公開番号数に対する比率を出現頻度として算出する。用語管理表から検索した公開番号数は、検索された特許公報数に相当する。
具体的には、まず、図19に示した検出結果に含まれる各国際特許分類のそれぞれの出現数をカウントする。また、上述したように特許分類コード情報検索部110が図17の用語管理表を用いて検索した公開番号数をカウントする。そして、出現数を、公開番号数で除算して出現頻度を算出する。
例えば、図19に示した検出結果において、国際特許分類「G01S 5/08」が20個検出され、特許分類コード情報検索部110が検索した公開番号の数が「80」であったとすると、国際特許分類「G01S 5/08」の出現頻度は、20/80×100=25%となる。
また、国際特許分類「G01C 21/10」が64個検出されたとすると、国際特許分類「G01C 21/10」の出現頻度は、64/80×100=80%となる。
図20は、出現頻度の算出結果を示す図である。
そして、特許分類コード情報選択部111は、特許分類コード情報検索部110が検索した特許分類コード情報である国際特許分類の中から、図20に示した出現頻度が予め指定されたしきい値以上の国際特許分類を選択する。例えば、予め、しきい値が50%に設定されていたとすると、ここでは、「G01C 21/10」、「G08G 1/133」、「G01G 1/137」が選択されたとする。
このような出現頻度を用いて、特許分類コード情報を選択することにより、出現頻度がしきい値よりも高いものだけを選択的に選択することができる。これにより、特許分類コード情報検索部110により検索された特許公報全体の特徴を適切に表す特許分類コードだけを選択的に取得することができる。
次に、特許検索式生成部107は、特許分類コード情報選択部111が選択した国際特許分類である「G01C 21/10」、「G08G 1/133」、および「G01G 1/137」と、候補キーワード取得部103が取得した候補キーワードのうちの、検索キーワードに指定された候補キーワードを用いて検索式を生成する。
具体的には、候補キーワード取得部103が取得した候補キーワードのうちの、検索キーワードに指定された候補キーワードにおいて、同じ受付キーワードに対応付けられた候補キーワード同士はOR条件としてつなぎ、異なる受付キーワードに対応付けられた候補キーワード(または候補キーワード群)同士は、AND条件でつながれる。また、特許分類コード情報選択部111が選択した国際特許分類同士は、OR条件でつながれる。そして、候補キーワード(あるいは候補キーワード群)と、国際特許分類(あるいは国際特許分類群)とを、AND条件でつなぐことで、特許検索式を生成する。
例えば、この具体例で生成される特許検索式は、(道路+歩道)*(GPS)*(G01C 21/10+G08G 1/133+G01G 1/137)となる。なお、「+」はOR条件による検索が行われる演算子であり、「*」はAND条件による検索が行われる演算子であるとする。
そして、生成された上記のような特許検索式が、特許検索式出力部108から出力される。
(具体例2)
この具体例においては、用語記憶部109に、技術文書情報に含まれる1以上の用語と、当該用語の当該技術文書情報内における出現頻度を示す情報である出現頻度情報と、当該技術文書情報についての上述したような1以上の特許分類コード情報とが、技術文書情報ごとに対応付けて記憶されている場合について説明する。
図21は、用語記憶部109に予め記憶されている特許公報の識別情報である公開番号と、特許公報に含まれる用語と、各用語の出現頻度情報とを対応付けて管理する用語管理表である。「公開番号」と「用語」は、図17と同様である。「用語数」は、一の特許公報において検出された各用語の数である。「出現頻度」は、出現頻度情報であり、ここでは、各用語の出現数の、特許公報に出現する用語の数に対する比率をパーセントで表したものである。ここでの特許公報に出現する用語とは、特許公報に出現する全ての用語と考えても良いし、特許公報に出現する用語のうちの予め指定された一部の用語等を除外した全ての用語数としても良い。また、特許公報の一部の領域(例えば発明の詳細な説明の欄等)に含まれる全ての用語数としても良い。なお、用語数は、用語管理表においては省略可能である。
また、用語記憶部109に格納されている、用語の取得元となった特許公報の公開番号と、当該特許公報に対応付けられている特許分類コード情報である国際特許分類とを対応付けて管理する特許分類コード情報管理表は、図18と同様であるとする。
まず、上記具体例1と同様に、図13に示すような状態において(即ち、「道路」というキーワードのチェックを外す前の状態において)、ユーザがマウス等を操作して、検索式を生成するためのボタン160をクリックしたとすると、指定指示受付部105や図示しない受付部等が指定指示を受け付ける。そして、特許分類コード情報検索部110は、特許分類コード情報の検索を開始する。
さらに、特許分類コード情報検索部110は、検索キーワードに指定されている候補キーワードを検索キーとして用いて、これらに一致する用語と対応付けられた公開番号の検索を図23に示した用語管理表において行う。ここでは、一例として、同じ受付キーワードについて取得された候補キーワード同士は、OR条件として検索に用いるようにし、対応する受付キーワードが異なる候補キーワード群同士は、AND条件として検索を行うものとする。すなわち、図12に示した候補キーワード管理表において、候補キーワード「道路」と「歩道」のいずれかと一致する「用語」と対応付けられた「公開番号」であって、なおかつ、候補キーワード「GPS」と一致する「用語」と対応付けられた「公開番号」を検索する。なお、ここでは、例として、一致が部分一致である場合について説明する。
この検索の結果、「JP2004−147…」、「JP2004−87…」等の複数の公開番号が検出されたとする。
次に、特許分類コード情報検索部110は、図18に示した特許分類コード情報管理表において、「公開番号」の値が、図17に示した用語管理表で管理される公開番号と一致するレコードを検出し、そのレコードの「国際特許分類」の値を図19に示すように取得する。
ここで、特許分類コード情報選択部111は、特許分類コード情報検索部110が取得した、各公開番号と対応付けられた「用語」のうちの候補キーワードと一致する「用語」に対応付けられた出現頻度情報を、21に示した用語管理表から各公開番号別に取得する。そして、その出現頻度情報のうちの、OR検索に用いられる候補キーワードに対応する用語の出現頻度情報同士を加算するとともに、AND検索に用いられる候補キーワードに対応する用語の出現頻度情報同士も加算して、各公開番号別に重み付けに用いる値を取得する。例えば、「JP2004−147…」に対応する用語のうちの「道路」、「歩道」、および「GPS」が検索キーと一致したとし、それぞれの出現頻度情報が、「0.5」、「0.8」、および「0.2」であったとする。「道路」と「歩道」とは、OR条件として検索に用いられる候補キーワードであるため、出現頻度情報同士は加算され、その値は、0.5+0.8=1.3となる。また、「道路」と「歩道」との組みと、「GPS」とは、AND条件として検索に用いられる検索キーであるため、上記で加算された出現頻度情報同士も加算され、最終的に算出される重み付けに用いられる値は、1.3+0.2=1.5となる。特許分類コード情報選択部111は、このようにして各公開番号別に算出した出現頻度に対応した重み付けに用いられる値を、各公開番号と対応付けられた「国際特許分類」の値と対応付けて、図示しない記憶媒体等に蓄積する。なお、ここでの検索キーと一致する「用語」を検索する際の一致は、完全一致であるとする。但し、部分一致としても良い。
なお、OR検索に用いられた検索キーに対応する出現頻度情報については、加算を行う代わりに、例えば、最大値だけを取得するようにしても良い。あるいは平均値を求めるようにしても良い。また、AND条件として検索に用いられる候補キーワード同士に対応する出現頻度情報を算出する際には、例えば、上記のように加算を行う代わりに、乗算を行うようにしてもよい。また、出現頻度情報のうちの最小値を取得するようにしても良い。あるいは、いずれの場合においても、これ以外のユーザ等により指定された演算等を行うようにしても良い。
図22は、特許分類コード情報選択部111が取得して蓄積した、各公開番号別の重み付けに用いられる値と、各公開番号に対応する国際特許分類とを対応づけて管理する管理情報である。この管理情報は、図19に示した特許分類コード情報検索部110が取得した特許公報別の国際特許分類を示す図に対して、さらに、特許分類コード情報選択部111が各公開番号別に取得した「重み付け値」の項目を付加したものに相当する。「重み付け値」は、特許分類コード情報選択部111が、上述したように、各公開番号別に用語の出現頻度情報を用いて取得した値である。一の公開番号に対応する1以上の国際特許分類(即ち、一の特許公報に対応する国際特許分類)には、それぞれ1の公開番号について取得された重み付け値が対応付けられる。
次に、特許分類コード情報選択部111は、図22に示した国際特許分類と対応付けられた重み付け値を、国際特許分類が同じもの同士、つまり国際特許分類別に加算していき、加算した値を国際特許分類と対応付けて図示しない記憶媒体等に一時記憶する。
図23は、特許分類コード情報選択部111が取得した国際特許分類別の重み付け値を示す図である。
そして、特許分類コード情報選択部111は、図23に示すような国際特許分類別の重み付け値を示す情報から、値が大きいものから順に、予め指定された数の国際特許分類を取得する。その後の特許検索式を生成する処理や、特許検索式を出力する処理等は、上記具体例1と同様であるので、ここでは説明を省略する。
なお、特許分類コード情報選択部111は、例えば、図22に示した全ての国際特許分類にそれぞれ対応付けられた重み付け値を合計し、その合計で、図23に示した各国際特許分類別の重み付け値をそれぞれ除算して得られた比率を用いて、その比率が高いものや比率が予め指定されたしきい値以上の国際特許分類を取得するようにしても良く、このような場合においても、上記具体例において比率を用いた場合と同様の効果を奏する。
例えば、図22において、公開番号「JP2004−147…」の国際特許分類「G01S 5/08」に対応付けられた重み付け値「1.5」と、公開番号「JP2004−147…」の国際特許分類「G08G 1/133」に対応付けられた重み付け値「1.5」と、公開番号「JP2004−149…」の国際特許分類「G01S 5/08」に対応付けられた重み付け値「0.53」と、公開番号「JP2004−149…」の国際特許分類「G01C 21/10」に対応付けられた重み付け値「0.53」等を全て加算し、この合計で、各国際特許分類別の重み付け値をそれぞれ除算した比率を用いて国際特許分類を取得するようにしてもよい。
このような用語の出現頻度に応じた重み付け値を用いて特許公報を選択することで、検索キーワードに対してより適切な特許分類コード情報を選択することが可能となる。
以上、本実施の形態によれば、ユーザが入力したキーワードに関連した用語が、特許検索式に用いられる候補のキーワードとして提案されるとともに、検索結果が同じとなるようなキーワードを候補のキーワードから省いて非表示とすることで、不必要な候補キーワードの提示を減らして、ユーザがキーワードを選びやすくすることできる。この結果、適切な特許検索式を容易に生成することが可能となる。
なお、上記各実施の形態において、各処理(各機能)は、単一の装置(システム)によって集中処理されることによって実現されてもよく、あるいは、複数の装置によって分散処理されることによって実現されてもよい。
また、上記各実施の形態において、一の装置に存在する2以上の通信手段(情報送信部など)は、物理的に一の媒体で実現されても良いことは言うまでもない。
また、上記実施の形態において、各構成要素が実行する処理に関係する情報、例えば、各構成要素が受け付けたり、取得したり、選択したり、生成したり、送信したり、受信したりする情報や、各構成要素が処理で用いるしきい値や数式、アドレス等の情報等は、上記説明で明記していない場合であっても、図示しない記録媒体において、一時的に、あるいは長期にわたって保持されていてもよい。また、その図示しない記録媒体への情報の蓄積を、各構成要素、あるいは、図示しない蓄積部が行ってもよい。また、その図示しない記録媒体からの情報の読み出しを、各構成要素、あるいは、図示しない読み出し部が行ってもよい。
また、上記各実施の形態では、特許検索式生成装置がスタンドアロンである場合について説明したが、特許検索式生成装置は、スタンドアロンの装置であってもよく、サーバ・クライアントシステムにおけるサーバ装置であってもよい。後者の場合には、出力部や受付部は、通信回線を介して入力を受け付けたり、画面を出力したりすることになる。
また、上記各実施の形態において、各構成要素は専用のハードウェアにより構成されてもよく、あるいは、ソフトウェアにより実現可能な構成要素については、プログラムを実行することによって実現されてもよい。例えば、ハードディスクや半導体メモリ等の記録媒体に記録されたソフトウェア・プログラムをCPU等のプログラム実行部が読み出して実行することによって、各構成要素が実現され得る。
なお、上記各実施の形態における特許検索式生成装置を実現するソフトウェアは、以下のようなプログラムである。つまり、このプログラムは、用語と、当該用語に関連する用語である関連用語とを有する関連用語情報が1以上格納される関連用語情報格納部にアクセス可能なコンピュータを、1以上のキーワードを受け付けるキーワード受付部と、関連用語情報から、各キーワードと一致する用語と対応付けられた関連用語であって、当該キーワードと一致する文字列を含まない関連用語を、特許検索式に用いられるキーワードの候補となる候補キーワードとして取得する候補キーワード取得部と、候補キーワード取得部が取得した候補キーワードを表示する候補キーワード表示部と、候補キーワード取得部が取得した候補キーワードの1以上を、特許検索式に用いるキーワードである検索キーワードに指定する指示である指定指示を受け付ける指定指示受付部と、指定指示により指定された候補キーワードを含む特許検索式を生成する特許検索式生成部と、特許検索式を出力する特許検索式出力部として実行させるためのプログラムである。
また、このプログラムは、用語と、当該用語に関連する用語である関連用語とを有する関連用語情報が1以上格納される関連用語情報格納部にアクセス可能なコンピュータを、1以上のキーワードを受け付けるキーワード受付部と、関連用語情報から、前記各キーワードと一致する用語と対応付けられた関連用語を、特許検索式に用いられるキーワードの候補となる候補キーワードとして取得する候補キーワード取得部と、候補キーワード取得部が取得した候補キーワードを表示する候補キーワード表示部と、候補キーワード取得部が取得した候補キーワードの1以上を、特許検索式に用いるキーワードである検索キーワードに指定する指示である指定指示を受け付ける指定指示受付部と、指定指示により指定された候補キーワードを含む特許検索式を生成する特許検索式生成部と、特許検索式を出力する特許検索式出力部として実行させるためのプログラムであって、候補キーワード取得部は、関連用語情報から取得した候補キーワードから、指定指示受付部が受け付けた指定指示により検索キーワードに指定された候補キーワードと一致する文字列を含む候補キーワードを除外した候補キーワードを取得し、候補キーワード表示部は、指定指示の受け付けに応じて候補キーワード取得部が取得した候補キーワードで表示を更新するプログラムである。
なお、上記プログラムにおいて、ハードウェアによって行われる処理やハードウェアでしか行われない処理は含まれない。
また、上記プログラムにおいて、上記プログラムが実現する機能には、ハードウェアでしか実現できない機能は含まれない。例えば、情報を取得する取得部や、情報を出力する出力部などにおけるモデムやインターフェースカードなどのハードウェアでしか実現できない機能は、上記プログラムが実現する機能には含まれない。
また、このプログラムを実行するコンピュータは、単数であってもよく、複数であってもよい。すなわち、集中処理を行ってもよく、あるいは分散処理を行ってもよい。
図24は、上記プログラムを実行して、上記実施の形態による特許検索式生成装置を実現するコンピュータの外観の一例を示す模式図である。上記実施の形態は、コンピュータハードウェア及びその上で実行されるコンピュータプログラムによって実現されうる。
図24において、コンピュータシステム900は、CD−ROM(Compact Disk Read Only Memory)ドライブ905、FD(Floppy(登録商標) Disk)ドライブ906を含むコンピュータ901と、キーボード902と、マウス903と、モニタ904とを備える。
図25は、コンピュータシステム900の内部構成を示す図である。図25において、コンピュータ901は、CD−ROMドライブ905、FDドライブ906に加えて、MPU(Micro Processing Unit)911と、ブートアッププログラム等のプログラムを記憶するためのROM912と、MPU911に接続され、アプリケーションプログラムの命令を一時的に記憶すると共に、一時記憶空間を提供するRAM(Random Access Memory)913と、アプリケーションプログラム、システムプログラム、及びデータを記憶するハードディスク914と、MPU911、ROM912等を相互に接続するバス915とを備える。なお、コンピュータ901は、LANへの接続を提供する図示しないネットワークカードを含んでいてもよい。
コンピュータシステム900に、上記実施の形態による特許検索式生成装置等の機能を実行させるプログラムは、CD−ROM921、またはFD922に記憶されて、CD−ROMドライブ905、またはFDドライブ906に挿入され、ハードディスク914に転送されてもよい。これに代えて、そのプログラムは、図示しないネットワークを介してコンピュータ901に送信され、ハードディスク914に記憶されてもよい。プログラムは実行の際にRAM913にロードされる。なお、プログラムは、CD−ROM921やFD922、またはネットワークから直接、ロードされてもよい。
プログラムは、コンピュータ901に、上記実施の形態による特許検索式生成装置の機能を実行させるオペレーティングシステム(OS)、またはサードパーティプログラム等を必ずしも含んでいなくてもよい。プログラムは、制御された態様で適切な機能(モジュール)を呼び出し、所望の結果が得られるようにする命令の部分のみを含んでいてもよい。コンピュータシステム900がどのように動作するのかについては周知であり、詳細な説明は省略する。
本発明は、以上の実施の形態に限定されることなく、種々の変更が可能であり、それらも本発明の範囲内に包含されるものであることは言うまでもない。