JP4743766B2 - Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program - Google Patents
Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program Download PDFInfo
- Publication number
- JP4743766B2 JP4743766B2 JP2006053026A JP2006053026A JP4743766B2 JP 4743766 B2 JP4743766 B2 JP 4743766B2 JP 2006053026 A JP2006053026 A JP 2006053026A JP 2006053026 A JP2006053026 A JP 2006053026A JP 4743766 B2 JP4743766 B2 JP 4743766B2
- Authority
- JP
- Japan
- Prior art keywords
- advertisement
- word
- information
- impression
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 44
- 238000003860 storage Methods 0.000 claims description 61
- 238000000605 extraction Methods 0.000 claims description 52
- 239000000463 material Substances 0.000 claims description 41
- 238000004458 analytical method Methods 0.000 claims description 24
- 239000000284 extract Substances 0.000 claims description 20
- 230000000877 morphologic effect Effects 0.000 claims description 10
- 238000009825 accumulation Methods 0.000 claims description 4
- 244000269722 Thea sinensis Species 0.000 description 16
- 230000000694 effects Effects 0.000 description 14
- 238000009826 distribution Methods 0.000 description 10
- 235000013616 tea Nutrition 0.000 description 10
- 238000010586 diagram Methods 0.000 description 9
- 235000009569 green tea Nutrition 0.000 description 6
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- 239000003607 modifier Substances 0.000 description 2
- 235000013361 beverage Nutrition 0.000 description 1
- 235000019658 bitter taste Nutrition 0.000 description 1
- 230000009193 crawling Effects 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000003205 fragrance Substances 0.000 description 1
- 235000011389 fruit/vegetable juice Nutrition 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、アフィリエイトシステムにおいて用いられる印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラムに関する。 The present invention relates to an impression determination system, an advertisement article generation system, an impression determination method, an advertisement article generation method, an impression determination program, and an advertisement article generation program used in an affiliate system.
近年、インターネットを利用した広告ビジネスが注目されている。このような分野では、インターネットの検索サイトでユーザが検索を実行させた語句に対応する広告を表示する技術が提案されている(たとえば特許文献1参照)。 In recent years, advertising business using the Internet has attracted attention. In such a field, a technique for displaying an advertisement corresponding to a phrase that a user has executed a search on a search site on the Internet has been proposed (for example, see Patent Document 1).
特許文献1に記載されている広告提供装置は、広告情報と対応語句とを対応付けて記憶するとともに、対応語句と対応語句に関連する関連語句とを対応付けて記憶する検索用のデータベースを有している。そして、広告提供装置は、入力を受け付けた語句を関連語句として検索し、関連語句に対応する対応語句を得て、さらに対応語句に対応付けて広告情報を取得し、広告情報を提供している。このように構成された広告提供装置により、関連する語句が入力された場合であっても広告情報を提供することを可能にしている。
上記のように、検索サイトでユーザが検索を実行させた語句に対応する広告を表示する技術は既に知られており、ユーザが検索語句に興味を持っているという点では、検索語句に関連する広告を表示する効果がある。しかしながら、ユーザは必ずしも検索語句に対して好感をもっているとは限らず、嫌悪感をもっている場合もある。したがって、検索語句のみに基づいて、それに関連する広告を表示するだけでは、ユーザの感情に適合する広告がなされ、必ずしも広告効果が生じるとは限らない。 As described above, a technique for displaying an advertisement corresponding to a phrase searched by a user on a search site is already known, and is related to a search phrase in that the user is interested in the search phrase. It has the effect of displaying advertisements. However, the user does not always have a good feeling for the search phrase, and may have a bad feeling. Therefore, an advertisement that matches the user's emotion is made only by displaying an advertisement related to it based only on the search phrase, and an advertisement effect is not always produced.
本発明は、このような事情に鑑みてなされたものであり、文書情報から抽出されたキーワードへの印象を判定することで広告効果を高める印象判定システム、広告記事生成システム、印象判定方法、広告記事生成方法、印象判定プログラムおよび広告記事生成プログラムを提供することを目的とする。 The present invention has been made in view of such circumstances, and an impression determination system, an advertisement article generation system, an impression determination method, an advertisement, and an advertisement effect are enhanced by determining an impression on a keyword extracted from document information. An object is to provide an article generation method, an impression determination program, and an advertisement article generation program.
(1)上記の目的を達成するため、本発明の印象判定システムは、Webサイトの文書情報を、前記Webサイトを閲覧可能にしているWebサーバから取得する文書情報取得部と、前記文書情報を形態素解析により単語に分解する単語解析部と、前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出部と、前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出部と、特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部と、前記印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定部と、を備えることを特徴としている。 (1) In order to achieve the above object, an impression determination system according to the present invention includes a document information acquisition unit that acquires document information of a Web site from a Web server that enables browsing of the Web site, and the document information. A word analysis unit that decomposes into words by morphological analysis; a keyword extraction unit that extracts a phrase that meets a predetermined condition as a keyword from the set of decomposed words; and the keyword in the acquired document information A related word extraction unit that extracts a word used in relation to a word as a related word, and a word that is easily used together with the specific word in association with the specific word And storing impression information for each registered word and storing the degree of positive or negative impression for the specific phrase And an impression determination unit that refers to the impression information storage unit, comprehensively calculates a degree of impression with respect to the keyword for the related word, and determines an impression with respect to the keyword obtained from the document information. It is said.
このように、本発明の印象判定システムは、文書からキーワードを抽出するだけでなく抽出されたキーワードに対する印象まで判定するため、判定結果を利用して文書から受けるキーワードへの印象に適合した広告の提供に利用可能となる。その結果、広告効果を高めることができる。 As described above, the impression determination system of the present invention not only extracts keywords from a document but also determines impressions for the extracted keywords. Available for provision. As a result, the advertising effect can be enhanced.
(2)また、本発明の広告記事生成システムは、上記の印象判定システムと、特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部と前記グループワード蓄積部を参照して、前記判定された印象と同じ印象で前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出部と、広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定部と、前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出部と、前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成部と、を備えることを特徴としている。 (2) Further, the advertisement article generation system of the present invention refers to the impression determination system described above, a group word storage unit that stores positive and negative word groups for a specific phrase, and the group word storage unit, respectively. A group word extraction unit that extracts a plurality of words that are likely to be used together with the keyword with the same impression as the determined impression, and an advertisement information storage unit that stores advertisement material information for each advertisement. An advertisement identifying unit that identifies a matched advertisement by matching the group word and information obtained from the advertisement material information, and an advertisement that extracts advertisement material information corresponding to the identified advertisement from the advertisement information storage unit An advertisement section information is generated using the extraction unit and the extracted advertisement material information, and the generated advertisement article information It is characterized in that and a advertisement articles generating unit that transmits to the Web server that obtains the document information.
このように、本発明の広告記事生成システムは、文書から受ける印象に近い広告記事情報を生成する。話題の中心事項について文書の印象に合った広告記事の生成が可能となる。その結果、広告によりさらにユーザの購買意欲を高めることができ、広告効果を高めることができる。 Thus, the advertisement article generation system of the present invention generates advertisement article information close to the impression received from the document. It is possible to generate an advertising article that matches the impression of the document with respect to the central topic. As a result, the user's willingness to purchase can be further enhanced by the advertisement, and the advertising effect can be enhanced.
(3)また、本発明の印象判定方法は、Webサイトの文書情報を、前記Webサイトを閲覧可能にしているWebサーバから取得する文書情報取得ステップと、前記文書情報を形態素解析により単語に分解する単語解析ステップと、前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出ステップと、前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出ステップと、特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定ステップと、を含むことを特徴としている。 (3) The impression determination method of the present invention includes a document information acquisition step of acquiring document information of a website from a web server that enables browsing of the website, and decomposes the document information into words by morphological analysis. Used in relation to the keyword in the acquired document information, a word analyzing step for extracting a phrase that matches a predetermined condition as a keyword from the set of decomposed words, A related word extracting step of extracting from the set of decomposed words as a related word, a word that is easily used together with the specific word in association with the specific word, and stored as a registered word, and Impression information storage that memorizes the degree of positive or negative impression for the specific phrase for each registered word Refers to the, the associated word comprehensively calculating the degree of impression of keywords for, is characterized in that it comprises, and impression judgment step of judging impression of the keyword obtained from the document information.
このように、本発明の印象判定方法は、文書からキーワードを抽出するだけでなく抽出されたキーワードに対する印象まで判定するため、判定結果を利用して文書から受けるキーワードへの印象に適合した広告の提供に利用可能となる。その結果、広告効果を高めることができる。 In this way, the impression determination method of the present invention not only extracts keywords from a document but also determines impressions for the extracted keywords, and therefore uses the determination result to display an advertisement that matches the impression of the keywords received from the document. Available for provision. As a result, the advertising effect can be enhanced.
(4)また、本発明の広告記事生成方法は、特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部を参照して、上記の印象判定方法により判定された印象と同じ印象で、前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出ステップと、広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定ステップと、前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出ステップと、前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成ステップと、を含むことを特徴としている。 (4) Further, the advertisement article generation method of the present invention refers to an impression determined by the above-described impression determination method with reference to a group word storage unit that stores positive and negative word groups for a specific phrase. A group word extraction step for extracting a plurality of words that are likely to be used together with the keyword with the same impression as a group word, and an advertisement information storage unit that stores advertisement material information for each advertisement, and the group word and the advertisement material An advertisement identifying step for identifying a matched advertisement by matching information obtained from information, an advertisement extracting step for extracting advertisement material information corresponding to the identified advertisement from the advertisement information storage unit, and the extracted Advertising article information is generated using the advertising material information, and the generated advertising article information is converted into the document information. It is characterized in that it comprises acquired advertisement articles generating step of transmitting to the Web server has, and.
このように、本発明の広告記事生成方法は、文書から受ける印象に近い広告記事情報を生成する。話題の中心事項について文書の印象に合った広告記事の生成が可能となる。その結果、広告によりさらにユーザの購買意欲を高めることができ、広告効果を高めることができる。 Thus, the advertisement article generation method of the present invention generates advertisement article information close to the impression received from a document. It is possible to generate an advertising article that matches the impression of the document with respect to the central topic. As a result, the user's willingness to purchase can be further enhanced by the advertisement, and the advertising effect can be enhanced.
(5)また、本発明の印象判定プログラムは、Webサイトの文書情報を、前記Webサイトを閲覧可能にしているWebサーバから取得する文書情報取得処理と、前記文書情報を形態素解析により単語に分解する単語解析処理と、前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出処理と、前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出処理と、特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定処理と、を含むことを特徴としている。 (5) In addition, the impression determination program of the present invention includes a document information acquisition process for acquiring document information of a Web site from a Web server that enables browsing of the Web site, and decomposes the document information into words by morphological analysis. Used in relation to the keyword in the acquired document information, and a word extraction process that extracts a phrase that matches a predetermined condition as a keyword from the set of decomposed words. A related word extraction process for extracting a word or phrase as a related word, a word that is easily used together with the specific word in association with the specific word, and storing as a registered word; and For each registered word, refer to the impression information storage unit that stores the degree of positive or negative impression for the specific phrase. The associated word comprehensively calculating the degree of impression of keywords for, is characterized in that it comprises a determining impression determination processing an impression for the keyword obtained from the document information.
このように、本発明の印象判定プログラムは、文書からキーワードを抽出するだけでなく抽出されたキーワードに対する印象まで判定するため、判定結果を利用して文書から受けるキーワードへの印象に適合した広告の提供に利用可能となる。その結果、広告効果を高めることができる。 As described above, the impression determination program according to the present invention not only extracts keywords from a document but also determines impressions for the extracted keywords. Available for provision. As a result, the advertising effect can be enhanced.
(6)また、本発明の広告記事生成プログラムは、特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部を参照して、上記の印象判定方法により判定された前記キーワードに対する印象と同じ印象で、前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出処理と、広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定処理と、前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出処理と、前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成処理と、を含むことを特徴としている。 (6) The advertisement article generation program of the present invention refers to the keyword determined by the impression determination method described above with reference to a group word storage unit that stores positive and negative word groups for a specific phrase. A group word extraction process for extracting a plurality of words that are easy to use with the keyword as a group word, and an advertisement information storage unit that stores advertisement material information for each advertisement. An advertisement specifying process for identifying a matched advertisement by matching information obtained from the advertisement material information, an advertisement extracting process for extracting advertisement material information corresponding to the specified advertisement from the advertisement information storage unit, Using the extracted advertisement material information to generate advertisement article information, the generated advertisement article information Is characterized in that it comprises, an advertising article generation processing to be sent to the Web server that obtains the document information.
このように、本発明の広告記事生成プログラムは、文書から受ける印象に近い広告記事情報を生成する。話題の中心事項について文書の印象に合った広告記事の生成が可能となる。その結果、広告によりさらにユーザの購買意欲を高めることができ、広告効果を高めることができる。 Thus, the advertisement article generation program of the present invention generates advertisement article information close to the impression received from a document. It is possible to generate an advertising article that matches the impression of the document with respect to the central topic. As a result, the user's willingness to purchase can be further enhanced by the advertisement, and the advertising effect can be enhanced.
本発明の印象判定システムによれば、文書からキーワードを抽出するだけでなく抽出されたキーワードに対する印象まで判定するため、判定結果を利用して文書から受けるキーワードへの印象に適合した広告の提供に利用可能となる。その結果、広告効果を高めることができる。 According to the impression determination system of the present invention, not only a keyword is extracted from a document but also an impression of the extracted keyword is determined, so that an advertisement that matches the impression of the keyword received from the document can be provided using the determination result. Be available. As a result, the advertising effect can be enhanced.
本発明者らは、アフィリエイトシステムの利用を提供するにあたり、Webサイトに掲載される文章に合致した広告を行なった方が、広告効果が高い点に着目し、掲載される文章がその中のキーワードに対してどのような印象で作成されているかを解析する手段を見出して、本発明を完成させるに至った。ここで、アフィリエイトシステムとは、Webサイトの作成者が、企業と提携をして、自分のWebサイト内にリンクを貼り、Webサイトに訪れる一般ユーザが、貼られたリンク経由で商品を購入したり、資料請求を行ったり、会員登録をした場合に、それぞれの成果に応じて提携企業からWebサイトの運営者に報酬が支払われるシステムをいう。 In providing the use of the affiliate system, the present inventors pay attention to the fact that advertising that matches the text posted on the website has a higher advertising effect, and the posted text is the keyword in it. As a result, the present inventors have completed the present invention. Here, the affiliate system is that the creator of the website makes a partnership with a company, puts a link in his website, and a general user who visits the website purchases a product via the pasted link. Or when requesting materials or registering as a member, this means a system in which a reward is paid from the partner company to the operator of the website according to each result.
本発明の印象判定システムは、取得したWebサイトの文書情報からキーワードおよびキーワードに関連の深い関連ワードを抽出し、関連ワードについてキーワードに対する印象の程度を総合的に算出することでキーワードに対する印象を判定する。このように判定された判定結果を利用すれば、文書がもつキーワードへの印象に適合した広告の提供を行なうことが可能となり、それによって広告効果を高めることができる。 The impression determination system of the present invention extracts keywords and related words that are deeply related to the keywords from the document information of the acquired website, and determines the impression of the keywords by comprehensively calculating the degree of impression of the keywords for the related words. To do. By using the determination result determined in this way, it is possible to provide an advertisement that matches the impression of the keyword that the document has, thereby enhancing the advertising effect.
以下の実施形態の説明では、図面を参照しながら、本発明の印象判定システムおよび広告記事生成システムを含むアフィリエイトシステム全体の構成を説明し、続いて広告記事生成システムおよび印象判定システムの具体的内容を説明する。説明の理解を容易にするため、各図面において同一の構成要素に対しては同一の参照番号を付し、重複する説明は省略する。 In the following description of the embodiment, the configuration of the entire affiliate system including the impression determination system and the advertisement article generation system of the present invention will be described with reference to the drawings, and then the specific contents of the advertisement article generation system and the impression determination system will be described. Will be explained. In order to facilitate understanding of the description, the same reference numerals are given to the same components in the respective drawings, and duplicate descriptions are omitted.
図1は、アフィリエイトシステム1の構成を示す概念図である。アフィリエイトシステム1は、作成者端末100、ユーザ端末250、Webサーバ200、AIサーバ310(広告記事生成システム)、広告管理サーバ330、広告配信サーバ340および会員管理サーバ350から構成されている。
FIG. 1 is a conceptual diagram showing the configuration of the
作成者端末100は、Webサイトを作成する作成者が使用する一般的な端末であり、インターネットNに接続されている。作成者端末100は、作成者がWebサーバ200にアクセスして、Webサイトを作成し、アフィリエイトシステム1の利用会員として会員登録を要求するため等に用いられる。また、作成者端末100は、会員登録後に会員管理サーバ350から受信した広告記事掲載用のタグ情報を作成者が入力する際にも用いられる。
The
Webサーバ200は、作成者端末100からWebサイト用の情報を受信し、これを蓄積して、送信可能化の状態に置く。上記のWebサイト作成用の情報には、ブログに掲載される文書等の文書情報が含まれる。一方で、Webサーバ200には、RSS情報を発信するRSSフィードが組み込まれ、Webサイトに新規の記事情報が蓄積されたときには、RSS情報が生成される。RSS情報には、見出し、要約等の情報が含まれる。なお、上記のRSSフィードは、AIサーバ310がRSSリーダーを利用してWebサイトの文書情報を取得する場合には必要となるが、AIサーバ310が一般的なクローラーにより文書情報を取得する場合には、不要となる。Webサーバ200は、送信した文書情報をもとに作成された広告記事情報を広告配信サーバ340から受信し、Webサイト情報に含めて送信可能化の状態に置く。
The
ユーザ端末250は、ユーザが使用する一般的な端末で、インターネットNに接続されており、Webサイトを閲覧可能にしている。また、ユーザ端末250からは、ユーザが広告記事の情報をもとに広告主サーバ(図示せず)にアクセスし、広告主サーバへの資料請求や商品等を注文することが可能となっている。
The
AIサーバ310は、会員管理サーバ350から得たWebサイト作成者に対応する会員IDおよびRSS情報取得用のアクセス先情報を記憶し、これをもとにRSSリーダーでRSS情報(文書情報)を取得する。RSSリーダーを用いずに一般的なクローラーで文書情報を取得してもよい。
The
また、AIサーバ310(広告記事生成システム)は、取得した文書情報を解析して文書情報のキーワードに対する印象を判定し、これをもとに広告記事生成用の広告情報を取得して広告記事情報を生成する。AIサーバ310の構成の詳細は、後述する。
Also, the AI server 310 (advertisement article generation system) analyzes the acquired document information to determine an impression of the keyword of the document information, acquires advertisement information for generating an advertisement article based on this, and acquires the advertisement article information. Is generated. Details of the configuration of the
広告管理サーバ330は、広告主から出稿された広告素材情報を蓄積し、AIサーバ310から要求があった場合には広告素材情報を送信する。広告管理サーバ330の構成の詳細は、後述する。
The
広告配信サーバ340は、AIサーバ310が生成した広告記事情報を受信し、蓄積する。また、広告配信サーバ340は、会員IDをもとに会員管理サーバ350を参照して広告記事情報の送信先情報を取得し、広告記事情報を文書情報が取得されたWebサーバ200に送信する。また、広告配信サーバ340は、ユーザ端末250が、AIサーバ310により生成された広告記事情報から広告主のシステムにアクセスしたときには、アクセスログを記録する。広告配信サーバ340は、アクセスログからアクセス数等の各アクション数を集計し、集計データをAIサーバ310に送信する。
The
会員管理サーバ350は、作成者端末100からアフィリエイトシステム1の利用会員として会員登録の要求があったときには、会員登録処理を行ない、作成されたWebサイトのRSS情報またはサイト情報を取得するとともに、作成者の会員IDを生成する。同時に、会員管理サーバ350は、AIサーバ310へRSS情報またはサイト情報および会員管理IDを送信し、広告記事掲載用のタグを生成して、作成者端末100へ送信する。また、会員管理サーバ350は、広告主へのユーザによるアクションの情報を広告配信サーバ340から取得し、その情報を報酬算出サーバ(図示せず)に送信する。報酬算出サーバは報酬額または報酬ポイントを算出し、作成者へ報酬を支払う。
When there is a request for member registration as a member of the
次に、AIサーバ310(広告記事生成システム)および広告管理サーバ330の詳細を説明する。図2は、AIサーバ310および広告管理サーバ330の構成を示すブロック図である。
Next, details of the AI server 310 (advertisement article generation system) and the
AIサーバ310(広告記事生成システム)は、文書情報取得部311、文書情報蓄積部312、単語解析部313、キーワード抽出部315、関連ワード抽出部316、印象判定部318、印象情報蓄積部317、グループワード抽出部320、広告特定部322、広告抽出部324および広告記事生成部326から構成されている。
The AI server 310 (advertisement article generation system) includes a document information acquisition unit 311, a document
文書情報取得部311は、Webサイトの文書情報を、Webサーバ200から取得する。文書情報取得部311は、あらかじめRSSフィードのアクセス先を登録している。このアクセス先は、アフィリエイトシステム1の利用会員が作成したWebサイトのRSSフィードのアクセス先である。文書情報取得部311は、登録されているRSSフィードのアクセス先の情報に基づいてアクセス先の文書情報を次々に収集する。図3は、文書情報が取得されたWebサイトの表示例を示す図である。RSSフィードでは、新たに更新があった2005年12月2日のブログの文書情報をRSS情報とする。
The document information acquisition unit 311 acquires the document information of the website from the
RSSにより情報を収集する場合には、予めRSSフィードがWebサイトの更新時に作成したタイトル情報や要約の情報を含む文書情報を送信可能にするため、Webサイトの更新に対応し易くなり、文書情報の収集の効率が上がる。ただし、本発明はRSSを利用することに限定されず、一般的なクローリングを行なう場合にも適用可能である。文書情報取得部311は、たとえばCPUおよびRAM等のメモリまたはハードディスク等の外部記憶装置により構成されている。 When collecting information by RSS, the RSS feed can transmit document information including title information and summary information created when the website is updated in advance. Increases the efficiency of collection. However, the present invention is not limited to using RSS, and can also be applied to general crawling. The document information acquisition unit 311 includes, for example, a memory such as a CPU and a RAM, or an external storage device such as a hard disk.
文書情報蓄積部312は、文書情報取得部311により取得された文書情報を蓄積する。蓄積された文書情報は、印象情報蓄積部317の情報の更新等に用いられる。文書情報蓄積部312は、たとえばRAM等のメモリまたはハードディスク等の外部記憶装置により構成されている。
The document
単語解析部313は、取得された文書情報を形態素解析により単語に分解する。形態素解析を行なうことにより、文章は形態素(言語において意味を持つ最小単位)の列に分割され、読み、原形、品詞の種類、活用の種類、活用形等まで分析される。形態素解析を行なう際には、単語解析部313にあらかじめ用意された文法および辞書(品詞等の情報が対応付けられた単語リスト)を参照する。単語解析部313は、たとえばCPUおよびRAM等のメモリまたはハードディスク等の外部記憶装置により構成される。
The
キーワード抽出部315は、分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出する。所定の条件には、たとえば(1)語句の出現頻度の高いこと(Term Frequency:tf)、(2)文書集合のうち少数の文書にしか現れないこと(Document Frequency:df)、(3)語句に関連した動詞や形容詞があること、等の組合せが挙げられる。このうち、dfについては、逆数の対数をとり、文書総数により正規化したidfを用いてもよい。キーワード抽出部315は、たとえばCPUにより構成されている。
The
関連ワード抽出部316は、取得された文書情報の中で、キーワードに関連して使用されている語句を関連ワードとして分解された単語の集合から抽出する。関連しているか否かの判断は、たとえば係り受け解析により行ない、修飾語と被修飾語とは互いに関連すると判断される。関連ワード抽出部316は、たとえばCPUにより構成されている。
The related
印象情報蓄積部317は、特定の語句に対応付けて、文書中で特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ登録ワードごとに特定の語句に対するポジティブまたはネガティブの印象値(印象の程度)を記憶している。図4は、登録ワードごとに特定の語句に対するポジティブまたはネガティブの印象値を記憶するテーブルの例を示している。たとえば、「コーヒー」という特定の語句について「紅茶」、「緑茶」、「苦さ」、「ブレンド」、「香り」等の登録ワードが記憶されている。そして、それぞれに対応付けて「コーヒー」に対する印象値を記憶している。たとえば、図4に示す例では、「紅茶」の「インスタント」に対する印象値は、「−1」であり、「ブレンド」の「インスタント」に対する印象値は「2」である。印象情報蓄積部317は、たとえばRAM等のメモリまたはハードディスク等の外部記憶装置により構成されている。
The impression
印象判定部318は、印象情報蓄積部317を参照し、関連ワードについてキーワードに対する印象値(印象の程度)を総合的に算出し、文書情報から得られるキーワードに対する印象を判定する。これにより、文書からキーワードを抽出するだけでなく抽出されたキーワードに対する印象まで判定するため、判定結果を利用して文書から受けるキーワードへの印象に適合した広告の提供に利用可能となる。その結果、広告効果を高めることができる。
The
図5は、キーワードに対する印象値を集計した結果を示す図である。図5に示す例では、キーワード「コーヒー」に対して、その関連ワード「紅茶」は、印象値が「−1」、文書中での関連値が「4」、文書中での出現数が「1」であるとき、それらの積が「−4」である。文書中での関連値は、使用されている関連ワードのキーワードに対する位置の近さや、主語述語関係にあるか等により決まる関連深さを示している。この関連値については、たとえば係り受け解析により数値を得ることができる。 FIG. 5 is a diagram illustrating a result of totaling impression values for keywords. In the example shown in FIG. 5, for the keyword “coffee”, the related word “tea” has an impression value of “−1”, a related value in the document of “4”, and the number of occurrences in the document of “coffee”. When they are “1”, their product is “−4”. The related value in the document indicates the related depth determined by the proximity of the used related word to the keyword, the subject predicate relationship, and the like. For this related value, for example, a numerical value can be obtained by dependency analysis.
図5では、同様に、関連ワード「苦さ」の数値の積が「−12」であり、関連ワード「ブレンド」の数値の積が「2」であることが示されている。したがって、これら数値の積を合計すると、「−14」となり、負の数値であることが分かる。印象判定部318は、このように総合的に算出された印象値の値が、0以上であるか否かを判定することで、文書情報から得られるキーワードに対する印象を判定する。数値が0以上である場合には、判定結果はポジティブであり、数値が負の場合には、判定結果はネガティブである。したがって、図5に示される例では、印象判定部318は、文書情報から得られるキーワード「コーヒー」に対する印象をネガティブであると判定することになる。印象判定部318は、たとえばCPUにより構成される。なお、上記の判定手法を一例にすぎず、関連値や出現数等のパラメータの組合せを限定するものではない。
Similarly, in FIG. 5, the product of the numerical values of the related word “bitter” is “−12”, and the product of the numerical values of the related word “blend” is “2”. Therefore, the sum of the products of these numerical values is “−14”, which is a negative numerical value. The
グループワード蓄積部319は、特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積する。図6は、グループワード蓄積部319に蓄積されるワード群の一例を示す概念図である。ワード群は、図6に示すように、重み付き無向構造で蓄積されている。図中のネットワーク上に記載している数値は、互いの関連性を示しており、小さいほど関連性が高い。一般的にデータ構造上近くに格納されているデータ同士は関連性がある可能性が高い。ただし、実際の関連性は、データ間の重み付けで決定される。グループワード蓄積部319は、たとえばRAM等のメモリまたはハードディスク等の外部記憶装置により構成されている。
The group
グループワード抽出部320は、グループワード蓄積部319を参照して、判定された印象と同じ印象でキーワードとともに使用されやすい複数の語句をグループワードとして抽出する。たとえば、ネガティブの判定結果を得た場合に、「コーヒー」というキーワードに対してグループワード蓄積部319に「コーヒー」のネガティブのワード群に、「コーヒー」にデータ構造上近いものとして「紅茶」、「緑茶」、「ジュース」「ケーキ」および「水」があったとき、まずこれらを抽出する。さらに、それらについて重み付けを含めて関連性を算出し、「紅茶」、「緑茶」、「ケーキ」の関連性が高いと判断されたときには、これらをグループワードとして抽出する。
The group
広告特定部322は、広告情報蓄積部335を参照し、グループワードと、広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する。すなわち、広告の紹介文、広告文章、広告の関連キーワード等の文章からグループワードに近いものを検索することで特定を行なう。たとえば、「紅茶」に合致する商品名「○○紅茶」の広告素材情報や、「緑茶」に合致する商品名「□□緑茶」の広告等を特定する。広告特定部322は、たとえばCPUにより構成される。なお、上記のマッチングでは、広告情報として用意されたデータ以外にも、広告主のWebサイトの情報を利用することもできる。また、マッチング手法としてベクトル空間モデル等を利用した情報検索やマッチする情報のランダム抽出等を利用することができる。
The
広告抽出部324は、特定された広告に対応する広告素材情報を、広告情報蓄積部335から抽出する。たとえば、「○○紅茶」の広告素材情報として「味わい深い○○紅茶で快適な午後のひとときを...」というテキストデータが広告情報蓄積部335に蓄積されている場合には、このテキストデータを抽出する。広告抽出部324は、たとえばCPUにより構成される。なお、広告素材情報は、テキストデータに限らず画像データを伴うものであってもよい。
The
広告記事生成部326は、抽出された広告素材情報を用いて広告記事情報を生成し、生成された広告記事情報を、文書情報を取得したWebサーバ200へ送信する。これにより、文書から受ける印象に近い広告記事情報が生成され、話題の中心事項について文書の印象に合った広告記事の生成が可能となる。その結果、広告によりさらにユーザの購買意欲を高めることができ、広告効果を高めることができる。広告記事の生成には、少なくとも抽出された広告素材情報を用い、必要に応じキーワードやグループワードを用いてもよい。広告記事情報の生成の際には、広告記事生成部326は、必要に応じキーワードやグループワードを用いてキャッチコピーを生成し、これを広告記事情報の中に含める。設定によりキャッチコピーを生成しない場合もある。このように、広告記事生成部326は、文書情報がキーワードに対してもっている印象を反映させてキャッチコピーを生成することができる。
The advertisement
たとえば、文書情報がキーワード「コーヒー」に対してネガティブな印象を有すると判定されたときには、広告記事生成部326は、「コーヒーが嫌いなあなたに送るベストセレクション」等のキャッチコピーを生成する。このようにして生成された広告記事情報がWebサーバ200に送信されることにより、Webサーバ200は、Webサイトの情報に生成された広告記事情報を掲載することが可能になる。図7は、生成された広告記事情報を掲載したWebサイトの表示例を示す図である。広告記事生成部326は、たとえばCPUにより構成されている。
For example, when it is determined that the document information has a negative impression with respect to the keyword “coffee”, the advertisement
広告管理サーバ330は、広告情報受付部332および広告情報蓄積部335を備えている。広告情報受付部332は、広告主サーバの認証処理および広告主サーバから出稿された広告素材情報を受付ける。広告情報受付部332は、たとえばCPUにより構成されている。広告情報蓄積部335は、受付けた広告素材情報を蓄積し、AIサーバ310の広告抽出部324からの要求を受けて、広告情報をAIサーバ310に送信する。広告情報蓄積部335は、たとえばRAM等のメモリまたはハードディスク等の外部記憶装置により構成されている。
なお、上記の例では、AIサーバ310が広告記事生成の機能を果たしているが、本発明はこのような形態に限定されることはなく適用可能である。すなわち、複数のサーバにより広告記事生成システムが構成されていてもよいし、広告記事生成システムが、広告記事生成の機能の他に上記の広告管理サーバ330の機能を含んでいてもよい。
The
In the above example, the
次に、上記のように構成されたAIサーバ310の特徴的な動作を説明する。前提として、作成者がアフィリエイトシステム1の利用会員として登録されている必要がある。会員登録の際、作成者端末100は、会員管理サーバ350にアクセスし、広告掲載用のタグの発行を受ける。そして、会員管理サーバ350は、作成者のWebサイトのRSSフィードのアクセス先情報を受けるとともに、会員IDを発行する。AIサーバ310(広告記事生成システム)は、RSSフィードのアクセス先情報および会員IDを会員管理サーバ350から受信し、記憶する。
Next, a characteristic operation of the
このような状況を前提に、AIサーバ310(広告記事生成システム)は動作する。図8は、AIサーバ310の特徴的な動作を示すフローチャートである。まず、AIサーバ310は、文書情報取得部311により、Webサイトの文書情報を、Webサーバ200から取得する(ステップS1)。そして、単語解析部313により、取得された文書情報を形態素解析により単語に分解する(ステップS2)。次に、AIサーバ310は、キーワード抽出部315により、分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出する(ステップS3)。キーワードの抽出処理の詳細については、後述する。続いてAIサーバ310は、関連ワード抽出部316により、取得された文書情報の中で、キーワードに関連して使用されている語句(関連ワード)を分解された単語の集合から抽出する。関連しているか否かの判断は、たとえば係り受け解析により行なう。
Based on such a situation, the AI server 310 (advertising article generation system) operates. FIG. 8 is a flowchart showing a characteristic operation of the
次に、AIサーバ310は、印象判定部318により、印象情報蓄積部317を参照し、すべての関連ワードにわたってキーワードに対する印象値を総合的に算出し、文書情報から得られるキーワードに対する印象を判定する(ステップS5)。印象判定処理の詳細については、後述する。AIサーバ310は、グループワード抽出部320により、グループワード蓄積部319を参照して、グループワードを抽出する(ステップS6)。グループワードとは、判定された印象と同じ印象でキーワードとともに使用されやすい複数の語句である。グループワードの抽出処理の詳細については、後述する。
Next, the
次に、AIサーバ310は、広告特定部322により、広告情報蓄積部335を参照し、グループワードと、広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する(ステップS7)。そして、広告抽出部324により、特定された広告に対応する広告素材情報を、広告情報蓄積部335から抽出する(ステップS8)。最後に、AIサーバ310は、広告記事生成部326により、抽出された広告素材情報を用いて広告記事情報を生成し、生成された広告記事情報を、文書情報を取得したWebサーバ200へ送信する(ステップS9)。広告記事生成処理の詳細については、後述する。このようにして生成された広告記事情報がWebサーバ200に送信されることにより、Webサーバ200は、Webサイトに生成された広告記事情報を掲載することが可能になる。なお、広告記事情報の送信は、広告配信サーバ340を介して行なわれる。
Next, the
このようにしてWebサイトに掲載された広告記事情報からユーザが広告主サイトにアクセスした場合、広告配信サーバ340がアクセスログを記録し、アクセスログをAIサーバ310に送信する。AIサーバ310は、このフィードバックされた情報をもとに語句の関連性や印象値の信頼度を高めることが可能である。また、ユーザが広告記事情報から広告主サイトへアクセスし、広告成果につながるアクションをした場合には、報酬算出サーバ(図示せず)が報酬額を計算し、作成者(利用会員)に報酬が支払われることになる。
In this way, when the user accesses the advertiser site from the advertisement article information posted on the website, the
このようなAIサーバ310の動作のうち、キーワード抽出の動作を以下に詳述する。図9は、キーワード抽出処理を示すフローチャートである。まず、キーワード抽出部315は、単語解析部313により分解された単語(最小単位)の一つについて、話題の中心となる品詞であるか否かを判定する(ステップT1)。話題の中心となる品詞でない場合には、ステップT5に進む。単語が話題の中心となる品詞である場合には、キーワードとなりうる語句を作成するのに単語を加工する必要があるか否かを判定する(ステップT2)。加工する必要がない場合には、ステップT4に進む。単語を加工する必要がある場合には、単語を語句に加工する(ステップT3)。たとえば、単語を組み合わせて、名詞+名詞で語句に加工したり、名詞+副詞+名詞で語句に加工したりする。
Of the operations of the
続いて、加工された語句あるいは加工される必要がないと判定された単語を選別する(ステップT4)。そして、分解されたすべての単語について上記の選別までの処理を終えたか否かを判定する(ステップT5)。すべての単語について選別を終えていない場合には、ステップT1に戻る。すべての単語について選別を終えた場合には、選別した語句の中から重要な語句を抽出する(ステップT6)。選別された語句の中から、局所的な重み付けの方法、大域的重み付けの方法、もしくは語句に関連する動詞や形容詞がある場合に重みを与える方法またはこれらの組合せ(所定の条件)により重要な語句(キーワード)を抽出しキーワードの抽出処理を終了する。局所的な重み付けの方法とは文書中の語句の出現頻度の高いことを考慮する方法であり、大域的重み付けの方法とは文書集合のうち少数の文書にしか現れないことを考慮する方法である。 Subsequently, the processed words or words determined not to be processed are selected (step T4). Then, it is determined whether or not the processing up to the above selection has been completed for all the decomposed words (step T5). If all the words have not been sorted, the process returns to step T1. When all the words have been selected, important words are extracted from the selected words (step T6). Phrases that are important by selecting a local weighting method, a global weighting method, a method of giving weight when there is a verb or adjective related to the phrase, or a combination thereof (predetermined conditions) among the selected words (Keyword) is extracted, and the keyword extraction process ends. The local weighting method is a method that considers the high frequency of words in the document, and the global weighting method is a method that considers that only a small number of documents in the document set appear. .
次に、AIサーバ310の動作のうち、印象判定の動作を以下に詳述する。図10は、印象判定の処理を示すフローチャートである。まず、印象判定部318は、印象情報蓄積部317を参照し、抽出された関連ワードが登録ワードであるか否かを判定する(ステップP1)。ここで、登録ワードとは、特定の語句とともに使用されやすい語句として、印象情報蓄積部317に記憶されている語句である。判定の結果、抽出された関連ワードが登録ワードでない場合には、ステップP4に移る。抽出された関連ワードが登録ワードである場合には、その登録ワードの印象値を印象情報蓄積部317から読み出す(ステップP2)。そして、その登録ワードの印象値に重み付けを乗じて、加算する(ステップP3)。重み付けには、たとえば、文書中で使用されている関連ワードのキーワードに対する関連深さを示す関連値や関連ワードの出現数等がある。
Next, of the operations of the
続いて、すべての関連ワードについて、上記の加算までの処理を終えたか否かを判定する(ステップP4)。処理を終えていない関連ワードがある場合には、ステップP1に戻る。すべての関連ワードにわたって処理を終えた場合には、上記の加算値を関連ワードすべてについて合計し、この印象値の合計が0以上であるか否かについて判定する(ステップP5)。判定の結果、印象値の合計が負である場合には、文書情報のキーワードに対する印象がネガティブであると判定する(ステップP6)。一方、印象値の合計が0以上である場合には、文書情報のキーワードに対する印象がポジティブであると判定する(ステップP7)。そして、印象判定の処理を終了する。 Subsequently, it is determined whether or not the processing up to the above addition has been completed for all related words (step P4). If there is a related word that has not been processed, the process returns to step P1. When the processing has been completed for all the related words, the above addition values are summed for all the related words, and it is determined whether or not the sum of the impression values is 0 or more (step P5). If the total impression value is negative as a result of the determination, it is determined that the impression for the keyword of the document information is negative (step P6). On the other hand, if the total impression value is 0 or more, it is determined that the impression of the keyword of the document information is positive (step P7). Then, the impression determination process ends.
次に、AIサーバ310の動作のうち、グループワードの抽出の動作を以下に詳述する。図11は、グループワードの抽出処理を示すフローチャートである。まず、グループワード抽出部320は、キーワードの印象がポジティブと判定されたか否かを判断する(ステップQ1)。ネガティブと判定された場合には、ネガティブのワード群からデータ構造上近くにある語句を抽出する(ステップQ2)。一方、ポジティブと判定された場合には、ポジティブのワード群からデータ構造上近くにある語句を抽出する(ステップQ3)。次に、グループワード抽出部320は、抽出された語句についてキーワードとの関連性を重み付けから関連度を算出することにより、特に関連性の高い語句をグループワードとして抽出する(ステップQ4)
次に、AIサーバ310の動作のうち、広告記事生成の動作を以下に詳述する。図12は、広告記事の生成処理を示すフローチャートである。広告記事生成部326は、キャッチコピーが必要か否かを判定する(ステップR1)。キャッチコピーが必要か否かは、設定次第である。たとえば、広告主が望まない場合には、キャッチコピーを生成しないように設定しておくことも可能である。キャッチコピーが必要ないと判定された場合には、ステップR5に移る。
Next, the group word extraction operation among the operations of the
Next, among the operations of the
一方、キャッチコピーが必要であると判定された場合には、文書情報のキーワードへの印象がポジティブと判定されたか否かを判定する(ステップR2)。印象がネガティブと判定されていたときには、ネガティブ用のキャッチコピーを生成する(ステップR3)。キャッチコピーの生成は、名詞、動詞、形容詞やテンプレート、定型文等を組み合わせて生成する。ネガティブ用のキャッチコピーは、たとえば、「コーヒーよりも○○紅茶」、「コーヒーも良いけど□□飲料の□□緑茶」等である。一方、印象がポジティブと判定されていたときには、ポジティブ用のキャッチコピーを生成する(ステップR4)。ポジティブ用のキャッチコピーは、たとえば、「コーヒーと言えば△△」、「美味しいコーヒーは××」等である。最後に、キャッチコピーや広告素材情報を合成して、広告記事情報を生成する(ステップR5)。このようにして、広告記事生成処理を終了する。 On the other hand, if it is determined that the catch phrase is necessary, it is determined whether or not the impression of the keyword of the document information is determined to be positive (step R2). If the impression is determined to be negative, a negative catch phrase is generated (step R3). The catch phrase is generated by combining nouns, verbs, adjectives, templates, fixed phrases, and the like. The negative catch phrase is, for example, “XX tea rather than coffee”, “coffee is good but □□ beverage □□ green tea”, and the like. On the other hand, if the impression is determined to be positive, a catch phrase for positive is generated (step R4). The positive catch phrase is, for example, “△△” for coffee or “xx for delicious coffee”. Finally, advertisement article information is generated by synthesizing the catch phrase and the advertisement material information (step R5). In this way, the advertisement article generation process is completed.
以上のような本発明の特徴的な動作は、プログラムを実行することによって行なわれる。このプログラムは、CD−ROMやDVD等の記録媒体に記録された状態で入手することができる。また、このようなプログラムは、ネットワークを構成する公衆電話回線、専用電話回線、ケーブルテレビ回線、無線通信回線等により構成される通信網等の伝送媒体を介して、送信装置であるコンピュータにより送信された信号を受信することで入手することもできる。 The characteristic operation of the present invention as described above is performed by executing a program. This program can be obtained in a state of being recorded on a recording medium such as a CD-ROM or a DVD. In addition, such a program is transmitted by a computer as a transmission device via a transmission medium such as a communication network including a public telephone line, a dedicated telephone line, a cable TV line, a wireless communication line, etc. constituting the network. It can also be obtained by receiving the received signal.
なお、上記の実施形態では、実数の範囲をとりうる印象値を用いて印象を判定しているが、それぞれ正の値をとるポジティブ値およびネガティブ値を用いて、両者の大小で印象を判定してもよい。 In the above embodiment, an impression is determined using an impression value that can take a real number range. However, an impression is determined based on the magnitude of both using a positive value and a negative value that take positive values. May be.
1 アフィリエイトシステム
100 作成者端末
200 Webサーバ
250 ユーザ端末
310 AIサーバ(広告記事生成システム)
311 文書情報取得部
312 文書情報蓄積部
313 単語解析部
315 キーワード抽出部
316 関連ワード抽出部
317 印象情報蓄積部
318 印象判定部
319 グループワード蓄積部
320 グループワード抽出部
322 広告特定部
324 広告抽出部
326 広告記事生成部
330 広告管理サーバ
332 広告情報受付部
335 広告情報蓄積部
340 広告配信サーバ
350 会員管理サーバ
1
311 Document
Claims (3)
前記文書情報を形態素解析により単語に分解する単語解析部と、
前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出部と、
前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出部と、
特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部と、
前記印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定部と、
特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部と、
前記グループワード蓄積部を参照して、前記判定された印象と同じ印象で前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出部と、
広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定部と、
前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出部と、
前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成部と、を備えることを特徴とする広告記事生成システム。 A document information acquisition unit that acquires document information of a website from a web server that enables browsing of the website;
A word analysis unit that decomposes the document information into words by morphological analysis;
A keyword extraction unit that extracts, as a keyword, a phrase that meets a predetermined condition from the set of decomposed words;
In the acquired document information, a related word extraction unit that extracts a phrase used in association with the keyword as a related word from the set of decomposed words;
An impression information storage unit that stores words that are likely to be used together with the specific word as a registered word in association with the specific word, and that stores a positive or negative impression degree for the specific word for each registered word; ,
An impression determination unit that refers to the impression information storage unit, comprehensively calculates the degree of impression with respect to the keyword for the related word, and determines an impression with respect to the keyword obtained from the document information;
A group word accumulation unit for accumulating positive and negative word groups for a specific phrase,
Referring to the group word storage unit, a group word extraction unit that extracts, as a group word, a plurality of words that are easily used with the keyword in the same impression as the determined impression;
For each advertisement, refer to an advertisement information storage unit that stores advertisement material information, an advertisement specifying unit that specifies a matched advertisement by matching the information obtained from the group word and the advertisement material information,
An advertisement extraction unit that extracts advertisement material information corresponding to the identified advertisement from the advertisement information storage unit;
An advertisement article generation unit that generates advertisement article information using the extracted advertisement material information and transmits the generated advertisement article information to the Web server that acquired the document information. Advertising article generation system.
Webサイトの文書情報を、前記Webサイトを閲覧可能にしているWebサーバから取得する文書情報取得ステップと、A document information acquisition step of acquiring document information of a Web site from a Web server that enables browsing of the Web site;
前記文書情報を形態素解析により単語に分解する単語解析ステップと、A word analysis step of decomposing the document information into words by morphological analysis;
前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出ステップと、A keyword extraction step of extracting a phrase that meets a predetermined condition as a keyword from the set of decomposed words;
前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出ステップと、In the acquired document information, a related word extracting step of extracting from the set of decomposed words as a related word a phrase used in association with the keyword;
特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定ステップと、An impression information storage unit that stores words that are easily used together with the specific word as a registered word in association with the specific word, and stores a positive or negative impression degree for the specific word for each registered word Referencing, comprehensively calculating the degree of impression of the keyword with respect to the related word, and an impression determination step of determining an impression of the keyword obtained from the document information;
特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部を参照して、前記判定された印象と同じ印象で、前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出ステップと、With reference to a group word storage unit that stores positive and negative word groups for a specific phrase, a plurality of phrases that are easy to use with the keyword with the same impression as the determined impression are extracted as group words. A group word extraction step;
広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定ステップと、For each advertisement, referring to an advertisement information storage unit that stores advertisement material information, an advertisement specifying step for specifying a matched advertisement by matching the information obtained from the group word and the advertisement material information;
前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出ステップと、An advertisement extraction step of extracting advertisement material information corresponding to the specified advertisement from the advertisement information storage unit;
前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成ステップと、を含む一連のステップを広告記事生成システムが行うことを特徴とする広告記事生成方法。An advertisement article generating step of generating advertisement article information using the extracted advertisement material information and transmitting the generated advertisement article information to the Web server that acquired the document information. An advertisement article generation method characterized by being performed by an article generation system.
Webサイトの文書情報を、前記Webサイトを閲覧可能にしているWebサーバから取得する文書情報取得処理と、Document information acquisition processing for acquiring document information of a Web site from a Web server that enables browsing of the Web site;
前記文書情報を形態素解析により単語に分解する単語解析処理と、A word analysis process for decomposing the document information into words by morphological analysis;
前記分解された単語の集合から、所定の条件に適合する語句をキーワードとして抽出するキーワード抽出処理と、A keyword extraction process for extracting, as a keyword, a phrase that meets a predetermined condition from the set of decomposed words;
前記取得された文書情報の中で、前記キーワードに関連して使用されている語句を関連ワードとして、前記分解された単語の集合から抽出する関連ワード抽出処理と、In the acquired document information, a related word extraction process for extracting a word / phrase used in association with the keyword as a related word from the set of decomposed words,
特定の語句に対応付けて、前記特定の語句とともに使用されやすい語句を登録ワードとして記憶し、かつ前記登録ワードごとに前記特定の語句に対するポジティブまたはネガティブの印象の程度を記憶する印象情報蓄積部を参照し、前記関連ワードについてキーワードに対する印象の程度を総合的に算出し、前記文書情報から得られる前記キーワードに対する印象を判定する印象判定処理と、An impression information storage unit that stores words that are easily used together with the specific word as a registered word in association with the specific word, and stores a positive or negative impression degree for the specific word for each registered word Referring to the related word, comprehensively calculating the degree of impression of the keyword, and impression determination processing for determining the impression of the keyword obtained from the document information;
特定の語句に対してポジティブおよびネガティブのワード群をそれぞれ蓄積するグループワード蓄積部を参照して、前記判定された前記キーワードに対する印象と同じ印象で、前記キーワードとともに使用されやすい複数の語句をグループワードとして抽出するグループワード抽出処理と、Referring to a group word storage unit that stores positive and negative word groups for a specific word and phrase, a plurality of words and phrases that are easy to use with the keyword with the same impression as the determined keyword. Group word extraction processing to be extracted as
広告ごとに、広告素材情報を蓄積する広告情報蓄積部を参照し、前記グループワードと前記広告素材情報から得られる情報とをマッチングしてマッチした広告を特定する広告特定処理と、For each advertisement, referring to an advertisement information storage unit that stores advertisement material information, an advertisement specifying process for specifying a matched advertisement by matching the information obtained from the group word and the advertisement material information;
前記特定された広告に対応する広告素材情報を、前記広告情報蓄積部から抽出する広告抽出処理と、An advertisement extraction process for extracting advertisement material information corresponding to the specified advertisement from the advertisement information storage unit;
前記抽出された広告素材情報を用いて広告記事情報を生成し、前記生成された広告記事情報を、前記文書情報を取得したWebサーバへ送信する広告記事生成処理と、を含む一連の処理を広告記事生成システムに実行させることを特徴とする広告記事生成プログラム。An advertisement article generation process that generates advertisement article information using the extracted advertisement material information, and transmits the generated advertisement article information to the Web server that acquired the document information. An advertisement article generation program which is executed by an article generation system.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006053026A JP4743766B2 (en) | 2006-02-28 | 2006-02-28 | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006053026A JP4743766B2 (en) | 2006-02-28 | 2006-02-28 | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2007233584A JP2007233584A (en) | 2007-09-13 |
JP4743766B2 true JP4743766B2 (en) | 2011-08-10 |
Family
ID=38554133
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006053026A Expired - Fee Related JP4743766B2 (en) | 2006-02-28 | 2006-02-28 | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4743766B2 (en) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8572112B2 (en) * | 2007-11-02 | 2013-10-29 | Microsoft Corporation | Syndicating search queries using web advertising |
JP2011090348A (en) * | 2007-12-25 | 2011-05-06 | J Magic Kk | System, server and method for advertisement management, program, and browsing client |
US20090248484A1 (en) * | 2008-03-28 | 2009-10-01 | Microsoft Corporation | Automatic customization and rendering of ads based on detected features in a web page |
KR20110015837A (en) * | 2009-08-10 | 2011-02-17 | 삼성전자주식회사 | Apparatus and method for sponsor-based advertising using extracted affection |
JP5559750B2 (en) * | 2011-07-12 | 2014-07-23 | ヤフー株式会社 | Advertisement processing apparatus, information processing system, and advertisement processing method |
CN108304363A (en) * | 2017-01-12 | 2018-07-20 | 北京跃盟科技有限公司 | Public sentiment public relations method and system |
CN112561549A (en) * | 2019-09-25 | 2021-03-26 | 北京国双科技有限公司 | Advertisement generation method, advertisement delivery method, advertisement generation device and advertisement delivery device |
JP6803998B1 (en) * | 2020-03-13 | 2020-12-23 | 株式会社ビデオリサーチ | Information processing device and information processing method |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167111A (en) * | 1999-12-09 | 2001-06-22 | Sharp Corp | Device/method for collecting information and related information database constructing method |
JP2002157498A (en) * | 2000-11-17 | 2002-05-31 | Nec Corp | Banner system, banner management method therefor and recording medium having banner management program recorded thereon |
JP2003157255A (en) * | 2001-11-20 | 2003-05-30 | Just Syst Corp | Device, method and program for processing information |
WO2005013150A1 (en) * | 2003-07-30 | 2005-02-10 | Google Inc. | Methods and systems for determining a meaning of a document to match the document to content |
JP2006500698A (en) * | 2002-09-24 | 2006-01-05 | グーグル、インコーポレイテッド | Method and apparatus for providing relevant advertisements |
-
2006
- 2006-02-28 JP JP2006053026A patent/JP4743766B2/en not_active Expired - Fee Related
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001167111A (en) * | 1999-12-09 | 2001-06-22 | Sharp Corp | Device/method for collecting information and related information database constructing method |
JP2002157498A (en) * | 2000-11-17 | 2002-05-31 | Nec Corp | Banner system, banner management method therefor and recording medium having banner management program recorded thereon |
JP2003157255A (en) * | 2001-11-20 | 2003-05-30 | Just Syst Corp | Device, method and program for processing information |
JP2006500698A (en) * | 2002-09-24 | 2006-01-05 | グーグル、インコーポレイテッド | Method and apparatus for providing relevant advertisements |
WO2005013150A1 (en) * | 2003-07-30 | 2005-02-10 | Google Inc. | Methods and systems for determining a meaning of a document to match the document to content |
Also Published As
Publication number | Publication date |
---|---|
JP2007233584A (en) | 2007-09-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI451275B (en) | System and method to facilitate matching of content to advertising information in a network | |
US7519588B2 (en) | Keyword characterization and application | |
US7007014B2 (en) | Canonicalization of terms in a keyword-based presentation system | |
JP4940399B2 (en) | Advertisement distribution apparatus and program | |
JP4743766B2 (en) | Impression determination system, advertisement article generation system, impression determination method, advertisement article generation method, impression determination program, and advertisement article generation program | |
JP4418135B2 (en) | Group forming system, group forming method, and group forming apparatus | |
JP4750814B2 (en) | Advertising method and system for exposing contextual advertising information | |
US20050267872A1 (en) | System and method for automated mapping of items to documents | |
US20140108143A1 (en) | Social content distribution network | |
WO2007108529A1 (en) | Information extraction system, information extraction method, information extraction program, and information service system | |
JP5442401B2 (en) | Behavior information extraction system and extraction method | |
KR101935937B1 (en) | System for providing advertisement information using opinion mining and a method thereof | |
US20130110594A1 (en) | Ad copy determination | |
JP2011108053A (en) | System for evaluating news article | |
KR20130033693A (en) | Method, apparatus and computer readable recording medium for search with exetension data-set of concept keywords | |
US20140214548A1 (en) | User Profiling Using Submitted Review Content | |
CN108470289B (en) | Virtual article issuing method and equipment based on E-commerce shopping platform | |
JP2010044585A (en) | Advertisement distribution device, advertisement distribution method and advertisement distribution control program | |
JP2009223537A (en) | Information providing system and information providing method | |
JP2007193697A (en) | Information collection apparatus, information collection method and program | |
JP4883644B2 (en) | RECOMMENDATION DEVICE, RECOMMENDATION SYSTEM, RECOMMENDATION DEVICE CONTROL METHOD, AND RECOMMENDATION SYSTEM CONTROL METHOD | |
JP2004280180A (en) | System for extracting keyword for advertisement, commercial copy delivery system, program for extracting keyword for advertisement, and commercial copy delivery program | |
JP2010015456A (en) | Information management system, advertisement output method and program | |
JP3461159B2 (en) | Web page attribute management device and web page attribute management method | |
JP2016197332A (en) | Information processing system, information processing method, and computer program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080826 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110125 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110316 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110405 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110506 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140520 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4743766 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313117 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |