JP5494100B2 - Information processing device - Google Patents
Information processing device Download PDFInfo
- Publication number
- JP5494100B2 JP5494100B2 JP2010070569A JP2010070569A JP5494100B2 JP 5494100 B2 JP5494100 B2 JP 5494100B2 JP 2010070569 A JP2010070569 A JP 2010070569A JP 2010070569 A JP2010070569 A JP 2010070569A JP 5494100 B2 JP5494100 B2 JP 5494100B2
- Authority
- JP
- Japan
- Prior art keywords
- language
- web page
- keyword
- unit
- translation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
本発明は、Webページの閲覧中にそのWebページの関連データの取得が指示された際に、そのWebページからキーワードを抽出してユーザに提示して、ユーザにより指定されたキーワードを用いて関連データを収集することができる情報処理装置に関する。 The present invention extracts a keyword from the Web page when the acquisition of the related data of the Web page is instructed while browsing the Web page, presents it to the user, and uses the keyword specified by the user The present invention relates to an information processing apparatus capable of collecting data.
世界のグローバル化が進む中で、様々な国でWebページが作成されて公開されるようになったことにより、近年の通信ネットワークにおいて様々な言語で記述されたWebページが混在している。また、多くの情報処理装置がブラウジング機能、Web検索機能を備えていて、ユーザによりキーワードが指定されることにより、その指定されたキーワードに関連するデータを言語を問わず容易に取得できるようになってきている。 With the globalization of the world progressing, web pages have been created and published in various countries, so that web pages written in various languages are mixed in recent communication networks. In addition, many information processing apparatuses have a browsing function and a Web search function, and when a keyword is designated by a user, data related to the designated keyword can be easily acquired regardless of the language. It is coming.
例えば特許文献1によると、検索対象データベースの記述言語と入力キーワードの記述言語とが異なる場合においても、入力キーワードに忠実な検索結果を出力させることが可能な情報検索装置が提案されている。この情報検索装置は、第1のデータ形式の検索要求に基づいて、第2のデータ形式の検索情報を生成する生成手段と、前記検索情報に基づいて、第2のデータ形式のデータを検索する検索手段と、前記第2のデータ形式の検索結果を前記第1のデータ形式に変換する変換手段と、前記第1のデータ形式の検索要求に基づいて、前記第1のデータ形式に変換された検索結果を評価する評価手段とを備えたものである。 For example, according to Patent Document 1, an information search apparatus capable of outputting a search result faithful to an input keyword even when the description language of the search target database is different from the description language of the input keyword is proposed. The information search device searches for data in the second data format based on the search means and generation means for generating search information in the second data format based on the search request in the first data format. Search means, conversion means for converting the search result in the second data format into the first data format, and conversion into the first data format based on the search request in the first data format And an evaluation means for evaluating the search result.
Webページの閲覧中に、そのWebページに含まれている複数のキーワードを抽出して、それらのキーワードの関連データについて検索エンジンを用いて容易に収集できる情報処理装置において、閲覧中のWebページの記述言語がシステムに対応していなかった場合には、キーワードの抽出を行えないという問題があった。また、閲覧中のWebページの記述言語がシステムに対応していても、その言語がユーザの母国語でなかった場合は、例えキーワードを抽出できてもユーザが各々のキーワードの意味を理解できない可能性があるという問題もあった。 While browsing a web page, an information processing apparatus that extracts a plurality of keywords included in the web page and easily collects related data of these keywords using a search engine. If the description language is not compatible with the system, there is a problem that keywords cannot be extracted. Also, even if the description language of the Web page being browsed is compatible with the system, if the language is not the user's native language, even if keywords can be extracted, the user may not understand the meaning of each keyword There was also a problem of having sex.
本発明は、上記課題を鑑みてなされてものであり、閲覧中のWebページの言語に関わらず、その閲覧中のWebページに関連するデータを容易に収集することができる情報処理装置を提供することを目的とする。 The present invention has been made in view of the above problems, and provides an information processing apparatus capable of easily collecting data related to a web page being browsed regardless of the language of the web page being browsed. For the purpose.
上記課題を解決するために、本発明に係る情報処理装置は、閲覧中のWebページの記述言語が所定の原語か否かを判断し、所定の原語ではない場合、前記Webページコンテンツを前記所定の原語に翻訳した翻訳コンテンツを取得する原語処理手段と、前記所定の原語のWebページ中の文または所定の原語に翻訳した翻訳文キーワードを抽出する抽出手段と、前記抽出手段により抽出されたキーワードを用いた検索クエリを生成し、前記キーワードに関連するWebページを収集する収集手段とを備えることを特徴とする。 In order to solve the above-described problem, the information processing apparatus according to the present invention determines whether or not a description language of a Web page being browsed is a predetermined original language, and if the predetermined language is not the predetermined language, the Web page content is determined to be the predetermined language. Original language processing means for acquiring translated content translated into the original language, extraction means for extracting a sentence in the Web page of the predetermined original language or a translated sentence keyword translated into the predetermined original language, and a keyword extracted by the extracting means And a collection means for collecting a Web page related to the keyword.
本発明に係る情報処理装置によると、閲覧中のWebページの言語に関わらず、その閲覧中のWebページに関連するデータを容易に収集することが可能となる。 According to the information processing apparatus according to the present invention, it is possible to easily collect data related to a web page being browsed regardless of the language of the web page being browsed.
本発明に係る情報処理装置の実施形態について、添付図面を参照しながら説明する。本発明に係る情報処理装置として、ブラウジング機能、Web検索機能を備えた携帯電話機1を例に挙げて説明する。 Embodiments of an information processing apparatus according to the present invention will be described with reference to the accompanying drawings. As an information processing apparatus according to the present invention, a mobile phone 1 having a browsing function and a Web search function will be described as an example.
図1は、携帯電話機1の斜視図である。携帯電話機1は、図1に示すように、矩形の板状の筐体10を備えている。筐体10の一方の面には、データを表示するとともに入力媒体の接触を検出することによりデータを入力するタッチスクリーン11、音声を出力するスピーカ12、音声を入力するマイクロフォン13及びデータを入力する操作キー14が設けられている。
FIG. 1 is a perspective view of the mobile phone 1. As shown in FIG. 1, the mobile phone 1 includes a rectangular plate-
タッチスクリーン11は、画面にデータを表示する表示機能、及び、ユーザが指や専用ペンなどの入力媒体を画面に接触させた際にその接触位置を検出することによりその接触位置に対応するデータを入力する入力機能の双方の機能を備えている。接触を検知する方法は、静電気により検知する方法でも感圧により検知する方法でも良く、または赤外線を用いた方法でも良く、その他の方法でも良い。
The
操作キー14は、ユーザによる物理的な押下によりデータを入力するキーであっても、静電気または感圧により入力媒体の接触を検知してデータを入力するキーであっても良い。操作キー14は、例えば電源のON/OFFを切り替えたり待機状態から復帰したりするための電源キーや、発呼を開始するための発呼キーなどである。
The
図2は、携帯電話機1の全体構成を示すブロック図である。図2に示すように、携帯電話機1は、主制御部20、電源回路部21、操作入力制御部22、表示制御部23、音声制御部24、通信制御部25及び記憶部26が相互に通信可能に接続されて構成されている。
FIG. 2 is a block diagram showing the overall configuration of the mobile phone 1. As shown in FIG. 2, in the mobile phone 1, the
主制御部20は、CPU(Central Processing Unit)を具備し、携帯電話機1の総括的な制御を行うとともに、後述する関連データ収集処理や、その他の様々な演算処理や制御処理等を行う。電源回路部21は、電源供給源(バッテリ等)を備え、所定の操作キー14(例えば電源キー)を介した入力に基づいて携帯電話機1の電源のON/OFF状態を切り替え、電源がON状態の場合に電力供給源から各部に対して電力を供給して、携帯電話機1を動作可能にする。
The
操作入力制御部22はタッチスクリーン11に対する入力インタフェースを備え、タッチスクリーン11の画面上で接触を検知すると、接触があった位置を示す信号を生成して主制御部20に伝送する。また、操作入力制御部22は操作キー14に対する入力インタフェースを備え、操作キー14のいずれかが押下されたことを検知すると、その押下された操作キー14を示す信号を生成して主制御部20に伝送する。これらの信号を受信した主制御部20は、それらの信号に基づいて処理を行う。
The operation
表示制御部23はタッチスクリーン11に対する表示インタフェースを備え、主制御部20の制御に基づいて、データをタッチスクリーン11に表示させる。
The
音声制御部24は、主制御部20の制御に基づいて、マイクロフォン13で集音されたデジタル音声信号に処理を施して主制御部20へ出力する。また音声制御部24は、デジタル音声信号を取得すると、主制御部20の制御に基づいてスピーカ12から音声として出力する。
The
通信制御部25は、主制御部20の制御に基づいて、基地局からアンテナ25aを介して受信した受信信号を復号化処理してデータを復元する。このデータは、主制御部20の指示により、音声制御部24に伝送されてスピーカ12から出力されたり、表示制御部23に伝送されてタッチスクリーン11に表示されたり、または記憶部26に記録されたりする。また通信制御部25は、主制御部20の制御に基づいて、マイクロフォン13で集音された音声データやタッチスクリーン11を介して入力されたデータや記憶部26に記憶されたデータを取得すると、これらのデータに対して符号化処理を行い、基地局に対してアンテナ25aを介して送信する。
Based on the control of the
記憶部26は、主制御部20が行う処理について、処理プログラムや処理に必要なデータ等を格納するROM(Read Only Memory)やハードディスク、不揮発性メモリ、データベース、主制御部20が処理を行う際に使用されるデータを一時的に記憶するRAM(Random Access Memory)等から構成される。また、主制御部20が後述する関連データ収集処理を行う際の処理プログラム、関連データ収集処理で用いられる母国語(例えば日本語)の辞書データ、所定の外国語(例えば英語)の辞書データは、例えばROMに記憶されているものとする。
The
図3は、主制御部20の制御によって関連データ収集機能を実現するためのソフトウェア構成を示すブロック図である。携帯電話機1は、図3に示すように、Webページ入力部30、設定情報記憶部31、言語判別部32、母国語キーワード抽出部33、外国語キーワード抽出部34、翻訳装置通信部35、キーワード表示選択部36、検索クエリ生成部37、検索結果解析表示部38を有している。
FIG. 3 is a block diagram showing a software configuration for realizing the related data collection function under the control of the
Webページ入力部30は、タッチスクリーン11を介してWebページアドレスが入力された際、または記憶部26に記憶されているWebページアドレスが選択された際に、そのWebページアドレスをブラウジング機能に入力してWebサイトからWebページデータを取得する。そしてWebページ入力部30は、ブラウジング機能によりタッチスクリーン11にWebページのコンテンツを表示させる。
When a web page address is input via the
設定情報記憶部31は、関連データ収集処理の際に使用される、言語に関する設定情報40を記憶している。図4は、設定情報40の一例を示すデータ構成図である。図4に示すように、設定情報40は、各々の言語を示す言語情報41に対して、母国語か否かを示す母国語情報42、翻訳が必要か否かを示す翻訳情報43、Webページの記述言語として指定される言語タグを示す言語タグ情報44、Webページの作成に使用される文字コードを示す文字コード情報45がそれぞれ対応付けられた情報である。母国語情報42は、各々の言語に対して、ユーザの母国語である場合は「○」で、母国語でない場合は「×」で示される。翻訳情報43は、各々の言語に対して、携帯電話機1のシステムが対応していない言語であるため翻訳が必要な場合は「要」で、携帯電話機1のシステムが対応しているため翻訳が不要な場合は「不要」で示される。
The setting
例えば図4によると、日本語が母国語で翻訳が不要な言語である旨、英語が母国語でなく翻訳が不要な言語である旨、ドイツ語が母国語でなく翻訳が必要な言語である旨がそれぞれ設定されている。すなわち、携帯電話機1のユーザは日本語を母国語としていることがわかる。また、日本語と英語には翻訳が不要であるが、ドイツ語には翻訳が必要なことがわかる。 For example, according to FIG. 4, Japanese is a native language and no translation is required, English is not a native language and no translation is required, and German is a native language that requires translation. Each is set. That is, it can be seen that the user of the mobile phone 1 uses Japanese as his native language. It can also be seen that Japanese and English do not require translation, but German requires translation.
言語判別部32は、Webページ入力部により入力されたWebページに含まれる言語タグ(例えばWebページデータに属性として付されているもの)から、設定情報40を用いてそのWebページの記述言語を判別するとともに、翻訳する必要があるか否かを判別する。
The
母国語キーワード抽出部33は、母国語で記載されたWebページの中からキーワード群を抽出する。外国語キーワード抽出部34は、外国語(母国語以外の言語)で記載されたWebページの中からキーワード群を抽出する。翻訳装置通信部35は、Webページを翻訳する必要がある場合に、Webページコンテンツから翻訳クエリを生成して、翻訳装置に対してその翻訳クエリを送信することにより、Webページコンテンツを母国語に翻訳するように翻訳装置に指示する。母国語キーワード抽出部33は、翻訳装置通信部35の指示により翻訳装置から返送された翻訳後のWebページコンテンツ(母国語)を受信すると、受信したWebページコンテンツからキーワード群を抽出する。
The native language
キーワード表示選択部36は、母国語キーワード抽出部33または外国語キーワード抽出部34により抽出されたキーワード群をタッチスクリーン11に表示させ、ユーザにいずれかのキーワードの選択を促す。検索クエリ生成部37は、ユーザによりキーワードが選択されると、選択されたキーワードから検索クエリを生成して、検索エンジン200に対してその検索クエリを送信する。検索結果表示部38は、検索エンジン200から検索結果を受信すると、検索結果を解析しタッチスクリーン11に表示させる。
The keyword
なお、翻訳装置は、携帯電話機1から翻訳元データ(例えばドイツ語)を受信するとともに翻訳後の言語(例えば日本語)が指定されると、翻訳元データをドイツ語から日本語に翻訳して、翻訳後の日本語のデータを携帯電話機1に送信する装置である。翻訳装置は、携帯電話機1とは別個に設けられた装置であっても携帯電話機1に内蔵された装置であっても良い。検索エンジン200は、予め多くのデータを記憶していて、携帯電話機1からキーワードを受信すると、記憶されたデータからそのキーワードに関連するデータを抽出してそれらのデータのリストを携帯電話機1に対して送信する装置であり、携帯電話機1とは別個に設けられた装置である。
The translation device receives translation source data (for example, German) from the mobile phone 1 and translates the translation source data from German to Japanese when a translated language (for example, Japanese) is designated. This is a device for transmitting translated Japanese data to the mobile phone 1. The translation device may be a device provided separately from the mobile phone 1 or a device built in the mobile phone 1. When the
携帯電話機1は、ユーザが携帯電話機1を用いてWebページを閲覧している際、そのWebページの関連ページの表示が指示された場合に、その閲覧中のWebページからキーワードを抽出して関連データを収集する。携帯電話機1がこの関連データ収集処理を行う際の手順について、図5に示すフローチャートに基づいて詳細に説明する。 When a user browses a web page using the cellular phone 1 and the user is instructed to display a related page of the web page, the cellular phone 1 extracts a keyword from the web page being browsed and Collect data. A procedure when the mobile phone 1 performs the related data collection processing will be described in detail based on the flowchart shown in FIG.
Webページをタッチスクリーン11に表示しているときに、現在表示しているWebページに関連するページの表示を指示する操作をタッチスクリーン11または操作キー14が受け付けると、Webページ入力部30に対して関連ページの表示の指示があったことを通知する。
When the
関連ページの表示の指示があった場合(S101;Yes)、言語判別部32は、閲覧中のWebページの言語を判別する。まず言語判別部32は、閲覧中のページが母国語で記載されているか否かを判断する(S103)。この際、言語判別部32は、例えば閲覧中のWebページに含まれる言語タグに基づいて言語を識別し、設定情報40においてその言語が母国語に設定されていた場合に、閲覧中のWebページが母国語で記載されているものと判断する。例えば図4に示す設定情報40によると、日本語が母国語であるため、閲覧中のページが日本語で書かれていた場合に、母国語で記載されているものと判断される。
When there is an instruction to display the related page (S101; Yes), the
閲覧中のページが母国語で記載されている場合(S103;Yes)は、母国語キーワード抽出部33は、閲覧中のWebページコンテンツから母国語のキーワードを抽出する(S105)。この際、母国語キーワード抽出部33は、例えば記憶部26に記憶されている母国語の辞書データを使用したり、Webページコンテンツについて形態素解析を行ったりすることによって、単語を抽出すると良い。または、「は」、「が」、「で」、「に」等の格助詞を判別してその直前の名詞を抽出するようにしても良い。
When the page being browsed is described in the native language (S103; Yes), the native language
閲覧中のページが母国語で記載されていなかった場合(S103;No)は、言語判別部32は、閲覧中のページが翻訳不要な外国語で記載されているか否かを判断する(S107)。この際、言語判別部32は、例えばステップS103にて識別された言語が設定情報40において翻訳不要に設定されていた場合に、閲覧中のページが翻訳不要な外国語で記載されているものと判断する。例えば図4に示す設定情報40によると、日本語及び英語が翻訳不要に設定されているため、閲覧中のページが日本語または英語で書かれていた場合に翻訳不要だと判断され、ドイツ語で書かれていた場合に翻訳が必要だと判断される。
When the page being browsed is not described in the native language (S103; No), the
閲覧中のページが翻訳不要な外国語で記載されていた場合(S107;Yes)は、外国語キーワード抽出部34は、閲覧中のWebページコンテンツからその外国語のキーワードを抽出する(S109)。この際、外国語キーワード抽出部34は、例えば記憶部26に記憶されている外国語の辞書データを使用し、Webページコンテンツについて形態素解析を行ったりすることにより、単語を抽出すると良い。
If the page being browsed is written in a foreign language that does not require translation (S107; Yes), the foreign language
閲覧中のページが翻訳不要な外国語で記載されていなかった場合(S107;No)は、翻訳が必要であるため、翻訳装置通信部35は外部の翻訳装置を用いて閲覧中のWebページコンテンツを翻訳する(S111)。このとき、翻訳装置通信部35は、閲覧中のWebページコンテンツを含んだ翻訳クエリを生成して翻訳装置に送信して、Webページコンテンツを母国語に翻訳するように翻訳装置に依頼する。この翻訳クエリを受信した翻訳装置は、翻訳クエリに含まれるWebページコンテンツを指定された母国語に翻訳して携帯電話機1に返信する。
If the page being browsed is not described in a foreign language that does not require translation (S107; No), translation is necessary, so the translation
なお、携帯電話機1と翻訳装置との通信の際には、翻訳装置通信部35は、Webブラウザを介さず、バックグラウンドで翻訳前後のWebページコンテンツのうちの文字列情報のみを送受信して、母国語キーワード抽出部33に翻訳後のWebページコンテンツを入力させることで、HTML(HyperText Markup Language)のファイルに参照として含まれる画像データの読み込みを省略してキーワードの抽出を行う。これにより、翻訳処理にかかる時間を短縮することができる。
In the communication between the mobile phone 1 and the translation device, the translation
携帯電話機1が翻訳装置から母国語に翻訳されたWebページコンテンツを受信すると、母国語キーワード抽出部34は、受信した母国語のWebページコンテンツから母国語のキーワードを抽出する(S105)。
When the mobile phone 1 receives the Web page content translated into the native language from the translation device, the native language
ステップS105またはS109にてキーワードが抽出されると、キーワード表示選択部36は、タッチスクリーン11にキーワードを表示させる(S113)。閲覧中のWebページの言語と抽出されたキーワードの言語とがそれぞれ異なっている場合には、抽出されたキーワードが、閲覧中のWebページにおいてそのキーワードに該当する文字列に対応付けて表示されると良い。
When a keyword is extracted in step S105 or S109, the keyword
ユーザは、タッチスクリーン11の画面を触れることで、表示されたキーワードからいずれかのキーワードを選択することができる。キーワード表示選択部36は、ユーザによりいずれかのキーワードが選択されたか否かを判断する(S115)。キーワードが選択されていない場合(S115;No)、キーワード表示選択部36はキーワードが選択されるまで待機する。
The user can select any keyword from the displayed keywords by touching the screen of the
キーワードが選択された場合(S115;Yes)、検索クエリ生成部37は、検索エンジン200を用いて、選択されたキーワードについて検索する(S117)。このとき、検索クエリ生成部37は、ユーザにより選択されたキーワードを含んだ検索クエリを生成して検索エンジン200に送信して、選択されたキーワードについて検索するように検索エンジン200に依頼する。この検索クエリを受信した検索エンジン200は、検索クエリに含まれるキーワードに関連のあるデータを抽出して検索結果として携帯電話機1に返信する。そして、携帯電話機1が検索エンジン200から検索結果(URLのリストやWebページ)を受信すると、検索結果解析表示部38は、タッチスクリーン11に検索結果を表示させる(S119)。なお、検索結果として表示させる情報は、母国語で記載されているWebページや、母国後で記載されているWebページのURLを含むリストに限定されても良い。
When a keyword is selected (S115; Yes), the search
このようにして携帯電話機1は、Webページの閲覧中にユーザにより関連ページの表示を指示された際に、そのWebページが母国語(例えば日本語)で記載されているか、母国語ではないが翻訳不要な言語(例えば英語)で記載されているか、翻訳が必要な言語(例えばドイツ語)で記載されているか、の3つに場合分けした上で検索を行う。携帯電話機1は、閲覧中のWebページが母国語(例えば日本語)で記載されている場合、予め記憶されている母国語の辞書データを用いて母国語のキーワードを抽出し、母国語ではないが翻訳不要な言語(例えば英語)で記載されている場合、予め記憶されている外国語の辞書データを用いて外国語のキーワードを抽出し、翻訳が必要な言語(例えばドイツ語)で記載されている場合、そのWebページコンテンツを翻訳装置を用いて母国語に翻訳した後に予め記憶されている母国語の辞書データを用いて母国語のキーワードを抽出する。そして携帯電話機1は、抽出されたキーワードをユーザに提示してユーザにより選択されたキーワードについて検索エンジン200を用いて検索する。
In this way, when the mobile phone 1 is instructed to display a related page by the user while browsing the Web page, the Web page is written in the native language (for example, Japanese) or is not the native language. The search is performed after dividing into three cases: whether it is described in a language that does not require translation (for example, English) or in a language that requires translation (for example, German). When the web page being browsed is written in the native language (for example, Japanese), the cellular phone 1 extracts the native language keyword using dictionary data of the native language stored in advance, and is not the native language. Is written in a language that does not require translation (for example, English), a foreign language keyword is extracted using foreign language dictionary data stored in advance and written in a language that requires translation (for example, German). If the web page content is translated into the native language using a translation device, the native language keyword is extracted using the dictionary data of the native language stored in advance. Then, the mobile phone 1 presents the extracted keyword to the user and searches for the keyword selected by the user using the
本発明の上記のような構成により、閲覧中のWebページが、ユーザが理解できない言語で記載されたWebページであっても、バックグラウンドでそのWebページコンテンツを母国語に翻訳した上で母国語のキーワードを抽出することにより、ユーザは、閲覧中のWebページに関連のある母国語のデータを容易に入手することが可能になる。 With the above-described configuration of the present invention, even if the web page being browsed is a web page written in a language that the user cannot understand, the native language is obtained by translating the web page content into the native language in the background. By extracting this keyword, the user can easily obtain native language data related to the Web page being browsed.
なお、閲覧中のWebページがユーザが理解できない言語で記載されていた場合に、そのWebページのコンテンツ自体を翻訳させて表示させることも考えられるが、現状での機械翻訳の精度はユーザが違和感無く文章を読める程度に十分ではない。しかしながら、現状での機械翻訳の精度は、Webページコンテンツから重要なキーワードを抽出する分には十分である。よって、携帯電話機1がWebページから抽出されたキーワードを用いて母国語で記載された関連ページを取得することにより、ユーザに有用な情報を提供することができる。 If the web page being browsed is written in a language that the user cannot understand, the content of the web page itself may be translated and displayed. However, the accuracy of machine translation at present is uncomfortable for the user. Not enough to read the text. However, the accuracy of machine translation at present is sufficient to extract important keywords from Web page contents. Therefore, the mobile phone 1 can provide useful information to the user by acquiring the related page described in the native language using the keyword extracted from the Web page.
本発明に係る情報処理装置(携帯電話機1)によると、閲覧中のWebページがユーザが理解できない外国語で記載されていた場合であっても、バックグラウンドでWebページコンテンツを母国語に翻訳して、Webページコンテンツから母国語のキーワードを抽出して検索することで、閲覧中のWebページに関連する母国語のデータを容易に収集することが可能となる。 According to the information processing apparatus (mobile phone 1) according to the present invention, even when the web page being browsed is written in a foreign language that the user cannot understand, the web page content is translated into the native language in the background. Thus, by extracting and searching the native language keyword from the web page content, it becomes possible to easily collect native language data related to the web page being browsed.
本発明の説明として、携帯電話機1について説明したが、これに限らず、PHS(Personal Handyphone System)、PDA(Personal Digital Assistants)、携帯ゲーム機、携帯音楽録再機など、ブラウジング機能、Web検索機能を備えている情報処理装置であれば、任意の情報処理装置であっても良い。 As an explanation of the present invention, the mobile phone 1 has been described. However, the present invention is not limited to this, but a browsing function, a Web search function, etc. Any information processing apparatus may be used as long as the information processing apparatus includes the information processing apparatus.
1…携帯電話機,10…筐体,11…タッチスクリーン,12…スピーカ,13…マイクロフォン,14…操作キー、20…主制御部,21…電源回路部,22…操作入力制御部,23…表示制御部,24…音声制御部,25…通信制御部,25a…アンテナ,26…記憶部,30…Webページ入力部,31…設定情報記憶部,32…言語判別部,33…母国語キーワード抽出部,34…外国語キーワード抽出部,35…翻訳装置通信部,36…キーワード表示選択部,37…検索クエリ生成部,38…検索結果解析表示部,40…設定情報,200…検索エンジン。 DESCRIPTION OF SYMBOLS 1 ... Mobile phone, 10 ... Housing | casing, 11 ... Touch screen, 12 ... Speaker, 13 ... Microphone, 14 ... Operation key, 20 ... Main control part, 21 ... Power supply circuit part, 22 ... Operation input control part, 23 ... Display Control unit, 24 ... Voice control unit, 25 ... Communication control unit, 25a ... Antenna, 26 ... Storage unit, 30 ... Web page input unit, 31 ... Setting information storage unit, 32 ... Language discrimination unit, 33 ... Native language keyword extraction 34: Foreign language keyword extraction unit, 35 ... Translation device communication unit, 36 ... Keyword display selection unit, 37 ... Search query generation unit, 38 ... Search result analysis display unit, 40 ... Setting information, 200 ... Search engine.
Claims (3)
閲覧中のWebページの記述言語が前記第2外国語か否かを判断し、前記第2外国語である場合、前記Webページのコンテンツを前記母国語に翻訳した翻訳コンテンツを取得する言語処理手段と、
前記Webページの記述言語が前記第2外国語でない場合には、前記Webページのコンテンツから、前記Webページの記述言語に応じて、前記母国語のキーワード又は第1外国語のキーワードを抽出し、前記Webページの記述言語が前記第2外国語である場合には、前記母国語に翻訳した翻訳コンテンツから母国語のキーワードを抽出する抽出手段と、
前記抽出手段により抽出された前記母国語又は前記第1外国語のキーワードを用いた検索クエリを生成し、該キーワードに関連するWebページを収集する収集手段とを備えることを特徴とする情報処理装置。 Setting means for setting one of the languages corresponding to the system of the information processing apparatus as a native language, a first foreign language, or a second foreign language;
Description language of the Web page being viewed, it is determined whether or not the second foreign language, said if the second is a foreign language, language processing means for obtaining a translation content that the translation of the content of the Web page in the native language When,
If the description language of the Web page is not the second foreign language, the native language keyword or the first foreign language keyword is extracted from the content of the Web page according to the description language of the Web page, When the description language of the Web page is the second foreign language, an extraction unit that extracts a native language keyword from the translated content translated into the native language ;
An information processing apparatus comprising: a collection unit configured to generate a search query using the keyword of the native language or the first foreign language extracted by the extraction unit and collect a Web page related to the keyword .
前記表示手段により表示されたキーワードのうちのいずれかの選択を受け付ける受付手段とを備え、
前記収集手段は、前記受付手段により受け付けられたキーワードの関連情報を検索することを特徴とする請求項1記載の情報処理装置。 Display means for displaying the keywords extracted by the extraction means;
Receiving means for receiving selection of any of the keywords displayed by the display means,
The information processing apparatus according to claim 1, wherein the collecting unit searches for related information of the keyword received by the receiving unit.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010070569A JP5494100B2 (en) | 2010-03-25 | 2010-03-25 | Information processing device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2010070569A JP5494100B2 (en) | 2010-03-25 | 2010-03-25 | Information processing device |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011204001A JP2011204001A (en) | 2011-10-13 |
JP5494100B2 true JP5494100B2 (en) | 2014-05-14 |
Family
ID=44880578
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2010070569A Expired - Fee Related JP5494100B2 (en) | 2010-03-25 | 2010-03-25 | Information processing device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5494100B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8806188B2 (en) | 2011-08-31 | 2014-08-12 | Sonic Ip, Inc. | Systems and methods for performing adaptive bitrate streaming using automatically generated top level index files |
KR20190097320A (en) | 2015-01-06 | 2019-08-20 | 디브이엑스, 엘엘씨 | Systems and methods for encoding and sharing content between devices |
JP2020154629A (en) * | 2019-03-19 | 2020-09-24 | 富士ゼロックス株式会社 | Document search assist apparatus and program, and document search assist system |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05165889A (en) * | 1991-12-13 | 1993-07-02 | Canon Inc | Document retrieval device |
JPH10187752A (en) * | 1996-12-24 | 1998-07-21 | Kokusai Denshin Denwa Co Ltd <Kdd> | Inter-language information retrieval backup system |
JPH10269237A (en) * | 1997-03-27 | 1998-10-09 | Hitachi Ltd | Document browsing system |
JP3647283B2 (en) * | 1998-09-21 | 2005-05-11 | シャープ株式会社 | Document information extraction device |
JP4073635B2 (en) * | 2000-02-29 | 2008-04-09 | 富士通株式会社 | Relay device, server device, terminal device, and translation server system using the same |
JP2002041518A (en) * | 2000-07-21 | 2002-02-08 | Toshiba Corp | Providing method for site information |
JP2005011138A (en) * | 2003-06-20 | 2005-01-13 | Brother Ind Ltd | Multi-language information retrieval system, multi-language information retrieval method and multi-language information retrieval program |
JP2005050221A (en) * | 2003-07-30 | 2005-02-24 | Nec Corp | Search retrieval system in transmission and reception of telephone and e-mail |
JP5161658B2 (en) * | 2008-05-30 | 2013-03-13 | 株式会社東芝 | Keyword input support device, keyword input support method, and program |
-
2010
- 2010-03-25 JP JP2010070569A patent/JP5494100B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011204001A (en) | 2011-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101526879B (en) | Speech input interface on a device | |
CN102609208B (en) | Method and system for word capture on screen of touch screen equipment, and touch screen equipment | |
US20140320413A1 (en) | Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device | |
JP6051338B2 (en) | Page rollback control method, page rollback control device, terminal, program, and recording medium | |
US20090222257A1 (en) | Speech translation apparatus and computer program product | |
CN103841656A (en) | Mobile terminal and data processing method thereof | |
WO2010060043A2 (en) | Personal dictionary and translator device | |
CN109165292A (en) | Data processing method, device and mobile terminal | |
CN102414994A (en) | Input processing method of mobile terminal and device for performing same | |
CN106055721A (en) | Accessible webpage processing method and relevant equipment | |
CN112632445A (en) | Webpage playing method, device, equipment and storage medium | |
CN106708885A (en) | Method and device for achieving searching | |
KR20140100315A (en) | Mobile terminal and control method thereof | |
US9310971B2 (en) | Document viewing device for display document data | |
JP5494100B2 (en) | Information processing device | |
US10140265B2 (en) | Apparatuses and methods for phone number processing | |
KR102267849B1 (en) | Data extraction method, device and terminal device | |
KR20140060217A (en) | System and method for posting message by audio signal | |
CN108737634B (en) | Voice input method and device, computer device and computer readable storage medium | |
KR20100117335A (en) | Search relay server requesting search result to search site based on text comprising search word | |
EP3996354B1 (en) | Electronic device and method for extracting and using semantic entity in text message of electronic device | |
KR20170029866A (en) | Server, user terminal and a method for controlling thereof | |
JP2009009170A (en) | Information retrieval system and server device | |
CN108614831A (en) | Semantic primitive display methods and device, the device shown for semantic primitive | |
JP5084859B2 (en) | Information processing apparatus, data extraction method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20121128 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20131112 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131226 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20140204 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20140217 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5494100 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |