Nothing Special   »   [go: up one dir, main page]

JP5494100B2 - Information processing device - Google Patents

Information processing device Download PDF

Info

Publication number
JP5494100B2
JP5494100B2 JP2010070569A JP2010070569A JP5494100B2 JP 5494100 B2 JP5494100 B2 JP 5494100B2 JP 2010070569 A JP2010070569 A JP 2010070569A JP 2010070569 A JP2010070569 A JP 2010070569A JP 5494100 B2 JP5494100 B2 JP 5494100B2
Authority
JP
Japan
Prior art keywords
language
web page
keyword
unit
translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010070569A
Other languages
Japanese (ja)
Other versions
JP2011204001A (en
Inventor
健太郎 竹田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Mobile Communications Ltd
Original Assignee
Fujitsu Mobile Communications Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Mobile Communications Ltd filed Critical Fujitsu Mobile Communications Ltd
Priority to JP2010070569A priority Critical patent/JP5494100B2/en
Publication of JP2011204001A publication Critical patent/JP2011204001A/en
Application granted granted Critical
Publication of JP5494100B2 publication Critical patent/JP5494100B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、Webページの閲覧中にそのWebページの関連データの取得が指示された際に、そのWebページからキーワードを抽出してユーザに提示して、ユーザにより指定されたキーワードを用いて関連データを収集することができる情報処理装置に関する。   The present invention extracts a keyword from the Web page when the acquisition of the related data of the Web page is instructed while browsing the Web page, presents it to the user, and uses the keyword specified by the user The present invention relates to an information processing apparatus capable of collecting data.

世界のグローバル化が進む中で、様々な国でWebページが作成されて公開されるようになったことにより、近年の通信ネットワークにおいて様々な言語で記述されたWebページが混在している。また、多くの情報処理装置がブラウジング機能、Web検索機能を備えていて、ユーザによりキーワードが指定されることにより、その指定されたキーワードに関連するデータを言語を問わず容易に取得できるようになってきている。   With the globalization of the world progressing, web pages have been created and published in various countries, so that web pages written in various languages are mixed in recent communication networks. In addition, many information processing apparatuses have a browsing function and a Web search function, and when a keyword is designated by a user, data related to the designated keyword can be easily acquired regardless of the language. It is coming.

例えば特許文献1によると、検索対象データベースの記述言語と入力キーワードの記述言語とが異なる場合においても、入力キーワードに忠実な検索結果を出力させることが可能な情報検索装置が提案されている。この情報検索装置は、第1のデータ形式の検索要求に基づいて、第2のデータ形式の検索情報を生成する生成手段と、前記検索情報に基づいて、第2のデータ形式のデータを検索する検索手段と、前記第2のデータ形式の検索結果を前記第1のデータ形式に変換する変換手段と、前記第1のデータ形式の検索要求に基づいて、前記第1のデータ形式に変換された検索結果を評価する評価手段とを備えたものである。   For example, according to Patent Document 1, an information search apparatus capable of outputting a search result faithful to an input keyword even when the description language of the search target database is different from the description language of the input keyword is proposed. The information search device searches for data in the second data format based on the search means and generation means for generating search information in the second data format based on the search request in the first data format. Search means, conversion means for converting the search result in the second data format into the first data format, and conversion into the first data format based on the search request in the first data format And an evaluation means for evaluating the search result.

特許第3181548号公報Japanese Patent No. 3181548

Webページの閲覧中に、そのWebページに含まれている複数のキーワードを抽出して、それらのキーワードの関連データについて検索エンジンを用いて容易に収集できる情報処理装置において、閲覧中のWebページの記述言語がシステムに対応していなかった場合には、キーワードの抽出を行えないという問題があった。また、閲覧中のWebページの記述言語がシステムに対応していても、その言語がユーザの母国語でなかった場合は、例えキーワードを抽出できてもユーザが各々のキーワードの意味を理解できない可能性があるという問題もあった。   While browsing a web page, an information processing apparatus that extracts a plurality of keywords included in the web page and easily collects related data of these keywords using a search engine. If the description language is not compatible with the system, there is a problem that keywords cannot be extracted. Also, even if the description language of the Web page being browsed is compatible with the system, if the language is not the user's native language, even if keywords can be extracted, the user may not understand the meaning of each keyword There was also a problem of having sex.

本発明は、上記課題を鑑みてなされてものであり、閲覧中のWebページの言語に関わらず、その閲覧中のWebページに関連するデータを容易に収集することができる情報処理装置を提供することを目的とする。   The present invention has been made in view of the above problems, and provides an information processing apparatus capable of easily collecting data related to a web page being browsed regardless of the language of the web page being browsed. For the purpose.

上記課題を解決するために、本発明に係る情報処理装置は、閲覧中のWebページの記述言語が所定の原語か否かを判断し、所定の原語ではない場合、前記Webページコンテンツを前記所定の原語に翻訳した翻訳コンテンツを取得する原語処理手段と、前記所定の原語のWebページ中の文または所定の原語に翻訳した翻訳文キーワードを抽出する抽出手段と、前記抽出手段により抽出されたキーワードを用いた検索クエリを生成し、前記キーワードに関連するWebページを収集する収集手段とを備えることを特徴とする。   In order to solve the above-described problem, the information processing apparatus according to the present invention determines whether or not a description language of a Web page being browsed is a predetermined original language, and if the predetermined language is not the predetermined language, the Web page content is determined to be the predetermined language. Original language processing means for acquiring translated content translated into the original language, extraction means for extracting a sentence in the Web page of the predetermined original language or a translated sentence keyword translated into the predetermined original language, and a keyword extracted by the extracting means And a collection means for collecting a Web page related to the keyword.

本発明に係る情報処理装置によると、閲覧中のWebページの言語に関わらず、その閲覧中のWebページに関連するデータを容易に収集することが可能となる。   According to the information processing apparatus according to the present invention, it is possible to easily collect data related to a web page being browsed regardless of the language of the web page being browsed.

本発明の一実施形態に係る情報処理装置(携帯電話機)の斜視図。1 is a perspective view of an information processing apparatus (mobile phone) according to an embodiment of the present invention. 本発明の一実施形態に係る情報処理装置(携帯電話機)の全体構成を示すブロック図。1 is a block diagram showing an overall configuration of an information processing apparatus (mobile phone) according to an embodiment of the present invention. 本発明の一実施形態に係る情報処理装置(携帯電話機)において関連データ収集機能を実現するためのソフトウェア構成を示すブロック図。The block diagram which shows the software structure for implement | achieving a related data collection function in the information processing apparatus (mobile telephone) which concerns on one Embodiment of this invention. 本発明の一実施形態に係る情報処理装置(携帯電話機)における設定情報の一例を示すデータ構成図。The data block diagram which shows an example of the setting information in the information processing apparatus (cellular phone) which concerns on one Embodiment of this invention. 本発明の一実施形態に係る情報処理装置(携帯電話機)における関連データ収集処理の手順を示すフローチャート。The flowchart which shows the procedure of the related data collection process in the information processing apparatus (mobile telephone) which concerns on one Embodiment of this invention.

本発明に係る情報処理装置の実施形態について、添付図面を参照しながら説明する。本発明に係る情報処理装置として、ブラウジング機能、Web検索機能を備えた携帯電話機1を例に挙げて説明する。   Embodiments of an information processing apparatus according to the present invention will be described with reference to the accompanying drawings. As an information processing apparatus according to the present invention, a mobile phone 1 having a browsing function and a Web search function will be described as an example.

図1は、携帯電話機1の斜視図である。携帯電話機1は、図1に示すように、矩形の板状の筐体10を備えている。筐体10の一方の面には、データを表示するとともに入力媒体の接触を検出することによりデータを入力するタッチスクリーン11、音声を出力するスピーカ12、音声を入力するマイクロフォン13及びデータを入力する操作キー14が設けられている。   FIG. 1 is a perspective view of the mobile phone 1. As shown in FIG. 1, the mobile phone 1 includes a rectangular plate-shaped housing 10. On one surface of the housing 10, a touch screen 11 for inputting data by displaying data and detecting contact of an input medium, a speaker 12 for outputting sound, a microphone 13 for inputting sound, and data are input. An operation key 14 is provided.

タッチスクリーン11は、画面にデータを表示する表示機能、及び、ユーザが指や専用ペンなどの入力媒体を画面に接触させた際にその接触位置を検出することによりその接触位置に対応するデータを入力する入力機能の双方の機能を備えている。接触を検知する方法は、静電気により検知する方法でも感圧により検知する方法でも良く、または赤外線を用いた方法でも良く、その他の方法でも良い。   The touch screen 11 has a display function for displaying data on the screen and data corresponding to the contact position by detecting the contact position when the user touches the screen with an input medium such as a finger or a dedicated pen. Both input functions are provided. The method for detecting contact may be a method for detecting by static electricity or a method for detecting by pressure, or a method using infrared rays, or other methods.

操作キー14は、ユーザによる物理的な押下によりデータを入力するキーであっても、静電気または感圧により入力媒体の接触を検知してデータを入力するキーであっても良い。操作キー14は、例えば電源のON/OFFを切り替えたり待機状態から復帰したりするための電源キーや、発呼を開始するための発呼キーなどである。   The operation key 14 may be a key for inputting data by being physically pressed by a user, or a key for inputting data by detecting contact of an input medium by static electricity or pressure. The operation keys 14 are, for example, a power key for switching power ON / OFF or returning from a standby state, a call key for starting a call, and the like.

図2は、携帯電話機1の全体構成を示すブロック図である。図2に示すように、携帯電話機1は、主制御部20、電源回路部21、操作入力制御部22、表示制御部23、音声制御部24、通信制御部25及び記憶部26が相互に通信可能に接続されて構成されている。   FIG. 2 is a block diagram showing the overall configuration of the mobile phone 1. As shown in FIG. 2, in the mobile phone 1, the main control unit 20, the power supply circuit unit 21, the operation input control unit 22, the display control unit 23, the voice control unit 24, the communication control unit 25, and the storage unit 26 communicate with each other. It is connected and configured.

主制御部20は、CPU(Central Processing Unit)を具備し、携帯電話機1の総括的な制御を行うとともに、後述する関連データ収集処理や、その他の様々な演算処理や制御処理等を行う。電源回路部21は、電源供給源(バッテリ等)を備え、所定の操作キー14(例えば電源キー)を介した入力に基づいて携帯電話機1の電源のON/OFF状態を切り替え、電源がON状態の場合に電力供給源から各部に対して電力を供給して、携帯電話機1を動作可能にする。   The main control unit 20 includes a CPU (Central Processing Unit), performs overall control of the mobile phone 1, and performs related data collection processing, which will be described later, and various other arithmetic processing and control processing. The power supply circuit unit 21 includes a power supply source (battery or the like), switches the power supply ON / OFF state of the mobile phone 1 based on an input via a predetermined operation key 14 (for example, a power supply key), and the power supply is in an ON state. In this case, power is supplied from the power supply source to each unit to enable the mobile phone 1 to operate.

操作入力制御部22はタッチスクリーン11に対する入力インタフェースを備え、タッチスクリーン11の画面上で接触を検知すると、接触があった位置を示す信号を生成して主制御部20に伝送する。また、操作入力制御部22は操作キー14に対する入力インタフェースを備え、操作キー14のいずれかが押下されたことを検知すると、その押下された操作キー14を示す信号を生成して主制御部20に伝送する。これらの信号を受信した主制御部20は、それらの信号に基づいて処理を行う。   The operation input control unit 22 includes an input interface for the touch screen 11. When contact is detected on the screen of the touch screen 11, the operation input control unit 22 generates a signal indicating a position where the contact has occurred and transmits the signal to the main control unit 20. The operation input control unit 22 includes an input interface for the operation keys 14. When it is detected that any of the operation keys 14 is pressed, the operation input control unit 22 generates a signal indicating the pressed operation key 14 to generate the main control unit 20. Transmit to. The main control unit 20 that has received these signals performs processing based on those signals.

表示制御部23はタッチスクリーン11に対する表示インタフェースを備え、主制御部20の制御に基づいて、データをタッチスクリーン11に表示させる。   The display control unit 23 includes a display interface for the touch screen 11 and displays data on the touch screen 11 based on the control of the main control unit 20.

音声制御部24は、主制御部20の制御に基づいて、マイクロフォン13で集音されたデジタル音声信号に処理を施して主制御部20へ出力する。また音声制御部24は、デジタル音声信号を取得すると、主制御部20の制御に基づいてスピーカ12から音声として出力する。   The audio control unit 24 processes the digital audio signal collected by the microphone 13 based on the control of the main control unit 20 and outputs the processed signal to the main control unit 20. In addition, when the sound control unit 24 acquires the digital sound signal, the sound control unit 24 outputs the sound from the speaker 12 as sound based on the control of the main control unit 20.

通信制御部25は、主制御部20の制御に基づいて、基地局からアンテナ25aを介して受信した受信信号を復号化処理してデータを復元する。このデータは、主制御部20の指示により、音声制御部24に伝送されてスピーカ12から出力されたり、表示制御部23に伝送されてタッチスクリーン11に表示されたり、または記憶部26に記録されたりする。また通信制御部25は、主制御部20の制御に基づいて、マイクロフォン13で集音された音声データやタッチスクリーン11を介して入力されたデータや記憶部26に記憶されたデータを取得すると、これらのデータに対して符号化処理を行い、基地局に対してアンテナ25aを介して送信する。   Based on the control of the main control unit 20, the communication control unit 25 decodes the received signal received from the base station via the antenna 25a and restores the data. This data is transmitted to the sound control unit 24 and output from the speaker 12 according to an instruction from the main control unit 20, transmitted to the display control unit 23 and displayed on the touch screen 11, or recorded in the storage unit 26. Or Further, when the communication control unit 25 acquires the voice data collected by the microphone 13, the data input via the touch screen 11, or the data stored in the storage unit 26 based on the control of the main control unit 20, These data are encoded and transmitted to the base station via the antenna 25a.

記憶部26は、主制御部20が行う処理について、処理プログラムや処理に必要なデータ等を格納するROM(Read Only Memory)やハードディスク、不揮発性メモリ、データベース、主制御部20が処理を行う際に使用されるデータを一時的に記憶するRAM(Random Access Memory)等から構成される。また、主制御部20が後述する関連データ収集処理を行う際の処理プログラム、関連データ収集処理で用いられる母国語(例えば日本語)の辞書データ、所定の外国語(例えば英語)の辞書データは、例えばROMに記憶されているものとする。   The storage unit 26 performs processing performed by the main control unit 20 when a processing program, data necessary for processing, a ROM (Read Only Memory), a hard disk, a non-volatile memory, a database, and the main control unit 20 perform processing. It is composed of a RAM (Random Access Memory) or the like that temporarily stores data used in the memory. In addition, a processing program used when the main control unit 20 performs related data collection processing, which will be described later, native language (for example, Japanese) dictionary data, and predetermined foreign language (for example, English) dictionary data used in the related data collection processing are as follows: For example, it is assumed that it is stored in a ROM.

図3は、主制御部20の制御によって関連データ収集機能を実現するためのソフトウェア構成を示すブロック図である。携帯電話機1は、図3に示すように、Webページ入力部30、設定情報記憶部31、言語判別部32、母国語キーワード抽出部33、外国語キーワード抽出部34、翻訳装置通信部35、キーワード表示選択部36、検索クエリ生成部37、検索結果解析表示部38を有している。   FIG. 3 is a block diagram showing a software configuration for realizing the related data collection function under the control of the main control unit 20. As shown in FIG. 3, the mobile phone 1 includes a web page input unit 30, a setting information storage unit 31, a language determination unit 32, a native language keyword extraction unit 33, a foreign language keyword extraction unit 34, a translation device communication unit 35, a keyword A display selection unit 36, a search query generation unit 37, and a search result analysis display unit 38 are provided.

Webページ入力部30は、タッチスクリーン11を介してWebページアドレスが入力された際、または記憶部26に記憶されているWebページアドレスが選択された際に、そのWebページアドレスをブラウジング機能に入力してWebサイトからWebページデータを取得する。そしてWebページ入力部30は、ブラウジング機能によりタッチスクリーン11にWebページのコンテンツを表示させる。   When a web page address is input via the touch screen 11 or when a web page address stored in the storage unit 26 is selected, the web page input unit 30 inputs the web page address to the browsing function. Web page data is acquired from the Web site. Then, the web page input unit 30 displays the content of the web page on the touch screen 11 by the browsing function.

設定情報記憶部31は、関連データ収集処理の際に使用される、言語に関する設定情報40を記憶している。図4は、設定情報40の一例を示すデータ構成図である。図4に示すように、設定情報40は、各々の言語を示す言語情報41に対して、母国語か否かを示す母国語情報42、翻訳が必要か否かを示す翻訳情報43、Webページの記述言語として指定される言語タグを示す言語タグ情報44、Webページの作成に使用される文字コードを示す文字コード情報45がそれぞれ対応付けられた情報である。母国語情報42は、各々の言語に対して、ユーザの母国語である場合は「○」で、母国語でない場合は「×」で示される。翻訳情報43は、各々の言語に対して、携帯電話機1のシステムが対応していない言語であるため翻訳が必要な場合は「要」で、携帯電話機1のシステムが対応しているため翻訳が不要な場合は「不要」で示される。   The setting information storage unit 31 stores language-related setting information 40 used in the related data collection process. FIG. 4 is a data configuration diagram illustrating an example of the setting information 40. As shown in FIG. 4, the setting information 40 includes native language information 42 indicating whether or not the language information 41 indicating each language is a native language, translation information 43 indicating whether translation is necessary, and a Web page. Language tag information 44 indicating a language tag designated as a description language of the text, and character code information 45 indicating a character code used for creating a Web page are associated with each other. For each language, the native language information 42 is indicated by “◯” when the language is the user's native language, and “x” when the language is not the native language. The translation information 43 is “necessary” when translation is necessary since the translation information 43 is a language that the system of the cellular phone 1 does not support for each language, and translation is possible because the system of the cellular phone 1 is compatible. When it is unnecessary, it is indicated as “unnecessary”.

例えば図4によると、日本語が母国語で翻訳が不要な言語である旨、英語が母国語でなく翻訳が不要な言語である旨、ドイツ語が母国語でなく翻訳が必要な言語である旨がそれぞれ設定されている。すなわち、携帯電話機1のユーザは日本語を母国語としていることがわかる。また、日本語と英語には翻訳が不要であるが、ドイツ語には翻訳が必要なことがわかる。   For example, according to FIG. 4, Japanese is a native language and no translation is required, English is not a native language and no translation is required, and German is a native language that requires translation. Each is set. That is, it can be seen that the user of the mobile phone 1 uses Japanese as his native language. It can also be seen that Japanese and English do not require translation, but German requires translation.

言語判別部32は、Webページ入力部により入力されたWebページに含まれる言語タグ(例えばWebページデータに属性として付されているもの)から、設定情報40を用いてそのWebページの記述言語を判別するとともに、翻訳する必要があるか否かを判別する。   The language discriminating unit 32 uses the setting information 40 to set the description language of the Web page from the language tag (for example, the one attached to the Web page data as an attribute) included in the Web page input by the Web page input unit. It is determined whether or not it is necessary to translate.

母国語キーワード抽出部33は、母国語で記載されたWebページの中からキーワード群を抽出する。外国語キーワード抽出部34は、外国語(母国語以外の言語)で記載されたWebページの中からキーワード群を抽出する。翻訳装置通信部35は、Webページを翻訳する必要がある場合に、Webページコンテンツから翻訳クエリを生成して、翻訳装置に対してその翻訳クエリを送信することにより、Webページコンテンツを母国語に翻訳するように翻訳装置に指示する。母国語キーワード抽出部33は、翻訳装置通信部35の指示により翻訳装置から返送された翻訳後のWebページコンテンツ(母国語)を受信すると、受信したWebページコンテンツからキーワード群を抽出する。   The native language keyword extraction unit 33 extracts a keyword group from Web pages described in the native language. The foreign language keyword extraction unit 34 extracts a keyword group from a Web page described in a foreign language (a language other than the native language). When the translation device communication unit 35 needs to translate a web page, the translation device communication unit 35 generates a translation query from the web page content and transmits the translation query to the translation device. Instruct the translation device to translate. When the native language keyword extraction unit 33 receives the translated web page content (native language) returned from the translation device according to an instruction from the translation device communication unit 35, the native language keyword extraction unit 33 extracts a keyword group from the received web page content.

キーワード表示選択部36は、母国語キーワード抽出部33または外国語キーワード抽出部34により抽出されたキーワード群をタッチスクリーン11に表示させ、ユーザにいずれかのキーワードの選択を促す。検索クエリ生成部37は、ユーザによりキーワードが選択されると、選択されたキーワードから検索クエリを生成して、検索エンジン200に対してその検索クエリを送信する。検索結果表示部38は、検索エンジン200から検索結果を受信すると、検索結果を解析しタッチスクリーン11に表示させる。   The keyword display selection unit 36 displays the keyword group extracted by the native language keyword extraction unit 33 or the foreign language keyword extraction unit 34 on the touch screen 11 and prompts the user to select any keyword. When a keyword is selected by the user, the search query generation unit 37 generates a search query from the selected keyword, and transmits the search query to the search engine 200. When receiving the search result from the search engine 200, the search result display unit 38 analyzes the search result and displays it on the touch screen 11.

なお、翻訳装置は、携帯電話機1から翻訳元データ(例えばドイツ語)を受信するとともに翻訳後の言語(例えば日本語)が指定されると、翻訳元データをドイツ語から日本語に翻訳して、翻訳後の日本語のデータを携帯電話機1に送信する装置である。翻訳装置は、携帯電話機1とは別個に設けられた装置であっても携帯電話機1に内蔵された装置であっても良い。検索エンジン200は、予め多くのデータを記憶していて、携帯電話機1からキーワードを受信すると、記憶されたデータからそのキーワードに関連するデータを抽出してそれらのデータのリストを携帯電話機1に対して送信する装置であり、携帯電話機1とは別個に設けられた装置である。   The translation device receives translation source data (for example, German) from the mobile phone 1 and translates the translation source data from German to Japanese when a translated language (for example, Japanese) is designated. This is a device for transmitting translated Japanese data to the mobile phone 1. The translation device may be a device provided separately from the mobile phone 1 or a device built in the mobile phone 1. When the search engine 200 stores a large amount of data in advance and receives a keyword from the mobile phone 1, the search engine 200 extracts data related to the keyword from the stored data and stores a list of the data for the mobile phone 1. Is a device that is provided separately from the mobile phone 1.

携帯電話機1は、ユーザが携帯電話機1を用いてWebページを閲覧している際、そのWebページの関連ページの表示が指示された場合に、その閲覧中のWebページからキーワードを抽出して関連データを収集する。携帯電話機1がこの関連データ収集処理を行う際の手順について、図5に示すフローチャートに基づいて詳細に説明する。   When a user browses a web page using the cellular phone 1 and the user is instructed to display a related page of the web page, the cellular phone 1 extracts a keyword from the web page being browsed and Collect data. A procedure when the mobile phone 1 performs the related data collection processing will be described in detail based on the flowchart shown in FIG.

Webページをタッチスクリーン11に表示しているときに、現在表示しているWebページに関連するページの表示を指示する操作をタッチスクリーン11または操作キー14が受け付けると、Webページ入力部30に対して関連ページの表示の指示があったことを通知する。   When the touch screen 11 or the operation key 14 receives an operation for instructing display of a page related to the currently displayed web page while the web page is being displayed on the touch screen 11, the web page input unit 30 is notified. That there is an instruction to display the related page.

関連ページの表示の指示があった場合(S101;Yes)、言語判別部32は、閲覧中のWebページの言語を判別する。まず言語判別部32は、閲覧中のページが母国語で記載されているか否かを判断する(S103)。この際、言語判別部32は、例えば閲覧中のWebページに含まれる言語タグに基づいて言語を識別し、設定情報40においてその言語が母国語に設定されていた場合に、閲覧中のWebページが母国語で記載されているものと判断する。例えば図4に示す設定情報40によると、日本語が母国語であるため、閲覧中のページが日本語で書かれていた場合に、母国語で記載されているものと判断される。   When there is an instruction to display the related page (S101; Yes), the language determination unit 32 determines the language of the Web page being browsed. First, the language discriminating unit 32 determines whether or not the page being browsed is described in the native language (S103). At this time, the language determination unit 32 identifies the language based on, for example, a language tag included in the web page being browsed, and when the language is set to the native language in the setting information 40, the web page being browsed Is described in the native language. For example, according to the setting information 40 shown in FIG. 4, since Japanese is the native language, if the page being viewed is written in Japanese, it is determined that it is written in the native language.

閲覧中のページが母国語で記載されている場合(S103;Yes)は、母国語キーワード抽出部33は、閲覧中のWebページコンテンツから母国語のキーワードを抽出する(S105)。この際、母国語キーワード抽出部33は、例えば記憶部26に記憶されている母国語の辞書データを使用したり、Webページコンテンツについて形態素解析を行ったりすることによって、単語を抽出すると良い。または、「は」、「が」、「で」、「に」等の格助詞を判別してその直前の名詞を抽出するようにしても良い。   When the page being browsed is described in the native language (S103; Yes), the native language keyword extraction unit 33 extracts the native language keyword from the web page content being browsed (S105). At this time, the native language keyword extraction unit 33 may extract words by using, for example, dictionary data of the native language stored in the storage unit 26 or by performing morphological analysis on the Web page content. Alternatively, case particles such as “ha”, “ga”, “de”, “ni”, etc. may be discriminated and the noun immediately before that may be extracted.

閲覧中のページが母国語で記載されていなかった場合(S103;No)は、言語判別部32は、閲覧中のページが翻訳不要な外国語で記載されているか否かを判断する(S107)。この際、言語判別部32は、例えばステップS103にて識別された言語が設定情報40において翻訳不要に設定されていた場合に、閲覧中のページが翻訳不要な外国語で記載されているものと判断する。例えば図4に示す設定情報40によると、日本語及び英語が翻訳不要に設定されているため、閲覧中のページが日本語または英語で書かれていた場合に翻訳不要だと判断され、ドイツ語で書かれていた場合に翻訳が必要だと判断される。   When the page being browsed is not described in the native language (S103; No), the language determination unit 32 determines whether the page being browsed is described in a foreign language that does not require translation (S107). . At this time, for example, if the language identified in step S103 is set to require no translation in the setting information 40, the language discriminating unit 32 describes that the page being viewed is described in a foreign language that does not require translation. to decide. For example, according to the setting information 40 shown in FIG. 4, since Japanese and English are set to require no translation, it is determined that no translation is required when the page being viewed is written in Japanese or English, and German is used. If it is written in, it is judged that translation is necessary.

閲覧中のページが翻訳不要な外国語で記載されていた場合(S107;Yes)は、外国語キーワード抽出部34は、閲覧中のWebページコンテンツからその外国語のキーワードを抽出する(S109)。この際、外国語キーワード抽出部34は、例えば記憶部26に記憶されている外国語の辞書データを使用し、Webページコンテンツについて形態素解析を行ったりすることにより、単語を抽出すると良い。   If the page being browsed is written in a foreign language that does not require translation (S107; Yes), the foreign language keyword extraction unit 34 extracts the foreign language keyword from the web page content being browsed (S109). At this time, the foreign language keyword extraction unit 34 may extract words by, for example, using foreign language dictionary data stored in the storage unit 26 and performing morphological analysis on the Web page content.

閲覧中のページが翻訳不要な外国語で記載されていなかった場合(S107;No)は、翻訳が必要であるため、翻訳装置通信部35は外部の翻訳装置を用いて閲覧中のWebページコンテンツを翻訳する(S111)。このとき、翻訳装置通信部35は、閲覧中のWebページコンテンツを含んだ翻訳クエリを生成して翻訳装置に送信して、Webページコンテンツを母国語に翻訳するように翻訳装置に依頼する。この翻訳クエリを受信した翻訳装置は、翻訳クエリに含まれるWebページコンテンツを指定された母国語に翻訳して携帯電話機1に返信する。   If the page being browsed is not described in a foreign language that does not require translation (S107; No), translation is necessary, so the translation device communication unit 35 uses the external translation device to view the web page content being browsed. Is translated (S111). At this time, the translation device communication unit 35 generates a translation query including the web page content being browsed and transmits it to the translation device, and requests the translation device to translate the web page content into the native language. The translation apparatus that has received the translation query translates the Web page content included in the translation query into the designated native language and sends it back to the mobile phone 1.

なお、携帯電話機1と翻訳装置との通信の際には、翻訳装置通信部35は、Webブラウザを介さず、バックグラウンドで翻訳前後のWebページコンテンツのうちの文字列情報のみを送受信して、母国語キーワード抽出部33に翻訳後のWebページコンテンツを入力させることで、HTML(HyperText Markup Language)のファイルに参照として含まれる画像データの読み込みを省略してキーワードの抽出を行う。これにより、翻訳処理にかかる時間を短縮することができる。   In the communication between the mobile phone 1 and the translation device, the translation device communication unit 35 transmits and receives only character string information in the web page contents before and after translation in the background without using a web browser. By inputting the translated web page content to the native language keyword extraction unit 33, keywords are extracted by omitting reading of image data included as a reference in an HTML (HyperText Markup Language) file. Thereby, the time required for the translation process can be shortened.

携帯電話機1が翻訳装置から母国語に翻訳されたWebページコンテンツを受信すると、母国語キーワード抽出部34は、受信した母国語のWebページコンテンツから母国語のキーワードを抽出する(S105)。   When the mobile phone 1 receives the Web page content translated into the native language from the translation device, the native language keyword extraction unit 34 extracts the native language keyword from the received native language Web page content (S105).

ステップS105またはS109にてキーワードが抽出されると、キーワード表示選択部36は、タッチスクリーン11にキーワードを表示させる(S113)。閲覧中のWebページの言語と抽出されたキーワードの言語とがそれぞれ異なっている場合には、抽出されたキーワードが、閲覧中のWebページにおいてそのキーワードに該当する文字列に対応付けて表示されると良い。   When a keyword is extracted in step S105 or S109, the keyword display selection unit 36 displays the keyword on the touch screen 11 (S113). When the language of the web page being browsed is different from the language of the extracted keyword, the extracted keyword is displayed in association with the character string corresponding to the keyword on the web page being browsed. And good.

ユーザは、タッチスクリーン11の画面を触れることで、表示されたキーワードからいずれかのキーワードを選択することができる。キーワード表示選択部36は、ユーザによりいずれかのキーワードが選択されたか否かを判断する(S115)。キーワードが選択されていない場合(S115;No)、キーワード表示選択部36はキーワードが選択されるまで待機する。   The user can select any keyword from the displayed keywords by touching the screen of the touch screen 11. The keyword display selection unit 36 determines whether any keyword has been selected by the user (S115). When no keyword is selected (S115; No), the keyword display selection unit 36 stands by until a keyword is selected.

キーワードが選択された場合(S115;Yes)、検索クエリ生成部37は、検索エンジン200を用いて、選択されたキーワードについて検索する(S117)。このとき、検索クエリ生成部37は、ユーザにより選択されたキーワードを含んだ検索クエリを生成して検索エンジン200に送信して、選択されたキーワードについて検索するように検索エンジン200に依頼する。この検索クエリを受信した検索エンジン200は、検索クエリに含まれるキーワードに関連のあるデータを抽出して検索結果として携帯電話機1に返信する。そして、携帯電話機1が検索エンジン200から検索結果(URLのリストやWebページ)を受信すると、検索結果解析表示部38は、タッチスクリーン11に検索結果を表示させる(S119)。なお、検索結果として表示させる情報は、母国語で記載されているWebページや、母国後で記載されているWebページのURLを含むリストに限定されても良い。   When a keyword is selected (S115; Yes), the search query generation unit 37 uses the search engine 200 to search for the selected keyword (S117). At this time, the search query generation unit 37 generates a search query including the keyword selected by the user, transmits the search query to the search engine 200, and requests the search engine 200 to search for the selected keyword. Upon receiving this search query, the search engine 200 extracts data related to the keyword included in the search query and sends it back to the mobile phone 1 as a search result. When the mobile phone 1 receives a search result (URL list or Web page) from the search engine 200, the search result analysis display unit 38 displays the search result on the touch screen 11 (S119). Note that the information to be displayed as a search result may be limited to a Web page described in the native language or a list including URLs of Web pages described after the native language.

このようにして携帯電話機1は、Webページの閲覧中にユーザにより関連ページの表示を指示された際に、そのWebページが母国語(例えば日本語)で記載されているか、母国語ではないが翻訳不要な言語(例えば英語)で記載されているか、翻訳が必要な言語(例えばドイツ語)で記載されているか、の3つに場合分けした上で検索を行う。携帯電話機1は、閲覧中のWebページが母国語(例えば日本語)で記載されている場合、予め記憶されている母国語の辞書データを用いて母国語のキーワードを抽出し、母国語ではないが翻訳不要な言語(例えば英語)で記載されている場合、予め記憶されている外国語の辞書データを用いて外国語のキーワードを抽出し、翻訳が必要な言語(例えばドイツ語)で記載されている場合、そのWebページコンテンツを翻訳装置を用いて母国語に翻訳した後に予め記憶されている母国語の辞書データを用いて母国語のキーワードを抽出する。そして携帯電話機1は、抽出されたキーワードをユーザに提示してユーザにより選択されたキーワードについて検索エンジン200を用いて検索する。   In this way, when the mobile phone 1 is instructed to display a related page by the user while browsing the Web page, the Web page is written in the native language (for example, Japanese) or is not the native language. The search is performed after dividing into three cases: whether it is described in a language that does not require translation (for example, English) or in a language that requires translation (for example, German). When the web page being browsed is written in the native language (for example, Japanese), the cellular phone 1 extracts the native language keyword using dictionary data of the native language stored in advance, and is not the native language. Is written in a language that does not require translation (for example, English), a foreign language keyword is extracted using foreign language dictionary data stored in advance and written in a language that requires translation (for example, German). If the web page content is translated into the native language using a translation device, the native language keyword is extracted using the dictionary data of the native language stored in advance. Then, the mobile phone 1 presents the extracted keyword to the user and searches for the keyword selected by the user using the search engine 200.

本発明の上記のような構成により、閲覧中のWebページが、ユーザが理解できない言語で記載されたWebページであっても、バックグラウンドでそのWebページコンテンツを母国語に翻訳した上で母国語のキーワードを抽出することにより、ユーザは、閲覧中のWebページに関連のある母国語のデータを容易に入手することが可能になる。   With the above-described configuration of the present invention, even if the web page being browsed is a web page written in a language that the user cannot understand, the native language is obtained by translating the web page content into the native language in the background. By extracting this keyword, the user can easily obtain native language data related to the Web page being browsed.

なお、閲覧中のWebページがユーザが理解できない言語で記載されていた場合に、そのWebページのコンテンツ自体を翻訳させて表示させることも考えられるが、現状での機械翻訳の精度はユーザが違和感無く文章を読める程度に十分ではない。しかしながら、現状での機械翻訳の精度は、Webページコンテンツから重要なキーワードを抽出する分には十分である。よって、携帯電話機1がWebページから抽出されたキーワードを用いて母国語で記載された関連ページを取得することにより、ユーザに有用な情報を提供することができる。   If the web page being browsed is written in a language that the user cannot understand, the content of the web page itself may be translated and displayed. However, the accuracy of machine translation at present is uncomfortable for the user. Not enough to read the text. However, the accuracy of machine translation at present is sufficient to extract important keywords from Web page contents. Therefore, the mobile phone 1 can provide useful information to the user by acquiring the related page described in the native language using the keyword extracted from the Web page.

本発明に係る情報処理装置(携帯電話機1)によると、閲覧中のWebページがユーザが理解できない外国語で記載されていた場合であっても、バックグラウンドでWebページコンテンツを母国語に翻訳して、Webページコンテンツから母国語のキーワードを抽出して検索することで、閲覧中のWebページに関連する母国語のデータを容易に収集することが可能となる。   According to the information processing apparatus (mobile phone 1) according to the present invention, even when the web page being browsed is written in a foreign language that the user cannot understand, the web page content is translated into the native language in the background. Thus, by extracting and searching the native language keyword from the web page content, it becomes possible to easily collect native language data related to the web page being browsed.

本発明の説明として、携帯電話機1について説明したが、これに限らず、PHS(Personal Handyphone System)、PDA(Personal Digital Assistants)、携帯ゲーム機、携帯音楽録再機など、ブラウジング機能、Web検索機能を備えている情報処理装置であれば、任意の情報処理装置であっても良い。   As an explanation of the present invention, the mobile phone 1 has been described. However, the present invention is not limited to this, but a browsing function, a Web search function, etc. Any information processing apparatus may be used as long as the information processing apparatus includes the information processing apparatus.

1…携帯電話機,10…筐体,11…タッチスクリーン,12…スピーカ,13…マイクロフォン,14…操作キー、20…主制御部,21…電源回路部,22…操作入力制御部,23…表示制御部,24…音声制御部,25…通信制御部,25a…アンテナ,26…記憶部,30…Webページ入力部,31…設定情報記憶部,32…言語判別部,33…母国語キーワード抽出部,34…外国語キーワード抽出部,35…翻訳装置通信部,36…キーワード表示選択部,37…検索クエリ生成部,38…検索結果解析表示部,40…設定情報,200…検索エンジン。   DESCRIPTION OF SYMBOLS 1 ... Mobile phone, 10 ... Housing | casing, 11 ... Touch screen, 12 ... Speaker, 13 ... Microphone, 14 ... Operation key, 20 ... Main control part, 21 ... Power supply circuit part, 22 ... Operation input control part, 23 ... Display Control unit, 24 ... Voice control unit, 25 ... Communication control unit, 25a ... Antenna, 26 ... Storage unit, 30 ... Web page input unit, 31 ... Setting information storage unit, 32 ... Language discrimination unit, 33 ... Native language keyword extraction 34: Foreign language keyword extraction unit, 35 ... Translation device communication unit, 36 ... Keyword display selection unit, 37 ... Search query generation unit, 38 ... Search result analysis display unit, 40 ... Setting information, 200 ... Search engine.

Claims (3)

情報処理装置のシステムに対応している言語のいずれかを母国語、第1外国語、又は第2外国語と設定する設定手段と、
閲覧中のWebページの記述言語が前記第2外国語か否かを判断し、前記第2外国語である場合、前記Webページコンテンツを前記母国語に翻訳した翻訳コンテンツを取得する言語処理手段と、
前記Webページの記述言語が前記第2外国語でない場合には、前記Webページのコンテンツから、前記Webページの記述言語に応じて、前記母国語のキーワード又は第1外国語のキーワードを抽出し、前記Webページの記述言語が前記第2外国語である場合には、前記母国語に翻訳した翻訳コンテンツから母国語のキーワードを抽出する抽出手段と、
前記抽出手段により抽出された前記母国語又は前記第1外国語のキーワードを用いた検索クエリを生成し、キーワードに関連するWebページを収集する収集手段とを備えることを特徴とする情報処理装置。
Setting means for setting one of the languages corresponding to the system of the information processing apparatus as a native language, a first foreign language, or a second foreign language;
Description language of the Web page being viewed, it is determined whether or not the second foreign language, said if the second is a foreign language, language processing means for obtaining a translation content that the translation of the content of the Web page in the native language When,
If the description language of the Web page is not the second foreign language, the native language keyword or the first foreign language keyword is extracted from the content of the Web page according to the description language of the Web page, When the description language of the Web page is the second foreign language, an extraction unit that extracts a native language keyword from the translated content translated into the native language ;
An information processing apparatus comprising: a collection unit configured to generate a search query using the keyword of the native language or the first foreign language extracted by the extraction unit and collect a Web page related to the keyword .
前記抽出手段により抽出されたキーワードを表示させる表示手段と、
前記表示手段により表示されたキーワードのうちのいずれかの選択を受け付ける受付手段とを備え、
前記収集手段は、前記受付手段により受け付けられたキーワードの関連情報を検索することを特徴とする請求項1記載の情報処理装置。
Display means for displaying the keywords extracted by the extraction means;
Receiving means for receiving selection of any of the keywords displayed by the display means,
The information processing apparatus according to claim 1, wherein the collecting unit searches for related information of the keyword received by the receiving unit.
前記収集手段は、前記母国語で記述されたWebページを検索結果として収集することを特徴とする請求項1記載の情報処理装置。   The information processing apparatus according to claim 1, wherein the collection unit collects Web pages described in the native language as a search result.
JP2010070569A 2010-03-25 2010-03-25 Information processing device Expired - Fee Related JP5494100B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010070569A JP5494100B2 (en) 2010-03-25 2010-03-25 Information processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010070569A JP5494100B2 (en) 2010-03-25 2010-03-25 Information processing device

Publications (2)

Publication Number Publication Date
JP2011204001A JP2011204001A (en) 2011-10-13
JP5494100B2 true JP5494100B2 (en) 2014-05-14

Family

ID=44880578

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010070569A Expired - Fee Related JP5494100B2 (en) 2010-03-25 2010-03-25 Information processing device

Country Status (1)

Country Link
JP (1) JP5494100B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8806188B2 (en) 2011-08-31 2014-08-12 Sonic Ip, Inc. Systems and methods for performing adaptive bitrate streaming using automatically generated top level index files
KR20190097320A (en) 2015-01-06 2019-08-20 디브이엑스, 엘엘씨 Systems and methods for encoding and sharing content between devices
JP2020154629A (en) * 2019-03-19 2020-09-24 富士ゼロックス株式会社 Document search assist apparatus and program, and document search assist system

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05165889A (en) * 1991-12-13 1993-07-02 Canon Inc Document retrieval device
JPH10187752A (en) * 1996-12-24 1998-07-21 Kokusai Denshin Denwa Co Ltd <Kdd> Inter-language information retrieval backup system
JPH10269237A (en) * 1997-03-27 1998-10-09 Hitachi Ltd Document browsing system
JP3647283B2 (en) * 1998-09-21 2005-05-11 シャープ株式会社 Document information extraction device
JP4073635B2 (en) * 2000-02-29 2008-04-09 富士通株式会社 Relay device, server device, terminal device, and translation server system using the same
JP2002041518A (en) * 2000-07-21 2002-02-08 Toshiba Corp Providing method for site information
JP2005011138A (en) * 2003-06-20 2005-01-13 Brother Ind Ltd Multi-language information retrieval system, multi-language information retrieval method and multi-language information retrieval program
JP2005050221A (en) * 2003-07-30 2005-02-24 Nec Corp Search retrieval system in transmission and reception of telephone and e-mail
JP5161658B2 (en) * 2008-05-30 2013-03-13 株式会社東芝 Keyword input support device, keyword input support method, and program

Also Published As

Publication number Publication date
JP2011204001A (en) 2011-10-13

Similar Documents

Publication Publication Date Title
CN101526879B (en) Speech input interface on a device
CN102609208B (en) Method and system for word capture on screen of touch screen equipment, and touch screen equipment
US20140320413A1 (en) Multimodal text input by a keyboard/camera text input module replacing a conventional keyboard text input module on a mobile device
JP6051338B2 (en) Page rollback control method, page rollback control device, terminal, program, and recording medium
US20090222257A1 (en) Speech translation apparatus and computer program product
CN103841656A (en) Mobile terminal and data processing method thereof
WO2010060043A2 (en) Personal dictionary and translator device
CN109165292A (en) Data processing method, device and mobile terminal
CN102414994A (en) Input processing method of mobile terminal and device for performing same
CN106055721A (en) Accessible webpage processing method and relevant equipment
CN112632445A (en) Webpage playing method, device, equipment and storage medium
CN106708885A (en) Method and device for achieving searching
KR20140100315A (en) Mobile terminal and control method thereof
US9310971B2 (en) Document viewing device for display document data
JP5494100B2 (en) Information processing device
US10140265B2 (en) Apparatuses and methods for phone number processing
KR102267849B1 (en) Data extraction method, device and terminal device
KR20140060217A (en) System and method for posting message by audio signal
CN108737634B (en) Voice input method and device, computer device and computer readable storage medium
KR20100117335A (en) Search relay server requesting search result to search site based on text comprising search word
EP3996354B1 (en) Electronic device and method for extracting and using semantic entity in text message of electronic device
KR20170029866A (en) Server, user terminal and a method for controlling thereof
JP2009009170A (en) Information retrieval system and server device
CN108614831A (en) Semantic primitive display methods and device, the device shown for semantic primitive
JP5084859B2 (en) Information processing apparatus, data extraction method, and program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121128

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131112

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131226

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140217

R150 Certificate of patent or registration of utility model

Ref document number: 5494100

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees