Nothing Special   »   [go: up one dir, main page]

JPH1153354A - Kana/kanji converter and method therefor - Google Patents

Kana/kanji converter and method therefor

Info

Publication number
JPH1153354A
JPH1153354A JP9204159A JP20415997A JPH1153354A JP H1153354 A JPH1153354 A JP H1153354A JP 9204159 A JP9204159 A JP 9204159A JP 20415997 A JP20415997 A JP 20415997A JP H1153354 A JPH1153354 A JP H1153354A
Authority
JP
Japan
Prior art keywords
conversion
character string
candidate
antecedent
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9204159A
Other languages
Japanese (ja)
Inventor
Minoru Nitta
実 新田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JustSystems Corp
Original Assignee
JustSystems Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JustSystems Corp filed Critical JustSystems Corp
Priority to JP9204159A priority Critical patent/JPH1153354A/en
Publication of JPH1153354A publication Critical patent/JPH1153354A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a KANA (JAPANESE SYLLABARY) KANJI (Chinese character) converter performing KANA/KANJI conversion while performing processing of a homonym with a conversion object character string containing a demonstrative by using cooccurrence information. SOLUTION: A conversion means 3 generates a conversion candidate for a conversion object character string on the basis of a specified conversion rule. A cooccurrence information storage means 9 stores cooccurrence information for performing a processing of a homonym. When a given conversion object character string contains a demonstrative, an antecedent candidate decision means 11 decides the antecedent candidate indicated by a demonstrative from an established character string stored in an established character string storage means 7. A conversion means 3 replaces the demonstrative with the antecedent candidate and executes a conversion by using the cooccurrence information.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】この発明は、かな漢字変換装
置およびかな漢字変換方法に関し、特に、指示詞を含む
変換処理に関する。
[0001] 1. Field of the Invention [0002] The present invention relates to a kana-kanji conversion device and a kana-kanji conversion method, and more particularly, to a conversion process including an instruction.

【0002】[0002]

【従来技術およびその課題】特開平5−158917号
公報には、共起情報を用いて同音異義語の適切な変換を
行なうかな漢字変換装置が開示されている。
2. Description of the Related Art Japanese Unexamined Patent Publication No. Hei 5-158917 discloses a kana-kanji conversion device for performing proper conversion of homonyms using co-occurrence information.

【0003】共起情報を用いた変換について簡単に説明
する。予め、対になって用いられる単語を共起情報辞書
に記憶しておく。例えば、「木」と「切る」、「着物」
と「着る」を記憶しておく。そして、「きをきる」と入
力されると、「きる」は「切る」に変換し、「きものを
きる」と入力されると、「きる」は「着る」に変換され
る。これにより、同音異義語を適切に変換することがで
きる。
[0003] Conversion using co-occurrence information will be briefly described. The words used in pairs are stored in the co-occurrence information dictionary in advance. For example, "tree" and "cut", "kimono"
And "wear" are stored. Then, when "cut off" is input, "cut off" is converted to "cut", and when "cut off kimono" is input, "cut off" is converted into "wear". Thereby, the homonym can be appropriately converted.

【0004】しかしながら、上記共起情報を用いた場合
でも、「おおきなきをもらった」を「大きな木をもらっ
た」と変換した後、「それをきるのはむずかしい。」と
入力した場合に、読みデータ「きる」については、上記
共起情報を用いた変換ができない。
[0004] However, even when the co-occurrence information is used, if "I got a big tree" is converted to "I got a big tree" and then "It is difficult to cut it" is input. Regarding the read data "Kiru", conversion using the co-occurrence information cannot be performed.

【0005】この発明は上記問題を解決し、指示詞を含
む変換対象文字列を共起情報を用いて同音異義語の処理
を行ないつつ、かな漢字変換を行かう漢字変換装置また
はその方法を提供することを目的とする。
The present invention solves the above-mentioned problem, and provides a kanji conversion apparatus and method for performing a kana-kanji conversion while processing a homonymous word using a co-occurrence information with a conversion target character string including a demonstrative. The purpose is to:

【0006】[0006]

【課題を解決するための手段】請求項1のかな漢字変換
装置においては、変換対象文字列を所定の変換規則に基
づいて変換するかな漢字変換装置において、与えられた
変換対象文字列に指示詞が含まれている場合には、前記
指示詞が示す先行詞候補を検索して、前記指示詞を前記
先行詞候補に置き換えて、共起情報を用いて同音異義語
の処理を行ないつつ、前記変換を行なうことを特徴とす
る。
According to a first aspect of the present invention, there is provided a kana-kanji conversion apparatus for converting a character string to be converted based on a predetermined conversion rule. If it is found, it searches for the antecedent candidate indicated by the demonstrative, replaces the definitive with the antecedent candidate, and processes the homonym using the co-occurrence information while performing the conversion. It is characterized by performing.

【0007】請求項2のかな漢字変換装置においては、
変換対象文字列を所定の変換規則に基づいて変換候補を
生成する変換手段、前記変換候補を記憶する変換候補記
憶手段、操作者からの確定命令を受けて、前記変換候補
記憶手段に記憶された変換候補を確定文字列として記憶
する確定文字列記憶手段、を備えたかな漢字変換装置に
おいて、同音異義語の処理を行なうための共起情報を記
憶する共起情報記憶手段、与えられた変換対象文字列に
指示詞が含まれている場合には、前記変換候補記憶手段
に記憶された変換候補または前記確定文字列記憶手段に
記憶された確定文字列中から、前記指示詞が示す先行詞
候補を決定する先行詞候補決定手段を備え、前記変換手
段は、前記指示詞を前記先行詞候補に置き換えて、前記
共起情報を用いた変換を行なうこと、を特徴とする。
[0007] In the kana-kanji conversion device of claim 2,
Conversion means for generating a conversion candidate based on a predetermined conversion rule for a character string to be converted, conversion candidate storage means for storing the conversion candidate, and stored in the conversion candidate storage means upon receipt of a confirmation command from an operator. Co-occurrence information storage means for storing co-occurrence information for processing homonymous words in a kana-kanji conversion device comprising a fixed character string storage means for storing conversion candidates as fixed character strings; In the case where a descriptive term is included in the sequence, the predecessor candidate indicated by the descriptive term is selected from the conversion candidates stored in the conversion candidate storage means or the definitive character string stored in the definitive character string storage means. It is provided with means for determining antecedent candidates, and the conversion means performs the conversion using the co-occurrence information by replacing the descriptives with the antecedent candidates.

【0008】請求項3のかな漢字変換装置においては、
前記変換手段は、所定の文節区切り規則に基づいて、文
節の区切りを行なって前記変換候補を生成するととも
に、前記文節の区切り方が複数ある場合には、その複数
の区切り方に基づいた複数の変換候補を生成し、この複
数の変換候補について、前記共起情報を用いた変換を行
なうことを特徴とする。
According to a third aspect of the present invention, there is provided a kana-kanji conversion device.
The conversion unit generates the conversion candidate by performing segmentation based on a predetermined segmentation rule, and when there are a plurality of segmentation methods, a plurality of conversion methods based on the plurality of segmentation methods. A conversion candidate is generated, and conversion using the co-occurrence information is performed on the plurality of conversion candidates.

【0009】請求項4のかな漢字変換方法においては、
変換対象文字列を所定の変換規則に基づいて変換するか
な漢字変換方法において、与えられた変換対象文字列に
指示詞が含まれている場合には、前記指示詞が示す先行
詞候補を検索して、前記指示詞を前記先行詞候補に置き
換えて、共起情報を用いて同音異義語の処理を行ないつ
つ、前記変換を行なうことを特徴とする。
According to a fourth aspect of the present invention, there is provided a kana-kanji conversion method.
In the kana-kanji conversion method of converting a character string to be converted based on a predetermined conversion rule, if a given character string to be converted includes an instructive, a search is made for the antecedent candidate indicated by the indicium. The present invention is characterized in that the conversion is performed while replacing homologous words with co-occurrence information by replacing the demonstratives with the antecedent candidates.

【0010】請求項1の記憶媒体においては、コンピュ
ータが実行可能なプログラムを記憶したコンピュータ可
読の記憶媒体であって、前記プログラムは、請求項1な
いし請求項4のいずれかの装置又は方法を実現するもの
であることを特徴とする。
The storage medium according to claim 1 is a computer-readable storage medium storing a computer-executable program, and the program implements the apparatus or method according to any one of claims 1 to 4. It is characterized by that.

【0011】CPU23を用いて実現した実施形態と、
各請求項の各手段との関係について説明する。変換手段
3は、CPU23のステップST3およびステップST
17の処理に該当する。変換候補記憶手段は、メモリ2
7の変換用作業バッファ27hに該当する。確定文字列
記憶手段は、メモリ27の確定結果バッファ27kに該
当する。共起情報記憶手段は、ハードディスク26の共
起用例辞書部26cに該当する。先行詞候補決定手段
は、CPU23のステップST11の処理に該当する。
An embodiment realized by using the CPU 23;
The relationship with each means of each claim will be described. The conversion means 3 includes the steps ST3 and ST
This corresponds to the processing of No. 17. The conversion candidate storage means is a memory 2
7 corresponds to the conversion work buffer 27h. The determined character string storage means corresponds to the determined result buffer 27k of the memory 27. The co-occurrence information storage means corresponds to the co-occurrence example dictionary unit 26c of the hard disk 26. The antecedent candidate determining means corresponds to the processing of step ST11 of the CPU 23.

【0012】[0012]

【発明の効果】請求項1のかな漢字変換装置または請求
項4のかな漢字変換方法においては、与えられた変換対
象文字列に指示詞が含まれている場合には、前記指示詞
が示す先行詞候補を検索して、前記指示詞を前記先行詞
候補に置き換えて、共起情報を用いて同音異義語の処理
を行ないつつ、前記変換を行なう。したがって、指示詞
を含む変換対象文字列を共起情報を用いて適切に変換す
ることができる。
According to the kana-kanji conversion device of the first aspect or the kana-kanji conversion method of the fourth aspect, when a given character string to be converted includes an instruction, the antecedent candidate indicated by the instruction is indicated. , And the conversion is performed while processing the homonym using the co-occurrence information, replacing the demonstrative with the antecedent candidate. Therefore, it is possible to appropriately convert the conversion target character string including the directive using the co-occurrence information.

【0013】請求項2のかな漢字変換装置においては、
先行詞候補決定手段は、与えられた変換対象文字列に指
示詞が含まれている場合には、前記変換候補記憶手段に
記憶された変換候補または前記確定文字列記憶手段に記
憶された確定文字列中から、前記指示詞が示す先行詞候
補を決定する。前記変換手段は、前記指示詞を前記先行
詞候補に置き換えて、前記共起情報を用いて変換する。
したがって、指示詞を含む変換対象文字列を共起情報を
用いて適切に変換することができる。
[0013] In the kana-kanji conversion device of claim 2,
The antecedent candidate determining means, if the given character string to be converted includes an instruction, the conversion candidate stored in the conversion candidate storage means or the confirmed character stored in the confirmed character string storage means From the columns, antecedent candidates indicated by the demonstratives are determined. The conversion means replaces the demonstrative with the antecedent candidate and performs conversion using the co-occurrence information.
Therefore, it is possible to appropriately convert the conversion target character string including the directive using the co-occurrence information.

【0014】請求項3のかな漢字変換装置においては、
前記変換手段は、所定の文節区切り規則に基づいて、文
節の区切りを行なって前記変換候補を生成するととも
に、前記文節の区切り方が複数ある場合には、その複数
の区切り方に基づいた複数の変換候補を生成し、この複
数の変換候補について、前記共起情報を用いた変換を行
なう。したがって、文節区切りが一義的でない場合も、
前記共起情報を用いた変換をすることができる。
According to a third aspect of the present invention, there is provided a kana-kanji conversion device.
The conversion unit generates the conversion candidate by performing segmentation based on a predetermined segmentation rule, and when there are a plurality of segmentation methods, a plurality of conversion methods based on the plurality of segmentation methods. A conversion candidate is generated, and conversion is performed on the plurality of conversion candidates using the co-occurrence information. Therefore, even if the phrase break is not unique,
Conversion using the co-occurrence information can be performed.

【0015】[0015]

【発明の実施の態様】DESCRIPTION OF THE PREFERRED EMBODIMENTS

1.機能ブロック図の説明 本発明の一実施例を図面に基づいて説明する。図1に示
すかな漢字変換装置1は、変換対象文字列記憶手段2、
変換手段3、変換候補記憶手段5、確定文字列記憶手段
7、共起情報記憶手段9、先行詞候補決定手段11、確
定手段13、および表示手段15を備えている。
1. Description of Functional Block Diagram An embodiment of the present invention will be described with reference to the drawings. The kana-kanji conversion device 1 shown in FIG.
It includes a conversion unit 3, a conversion candidate storage unit 5, a fixed character string storage unit 7, a co-occurrence information storage unit 9, an antecedent candidate determination unit 11, a determination unit 13, and a display unit 15.

【0016】変換対象文字列記憶手段2は、操作者が入
力した入力データである変換対象文字列を記憶する。変
換手段3は、前記変換対象文字列を所定の変換規則に基
づいて変換し、変換候補を生成する。変換候補記憶手段
5は、前記変換候補を記憶する。共起情報記憶手段9
は、同音異義語の処理を行なうための共起情報を記憶す
る。先行詞候補決定手段11は、与えられた変換対象文
字列に指示詞が含まれているか否か判断し、指示詞が含
まれている場合には、確定文字列記憶手段7に記憶され
た確定文字列中から、前記指示詞が示す先行詞候補を決
定する。なお、この先行詞候補は複数である場合もあ
る。変換手段3は、前記指示詞を前記先行詞候補に置き
換えて、前記共起情報を用いた変換が可能か否か判断
し、可能である場合には前記共起情報を用いた変換を行
なう。
The conversion target character string storage means 2 stores a conversion target character string which is input data input by the operator. The conversion unit 3 converts the conversion target character string based on a predetermined conversion rule to generate a conversion candidate. The conversion candidate storage unit 5 stores the conversion candidates. Co-occurrence information storage means 9
Stores co-occurrence information for processing homonyms. The antecedent candidate determination means 11 determines whether or not the given conversion target character string contains an instruction, and if the instruction is included, the finalized character string stored in the determined character string storage 7. From the character string, determine the antecedent candidate indicated by the demonstrative. Note that there may be a plurality of antecedent candidates. The conversion means 3 replaces the demonstrative with the antecedent candidate, determines whether or not conversion using the co-occurrence information is possible, and if possible, performs conversion using the co-occurrence information.

【0017】一方、変換手段3は、前記共起情報を用い
た再変換が必要でない場合は、表示手段5に前記変換候
補を表示する。確定手段13は、操作者からの確定命令
を受けて、変換候補記憶手段5に記憶された変換候補を
確定させ、確定文字列記憶手段7に確定文字列として記
憶する。
On the other hand, when the re-conversion using the co-occurrence information is not necessary, the conversion means 3 displays the conversion candidates on the display means 5. The determination unit 13 receives the determination command from the operator, determines the conversion candidates stored in the conversion candidate storage unit 5, and stores the conversion candidates in the determined character string storage unit 7 as a determined character string.

【0018】したがって、かな漢字変換装置1は、指示
詞を含む変換対象文字列が与えられた場合に、確定文字
列記憶手段7に記憶されたデータから先行詞を検索し
て、共起情報を用いた変換を行なうことができる。
Therefore, the kana-kanji conversion device 1 searches for the antecedent from the data stored in the definite character string storage means 7 when the conversion target character string including the demonstrative is given, and uses the co-occurrence information. Conversion can be performed.

【0019】なお、先行詞候補決定手段11は、変換候
補記憶手段5に記憶された変換候補から前記先行詞候補
を検索するようにしてもよい。
The antecedent candidate determination means 11 may search for the antecedent candidate from the conversion candidates stored in the conversion candidate storage means 5.

【0020】なお、本実施形態においては、先行詞候補
決定手段11は、与えられた変換対象文字列に指示詞が
含まれているか否か判断し、指示詞が含まれている場合
には、確定文字列記憶手段7に記憶された確定文字列中
から、前記指示詞が示す先行詞候補を決定するようにし
ているが、前記判断を行なわなくともよい。また、変換
手段3は、前記指示詞を前記先行詞候補に置き換えて、
前記共起情報を用いた変換が可能か否か判断し、可能で
ある場合には前記共起情報を用いた変換を行なうが、前
記判断を行なわずに、前記共起情報を用いた変換を行な
うようにしてもよい。
In the present embodiment, the antecedent candidate determining means 11 determines whether or not the given character string to be converted includes a demonstrative character. Although the antecedent candidate indicated by the demonstrator is determined from the determined character string stored in the determined character string storage means 7, the determination need not be performed. Further, the conversion means 3 replaces the denotative with the antecedent candidate,
It is determined whether or not conversion using the co-occurrence information is possible, and if possible, conversion using the co-occurrence information is performed, but without performing the determination, conversion using the co-occurrence information is performed. It may be performed.

【0021】以下に示すCPU23を用いて実現した実
施形態と、図1に示す各手段との関係について説明す
る。変換手段3は、CPU23のステップST3、ステ
ップST15、ステップST17の処理に該当する。変
換候補記憶手段5は、メモリ27の変換用作業バッファ
27hに該当する。確定文字列記憶手段7は、メモリ2
7の確定結果バッファ27kに該当する。共起情報記憶
手段9は、ハードディスク26の共起用例辞書部26c
に該当する。先行詞候補決定手段11は、CPU23の
ステップST9、ステップST11の処理に該当する。
The relationship between the embodiment realized by using the CPU 23 described below and each means shown in FIG. 1 will be described. The conversion means 3 corresponds to the processing of step ST3, step ST15, and step ST17 of the CPU 23. The conversion candidate storage means 5 corresponds to the conversion work buffer 27h of the memory 27. The confirmed character string storage means 7
7 corresponds to the determined result buffer 27k. The co-occurrence information storage means 9 stores the co-occurrence example dictionary section 26 c
Corresponds to. The antecedent candidate determining means 11 corresponds to the processing of step ST9 and step ST11 of the CPU 23.

【0022】2.ハードウェア構成 図2に、図1に示す装置1をCPUを用いて実現したハ
ードウェア構成の一例を示す。
2. 2. Hardware Configuration FIG. 2 shows an example of a hardware configuration in which the device 1 shown in FIG. 1 is realized using a CPU.

【0023】装置1は、CPU23、メモリ27、ハー
ドディスク26、CRT30、FDD25、キーボード
28、マウス31およびバスライン29を備えている。
CPU23は、ハードディスク26に記憶された制御プ
ログラムにしたがいバスライン29を介して、各部を制
御する。
The apparatus 1 includes a CPU 23, a memory 27, a hard disk 26, a CRT 30, a FDD 25, a keyboard 28, a mouse 31, and a bus line 29.
The CPU 23 controls each unit via a bus line 29 according to a control program stored in the hard disk 26.

【0024】前記制御プログラムは、例えば、FDD3
3を介して、プログラムが記憶されたフレキシブルディ
スク(ディスケット)からハードディスク26にインス
トールすればよい。なお、フレキシブルディスク以外
に、CD−ROM、ICカード等のプログラムを実体的
に一体化したコンピュータ可読の記憶媒体から、ハード
ディスクにインストールさせてもよい。さらに、通信回
線を用いてダウンロードさせてもよい。
The control program is, for example, FDD3
3 through a flexible disk (diskette) in which the program is stored. In addition to the flexible disk, a hard disk may be installed from a computer-readable storage medium in which a program such as a CD-ROM or an IC card is substantially integrated. Furthermore, you may make it download using a communication line.

【0025】本実施形態においては、プログラムをフレ
キシブルディスクからハードディスク26にインストー
ルさせることにより、フレキシブルディスクに記憶させ
たプログラムを間接的にコンピュータに実行させるよう
にしている。しかし、これに限定されることなく、フレ
キシブルディスクに記憶させたプログラムをFDD33
から直接的に実行するようにしてもよい。なお、コンピ
ュータによって、実行可能なプログラムとしては、その
ままのインストールするだけで直接実行可能なものはも
ちろん、一旦変換が必要なもの(例えば、データ圧縮さ
れているものを、解凍する等)、さらには、他のモジュ
ール部分(OS、ライブラリ等)と組合して実行可能な
ものも含む。
In the present embodiment, the program is installed on the hard disk 26 from the flexible disk, so that the computer indirectly executes the program stored on the flexible disk. However, the present invention is not limited to this.
Alternatively, it may be executed directly from. The programs executable by the computer include those that can be directly executed by simply installing the software, programs that need to be converted once (for example, decompressing data that has been compressed, etc.), , Which can be executed in combination with other module parts (OS, library, etc.).

【0026】メモリ27は、読みバッファ27y、変換
用作業バッファ27h、確定結果バッファ27k及び先
行詞チェック用バッファ27cを備えている。読みバッ
ファ27yは、入力された読み文字列が記憶される。変
換用作業バッファ27hは、かな漢字変換を行うための
作業用の領域である。確定結果バッファ27kは、確定
キーが押された場合の確定結果を記憶する領域である。
先行詞チェック用バッファ27cは、先行詞のチェック
を行うために、その候補を一時的に記憶する領域であ
る。
The memory 27 includes a reading buffer 27y, a conversion work buffer 27h, a confirmed result buffer 27k, and a preceding word check buffer 27c. The reading buffer 27y stores the input reading character string. The conversion work buffer 27h is a work area for performing kana-kanji conversion. The determination result buffer 27k is an area for storing a determination result when the determination key is pressed.
The antecedent check buffer 27c is an area for temporarily storing candidates for the antecedent check.

【0027】ハードディスク26は、制御プログラム2
6a、基本辞書部26b、共起用例辞書部26c及び付
属語用辞書部26dを備えている。制御プログラム26
aは、この装置の制御プログラムを記憶しており、基本
辞書部26bはかな漢字変換における基本辞書を記憶す
る。共起用例辞書部26cは、図3に示すように同音異
義語の処理を行うための共起用例が対(ペア)で記憶さ
れている。なお、図3には示していないが、従来と同様
に、その読み、品詞、動詞の活用類型(五段活用等)な
どの関係情報も合わせて記憶されている。付属語用辞書
部26dは、付属語(助詞等)の用例を記憶する辞書部
である。
The hard disk 26 stores the control program 2
6a, a basic dictionary unit 26b, a co-occurrence example dictionary unit 26c, and an auxiliary word dictionary unit 26d. Control program 26
“a” stores a control program of the apparatus, and the basic dictionary unit 26b stores a basic dictionary in kana-kanji conversion. As shown in FIG. 3, the co-occurrence example dictionary unit 26c stores co-occurrence examples for processing homonymous words in pairs. Although not shown in FIG. 3, related information such as the reading, the part of speech, and the type of use of the verb (five-step use, etc.) is also stored as in the conventional case. The auxiliary word dictionary unit 26d is a dictionary unit that stores an example of an auxiliary word (particle, etc.).

【0028】CRT30には、変換候補等が表示され
る。
Conversion candidates and the like are displayed on the CRT 30.

【0029】3.フローチャート つぎに、ハードディスク26に記憶されている制御プロ
グラムについて、説明する。以下では、既に確定結果バ
ッファ27kに「彼女は大きな木をもらった。」が記憶
されているものとして説明する。
3. Flowchart Next, a control program stored in the hard disk 26 will be described. In the following, a description will be given assuming that "She got a large tree." Has already been stored in the confirmed result buffer 27k.

【0030】CPU23は、入力された文字列を読みバ
ッファ27yに読み込む(図4ステップST1)。以下
では、キーボード28から変換対象文字列「それをきる
のはむずかしい」が入力され、読みバッファ27yに読
み出されたものとして説明する。
The CPU 23 reads the input character string into the reading buffer 27y (step ST1 in FIG. 4). In the following, a description will be given assuming that the character string to be converted “difficult to cut it” is input from the keyboard 28 and read into the reading buffer 27y.

【0031】CPU23は、所定の文節区切り規則及び
かな漢字変換規則に基づいて、文節区切りを行なうとと
もに変換候補を特定し、変換用作業バッファ27hに記
憶する(ステップST3)。ここでは、図5Aに示すよ
うに、変換対象文字列「それをきるのはむずかしい」
が、使用頻度等を考慮して、変換候補「それを着るのは
難しい」に変換されたものとする。
The CPU 23 separates phrases and specifies conversion candidates based on a predetermined rule for separating phrases and kana-kanji conversion rules, and stores them in the conversion work buffer 27h (step ST3). Here, as shown in FIG. 5A, the character string to be converted “it is difficult to cut it”
However, it is assumed that the conversion candidate has been converted to "difficult to wear" in consideration of the frequency of use and the like.

【0032】つぎに、CPU23は、変換用作業バッフ
ァ27hに記憶された変換候補に、共起用例辞書部26
cに該当するものがあるか否かを判断する(ステップS
T5)。この場合、変換用作業バッファ27hに記憶さ
れたデータ「それを着るのは難しい」には、共起用例辞
書部26cの共起用例が存在しないので、ステップST
9に進み、指示詞があるか否かを判断する。本実施形態
においては、指示詞が存在するか否かは、変換用作業バ
ッファ27hに各文節ごとに記憶された品詞情報に基づ
いて(図示せず)、判断するようにしたが、これに限定
されるものではなく、例えば、指示詞となる単語を記憶
する指示詞単語テーブルを用意し、該当するものがある
か否かを判断するようにしてもよい。
Next, the CPU 23 adds the co-occurrence example dictionary 26 to the conversion candidates stored in the conversion work buffer 27h.
It is determined whether or not there is any item corresponding to c (step S
T5). In this case, since the co-occurrence example of the co-occurrence example dictionary section 26c does not exist in the data “It is difficult to wear” stored in the conversion work buffer 27h, the step ST
Proceed to 9 to determine whether or not there is a directive. In the present embodiment, whether or not an instruction is present is determined based on part-of-speech information (not shown) stored for each phrase in the conversion work buffer 27h, but is not limited to this. Instead, for example, a descriptive word table that stores words to be descriptives may be prepared, and it may be determined whether or not there is a corresponding one.

【0033】なお、CPU23は、ステップST5に
て、共起用例が存在すると判断した場合には、従来と同
様に共起情報を用いた変換を行ない、ステップST9に
進む。
If the CPU 23 determines in step ST5 that there is a co-occurrence example, it performs conversion using co-occurrence information as in the prior art, and proceeds to step ST9.

【0034】この場合、CPU23は、ステップST9
において、指示詞「それ」が存在するので、ステップS
T11に進み、確定結果バッファ27kに記憶されてい
るデータから、先行詞となり得る候補(以下先行詞候補
という)を特定し、記憶する。本実施形態においては、
先行詞候補については、確定バッファ27kに記憶され
た品詞情報に基づいて(図示せず)、名詞句を含む文節
を選択するようにした。この場合、CPU23は、確定
結果バッファ27kに、先行詞候補「彼女」および
「木」を特定し、先行詞チェック用バッファ27cに記
憶する。この状態を図5Bに示す。
In this case, the CPU 23 determines in step ST9
In step S, since the demonstrative "it" exists,
Proceeding to T11, a candidate that can be an antecedent (hereinafter referred to as antecedent candidate) is specified from the data stored in the determination result buffer 27k and stored. In the present embodiment,
As for the antecedent candidate, a phrase including a noun phrase is selected based on the part of speech information stored in the definite buffer 27k (not shown). In this case, the CPU 23 specifies the antecedent candidates “her” and “tree” in the confirmed result buffer 27k and stores them in the antecedent check buffer 27c. This state is shown in FIG. 5B.

【0035】つぎに、CPU23は抽出した全先行詞候
補について、共起用例辞書部26cに存在するか否かを
判断する(図4ステップST15)。この場合、まず、
「彼女」が「それ」と置換され、「彼女を切るのは難し
い」で、共起用例辞書部26cに共起用例として存在す
るか否かが判断される。この場合、存在しないので、つ
ぎの候補である「木」が「それ」と置換されて「木を切
るのは難しい」に共起用例が存在するか否かを判断す
る。この場合、共起用例辞書部26cに「木」と「切
る」が共起用例として存在するので、再変換処理を行な
う(ステップST17)。これにより、図5Cに示すよ
うに、変換用作業バッファ27hには、変換候補「それ
を切るのは難しい」が記憶される。CPU23は、変換
用作業バッファ27hに記憶された変換候補「それを切
るのは難しい」をCRT30に表示する(図4ステップ
ST19)。
Next, the CPU 23 determines whether or not all extracted antecedent candidates exist in the co-occurrence example dictionary unit 26c (step ST15 in FIG. 4). In this case, first
“She” is replaced with “It”, and it is “difficult to cut her”, and it is determined whether or not it exists as a co-occurrence example in the co-occurrence example dictionary section 26c. In this case, since there is no co-occurrence example, it is determined whether or not a co-occurrence example exists in which “the tree is hard to cut” is replaced by “the tree”, which is the next candidate. In this case, since "tree" and "cut" exist as co-occurrence examples in the co-occurrence example dictionary section 26c, re-conversion processing is performed (step ST17). Thus, as shown in FIG. 5C, the conversion work buffer 27h stores the conversion candidate “It is difficult to cut it”. The CPU 23 displays the conversion candidate “It is difficult to cut it” stored on the conversion work buffer 27h on the CRT 30 (FIG. 4, step ST19).

【0036】操作者は、表示された変換候補を見て、キ
ーボード28の確定キーまたは取消キーを操作する。C
PU23は、確定キーまたは取消キーが操作されるか否
かを判断しており(ステップST21)、確定キーが押
された場合には、これを確定する(ステップST2
3)。具体的にはCPU23は、確定結果バッファ27
kに変換用作業バッファ27hのデータを追加して記憶
する。一方、ステップST21にて、取消キーが押され
た場合には、そのまま終了する。
The operator looks at the displayed conversion candidates and operates the enter key or the cancel key on the keyboard 28. C
The PU 23 determines whether or not the enter key or the cancel key is operated (step ST21). If the enter key is pressed, it is determined (step ST2).
3). Specifically, the CPU 23
The data of the conversion work buffer 27h is added to k and stored. On the other hand, if the cancel key is pressed in step ST21, the process ends.

【0037】このように、本実施形態においては、先行
詞となりうる先行詞候補について、確定結果バッファ2
7kを検索し、先行詞候補を全て抽出して、共起用例辞
書部26cに記憶された共起用例とマッチングするのが
あるか否かを判断するようにしている。そして、先行詞
候補が存在する場合には、変換候補をその共起用例の単
語と入れ替えて変換するようにしている。これにより、
指示詞があるような場合でも、より変換効率の高い変換
を行うことができる。
As described above, in the present embodiment, for the antecedent candidate that can be the antecedent, the determined result buffer 2
7k is searched, all antecedent candidates are extracted, and it is determined whether or not there is a match with the co-occurrence example stored in the co-occurrence example dictionary unit 26c. When there is an antecedent candidate, the conversion candidate is replaced with the word of the co-occurrence example and converted. This allows
Even when there is a directive, conversion with higher conversion efficiency can be performed.

【0038】なお、複数の先行詞候補が存在する場合
に、全先行詞候補を抽出するようにしたが、優先規則を
記憶しておき、先行詞候補を絞り込むようにしてもよ
い。例えば、名詞句のうちでも、指示詞が「それ」、
「これ」である場合には、「人」を差しにくいので、
「彼女」は先行詞候補から外すようにすればよい。すな
わち、指示詞の性質(人象指示詞か、物象指示詞か等)
等を記憶しておき、その性質に応じて、絞り込むように
してもよい。
Although a plurality of antecedent candidates are extracted when there are a plurality of antecedent candidates, priority rules may be stored to narrow the antecedent candidates. For example, among the noun phrases, the declarative is "it",
If it is "this", it is difficult to refer to "people"
"She" may be excluded from the antecedent candidates. In other words, the properties of the demonstratives (whether they are human or physical descriptives, etc.)
And the like may be stored, and narrowed down according to the property.

【0039】なお、確定結果バッファに記憶された変換
後文字列を全て検索するのではなく、句点(。)で区切
られる一文、および二文だけ等の、限られた範囲を検索
するようにしてもよい。
It is to be noted that instead of searching all the converted character strings stored in the determined result buffer, a limited range such as only one sentence or two sentences separated by a period (.) Is searched. Is also good.

【0040】また、この実施形態においては先行詞候補
を、確定結果バッファ27kから抽出するようにしてい
る。これにより、各文節毎に細切れ入力した場合でも、
指示詞を含む文節を適切に変換することができる。しか
し、これに限定されず、変換用作業バッファ27hを検
索するようにしてもよい。これにより、二文の読みを入
力して、一度に変換をする場合でも、指示詞を含む文節
を適切に変換することができる。
In this embodiment, antecedent candidates are extracted from the determined result buffer 27k. With this, even if you input a fragment for each phrase,
Phrases including demonstrators can be appropriately converted. However, the present invention is not limited to this, and the conversion work buffer 27h may be searched. Thus, even when two readings are input and conversion is performed at a time, a phrase including a directive can be appropriately converted.

【0041】なお、上記実施形態においては、共起用例
を用いた同音異義語の変換をするのに、従来と同様に、
その読みと品詞をキーとして検索しておこなったが、こ
の方法に限定されるわけではなく、他の方法を適用する
こともできる。
In the above embodiment, the homonym conversion using the co-occurrence example is performed in the same manner as in the prior art.
Although the search was performed using the reading and the part of speech as keys, the present invention is not limited to this method, and other methods can be applied.

【0042】また、入力文字列を文節に区切る場合に、
複数の区切り方が存在する場合には、それを各々変換用
作業バッファ27hに記憶し、それぞれについて先行詞
候補のチェックを行うようにしてもよい。
When the input character string is divided into phrases,
When there are a plurality of delimiters, each of them may be stored in the conversion work buffer 27h, and the antecedent candidate may be checked for each.

【0043】なお、本実施形態においては、一旦通常の
基本辞書を用いて変換し、共起用例がある場合には、こ
れを用いて再変換後、変換候補として表示し、共起用例
が無い場合は、そのまま変換候補として表示して、操作
者の確定命令入力を待つようにしている。したがって、
操作者は、前記再変換が行なわれたか否かを意識しない
で、前記変換候補が表示される。
In the present embodiment, conversion is performed once using an ordinary basic dictionary, and if there is a co-occurrence example, it is re-converted using this and displayed as a conversion candidate, and there is no co-occurrence example. In this case, it is displayed as a conversion candidate as it is, and waits for the operator to input a confirmation command. Therefore,
The conversion candidate is displayed without the operator being conscious of whether or not the re-conversion has been performed.

【0044】また、本実施形態においては、本発明を日
本語ワードプロッセッサに適用した場合について説明し
たが、日本語ワードプロッセッサのFEPとして用いる
こともできる。さらに、日本語ワードプロッセッサ以外
のアプリケーションプログラム、たとえば、CADプロ
グラムや表計算プログラム等のFEPとして、かな漢字
変換装置を用いる場合にも適用される。
In this embodiment, the case where the present invention is applied to a Japanese word processor has been described. However, the present invention can be used as a FEP of a Japanese word processor. Furthermore, the present invention is also applied to a case where a kana-kanji conversion device is used as an application program other than the Japanese word processor, for example, a FEP such as a CAD program or a spreadsheet program.

【0045】なお、本実施形態においては、図1に示す
機能を実現する為に、CPU23を用い、ソフトウェア
によってこれを実現している。しかし、その一部もしく
は全てを、ロジック回路等のハードウェアによって実現
してもよい。
In the present embodiment, the functions shown in FIG. 1 are realized by using the CPU 23 and software. However, some or all of them may be realized by hardware such as a logic circuit.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明にかかるかな漢字変換1の機能ブロック
図である。
FIG. 1 is a functional block diagram of Kana-Kanji conversion 1 according to the present invention.

【図2】図1に示すかな漢字変換装置1のハードウエア
構成の一例を示す図である。
FIG. 2 is a diagram showing an example of a hardware configuration of the kana-kanji conversion device 1 shown in FIG.

【図3】共起用例辞書を示す図である。FIG. 3 is a diagram showing a co-occurrence example dictionary.

【図4】先行詞がある場合の変換を説明するフローチャ
ートである。
FIG. 4 is a flowchart illustrating conversion when there is an antecedent.

【図5】各バッファの変遷を示す図である。FIG. 5 is a diagram showing the transition of each buffer.

【符号の説明】 3・・・・変換手段 5・・・・変換候補記憶手段 7・・・・確定文字列記憶手段 9・・・・共起情報記憶手段 11・・・先行詞候補決定手段 13・・・個別情報付加手段 23・・・CPU 27・・・メモリ[Description of Signs] 3... Conversion means 5... Conversion candidate storage means 7... 13: Individual information adding means 23: CPU 27: Memory

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】変換対象文字列を所定の変換規則に基づい
て変換するかな漢字変換装置において、 与えられた変換対象文字列に指示詞が含まれている場合
には、前記指示詞が示す先行詞候補を検索して、前記指
示詞を前記先行詞候補に置き換えて、共起情報を用いて
同音異義語の処理を行ないつつ、前記変換を行なうこ
と、 を特徴とするかな漢字変換装置。
1. A kana-kanji conversion device for converting a character string to be converted based on a predetermined conversion rule, wherein when a given character string to be converted includes an instruction, the antecedent indicated by the instruction is used. Kana-Kanji conversion apparatus characterized by: searching for candidates, replacing said demonstratives with said antecedent candidates, and performing said conversion while processing homonyms using co-occurrence information.
【請求項2】変換対象文字列を所定の変換規則に基づい
て変換候補を生成する変換手段、 前記変換候補を記憶する変換候補記憶手段、 を備え、 操作者からの確定命令を受けて、前記変換候補記憶手段
に記憶された変換候補を確定文字列として記憶する確定
文字列記憶手段、 を備えたかな漢字変換装置において、 同音異義語の処理を行なうための共起情報を記憶する共
起情報記憶手段、 与えられた変換対象文字列に指示詞が含まれている場合
には、前記変換候補記憶手段に記憶された変換候補また
は前記確定文字列記憶手段に記憶された確定文字列中か
ら、前記指示詞が示す先行詞候補を決定する先行詞候補
決定手段を備え、 前記変換手段は、前記指示詞を前記先行詞候補に置き換
えて、前記共起情報を用いた変換を行なうこと、 を特徴とするかな漢字変換装置。
2. A conversion means for generating a conversion candidate based on a predetermined conversion rule for a character string to be converted, and a conversion candidate storage means for storing the conversion candidate. Co-occurrence information storage for storing co-occurrence information for processing homonymous words in a kana-kanji conversion device comprising: a fixed character string storage means for storing the conversion candidates stored in the conversion candidate storage means as a fixed character string. Means, when the given conversion target character string includes an instruction, from the conversion candidates stored in the conversion candidate storage means or the fixed character string stored in the fixed character string storage means, An antecedent candidate determining means for determining an antecedent candidate indicated by a demonstrative, wherein the converting means replaces the definitive with the antecedent candidate and performs conversion using the co-occurrence information. Kana-kanji conversion device that.
【請求項3】請求項2のかな漢字変換装置において、 前記変換手段は、所定の文節区切り規則に基づいて、文
節の区切りを行なって前記変換候補を生成するととも
に、前記文節の区切り方が複数ある場合には、その複数
の区切り方に基づいた複数の変換候補を生成し、この複
数の変換候補について、前記共起情報を用いた変換を行
なうこと、 を特徴とするかな漢字変換装置。
3. The kana-kanji conversion device according to claim 2, wherein the conversion means generates the conversion candidates by performing segmentation based on a predetermined segmentation rule, and there are a plurality of ways of segmenting the phrase. In this case, a plurality of conversion candidates are generated based on the plurality of delimiters, and the plurality of conversion candidates are converted using the co-occurrence information.
【請求項4】変換対象文字列を所定の変換規則に基づい
て変換するかな漢字変換方法において、 与えられた変換対象文字列に指示詞が含まれている場合
には、前記指示詞が示す先行詞候補を検索して、前記指
示詞を前記先行詞候補に置き換えて、共起情報を用いて
同音異義語の処理を行ないつつ、前記変換を行なうこ
と、 を特徴とするかな漢字変換方法。
4. In a kana-kanji conversion method for converting a character string to be converted based on a predetermined conversion rule, when a given character string to be converted includes a directive, the antecedent indicated by the directive is indicated. Retrieving candidates, replacing said descriptives with said antecedent candidates, and performing said conversion while processing homonyms using co-occurrence information.
【請求項5】コンピュータが実行可能なプログラムを記
憶したコンピュータ可読の記憶媒体であって、前記プロ
グラムは、請求項1ないし請求項4のいずれかの装置又
は方法を実現するものであること、 を特徴とする記憶媒体。
5. A computer-readable storage medium storing a computer-executable program, wherein the program implements the apparatus or method according to claim 1. Characteristic storage medium.
JP9204159A 1997-07-30 1997-07-30 Kana/kanji converter and method therefor Pending JPH1153354A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP9204159A JPH1153354A (en) 1997-07-30 1997-07-30 Kana/kanji converter and method therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP9204159A JPH1153354A (en) 1997-07-30 1997-07-30 Kana/kanji converter and method therefor

Publications (1)

Publication Number Publication Date
JPH1153354A true JPH1153354A (en) 1999-02-26

Family

ID=16485820

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9204159A Pending JPH1153354A (en) 1997-07-30 1997-07-30 Kana/kanji converter and method therefor

Country Status (1)

Country Link
JP (1) JPH1153354A (en)

Similar Documents

Publication Publication Date Title
US7526423B2 (en) Apparatus and method for selecting a translation word of an original word by using a target language document database
US6535842B1 (en) Automatic bilingual translation memory system
US8041557B2 (en) Word translation device, translation method, and computer readable medium
JP5535379B2 (en) Japanese virtual dictionary
JP5513898B2 (en) Shared language model
WO2001082111A2 (en) Computer-aided reading system and method with cross-language reading wizard
US20080077397A1 (en) Dictionary creation support system, method and program
JP2010520531A (en) Integrated pinyin and image input
JP2002117027A (en) Feeling information extracting method and recording medium for feeling information extracting program
US7684975B2 (en) Morphological analyzer, natural language processor, morphological analysis method and program
JP2000148754A (en) Multilingual system, multilingual processing method, and medium storing program for multilingual processing
JP5025603B2 (en) Machine translation apparatus, machine translation program, and machine translation method
JP2943791B2 (en) Language identification device, language identification method, and recording medium recording language identification program
JP3952964B2 (en) Reading information determination method, apparatus and program
JPH1153354A (en) Kana/kanji converter and method therefor
JP2715419B2 (en) Translation equipment
JPH0561902A (en) Mechanical translation system
JP2004264960A (en) Example-based sentence converter and computer program
JP5032453B2 (en) Machine translation apparatus and machine translation program
JP3267168B2 (en) Natural language conversion system
JP3061855B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JP2022075104A (en) Input supporting device, input supporting system and program
WO2012127805A1 (en) Translation word selecting condition extraction system, translation word selecting condition extraction method, and translation word selecting condition extraction program
JPH0612449A (en) System and method for machine translation
Wenzowski Advances in automated and computer assisted coding software at Statistics Canada