Nothing Special   »   [go: up one dir, main page]

JP2005148199A - Information processing apparatus, image forming apparatus, program, and storage medium - Google Patents

Information processing apparatus, image forming apparatus, program, and storage medium Download PDF

Info

Publication number
JP2005148199A
JP2005148199A JP2003382282A JP2003382282A JP2005148199A JP 2005148199 A JP2005148199 A JP 2005148199A JP 2003382282 A JP2003382282 A JP 2003382282A JP 2003382282 A JP2003382282 A JP 2003382282A JP 2005148199 A JP2005148199 A JP 2005148199A
Authority
JP
Japan
Prior art keywords
signal
microphone
input
voice
impulse response
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003382282A
Other languages
Japanese (ja)
Inventor
Kazuhito Saito
一仁 齊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003382282A priority Critical patent/JP2005148199A/en
Publication of JP2005148199A publication Critical patent/JP2005148199A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To improve usability by making it easy to input a retrieval keyword when a file group is retrieved. <P>SOLUTION: When the retrieval keyword is inputted in voice (steps S3 and S4), the voice of the inputted retrieval keyword is recognized by a voice recognition part and converted into text data (step S6), which are displayed on a console panel (step S7). When it is considered that the displayed retrieval keyword is proper, an OK button is selected (Y at step S9) and then a retrieving engine performs full-text retrieval based upon the retrieval keyword from text data files in a database (step S10) and displays retrieval results on a console panel (step S11). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

本発明は、ファイル検索などを行なう情報処理装置、画像形成装置及びプログラム、並びにこのプログラムを記憶した記憶媒体に関する。   The present invention relates to an information processing apparatus that performs file search and the like, an image forming apparatus, a program, and a storage medium that stores the program.

特許文献1には、スピーカーから出力する音声による音響エコーに人間の声、背景雑音などが混入している場合に、マイク入力する音声から、これら音響エコーなどのノイズを除去する技術について開示されている。   Patent Document 1 discloses a technique for removing noises such as acoustic echoes from voices input to a microphone when human voices, background noises, and the like are mixed in the acoustic echoes generated by voices output from speakers. Yes.

特開平10−257583号公報JP 10-257583 A

デジタル複写機においては、画像データなどのファイルを蓄積する機能や、ネットワーク機能を備えたものが知られている。このようなデジタル複写機においては、蓄積されるファイルには、スキャナで読み取ったPDFファイルなどをOCR処理したテキストデータや、インターネットやLANを介して外部から受信したテキストデータなども蓄積される。そこで、このような蓄積されたテキストデータを含むファイルを対象として全文検索することができれば、必要なファイルを用意に探し出すことができて便利である。このような全文検索の技術については、さまざまな技術が周知である。   Digital copying machines are known that have a function of storing files such as image data and a network function. In such a digital copying machine, the stored file also stores text data obtained by OCR processing of a PDF file read by a scanner, text data received from the outside via the Internet or LAN, and the like. Therefore, if a full-text search can be performed on a file containing such accumulated text data, it is convenient to find a necessary file in advance. Various techniques for such full-text search are well known.

しかしながら、この全文検索を行う際に検索キーワードをキーボード操作で入力したのでは、全文検索機能の使い勝手が悪く、より簡易な操作により全文検索できるようにしたい。   However, if a search keyword is input by keyboard operation when performing this full-text search, the full-text search function is not easy to use, and the full-text search can be performed by a simpler operation.

本発明の目的は、ファイル群の検索を行う際に、検索キーワードの入力を容易として使い勝手を向上させることである。   An object of the present invention is to facilitate the input of a search keyword and improve the usability when searching for a file group.

本発明は、マイクと、このマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、このテキストデータを検索キーワードとして所定のファイル群を検索する検索手段と、を備えている情報処理装置である。   The present invention includes a microphone, speech recognition means for recognizing a voice input through the microphone and converting it into text data, and search means for searching a predetermined file group using the text data as a search keyword. Information processing apparatus.

別の面から見た本発明は、原稿の画像を読み取るスキャナと、この読取後の画像データに基づいて媒体上に画像の形成を行うプリンタと、ファイル群を蓄積する蓄積手段と、マイクと、このマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、このテキストデータを検索キーワードとして前記ファイル群を検索する検索手段と、を備えている画像形成装置である。   Another aspect of the present invention is a scanner that reads an image of a document, a printer that forms an image on a medium based on the image data after the reading, a storage unit that stores a file group, a microphone, The image forming apparatus includes speech recognition means for recognizing voice converted by the microphone and converting it into text data, and search means for searching the file group using the text data as a search keyword.

別の面から見た本発明は、所定のマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、このテキストデータを検索キーワードとして所定のファイル群を検索する検索手段と、をコンピュータに実行させるコンピュータに読み取り可能なプログラムである。   Another aspect of the present invention relates to a voice recognition means for recognizing a voice inputted by a predetermined microphone and converting it into text data, and a search means for searching a predetermined file group using the text data as a search keyword. Is a computer-readable program that causes a computer to execute.

本発明によれば、検索キーワードをキーボードなどによらず音声入力により入力することができるので、検索機能の使い勝手を向上させることができる。   According to the present invention, since the search keyword can be input by voice input without using a keyboard or the like, the usability of the search function can be improved.

本発明を実施するための最良の一形態について説明する。   The best mode for carrying out the present invention will be described.

本実施の形態は、情報処理装置、画像形成装置として、コピー機能、ファクシミリ(FAX)機能、プリント機能、スキャナ機能及び入力画像(スキャナ機能による読み取り原稿画像やプリンタあるいはFAX機能により入力された画像)を配信する機能等を複合したいわゆるデジタルカラー複合機に適用した例を示す。   In this embodiment, as an information processing apparatus and an image forming apparatus, a copy function, a facsimile (FAX) function, a print function, a scanner function, and an input image (an original image read by the scanner function or an image input by a printer or a FAX function) An example applied to a so-called digital color multi-function peripheral that combines functions for distributing the image and the like.

図1は、本実施の形態のデジタルカラー複合機1を含むシステム構成図である。図1に示すように、本実施の形態においては、デジタルカラー複合機1に通信ネットワークであるLAN(Local Area Network)2を介し、各種の情報処理を実行するサーバコンピュータ3や複数代のクライアントコンピュータ4が接続されたシステムを想定する。サーバコンピュータ3は、例えばFTP,HTTPプロトコルをサポートしたり、WebサーバやDNS(ドメインネームサーバ)の機能を実現するものである。すなわち、このシステムにおいては、デジタルカラー複合機1が備えている画像入力機能(スキャナ機能)、画像出力機能(プリント機能)及び画像蓄積機能等の画像処理機能を、LAN2上でシェアし得る環境が構築されているものである。   FIG. 1 is a system configuration diagram including a digital color multifunction peripheral 1 according to the present embodiment. As shown in FIG. 1, in the present embodiment, a server computer 3 or a plurality of generations of client computers that execute various kinds of information processing via a local area network (LAN) 2 as a communication network is connected to the digital color MFP 1. Assume a system in which 4 is connected. The server computer 3 supports, for example, the FTP and HTTP protocols, and realizes functions of a Web server and DNS (Domain Name Server). That is, in this system, there is an environment in which image processing functions such as an image input function (scanner function), an image output function (print function), and an image storage function provided in the digital color multifunction peripheral 1 can be shared on the LAN 2. It has been built.

このようなシステムは、通信制御ユニット5を介してインターネット網6に接続され、インターネット網6を介して外部環境とデータ通信可能に構築されている。通信制御ユニット5としては、ルータ、交換機、モデム、DSLモデム等が一般的であるが、最低限TCP/IP通信が可能であればよい。また、LAN2は有線通信に限るものではなく、無線通信(赤外線や電波等)であってもよい。また、光ファイバーを用いたものであってもよい。   Such a system is connected to the Internet network 6 via the communication control unit 5 and is constructed so as to be able to communicate data with an external environment via the Internet network 6. The communication control unit 5 is generally a router, an exchange, a modem, a DSL modem, or the like, but it is sufficient that TCP / IP communication is possible at a minimum. The LAN 2 is not limited to wired communication, but may be wireless communication (infrared rays, radio waves, etc.). Further, an optical fiber may be used.

次に、デジタルカラー複合機1について説明する。ここで、図2はデジタルカラー複合機1を概略的に示す外観斜視図、図3はデジタルカラー複合機1の各部の電気的接続を示すブロック図である。図2に示すように、デジタルカラー複合機1は、転写紙などの媒体に画像を形成する画像形成装置である印刷装置7(プリンタ)の上部に、原稿から画像を読み取る画像読取装置8を配設した構成とされている。また、画像読取装置8(スキャナ)の装置外面には、オペレータに対する表示とオペレータからの機能設定等の各種の入力を許容する操作パネルPが設けられている。さらに、操作パネルPの下部には、光ディスク、フレキシブルディスクなどの記憶媒体M(図3参照)に記憶されているプログラムコードや画像データ等を読み取る、又は、記憶媒体Mに対してプログラムコードや画像データ等を書き込む装置である外部メディア入出力装置9が、記憶媒体Mの挿入を許容する挿入口を外部に露出させて設けられている。   Next, the digital color multifunction peripheral 1 will be described. Here, FIG. 2 is an external perspective view schematically showing the digital color multifunction peripheral 1, and FIG. 3 is a block diagram showing electrical connection of each part of the digital color multifunction peripheral 1. As shown in FIG. As shown in FIG. 2, the digital color multifunction peripheral 1 includes an image reading device 8 that reads an image from a document on an upper portion of a printing device 7 (printer) that is an image forming device that forms an image on a medium such as transfer paper. It is set as the set-up. An operation panel P that allows various inputs such as display to the operator and function setting from the operator is provided on the outer surface of the image reading device 8 (scanner). Further, under the operation panel P, program codes and image data stored in a storage medium M (see FIG. 3) such as an optical disk and a flexible disk are read, or program codes and images are read from the storage medium M. An external media input / output device 9 that is a device for writing data and the like is provided with an insertion opening that allows insertion of the storage medium M exposed to the outside.

このようなデジタルカラー複合機1のストラクチャとしては、図3に示すように、画像処理ユニット部Aと情報処理ユニット部Bとに大別されており、印刷装置7及び画像読取装置8は画像処理ユニット部Aに属し、操作パネルP及び外部メディア入出力装置9は情報処理ユニット部Bに属している。   As shown in FIG. 3, the structure of the digital color multifunction peripheral 1 is roughly divided into an image processing unit A and an information processing unit B, and the printing device 7 and the image reading device 8 are image processing units. The operation panel P and the external media input / output device 9 belong to the information processing unit B.

画像処理ユニット部Aについて説明する。印刷装置7及び画像読取装置8を備える画像処理ユニット部Aは、画像処理ユニット部Aにおける画像処理全般の制御を行う画像処理制御ユニット10を備えており、この画像処理制御ユニット10には、印刷装置7を制御する印刷制御ユニット11と、画像読取装置8を制御する画像読取制御ユニット12とが接続されている。   The image processing unit A will be described. The image processing unit A including the printing device 7 and the image reading device 8 includes an image processing control unit 10 that performs overall control of image processing in the image processing unit A. The image processing control unit 10 includes a printing unit. A print control unit 11 that controls the apparatus 7 and an image reading control unit 12 that controls the image reading apparatus 8 are connected.

印刷制御ユニット11は、画像処理制御ユニット10の制御に従って印刷装置7に対して画像データを含む印刷指示を出力し、印刷装置7に転写紙などの媒体に画像を形成して出力させる。印刷装置7はフルカラー印刷可能とされており、その印刷方式は、電子写真方式のほか、インクジェット方式、昇華型熱転写方式、銀塩写真方式、直接感熱記録方式、溶融型熱転写方式など、さまざまな方式を用いることができる。   The print control unit 11 outputs a print instruction including image data to the printing apparatus 7 under the control of the image processing control unit 10, and causes the printing apparatus 7 to form and output an image on a medium such as transfer paper. The printing device 7 is capable of full-color printing. In addition to the electrophotographic method, the printing method includes various methods such as an inkjet method, a sublimation type thermal transfer method, a silver salt photography method, a direct thermal recording method, and a melt type thermal transfer method. Can be used.

画像読取制御ユニット12は、画像処理制御ユニット10の制御により画像読取装置8を駆動し、原稿の表面に対するランプ照射の反射光をミラー及びレンズにより受光素子(例えば、CCD(Charge Coupled Device))に集光して読み取り、A/D変換してRGB各8bitのデジタル画像データを生成する。   The image reading control unit 12 drives the image reading device 8 under the control of the image processing control unit 10, and reflects the reflected light of the lamp irradiation on the surface of the document to a light receiving element (for example, a CCD (Charge Coupled Device)) using a mirror and a lens. Light is collected and read, and A / D converted to generate 8-bit RGB digital image data.

このような画像処理制御ユニット10は、メインプロセッサであるCPU(Central Processing Unit)13と、画像読取装置8から読み込んだ画像データを印刷装置7による作像に供すべく一旦格納しておくSDRAM(Synchronous Dynamic Random Access Memory)14と、制御プログラム等を記憶したROM(Read Only Memory)15と、システムログ/システム設定/ログ情報等を記録しておく電源OFF時にもデータの保持が可能なNVRAM16と、をバス接続したマイクロコンピュータ構成とされている。   Such an image processing control unit 10 includes a central processing unit (CPU) 13 as a main processor and an SDRAM (Synchronous) that temporarily stores image data read from the image reading device 8 for image formation by the printing device 7. Dynamic Random Access Memory) 14, ROM (Read Only Memory) 15 storing a control program, NVRAM 16 capable of holding data even when the power is turned off to record system log / system setting / log information, The microcomputer is configured with a bus connection.

また、画像処理制御ユニット10には、多量の画像データの蓄積やジョブ履歴等の記憶装置となるHDD(Hard Disk Drive)17、装置内部に設けられた集線装置であるHUB19を介して画像処理ユニット部AをLAN2に接続するためのLAN制御部18、FAX制御を行うFAX制御ユニット20が接続されている。このFAX制御ユニット20は、公衆電話網21に通じる構内交換器(PBX)22に接続されており、デジタルカラー複合機1は、遠隔のファクシミリ装置と交信することができる。   Further, the image processing control unit 10 includes an image processing unit via an HDD (Hard Disk Drive) 17 serving as a storage device for storing a large amount of image data and a job history, and a HUB 19 which is a concentrator provided inside the device. A LAN control unit 18 for connecting the part A to the LAN 2 and a FAX control unit 20 for performing FAX control are connected. The FAX control unit 20 is connected to a private branch exchange (PBX) 22 that communicates with the public telephone network 21, and the digital color multifunction peripheral 1 can communicate with a remote facsimile apparatus.

加えて、画像処理制御ユニット10には、表示制御ユニット23及び操作入力制御ユニット24が接続されている。表示制御ユニット23は、画像処理制御ユニット10のコントロールによって制御パネルI/F25に接続された通信ケーブル26を介して情報処理ユニット部Bに対して画像表示制御信号を出力し、情報処理ユニット部Bの操作パネルPに対して画像表示の制御を行う。また、操作入力制御ユニット24は、情報処理ユニット部Bの操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号を、画像処理制御ユニット10のコントロールによって制御パネルI/F25に接続された通信ケーブル26を介して入力する。すなわち、画像処理ユニット部Aは、情報処理ユニット部Bの操作パネルPを通信ケーブル26を介して直接モニタすることができる構成になっている。   In addition, a display control unit 23 and an operation input control unit 24 are connected to the image processing control unit 10. The display control unit 23 outputs an image display control signal to the information processing unit unit B via the communication cable 26 connected to the control panel I / F 25 under the control of the image processing control unit 10. The image display is controlled on the operation panel P. Further, the operation input control unit 24 connects an input control signal corresponding to the function setting or input operation by the operator from the operation panel P of the information processing unit B to the control panel I / F 25 by the control of the image processing control unit 10. Input via the communication cable 26. In other words, the image processing unit A is configured to be able to directly monitor the operation panel P of the information processing unit B via the communication cable 26.

したがって、画像処理ユニット部Aは、従来の画像処理装置が備える画像処理ユニットに対して通信ケーブル26を接続し、情報処理ユニット部Bの操作パネルPを利用するようにしたものである。すなわち、画像処理ユニット部Aの表示制御ユニット23及び操作入力制御ユニット24は、操作パネルPに接続されているものとして動作している。   Accordingly, the image processing unit A is configured such that the communication cable 26 is connected to the image processing unit provided in the conventional image processing apparatus, and the operation panel P of the information processing unit B is used. That is, the display control unit 23 and the operation input control unit 24 of the image processing unit A operate as if they are connected to the operation panel P.

このような構成により、画像処理ユニット部Aは、外部(サーバコンピュータ3、クライアントコンピュータ4、ファクシミリ装置等)からの画像情報である印刷データ及びプリント指示するコマンドを解析し、印刷データを出力画像データとして印刷できる状態にビットマップ展開し、印刷モードをコマンドから解析し動作を決定している。その印刷データ及びコマンドをLAN制御部18あるいはFAX制御ユニット20を通じて受信し動作する。   With such a configuration, the image processing unit A analyzes the print data that is image information from the outside (the server computer 3, the client computer 4, the facsimile machine, etc.) and the command that instructs printing, and outputs the print data to the output image data The bitmap is expanded so that it can be printed, and the printing mode is analyzed from the command to determine the operation. The print data and command are received and operated through the LAN control unit 18 or the FAX control unit 20.

また、画像処理ユニット部Aは、SDRAM14やHDD17に記憶されている印刷データ、原稿読取りデータ、これらを出力用に処理した出力画像データ、及び、それらを圧縮した圧縮データを外部(サーバコンピュータ3、クライアントコンピュータ4、ファクシミリ等)に転送することができる。   In addition, the image processing unit A externally print data stored in the SDRAM 14 or the HDD 17, document reading data, output image data processed for output, and compressed data obtained by compressing them externally (server computer 3, Client computer 4, facsimile, etc.).

さらに、画像処理ユニット部Aは、画像読取装置8の読取り画像データを画像処理制御ユニット10に転送し、光学系及びデジタル信号への量子化に伴う信号劣化を補正し、該画像データをSDRAM14に書込む。このようにしてSDRAM14に格納された画像データは、印刷制御ユニット11で出力画像データに変換されて、印刷装置7に出力される。   Further, the image processing unit A transfers the read image data of the image reading device 8 to the image processing control unit 10, corrects signal deterioration due to quantization to the optical system and digital signals, and stores the image data in the SDRAM 14. Write. The image data stored in the SDRAM 14 in this way is converted into output image data by the print control unit 11 and output to the printing apparatus 7.

次に、操作パネルPを備える情報処理ユニット部Bについて説明する。情報処理ユニット部Bは、一般にパーソナルコンピュータといわれるような情報処理装置に用いられる汎用のOS(Operating System)によって制御されるマイクロコンピュータ構成とされている。情報処理ユニット部Bは、メインプロセッサであるCPU31を有しており、このCPU31には、CPU31の作業用領域となるRAMや起動プログラムなどを記憶した読出し専用メモリであるROMで構成されるメモリユニット32と、OS(Operating System)やアプリケーションプログラムを記憶するHDD等の記憶装置34に対するデータの入出力を制御する記憶装置制御ユニット35とが、バス接続されている。   Next, the information processing unit B including the operation panel P will be described. The information processing unit part B has a microcomputer configuration controlled by a general-purpose OS (Operating System) used in an information processing apparatus generally called a personal computer. The information processing unit section B has a CPU 31 that is a main processor, and the CPU 31 includes a memory unit that includes a ROM that is a read-only memory that stores a RAM that is a work area of the CPU 31, a startup program, and the like. 32 and a storage device control unit 35 that controls input / output of data to / from a storage device 34 such as an HDD that stores an OS (Operating System) and application programs are connected via a bus.

また、CPU31には、情報処理ユニット部Bを、HUB19を介してLAN2に接続するための通信インターフェースであるLAN制御部33が接続されている。このLAN制御部33に割り当てられるネットワークアドレスであるIPアドレスは、前述した画像処理ユニット部AのLAN制御部18に割り当てられるIPアドレスとは異なるものである。すなわち、本実施の形態のデジタルカラー複合機1には、2つのIPアドレスが割り当てられていることになる。つまり、画像処理ユニット部Aと情報処理ユニット部BとはそれぞれLAN2に接続されていることになり、画像処理ユニット部Aと情報処理ユニット部Bとの間においてはデータ交換が可能な構成になっている。   The CPU 31 is connected to a LAN control unit 33 that is a communication interface for connecting the information processing unit unit B to the LAN 2 via the HUB 19. The IP address that is the network address assigned to the LAN control unit 33 is different from the IP address assigned to the LAN control unit 18 of the image processing unit A described above. That is, two IP addresses are assigned to the digital color multifunction peripheral 1 of the present embodiment. That is, the image processing unit unit A and the information processing unit unit B are each connected to the LAN 2, and the image processing unit unit A and the information processing unit unit B can exchange data. ing.

なお、デジタルカラー複合機1はHUB19を介してLAN2に接続されていることから、見かけ上は、1つのIPアドレスのみが割り当てられているように見える。したがって、美観を損ねることはなく、結線等の取り扱いを容易にすることが可能になっている。   Since the digital color multifunction peripheral 1 is connected to the LAN 2 via the HUB 19, it appears that only one IP address is assigned. Therefore, the aesthetic appearance is not impaired, and handling such as connection can be facilitated.

さらに、CPU31には、操作パネルPを制御する表示制御ユニット36及び操作入力制御ユニット37が接続されている。ここで、図4は操作パネルPの構成を示す平面図である。図4に示すように、操作パネルPは、例えばLCD(Liquid Crystal Display)である表示装置40と、操作入力装置41とで構成されている。操作入力装置41は、表示装置40の表面に積層された超音波弾性波方式等のタッチパネル41aと、複数のキーを有するキーボード41bとで構成されている。キーボード41bには、画像読み取りの開始を宣言するためのスタートキー、数値入力を行うためのテンキー、読み取った画像データの送信先を設定する読取条件設定キー、クリアキー等が設けられている。すなわち、表示制御ユニット36は、画像表示制御信号を制御パネルI/F38を介して表示装置40に出力し、画像表示制御信号に応じた所定事項を表示装置40に表示させる。一方、操作入力制御ユニット37は、操作入力装置41におけるオペレータによる機能設定や入力操作に応じた入力制御信号を、制御パネルI/F38を介して受信する。   Further, a display control unit 36 and an operation input control unit 37 that control the operation panel P are connected to the CPU 31. Here, FIG. 4 is a plan view showing the configuration of the operation panel P. FIG. As shown in FIG. 4, the operation panel P includes a display device 40 that is, for example, an LCD (Liquid Crystal Display) and an operation input device 41. The operation input device 41 includes an ultrasonic acoustic wave type touch panel 41a laminated on the surface of the display device 40 and a keyboard 41b having a plurality of keys. The keyboard 41b is provided with a start key for declaring the start of image reading, a numeric keypad for inputting numerical values, a reading condition setting key for setting the transmission destination of the read image data, a clear key, and the like. That is, the display control unit 36 outputs an image display control signal to the display device 40 via the control panel I / F 38 and causes the display device 40 to display predetermined items corresponding to the image display control signal. On the other hand, the operation input control unit 37 receives, via the control panel I / F 38, an input control signal corresponding to the function setting or input operation by the operator in the operation input device 41.

加えて、CPU31には、画像処理ユニット部Aの制御パネルI/F25と通信ケーブル26を介して接続されている制御パネル通信ユニット39が接続されている。制御パネル通信ユニット39は、画像処理ユニット部Aから出力された画像表示制御信号を受信し、また、操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号を画像処理ユニット部Aに転送する。なお、詳細は後述するが、制御パネル通信ユニット39で受信した画像処理ユニット部Aからの画像表示制御信号は操作パネルPの表示装置40用にデータ変換処理されてから表示制御ユニット36に出力され、また、操作パネルPからのオペレータによる機能設定や入力操作に応じた入力制御信号は画像処理ユニット部Aでの仕様に応じた形式にデータ変換処理されてから制御パネル通信ユニット39に入力される。   In addition, a control panel communication unit 39 connected to the control panel I / F 25 of the image processing unit A via the communication cable 26 is connected to the CPU 31. The control panel communication unit 39 receives the image display control signal output from the image processing unit unit A, and receives the input control signal according to the function setting or input operation by the operator from the operation panel P. Forward to. Although details will be described later, the image display control signal from the image processing unit A received by the control panel communication unit 39 is subjected to data conversion processing for the display device 40 of the operation panel P and then output to the display control unit 36. The input control signal corresponding to the function setting or input operation by the operator from the operation panel P is input to the control panel communication unit 39 after being subjected to data conversion processing in a format according to the specifications in the image processing unit A. .

上述したように記憶装置34には、CPU31が実行するOS(Operating System)やアプリケーションプログラムが格納されている。この意味で、記憶装置34は、アプリケーションプログラムを記憶する記憶媒体として機能する。このデジタルカラー複合機1では、ユーザが電源を投入するとCPU31がメモリユニット32内の起動プログラムを起動させ、記憶装置34よりOSをメモリユニット32内のRAMに読み込み、このOSを起動させる。このようなOSは、ユーザの操作に応じてプログラムを起動したり、情報を読み込んだり、保存を行ったりする。OSのうち代表的なものとしては、Windows(登録商標)等が知られている。これらのOS上で走る動作プログラムをアプリケーションプログラムと呼んでいる。情報処理ユニット部BのOSは、情報処理装置(サーバコンピュータ3やクライアントコンピュータ4等)と同種のOS、すなわち汎用のOS(例えば、Windows(登録商標)等)とされている。   As described above, the storage device 34 stores an OS (Operating System) and application programs executed by the CPU 31. In this sense, the storage device 34 functions as a storage medium that stores application programs. In the digital color multifunction peripheral 1, when the user turns on the power, the CPU 31 activates the activation program in the memory unit 32, reads the OS from the storage device 34 into the RAM in the memory unit 32, and activates the OS. Such an OS activates a program, reads information, and stores information in accordance with a user operation. As a representative OS, Windows (registered trademark) and the like are known. These operation programs running on the OS are called application programs. The OS of the information processing unit section B is the same type of OS as the information processing apparatus (server computer 3, client computer 4, etc.), that is, a general-purpose OS (for example, Windows (registered trademark)).

なお、前述したように、本実施の形態のデジタルカラー複合機1には、OS、デバイスドライバや各種アプリケーションプログラム等の各種のプログラムコード(制御プログラム)や画像データ等を記憶した記憶媒体M、すなわち、フレキシブルディスク、ハードディスク、光ディスク(CD−ROM,CD−R,CD−RW,DVD−ROM,DVD−RAM,DVD−R,DVD+R,DVD−RW,DVD+RWなど)、光磁気ディスク(MO)、半導体メディアなどの記憶媒体Mに記憶されているプログラムコードや画像データ等を読み取る、又は記憶媒体Mに対してプログラムコードや画像データ等を書き込む装置であるフレキシブルディスクドライブ装置、光ディスクドライブ装置、MOドライブ装置、メディアドライブ装置等の外部メディア入出力装置9が搭載されている。このような外部メディア入出力装置9は、CPU31にバス接続されている入出力デバイス制御ユニット42により制御される。   As described above, the digital color multi-function peripheral 1 of the present embodiment has a storage medium M that stores various program codes (control programs) such as an OS, device drivers and various application programs, image data, and the like. , Flexible disk, hard disk, optical disk (CD-ROM, CD-R, CD-RW, DVD-ROM, DVD-RAM, DVD-R, DVD + R, DVD-RW, DVD + RW, etc.), magneto-optical disk (MO), semiconductor A flexible disk drive device, an optical disk drive device, and an MO drive device, which are devices that read program codes, image data, and the like stored in a storage medium M such as a medium, or write program codes, image data, and the like to the storage medium M , Media drive devices, etc. External media input-output device 9 is mounted. Such an external media input / output device 9 is controlled by an input / output device control unit 42 connected to the CPU 31 by a bus.

したがって、記憶装置34に記憶されているアプリケーションプログラムは、この記憶媒体Mに記録されたアプリケーションプログラムがインストールされたものであってもよい。このため、記憶媒体Mも、アプリケーションプログラムを記憶する記憶媒体となり得る。さらには、アプリケーションプログラムは、例えばインターネット網6及びLAN2を介して外部から取り込まれ、記憶装置34にインストールされてもよい。   Therefore, the application program stored in the storage device 34 may be one in which the application program recorded in the storage medium M is installed. Therefore, the storage medium M can also be a storage medium that stores application programs. Furthermore, the application program may be imported from the outside via, for example, the Internet network 6 and the LAN 2 and installed in the storage device 34.

なお、入出力デバイス制御ユニット42には、USB,IEEE1394,SCSI等の各種インターフェース43も接続されており、各種インターフェース43を介して様々な機器(デジタルカメラ等)が接続可能とされている。   The input / output device control unit 42 is also connected with various interfaces 43 such as USB, IEEE 1394, SCSI, and the like, and various devices (such as digital cameras) can be connected via the various interfaces 43.

次に、デジタルカラー複合機1で実行する特徴的な処理の内容について説明する。この処理は、記憶媒体Mから外部メディア入出力装置9により読み取られ、記憶装置34にインストールされる検索実行プログラムにより実行される。   Next, the contents of characteristic processing executed by the digital color multifunction peripheral 1 will be described. This processing is executed by a search execution program that is read from the storage medium M by the external media input / output device 9 and installed in the storage device 34.

図5は、かかる検索実行プログラムにより実行されるシステムのシステム構成を示すブロック図である。   FIG. 5 is a block diagram showing a system configuration of a system executed by the search execution program.

デジタルカラー複合機1の情報処理ユニット部Bは、音声の入力を受け付けるマイク101を備えている。このマイク101は、例えば、操作パネルPに設けられる(図4を参照)。このマイク101は、各種インターフェース43となる音声入力用の所定のインターフェース102を介して、デジタルカラー複合機1に音声データを取り込むことができる。この入力された音声データは、音声記憶部103に記憶される。この音声記憶部103は、具体的には、メモリユニット32の所定の記憶エリアなどである。   The information processing unit B of the digital color multifunction peripheral 1 includes a microphone 101 that accepts voice input. For example, the microphone 101 is provided on the operation panel P (see FIG. 4). The microphone 101 can take in audio data to the digital color multifunction peripheral 1 via a predetermined interface 102 for audio input serving as various interfaces 43. The input voice data is stored in the voice storage unit 103. Specifically, the voice storage unit 103 is a predetermined storage area of the memory unit 32 or the like.

データベース104(蓄積手段)は、記憶装置34などに構築され、テキストデータファイルなど、各種のファイルが登録される。このファイルは、具体的には、LAN2を介して、インターネット6、サーバコンピュータ3、クライアントコンピュータ4など、外部から受信したデータや、画像読取装置8で読み取った画像データにOCR(Optical Character Reader)処理をかけてテキスト変換したデータ(例えば、PDFファイルにOCR処理をかけてテキスト変換したデータ)などである。   The database 104 (storage means) is constructed in the storage device 34 and the like, and various files such as text data files are registered. Specifically, this file is processed by OCR (Optical Character Reader) processing on data received from the outside such as the Internet 6, the server computer 3 and the client computer 4 via the LAN 2 or image data read by the image reading device 8. Is converted to text (for example, data converted to text by performing OCR processing on a PDF file).

音声認識部105は、周知の技術により、音声記憶部103に記憶されている音声データをテキストデータに変換する。よって、マイク101に向かってユーザがしゃべった音声は音声認識部105でテキストデータとなる。   The voice recognition unit 105 converts voice data stored in the voice storage unit 103 into text data by a known technique. Therefore, the voice spoken by the user toward the microphone 101 becomes text data in the voice recognition unit 105.

検索エンジン106は、データベース104内に登録されているテキストデータファイル群を対象に、与えられた検索キーワードで全文検索を行う。その全文検索の具体的な手段としては様々なシステムが周知であるので、詳細な説明は省略する。この場合に、検索エンジン106は、音声認識部105で変換後のテキストデータを検索キーワードとすることができる。なお、以上のシステム構成において、音声認識部105、検索エンジン106については、前述の検索実行プログラムに基づいてCPU31が実行する処理により実現される。   The search engine 106 performs a full-text search for a text data file group registered in the database 104 using a given search keyword. Various systems are known as specific means for the full-text search, and detailed description thereof is omitted. In this case, the search engine 106 can use the text data converted by the voice recognition unit 105 as a search keyword. In the above system configuration, the voice recognition unit 105 and the search engine 106 are realized by processing executed by the CPU 31 based on the above-described search execution program.

次に、図5のシステムを用いて実行される処理について、図6のフローチャートを参照して説明する。   Next, processing executed using the system of FIG. 5 will be described with reference to the flowchart of FIG.

ユーザは、データベース104内のテキストデータファイル群を全文検索するときは、図7に示す操作パネルPに表示されるメニュー画面141から検索ボタン111を選択する(ステップS1のY)。これにより、図8に示す検索画面142が表示される(ステップS2)。この検索画面でキーボード入力ボタン112を選択すると操作パネルPのタッチパネルにキーボードが表示されて、全文検索の検索キーワードを当該キーボードで入力できるが、ここでは、音声入力ボタン113を選択する。そして、この音声入力ボタン113を押下している間は(ステップS3のY)、マイク101から音声が取り込まれて音声データが音声記憶部103に記憶される(ステップS4)。そこで、ユーザは音声入力ボタン113を押下しながら検索キーワードとしたい語をマイク101に向かってしゃべることで、キーボードを操作しなくとも検索キーワードを入力することができる。   The user selects the search button 111 from the menu screen 141 displayed on the operation panel P shown in FIG. 7 when searching the entire text data file group in the database 104 (Y in step S1). Thereby, the search screen 142 shown in FIG. 8 is displayed (step S2). When the keyboard input button 112 is selected on this search screen, a keyboard is displayed on the touch panel of the operation panel P, and a search keyword for full-text search can be input with the keyboard. Here, the voice input button 113 is selected. While the voice input button 113 is being pressed (Y in Step S3), voice is captured from the microphone 101 and voice data is stored in the voice storage unit 103 (Step S4). Therefore, the user can input the search keyword without operating the keyboard by speaking to the microphone 101 the word to be used as the search keyword while pressing the voice input button 113.

このようにして音声により検索キーワードが入力され、音声入力ボタン113の押下がなくなると(ステップS5のY)、入力された検索キーワードは音声認識部105で音声認識がなされてテキストデータに変換され(音声認識手段)(ステップS6)、図9に示す検索キーワード表示画面143のキーワード表示欄144に表示される(ステップS7)。この表示された検索キーワードが適切でないときは、再入力ボタン114を選択すれば(ステップS8のY)、ステップS2に戻る。表示された検索キーワードが適切であると考える場合は、OKボタン115を選択すれば(ステップS9のY)、その検索キーワードに基づいて検索エンジン106がデータベース104内のテキストデータファイルを全文検索し(検索手段)(ステップS10)、その検索結果を操作パネルPに表示する(ステップS11)。   When the search keyword is input by voice and the voice input button 113 is not pressed (Y in step S5), the input search keyword is voice-recognized by the voice recognition unit 105 and converted into text data ( (Speech recognition means) (step S6) and displayed in the keyword display field 144 of the search keyword display screen 143 shown in FIG. 9 (step S7). When the displayed search keyword is not appropriate, if the re-input button 114 is selected (Y in step S8), the process returns to step S2. If the displayed search keyword is considered appropriate, if the OK button 115 is selected (Y in step S9), the search engine 106 performs a full text search of the text data file in the database 104 based on the search keyword ( Search means) (step S10), and the search result is displayed on the operation panel P (step S11).

このように、検索キーワードは音声で入力することができるので、キーボード操作の場合と比べてデータベース104の全文検索が容易である。   As described above, since the search keyword can be input by voice, a full-text search of the database 104 is easier than in the case of keyboard operation.

ところで、このような全文検索システムはデジタルカラー複合機1に搭載されているため、このデジタルカラー複合機1の機構部から発するノイズが邪魔になり、音声認識部105による音声認識の認識率を低下させてしまう。そこで、音声認識部105では、ノイズ対策を講じている。以下では、かかる対策として実行される処理について説明する。   By the way, since such a full-text search system is installed in the digital color multi-function peripheral 1, noise generated from the mechanism section of the digital color multi-function peripheral 1 becomes an obstacle, and the recognition rate of voice recognition by the voice recognition section 105 is lowered. I will let you. Therefore, the speech recognition unit 105 takes measures against noise. Below, the process performed as this countermeasure is demonstrated.

すなわち、テレビ会議システムやハンズフリー自動車電話システム、カーナビゲーションシステムにおいては、リモートスピーカーが使用されるのが通例であり、スピーカーから出力された音声・音響信号がテレビ会議システムにおいては部屋の壁や机、自動車の窓ガラスやダッシュボードに反射して音響エコーとしてマイクの入力に混入する。この音響エコーはマイクの入力に対する雑音成分になるためにマイク入力から消去されることが望ましい。   That is, a remote speaker is usually used in a video conference system, a hands-free car phone system, and a car navigation system, and an audio / acoustic signal output from the speaker is a room wall or desk in the video conference system. It is reflected on the window glass and dashboard of the car and mixed into the microphone input as an acoustic echo. Since this acoustic echo becomes a noise component with respect to the input of the microphone, it is desirable to eliminate it from the microphone input.

このための対策としてLMS(Least Means Square)法やNLMS(Normalized Least Mean Square)法などが提案されてきた。これらの技術については、“北脇信彦編著「音のコミュニケーション工学−マルチメディア時代の音声・音響技術」コロナ社の第4章”に記述されている。   As countermeasures for this, the LMS (Least Means Square) method, the NLMS (Normalized Least Mean Square) method, and the like have been proposed. These technologies are described in “Chapter 4 of Corona,” edited by Nobuhiko Kitawaki, “Sound Communication Engineering-Speech and Acoustic Technology in the Multimedia Age”.

LMS法、NLMS法およびそれらの改良法のいずれの場合においても、音響エコーの伝達経路のインパルス応答の推定値とスピーカーから出力される音声・音響信号の源信号から生成された擬似的な音響エコーとマイク入力信号の差がより小さくなるように、適応フィルタリングの原理により、音響エコーの伝達経路のインパルス応答を動的かつ逐次的に適応化することを基本的な原理としている。   In any of the LMS method, the NLMS method, and their improved methods, a pseudo acoustic echo generated from the estimated value of the impulse response of the transmission path of the acoustic echo and the source signal of the sound / acoustic signal output from the speaker Based on the principle of adaptive filtering, the basic principle is to dynamically and sequentially adapt the impulse response of the acoustic echo transmission path so that the difference between the input signal and the microphone input signal becomes smaller.

従って、もし、マイク入力に音響エコー以外の信号、たとえば、人間の声、背景雑音などが混入している場合は、それらの影響を受けて、音響エコーの伝達経路のインパルス応答が理想的な値から乖離するという現象が起こる。この状態を同時通話(ダブルトーク)と呼びダブルトーク状態では音響エコーの伝達経路のインパルス応答の適応動作を停止し、この時点のインパルス応答を保持する。音声が発生されなくなると停止直前に保持したインパルス応答を復帰させることにより、音響エコーの消去性能の著しい低下を防止するのが一般的である。   Therefore, if a signal other than an acoustic echo, such as a human voice or background noise, is mixed in the microphone input, the impulse response of the acoustic echo transmission path is an ideal value due to these effects. The phenomenon of deviating from occurs. This state is called simultaneous conversation (double talk). In the double talk state, the adaptive operation of the impulse response of the acoustic echo transmission path is stopped, and the impulse response at this time is held. When no sound is generated, the impulse response held immediately before the stop is restored to prevent the acoustic echo cancellation performance from significantly decreasing.

そこで、音声認識部105では、このような雑音消去を行う図10に示す音声処理システム121を備えている。以下では、この音声処理システム121について説明する。図10において、符号131は、音響信号と更新されたインパルス応答に基づき、擬似音響エコー信号を発生する適応フィルタ(適応フィルタ手段)であり、減算部133(減算手段)の減算結果、すなわち、エコー除去信号(雑音成分を除去後の信号)を入力し、エコー除去信号のレベルが0(ゼロ)になるようにフィルタ係数を逐次更新する。適応フィルタ131は後述のVAD(Voice Activity Detection)132(VAD手段)からオン/オフの停止/再開信号を受け付け、停止が指示されたとき、すなわち、上述のダブルトークが発生した時にインパルス応答の適応動作を停止して回復が指示された停止信号を入力した時点のフィルタ係数を保持する。   Therefore, the speech recognition unit 105 includes the speech processing system 121 shown in FIG. 10 that performs such noise cancellation. Hereinafter, the voice processing system 121 will be described. In FIG. 10, reference numeral 131 denotes an adaptive filter (adaptive filter means) that generates a pseudo acoustic echo signal based on the acoustic signal and the updated impulse response. The subtraction result of the subtraction unit 133 (subtraction means), that is, the echo A removal signal (a signal after removing the noise component) is input, and the filter coefficient is sequentially updated so that the level of the echo removal signal becomes 0 (zero). The adaptive filter 131 receives an on / off stop / restart signal from a VAD (Voice Activity Detection) 132 (VAD means), which will be described later, and adapts the impulse response when the stop is instructed, that is, when the above-described double talk occurs. The filter coefficient at the time when the operation is stopped and the stop signal instructed to recover is input is held.

減算部133は上記擬似エコー信号をマイク101から入力される入力信号から減算し、入力信号の中から雑音成分を消去する。   The subtracting unit 133 subtracts the pseudo echo signal from the input signal input from the microphone 101 and eliminates a noise component from the input signal.

VAD132は入力の信号が音声(人間の声)か非音声を判別するシステムであり、このシステムは“古井貞煕著「デジタル音声処理」(東海大学出版会)153頁”や“Recommendation GSM 06.32”に記述されている。なお、適応フィルタ131、減算部133、VAD132はワイヤードロジックによっても実現できるが、ここでは、前述の検索実行プログラムに基づいてソフトウエアにより実現しているものとして説明する。   VAD132 is a system that discriminates whether the input signal is speech (human voice) or non-speech. This system is written by Sadaaki Furui, “Digital Speech Processing” (Page 153 of Tokai University Press) and “Recommendation GSM 06.32” The adaptive filter 131, the subtracting unit 133, and the VAD 132 can be realized by wired logic, but here, description will be made assuming that they are realized by software based on the above-described search execution program.

VAD132が入力信号に音声信号が含まれると判定した場合には、VAD132からインパルス応答適応動作の停止信号が適応フィルタ131に出力され、VAD132が入力信号は非音声であると判定した場合にインパルス応答適応動作の再開信号が適応フィルタ131に出力される。   When the VAD 132 determines that an audio signal is included in the input signal, an impulse response adaptive operation stop signal is output from the VAD 132 to the adaptive filter 131, and when the VAD 132 determines that the input signal is non-speech, the impulse response An adaptive operation restart signal is output to the adaptive filter 131.

マイク101への音声入力の雑音成分は、デジタルカラー複写機1から発するノイズの音響が当該デジタルカラー複写機1の設置されている部屋の壁により反射されてマイク101に入力したもの(音響エコー、図11の(b)参照)、および使用環境に特有の背景雑音(図11の(c)参照)がある。そして、適応フィルタ131に入力される音響信号は、デジタルカラー複写機1が所定の操作がなされたときに操作音を発する場合の当該操作音や、音声案内で音声を発する場合の当該音声である(スピーカー107(図4を参照)から出力される)。   The noise component of the sound input to the microphone 101 is the sound component of the noise emitted from the digital color copying machine 1 reflected by the wall of the room where the digital color copying machine 1 is installed and input to the microphone 101 (acoustic echo, 11 (b)) and background noise (see FIG. 11 (c)) specific to the usage environment. The acoustic signal input to the adaptive filter 131 is the operation sound when the digital color copying machine 1 emits an operation sound when a predetermined operation is performed, or the sound when the sound is emitted by voice guidance. (Output from the speaker 107 (see FIG. 4)).

図10のようなシステム構成において、音声がマイク101から入力されていない状態では、スピーカー107から再生出力された音響のエコーおよび背景雑音がマイク101から入力される。この入力信号から減算部133により擬似音響エコーが減算され得られるエコー除去信号が非音声であると、VAD132が判定している間はVAD132からは再開信号が出力されているので、適応フィルタ131はエコー除去信号が0(ゼロ)となるようにフィルタ係数を更新しながら、入力信号の音響エコー成分を消去する擬似エコー信号を発生する。図11に示すようにタイミングt1で音声が入力され、VAD132がタイミングt2で入力信号に音声が含まれると判定すると停止信号を適応フィルタ131に送る。これにより適応フィルタ131はフィルタ係数の更新を停止して、タイミングt2の時点のフィルタ係数の値に自己のフィルタ係数の値を固定する。これによりマイク101から入力された音声成分と雑音成分(音響エコーおよび背景雑音)からなる入力信号の中の音響エコー成分のみが消去され、この消去後の音声信号に対して音声認識部105が前述のように音声認識を行なう。   In the system configuration as shown in FIG. 10, in a state where no sound is input from the microphone 101, an acoustic echo and background noise reproduced and output from the speaker 107 are input from the microphone 101. When the echo cancellation signal obtained by subtracting the pseudo acoustic echo from the input signal by the subtracting unit 133 is non-speech, the VAD 132 outputs a restart signal while the VAD 132 is determining. While updating the filter coefficient so that the echo cancellation signal becomes 0 (zero), a pseudo echo signal for canceling the acoustic echo component of the input signal is generated. As shown in FIG. 11, when a voice is input at timing t1 and the VAD 132 determines that a voice is included in the input signal at timing t2, a stop signal is sent to the adaptive filter 131. As a result, the adaptive filter 131 stops updating the filter coefficient, and fixes its own filter coefficient value to the filter coefficient value at the timing t2. As a result, only the acoustic echo component in the input signal composed of the speech component and the noise component (acoustic echo and background noise) input from the microphone 101 is erased, and the speech recognition unit 105 performs the above-described speech recognition unit 105 for the speech signal after the erasure. Voice recognition is performed as follows.

このように、検索キーワードの音声入力を行なう場合には、操作音や背景雑音などのノイズが入力音声から除去され、除去後の音声について音声認識が行なわれるので、検索キーワードの音声入力を行うときの音声認識率を高めることができる。   As described above, when inputting a search keyword by voice, noises such as operation sounds and background noise are removed from the input voice, and voice recognition is performed on the voice after the removal. Can improve the voice recognition rate.

本発明の実施の一形態のデジタルカラー複合機を含むシステム構成図である。1 is a system configuration diagram including a digital color multifunction peripheral according to an embodiment of the present invention. デジタルカラー複合機を概略的に示す外観斜視図である。1 is an external perspective view schematically showing a digital color multifunction peripheral. デジタルカラー複合機の各部の電気的接続を示すブロック図である。FIG. 3 is a block diagram showing electrical connections of each part of the digital color multifunction peripheral. 操作パネルの構成を示す平面図である。It is a top view which shows the structure of an operation panel. 検索実行プログラムにより実行されるシステムのシステム構成を示すブロック図である。It is a block diagram which shows the system configuration | structure of the system performed by a search execution program. 図5のシステムで実行される処理のフローチャートである。It is a flowchart of the process performed with the system of FIG. メニュー画面の平面図である。It is a top view of a menu screen. 検索画面の平面図である。It is a top view of a search screen. 検索キーワード画面の平面図である。It is a top view of a search keyword screen. 音声認識部が備えている音声処理システムのブロック図である。It is a block diagram of the voice processing system with which a voice recognition part is provided. 音声処理システムが実行する処理の説明図である。It is explanatory drawing of the process which a speech processing system performs.

符号の説明Explanation of symbols

1 情報処理装置、画像形成装置
7 プリンタ
8 スキャナ
121 蓄積手段
131 適応フィルタ手段
132 VAD手段
133 減算手段
DESCRIPTION OF SYMBOLS 1 Information processing apparatus, image forming apparatus 7 Printer 8 Scanner 121 Storage means 131 Adaptive filter means 132 VAD means 133 Subtraction means

Claims (7)

マイクと、
このマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、
このテキストデータを検索キーワードとして所定のファイル群を検索する検索手段と、
を備えている情報処理装置。
With a microphone,
Speech recognition means for recognizing voice converted by the microphone and converting it into text data;
Search means for searching a predetermined file group using the text data as a search keyword;
An information processing apparatus comprising:
スピーカーと、
このスピーカーが発する音声の音響エコーの伝達経路のインパルス応答の推定値と前記スピーカーから出力される音響信号とから擬似的な音響エコー信号を生成する適応フィルタ手段と、
前記マイクで入力され前記音声認識前の音声信号から前記音響エコー信号を減算してエコー除去信号とする減算手段と、
前記エコー除去信号に音声信号が含まれると判定した場合には、前記適応フィルタ手段に前記インパルス応答適応動作の停止を指示し、音声信号が含まれないと判断したときは前記インパルス応答適応動作の再開を指示するVAD(Voice Activity Detection)手段と、
をさらに備えている請求項1に記載の情報処理装置。
Speakers,
Adaptive filter means for generating a pseudo acoustic echo signal from the estimated value of the impulse response of the acoustic echo transmission path of the sound emitted by the speaker and the acoustic signal output from the speaker;
Subtracting means for subtracting the acoustic echo signal from the speech signal input by the microphone and before the speech recognition to obtain an echo removal signal;
When it is determined that an audio signal is included in the echo cancellation signal, the adaptive filter unit is instructed to stop the impulse response adaptive operation. When it is determined that no audio signal is included, the impulse response adaptive operation is performed. VAD (Voice Activity Detection) means for instructing resumption,
The information processing apparatus according to claim 1, further comprising:
原稿の画像を読み取るスキャナと、
この読取後の画像データに基づいて媒体上に画像の形成を行うプリンタと、
ファイル群を蓄積する蓄積手段と、
マイクと、
このマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、
このテキストデータを検索キーワードとして前記ファイル群を検索する検索手段と、
を備えている画像形成装置。
A scanner that reads the image of the document,
A printer that forms an image on a medium based on the read image data;
Storage means for storing files,
With a microphone,
Speech recognition means for recognizing voice converted by the microphone and converting it into text data;
Search means for searching the file group using the text data as a search keyword;
An image forming apparatus.
スピーカーと、
このスピーカーが発する音声の音響エコーの伝達経路のインパルス応答の推定値と前記スピーカーから出力される音響信号とから擬似的な音響エコー信号を生成する適応フィルタ手段と、
前記マイクで入力され前記音声認識前の音声信号から前記音響エコー信号を減算してエコー除去信号とする減算手段と、
前記エコー除去信号に音声信号が含まれると判定した場合には、前記適応フィルタ手段に前記インパルス応答適応動作の停止を指示し、音声信号が含まれないと判断したときは前記インパルス応答適応動作の再開を指示するVAD(Voice Activity Detection)手段と、
をさらに備えている請求項3に記載の画像形成装置。
Speakers,
Adaptive filter means for generating a pseudo acoustic echo signal from the estimated value of the impulse response of the acoustic echo transmission path of the sound emitted by the speaker and the acoustic signal output from the speaker;
Subtracting means for subtracting the acoustic echo signal from the speech signal input by the microphone and before the speech recognition to obtain an echo removal signal;
When it is determined that an audio signal is included in the echo cancellation signal, the adaptive filter unit is instructed to stop the impulse response adaptive operation. When it is determined that no audio signal is included, the impulse response adaptive operation is performed. VAD (Voice Activity Detection) means for instructing resumption,
The image forming apparatus according to claim 3, further comprising:
所定のマイクで入力された声を音声認識してテキストデータに変換する音声認識手段と、
このテキストデータを検索キーワードとして所定のファイル群を検索する検索手段と、
をコンピュータに実行させるコンピュータに読み取り可能なプログラム。
Voice recognition means for recognizing a voice input with a predetermined microphone and converting it into text data;
Search means for searching a predetermined file group using the text data as a search keyword;
A computer-readable program that causes a computer to execute.
所定のスピーカーが発する音声の音響エコーの伝達経路のインパルス応答の推定値と前記スピーカーから出力される音響信号とから擬似的な音響エコー信号を生成する適応フィルタ手段と、
前記マイクで入力され前記音声認識前の音声信号から前記音響エコー信号を減算してエコー除去信号とする減算手段と、
前記エコー除去信号に音声信号が含まれると判定した場合には、前記適応フィルタ手段に前記インパルス応答適応動作の停止を指示し、音声信号が含まれないと判断したときは前記インパルス応答適応動作の再開を指示するVAD(Voice Activity Detection)手段と、
をさらにコンピュータに実行させる請求項5に記載のプログラム。
Adaptive filter means for generating a pseudo acoustic echo signal from the estimated value of the impulse response of the acoustic echo transmission path of the sound emitted by the predetermined speaker and the acoustic signal output from the speaker;
Subtracting means for subtracting the acoustic echo signal from the speech signal input by the microphone and before the speech recognition to obtain an echo removal signal;
When it is determined that an audio signal is included in the echo cancellation signal, the adaptive filter unit is instructed to stop the impulse response adaptive operation. When it is determined that no audio signal is included, the impulse response adaptive operation is performed. VAD (Voice Activity Detection) means for instructing resumption,
The program according to claim 5, further causing the computer to execute.
請求項5又は6に記載のプログラムを記憶している、記憶媒体。
A storage medium storing the program according to claim 5 or 6.
JP2003382282A 2003-11-12 2003-11-12 Information processing apparatus, image forming apparatus, program, and storage medium Pending JP2005148199A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003382282A JP2005148199A (en) 2003-11-12 2003-11-12 Information processing apparatus, image forming apparatus, program, and storage medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003382282A JP2005148199A (en) 2003-11-12 2003-11-12 Information processing apparatus, image forming apparatus, program, and storage medium

Publications (1)

Publication Number Publication Date
JP2005148199A true JP2005148199A (en) 2005-06-09

Family

ID=34691399

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003382282A Pending JP2005148199A (en) 2003-11-12 2003-11-12 Information processing apparatus, image forming apparatus, program, and storage medium

Country Status (1)

Country Link
JP (1) JP2005148199A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2010075015A2 (en) * 2008-12-15 2010-07-01 Motorola, Inc. Assigning an indexing weight to a search term
US7921094B2 (en) 2007-02-28 2011-04-05 Brother Kogyo Kabushiki Kaisha Network system and communication device
US8284919B2 (en) 2007-03-29 2012-10-09 Brother Kogyo Kabushiki Kaisha Network system and communication device

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139289A (en) * 1992-10-26 1994-05-20 Olympus Optical Co Ltd Information reproducing device
JPH10257583A (en) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd Voice processing unit and its voice processing method
JP2002259113A (en) * 2001-03-02 2002-09-13 Sharp Corp Voice macro processor, its method, computer program, and recording medium with its program recorded
JP2003131773A (en) * 2001-08-17 2003-05-09 Ricoh Co Ltd Equipment-operating device, program, data-storage medium and image-forming device

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06139289A (en) * 1992-10-26 1994-05-20 Olympus Optical Co Ltd Information reproducing device
JPH10257583A (en) * 1997-03-06 1998-09-25 Asahi Chem Ind Co Ltd Voice processing unit and its voice processing method
JP2002259113A (en) * 2001-03-02 2002-09-13 Sharp Corp Voice macro processor, its method, computer program, and recording medium with its program recorded
JP2003131773A (en) * 2001-08-17 2003-05-09 Ricoh Co Ltd Equipment-operating device, program, data-storage medium and image-forming device

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7921094B2 (en) 2007-02-28 2011-04-05 Brother Kogyo Kabushiki Kaisha Network system and communication device
US8543559B2 (en) 2007-02-28 2013-09-24 Brother Kogyo Kabushiki Kaisha Network system and communication device
US8284919B2 (en) 2007-03-29 2012-10-09 Brother Kogyo Kabushiki Kaisha Network system and communication device
WO2010075015A2 (en) * 2008-12-15 2010-07-01 Motorola, Inc. Assigning an indexing weight to a search term
WO2010075015A3 (en) * 2008-12-15 2010-08-26 Motorola, Inc. Assigning an indexing weight to a search term

Similar Documents

Publication Publication Date Title
JP7180330B2 (en) Information processing system, information processing device, and method
JP3885002B2 (en) Information processing apparatus and method
JP2005056315A (en) Information processor, program and storage medium
JP2000194533A (en) Voice command annotating method
JP5146429B2 (en) Image processing apparatus, speech recognition processing apparatus, control method for speech recognition processing apparatus, and computer program
US11140284B2 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP4854704B2 (en) Data processing apparatus, voice conversion method, and voice conversion program
JP2006330576A (en) Apparatus operation system, speech recognition device, electronic apparatus, information processor, program, and recording medium
JP2007065994A (en) Document ocr execution apparatus
JP7192220B2 (en) Image processing device, information processing device and program
JP2005149061A (en) Information processing system, program, and storage medium
JP2020155030A (en) Information processing device and program
JP7187965B2 (en) Image processing device, operation control method and operation control program
JP2005148199A (en) Information processing apparatus, image forming apparatus, program, and storage medium
US20200366800A1 (en) Apparatus
JP2021086510A (en) Electronic apparatus
JP6939426B2 (en) Image processing device and its operation control method
JP2005084861A (en) Email sending device, image forming system, program and storage medium
JP2020052511A (en) Summary generation apparatus, summary generation method, and program
JP4276921B2 (en) Image processing device
JP6229433B2 (en) Operation guidance server, operation guidance system, image forming apparatus, and program
KR102537797B1 (en) Image forming system equipped with interactive agent function, method of controlling same, and storage medium
JP2018120372A (en) Electronic device and image forming apparatus
JP7139937B2 (en) Speech processing system, job generation device, job generation method and job generation program
JP7314499B2 (en) Information processing system, information processing device, job control method and job control program

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060823

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060811

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20091006

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091124

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20100518