Nothing Special   »   [go: up one dir, main page]

JP4869420B2 - 音情報判定装置、及び音情報判定方法 - Google Patents

音情報判定装置、及び音情報判定方法 Download PDF

Info

Publication number
JP4869420B2
JP4869420B2 JP2010070797A JP2010070797A JP4869420B2 JP 4869420 B2 JP4869420 B2 JP 4869420B2 JP 2010070797 A JP2010070797 A JP 2010070797A JP 2010070797 A JP2010070797 A JP 2010070797A JP 4869420 B2 JP4869420 B2 JP 4869420B2
Authority
JP
Japan
Prior art keywords
noise
level
audio signal
input audio
determination
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010070797A
Other languages
English (en)
Other versions
JP2011203500A (ja
Inventor
裕 米久保
広和 竹内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2010070797A priority Critical patent/JP4869420B2/ja
Priority to US12/965,586 priority patent/US20110235812A1/en
Publication of JP2011203500A publication Critical patent/JP2011203500A/ja
Application granted granted Critical
Publication of JP4869420B2 publication Critical patent/JP4869420B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音情報判定装置、及び音情報判定方法に関する。
周知のように、例えばテレビジョン放送を受信する放送受信機器や、情報記録媒体からその記録情報を再生する情報再生機器等にあっては、受信した放送信号や情報記録媒体から読み取った信号等からオーディオ信号を再生する際に、オーディオ信号に音質補正処理を施すことによって、より一層の高音質化を図るようにしている。
この場合、オーディオ信号に施す音質補正処理の内容は、オーディオ信号にノイズが含まれているか否かに応じて異なる。
そこで、オーディオ信号の区間毎に、ノイズが含まれているか否かを判定する技術が提案されている。例えば、特許文献1に記載された技術では、周波数分布から周波数分布の平坦さを算出し、算出した周波数分布の平坦さと閾値とを比較して、音声と雑音との判定を行っている。
特開2004−272052号公報
しかしながら、ノイズの種類に応じて音成分は様々であるため、特許文献1に記載された技術では、雑音の誤判定が生じる可能性がある。
本発明は、上記に鑑みてなされたものであって、ノイズの高精度の判定を可能とする音情報判定装置、及び音情報判定方法を提供することを目的とする。
上述した課題を解決し、目的を達成するために、本発明にかかる音情報判定装置は、入力オーディオ信号の音種を表す信号音種別と、当該入力オーディオ信号に含まれる可能性のある雑音の種別と、の組み合わせ毎に、当該種別の雑音であるか否かを雑音の特徴に従って判定する判定手法を、複数保持する保持手段と、入力オーディオ信号に対して、前記保持手段に保持された前記複数の前記判定手法のうち、複数を用いて、前記入力オーディオ信号に雑音が含まれているか否かを判定する判定手段と、前記判定手段が判定した前記入力オーディオ信号に雑音が含まれているか否かを示す判定結果に従って、雑音である度合いを示す雑音レベルを導き出す雑音レベル導出手段と、前記入力オーディオ信号について、音楽であるか否かの度合いと音声であるか否かの度合いとを含む音情報レベルを取得する音楽レベル取得手段と、前記音情報レベルを、前記雑音レベルに従って調整する調整手段と、前記調整手段で調整された前記音情報レベルに従って、前記入力オーディオ信号の補正処理を行う補正手段と、を備え、前記保持手段が保持する前記判定手法は、入力オーディオ信号の周波数分布の平坦さから、前記種別の雑音であるか否かを判別する判別式であって、当該判別式では、入力オーディオ信号の周波数分布について、前記種別の雑音の特徴に応じた帯域に重み付けしていること、を特徴とする。
また、本発明にかかる音情報判定方法は、音情報判定装置で実行される音情報判定方法であって、前記音情報判定装置は、入力オーディオ信号の音種を表す信号音種別と、当該入力オーディオ信号に含まれる可能性のある雑音の種別と、の組み合わせ毎に、当該種別の雑音であるか否かを雑音の特徴に従って判定する判定手法を、複数記憶する記憶手段を備え、判定手段が、入力オーディオ信号に対して、前記記憶手段に記憶された前記複数の前記判定手法のうち、当該入力オーディオ信号の信号音種に対応する判定手法を複数用いて、前記入力オーディオ信号に雑音が含まれているか否かを判定する判定ステップ雑音レベル導出手段が、前記判定ステップが判定した前記入力オーディオ信号に雑音が含まれているか否かを示す判定結果に従って、雑音である度合いを示す雑音レベルを導き出す雑音レベル導出ステップと、音楽レベル取得手段が、前記入力オーディオ信号について、音楽であるか否かの度合いと音声であるか否かの度合いとを含む音情報レベルを取得する音楽レベル取得ステップと、調整手段が、前記音情報レベルを、前記雑音レベルに従って調整する調整ステップと、補正手段が、前記調整ステップで調整された前記音情報レベルに従って、前記入力オーディオ信号の補正処理を行う補正ステップと、を含むことを特徴とする。
本発明によれば、オーディオ信号に含まれるノイズの判定精度を向上させるという効果を奏する。
図1は、第1の実施の形態にかかるデジタルテレビジョン放送受信装置の主要な信号処理系を示した図である。 図2は、第1の実施の形態にかかるデジタルテレビジョン放送受信装置のオーディオ処理部に含まれる構成を示すブロック図である。 図3は、オーディオ処理部が、音質補正を行うために入力オーディオ信号から抽出する各種レベルを示した図である。 図4は、音声処理モジュールにおける、オーディオ信号に含まれるノイズに関連した処理の手順を示すフローチャートである。 図5は、ノイズ用特徴量抽出部における、特徴量パラメータの生成の手順を示すフローチャートである。 図6は、ノイズレベル判定部における、ノイズレベルの元となるベーススコアSn_baseの算出手順を示すフローチャートである。 図7は、ノイズレベル補正部における、ノイズレベルの初期値となるベーススコアSn_baseの算出処理の手順を示すフローチャートである。 図8は、レベル調停部207における、音楽レベルの補正処理の手順を示すフローチャートである。
以下に添付図面を参照して、この発明にかかる音情報判定装置、及び音情報判定方法の最良な実施の形態を詳細に説明する。
(第1の実施の形態)
図1は、本実施の形態にかかるデジタルテレビジョン放送受信装置1の主要な信号処理系を示した図である。すなわち、BS/CS(broadcasting satellite/communication satellite)デジタル放送受信用のアンテナ43で受信した衛星デジタルテレビジョン放送信号は、入力端子44を介して衛星デジタル放送用のチューナ45に供給されることにより、所望のチャンネルの放送信号が選局される。
そして、このチューナ45で選局された放送信号は、PSK(phase shift keying)復調器46及びTS(transport stream)復号器47に順次供給されることにより、デジタルの映像信号及びオーディオ信号に復調された後、信号処理部48に出力される。
また、地上波放送受信用のアンテナ49で受信した地上デジタルテレビジョン放送信号は、入力端子50を介して地上デジタル放送用のチューナ51に供給されることにより、所望のチャンネルの放送信号が選局される。
そして、このチューナ51で選局された放送信号は、例えば日本ではOFDM(orthogonal frequency division multiplexing)復調器52及びTS復号器53に順次供給されることにより、デジタルの映像信号及びオーディオ信号に復調された後、上記信号処理部48に出力される。
また、上記地上波放送受信用のアンテナ49で受信した地上アナログテレビジョン放送信号は、入力端子50を介して地上アナログ放送用のチューナ54に供給されることにより、所望のチャンネルの放送信号が選局される。そして、このチューナ54で選局された放送信号は、アナログ復調器55に供給されてアナログの映像信号及びオーディオ信号に復調された後、上記信号処理部48に出力される。
ここで、上記信号処理部48は、TS復号器47,53からそれぞれ供給されたデジタルの映像信号及びオーディオ信号に対して、選択的に所定のデジタル信号処理を施し、グラフィック処理部56及びオーディオ処理部57に出力している。
また、上記信号処理部48には、複数(図示の場合は4つ)の入力端子58a,58b,58c,58dが接続されている。これら入力端子58a〜58dは、それぞれ、アナログの映像信号及びオーディオ信号を、デジタルテレビジョン放送受信装置1の外部から入力可能とするものである。
信号処理部48は、上記アナログ復調器55及び各入力端子58a〜58dからそれぞれ供給されたアナログの映像信号及びオーディオ信号を選択的にデジタル化し、このデジタル化された映像信号及びオーディオ信号に対して所定のデジタル信号処理を施した後、グラフィック処理部56及びオーディオ処理部57に出力する。
グラフィック処理部56は、信号処理部48から供給されるデジタルの映像信号に、OSD(on screen display)信号生成部59で生成されるOSD信号を重畳して出力する機能を有する。このグラフィック処理部56は、信号処理部48の出力映像信号と、OSD信号生成部59の出力OSD信号とを選択的に出力すること、また、両出力をそれぞれ画面の半分を構成するように組み合わせて出力することができる。
グラフィック処理部56から出力されたデジタルの映像信号は、映像処理部60に供給される。この映像処理部60は、入力されたデジタルの映像信号を、前記映像表示器14で表示可能なフォーマットのアナログ映像信号に変換した後、映像表示器14に出力して映像表示させるとともに、出力端子61を介して外部に導出させる。
また、上記オーディオ処理部57は、入力されたデジタルのオーディオ信号に対して、後述する音質補正処理を施した後、前記スピーカ15で再生可能なフォーマットのアナログオーディオ信号に変換している。そして、このアナログオーディオ信号は、スピーカ15に出力されてオーディオ再生に供されるとともに、出力端子62を介して外部に導出される。
ここで、このデジタルテレビジョン放送受信装置1は、上記した各種の受信動作を含むその全ての動作を制御部63によって統括的に制御されている。この制御部63は、CPU(central processing unit)64を内蔵しており、前記操作部16からの操作情報、または、リモートコントローラ17から送出され前記受光部18に受信された操作情報を受けて、その操作内容が反映されるように各部をそれぞれ制御している。
この場合、制御部63は、主として、そのCPU64が実行する制御プログラムを格納したROM(read only memory)65と、該CPU64に作業エリアを提供するRAM(random access memory)66と、各種の設定情報及び制御情報等が格納される不揮発性メモリ67とを利用している。
また、この制御部63は、カードI/F(interface)68を介して、前記第1のメモリカード19が装着可能なカードホルダ69に接続されている。これによって、制御部63は、カードホルダ69に装着された第1のメモリカード19と、カードI/F68を介して情報伝送を行なうことができる。
さらに、上記制御部63は、カードI/F70を介して、前記第2のメモリカード20が装着可能なカードホルダ71に接続されている。これにより、制御部63は、カードホルダ71に装着された第2のメモリカード20と、カードI/F70を介して情報伝送を行なうことができる。
次に、オーディオ処理部57に含まれる構成について説明する。図2は、第1の実施の形態にかかるデジタルテレビジョン放送受信装置1のオーディオ処理部57に含まれる構成を示すブロック図である。
図2に示すように、オーディオ処理部57は、音声/音楽用特徴量抽出部201と、音声/音楽用レベル判定部202と、音声/音楽用レベル補正部203と、ノイズ用特徴量抽出部204と、ノイズレベル判定部205と、ノイズレベル補正部206と、レベル調停部207と、DSP(Digital Signal Processor)208と、を備えている。次に、オーディオ処理部57が行う処理の概要について説明する。
図3は、本実施の形態にかかるオーディオ処理部57が、音質補正を行うために入力オーディオ信号から抽出する各種レベルを示した図である。図3に示すように、オーディオ処理部57は、入力されたオーディオ信号についてフレーム単位(例えば、n、n+1、n+2、n+3……)で、音声レベル、音楽レベル、及びノイズレベルを特定し、フレーム毎に算出された音声レベル、音楽レベル、及びノイズレベルに基づいて音質補正を行っている。本実施の形態にかかるフレームは、予め定められた第1の時間(例えば、数百ms)でオーディオ信号を区切ったデータ長とする。
図3の音声レベルは、入力されるオーディオ信号が音声である度合いを示したレベルとする。音声レベルが高いほど音声である可能性が高いことを意味する。音楽レベルは、入力されるオーディオ信号が音楽である度合いを示したレベルとする。音楽レベルが高いほど音楽である可能性が高いことを意味する。
なお、音声レベル及び音楽レベルはそれぞれ独立したものに制限するものではなく、音楽・音声レベルとしてまとめてもよい。この音楽・音声レベルでは、レベルが小さいほど音声らしさが高く、レベルが大きいほど音楽らしさが高いなどが考えられる。
ノイズレベルは、入力オーディオ信号においてノイズが含まれている度合いを示したレベルとする。ノイズレベルが高いほど入力オーディオ信号に含まれているノイズが大きい可能性があることを意味する。
そして、図3に示すように、入力オーディオ信号の楽曲区間であれば、検出される音楽レベルは高くなる。音楽レベルが高いほど、後述するDSP208が楽曲に適した音質補正を行う。また、楽曲が停止したトーク区間や曲中のボーカルのみが歌っている区間では、音楽レベルが低くなる一方、音声レベルが高くなる。これにより、後述するDSP208が音声に適した音質補正を行う。このように、音楽又は音声の検出度合いに応じたきめ細かい音質制御が可能である。
さらに、音楽や音声向けの音質補正する上で有害となるノイズが重畳した区間302も存在する。この区間302では、オーディオ信号部57は、入力オーディオ信号から、信号のノイズ性を示したノイズレベル301を抽出し、抽出したノイズレベルに応じて、音質補正処理を行う。例えば、ノイズレベルが高い場合には、音質補正を抑止するなどが考えられる。抽出対象となるノイズとしては、例えば、楽曲の演奏前後に重畳しやすい拍手や、ニュースやバラエティ番組の街頭シーンで発生しやすい雑踏雑音などとする。
このように、本実施の形態にかかるオーディオ処理部57は、入力されたオーディオ信号について、ノイズが含まれているか否かに応じて、区間毎に音質補正処理を異ならせている。
これにより、本実施の形態にかかるオーディオ処理部57は、放送受信時や記録媒体からのコンテンツ再生時に、シーンの内容に応じてオーディオ信号に適切な音質補正処理を施すことで、高音質化を図ることができる。
本実施の形態では、拍手や雑踏雑音をノイズとして高精度で判定する例について説明する。このように本実施の形態では、拍手や雑踏雑音など、突発的に音楽や音声に重畳することの多い雑音を例に説明するが、定常的に重畳するノイズ(例えば、エアコンの動作音)など、他の種類のノイズを判定対象としてもよい。
音声/音楽用特徴量抽出部201は、オーディオ信号から、音声信号と音楽信号のいずれであるかを判定するための各種の特徴量パラメータを算出する。本実施の形態においては、音声/音楽用特徴量抽出部201は、オーディオ信号を、フレーム単位で区切った後、さらに各フレームをサブフレーム毎に分割する。なお、サブフレームは、数十msec程度のデータ長とする。そして、音声/音楽用特徴量抽出部201は、サブフレーム単位でパワー、零交差周波数等の判別情報を算出した後、サブフレーム単位で算出した判別情報に基づいてフレーム単位の平均・分散等の統計量を算出し、算出した統計量を特徴量パラメータとする。なお、当該手法に制限するものではなく、周知の手法を含め様々な手法を適用してよい。また、特徴量パラメータを算出するための判別情報として、パワー、零交差周波数等を用いることとしたが、判別情報としてこれらに限定するものではなく、音声と音楽間の識別に効果のあるものであればよい。
音声/音楽用レベル判定部202は、音質を細かく制御するための確度情報を含む、音声レベル及び音楽レベルを、抽出された特徴量パラメータから算出する。例えば、オーディオ信号が、音楽の場合、LRで異なる楽音が出力されるため、LRパワー比は大きくなる傾向にある。そこで、音声/音楽用レベル判定部202は、この傾向を用いて、音楽レベルを算出する。
具体的には、音声/音楽用レベル判定部202は、音声/音楽用特徴量抽出部201が抽出した特徴量パラメータを、予め定められた判定式に代入することで、音声レベル又は音楽レベル抽出の元となるベーススコアを算出する。この予め定められた判定式は、従来から提案されている線形判別式等を用いることとする。また、判定式は、オーディオ信号がステレオかモノラル化に応じて切り替えてもよいし、多段構成としてもよい。
音声/音楽用レベル補正部203は、音声/音楽用レベル判定部202で算出されたベーススコアに対して、音声及び音楽のそれぞれに独立して平滑化、補正することで、音声レベル及び音楽レベルを生成する。その際、音声か音楽かの排他的判定にしかできない線形判定式を、それぞれのベーススコアに適用することで、音楽、音声らしさの度合いを示す音楽レベル及び音声レベルを独立に算出できる。
詳細な例として、音声/音楽用レベル補正部203は、一定期間内に算出されたベーススコアに基づいて、当該一定時間の音楽レベル及び音声レベルの検出状態を参照しながら、各ベーススコアを補正する。例えば、楽曲中に短時間に無音等が生じた場合、算出された音楽レベルの元となるベーススコアは低い値を示すが、音声/音楽用レベル補正部203は、前後のフレームの音楽レベルに応じて、音楽レベルの元となるベーススコアを補正する。そして、音声/音楽用レベル補正部203は、補正したベーススコアから、音楽レベルを求める。なお、ベーススコアから音楽レベルを求める手法は、周知の手法を問わず、あらゆる手法を用いてよい。
このように楽曲中にもかかわらず、音楽レベルの元となるベーススコアが低かった区間について、適切な音楽レベルになるよう補正が行われる。また、音声レベルについても同様の補正が行われる。このように、本実施の形態では、音声レベル、音楽レベルの安定化を図るために、判定の連続性、判定値の大きさなどに基づく各レベルの補正が行われる。
ノイズ用特徴量抽出部204は、オーディオ信号から、当該オーディオ信号にノイズが含まれているか否かを判定するための各種の特徴量パラメータを算出する。本実施の形態においては、ノイズ用特徴量抽出部204は、音声/音楽用特徴量抽出部201と同様に、オーディオ信号を、フレーム単位で区切った後、さらに各フレームをサブフレーム毎に分割する。そして、ノイズ用特徴量抽出部204は、サブフレーム単位で各種判別情報を算出した後、サブフレーム単位で算出した各種判別情報に基づいてフレーム単位の平均・分散等の統計量を算出し、算出した統計量を特徴量パラメータとする。なお、判定情報は、オーディオ信号にノイズが含まれているか否かを判定するために用いられる情報であればよい。
本実施の形態では、ノイズ特性を抽出するための判別情報の一つとして、周波数特性の平坦さに着目したSFM(Spectral Flatness Measure)を用いる。これは、一般に雑音性の高い信号ほど周波数スペクトルが平坦になりSFM値が高くなる傾向を、ノイズの特徴として利用するものである。SFMは、以下に示す式(1)により算出する。
Figure 0004869420
そこで、ノイズ用特徴量抽出部204は、オーディオ信号に対してFFTを行うことで、算出されるスペクトルパワーを複数の帯域に分割してSFM値を算出する。そして、ノイズ用特徴量抽出部204は、この帯域ごとのSFMを重み付けて特徴量パラメータの一つとする。式(2)は、当該特徴量パラメータの算出式である。
Figure 0004869420
この式(2)において、変数N1〜Npは、p個に分割した帯域であり、α1〜αpは、総和が1になる重み係数とする。この式(2)で算出される特徴量パラメータは、ノイズの種別毎に異なる重み付け係数を用いることで、異なる値として算出される。
例えば、拍手を示すノイズで平坦さが顕著に表れる帯域を複数個選択し、当該拍手である特徴が明確に出るように設定された重み付け係数を用いて、拍手に関する特徴量を算出する一方、雑踏雑音で平坦さが顕著に表れる帯域を複数個選択し、当該雑踏雑音である特徴が明確に出るように設定された重み付け係数を用いて、雑踏雑音用の特徴量を算出する。
このように、本実施の形態にかかるノイズ用特徴量抽出部204は、判定対象となるノイズ毎に、適した帯域を複数個選択し、選択された各帯域に当該ノイズに適した重み付け係数が設定された式(2)で、ノイズの種類毎の特徴量を算出する。
なお、SFMは、ノイズの判定に有効な特徴量ではあるが、他のパラメータと併用することで、さらに高精度にノイズの判定が可能となる。そこで、本実施の形態にかかるノイズ用特徴量抽出部204は、SFM以外のパラメータも特徴量パラメータとして抽出する。
ノイズ用特徴量抽出部204は、ノイズ性抽出に効果ある他の特徴量パラメータとして、ホワイトノイズとの類似性を、特徴量パラメータとして抽出する。つまり、雑踏などの雑音は、ホワイトノイズに近似している性質を有する。そこで、雑踏雑音などの特徴量パラメータとして、ホワイトノイズに近い特徴量を選択すれば、ノイズ抽出により効果を発揮する。
そこで、ノイズ用特徴量抽出部204は、理想的なノイズ信号であるホワイトノイズを示す信号、各種ノイズとみなしたい信号、及びノイズとみなさない音声・音楽信号の代表的な信号を予め保持しておく。そして、ノイズ用特徴量抽出部204は、入力されたオーディオ信号から抽出する、雑踏などのノイズと見なしたい信号の特徴量として、音声・音楽と比べてよりホワイトノイズに類似する特徴量分布を取る特徴量を選択する。
また、音楽によっては、しばしば高周波ノイズ(パーカッション、シンセサイザー等に起因)のような音成分を含んでいる。こうした音成分に対して、ノイズと誤検出されることを抑止するため、ノイズ用特徴量抽出部204は、信号の平坦さの他に、音楽の構造に着目した特徴量を抽出してもよい。例えば、ノイズ用特徴量抽出部204が、音階に対応した倍音成分が強く励起しているか否かを示す特徴量を抽出することが考えられる。このような特徴量を抽出することで、一部の楽曲でノイズと誤検出されることを抑止できる。
なお判別情報は、SFM以外にも、ノイズ性抽出に効果のある特徴量を用いればよく、音声・音楽向け特徴量と共通で使うものであってよい。また、本実施の形態にかかるノイズ用特徴量抽出部204では、m個の特徴量パラメータを抽出する。この“m”は、実施の態様に応じて適切な値が定められるものとする。
ノイズレベル判定部205は、r個のノイズ−非ノイズ判定式保持部を備え、オーディオ信号から抽出された特徴量パラメータを用いて、r個のノイズ−非ノイズ判定式保持部に保持された各判定式をそれぞれ用いて、オーディオ信号に雑音が含まれているか否かを推定し、各判定式による推定結果から、ノイズが含まれているか否かを判定する。なお、r個のノイズ−非ノイズ判定式保持部は、デジタルテレビジョン放送受信装置1が保持する記憶手段(例えばHDD)の記憶領域内に設けられているものとする。なお、本実施の形態では、r個のノイズ−非ノイズ判定式保持部に保持された各判定式全てを用いて推定を行うが、全て利用せず、いずれか複数を用いて推定を行ってもよい。
r個のノイズ−非ノイズ判定式保持部211−1〜211−rは、オーディオ信号に含まれる可能性のあるノイズの種別毎に、種別のノイズであるか否かを雑音の特徴に従って判定するための線形判別式を、保持部毎にr個を保持している。なお、各保持部が保持する判別式の合計数rは、判定対象となる雑音の種別の合計数以上とする。例えば、音楽中の拍手を判別する判別式と、音声中の拍手を判別する判別式などを分けてもよい。
第1のノイズ−非ノイズ判別式保持部211−1が保持する線形判別式の例を、式(3)に示す。
Sn1=α1χ1+α2χ2+……+αmχm …(3)
χ1〜、χmには、ノイズ用特徴量抽出部204が抽出した特徴量パラメータが代入される。そして、重み付け係数α1〜αmには、ノイズの種別に応じて定められた重み付け係数が設定されている。なお、重み付け係数α1〜αmは、全て加算すると、‘1’になるような数値を設定することが考えられる。
例えば、式(3)が、拍手ノイズが含まれているか否かを判定する式の場合、重み付け係数α1〜αmには、拍手ノイズの抽出に適した数値が設定される。例えば、拍手ノイズに近い特徴量パラメータに対応する重み付け係数については、大きい値を設定する。そして、式(3)により算出されるSn1が正の場合、拍手ノイズを含んでいると判定され、負の場合、拍手ノイズを含んでいないと判定される。なお、正負は、学習の時点で便宜的に定めたものであり、拍手ノイズを正とするか否かはどちらでもよい。また、判別式は、正負で判定することに限らず、ノイズか否かを判定できればよい。
なお、α1〜αmは、拍手であるか否かを示す重み付け係数は、ユーザが調節してもよいし、学習アルゴリズムに従って算出される係数であってもよい。
そして、第2のノイズ−非ノイズ判別式保持部211−2が保持する線形判別式の例を、式(4)に示す。なお、式(4)は、雑踏雑音を検出するための線形判別式とする。
Sn2=α’1χ1+α’2χ2+……+α’mχm …(4)
式(4)は、式(3)と比べて、重み付け係数がα1〜αmから、α’1〜α’mに変更されていることが確認できる。これら重み付け係数α’1〜α’mは、雑踏ノイズの抽出に適した数値が設定される。なお、これら重み付け係数は、実測に応じて適切な値が設定されているものとして、具体的な数値は省略する。
なお、判定式で用いる特徴量パラメータは、判定式毎に異ならせてもよい。例えば、識別に際してSFMのような指標が有効でない雑音の音種別もありうるため、音種別に応じた特徴量パラメータの選択も重要である。
このように線形判別式が判定する雑音の種類に応じて、最適な重み付け係数が設定されているものとする。
そして、ノイズレベル判定部205は、これら算出された判別値Sn1〜Snrに基づいて、ベーススコアSn_baseを算出する。ベーススコアSn_baseは、ノイズレベルを算出するための初期値とする。このようにして、ノイズらしさを示したベーススコアSn_baseが推定されることになる。なお、ベーススコアSn_baseは、これら判別式の判定結果に基づくパラメータであればよく、例えば正となった判別式の判別結果の合計値、又は平均値などであってもよい。
ところで、拍手や、雑踏雑音など、「ノイズ」として分類したい音種別は、音種別毎に音響特性が異なっている。そこで、ノイズレベル判定部205が、音種別毎に複数の判別式を保持し、これら判別式でノイズと分類したい音種別を判定することで、各音種別を高精度で判定できる。なお、これら判別式の重み付け係数は、オフライン学習により設定したものとするが、ユーザが自分で設定したものでもよい。
例えば、拍手-非拍手、雑踏-非雑踏として判定式を一つずつ用いる場合、rが2となる。この場合、拍手-音楽、拍手-音声、雑踏-音楽、雑踏-音声などの区分に応じた参照データの学習により2個の判別式を決定され、各保持部が決定された判別式を保持することになる。
このように、本実施の形態においては、ノイズレベル判定部205が、環境に応じて設定された複数の判別式を用いてノイズレベルを推定するため、各判定式による推定結果に基づいて、統合的にノイズが含まれているか否かを判定しているので、ノイズ判定の信頼性を高めている。
ただし、ノイズレベル判定部205が用いる線形判別式の特質として、信号の種類を2分類に分けるため、非拍手として音楽も音声も含まれると音種別間の明確な判別が困難になりやすい。そこで、例えば、拍手-音楽(音楽内の拍手判定用)、拍手-音声(音声内の拍手判定用)のそれぞれに対応する判別式を用意するなど、さらに細かい判別条件毎に判定式を用意してもよい。これにより、判別の確度を高めることができる。
例えば、通常の音声区間について、拍手-音楽の判別式が拍手(ノイズ)を示している場合があるとする。これは、音声成分以外の微小な背景音、暗騒音の周波数特性が、拍手向けに設定した帯域で、(音楽と比べると拍手に近い程度に)高いSFM値となるような状況である。このような場合、拍手-音声の判別式を併せ見て、こちらの判別値で音声内に拍手が含まれる要素が低いと判定された(且つ当該サブフレームで音楽レベルより音声レベル方が高いと判定された)場合、拍手-音楽の判別式のノイズの判定をキャンセルするというように使える。これを拡張し、複数判定式による多重判定を汎用化してもよい。
複数判別式を併せて判定する手法としては、判定式のうちすべてを信頼するAND条件、最低限一つの判定をクリアすればよいOR方式、多数決方式、判定式間の重み付け方式と様々な手法が考えられる。ベーススコアはそれぞれの判別式から求めたスコア値{Sn1, …, Snr}(以下、判別式値リストとも称す)の関数値となる。
ノイズレベル補正部206は、一定期間内に算出されたベーススコアSn_baseに基づいて、当該一定時間のノイズレベルの検出状態に従って各ベーススコアを補正した後、ノイズレベルを算出する。
レベル調停部207は、音声/音楽レベル用補正部203により補正された音声レベル及び音楽レベル、並びにノイズレベル補正部206により補正されたノイズレベルに対して、各レベル間の調停を行う。つまり、音声/音楽レベル用補正部203の処理では、瞬時的な誤検出などを抑止できるが、拍手や雑踏雑音などノイズとみなす音成分が含まれている場合に、紛らわしい特徴量分布となり、誤って音楽レベルが強く出る可能性もある。そこで、レベル調停部207は、ノイズレベルに応じて、音楽レベルの調停を行う。本実施の形態では、音声、音楽レベルと独立して、ノイズレベルを求めているため、従来と比べてより高い精度で音声、音楽レベルを調整できる。
DSP208は、調整された後の音声レベル、音楽レベル及びノイズレベルに従って、入力されたオーディオ信号の音質補正を行う。なお、各レベルを用いた具体的な音質補正手法としては、周知の手法を問わずあらゆる手法を用いることができるものとする。
次に、本実施の形態にかかるデジタルテレビジョン放送受信装置1の音声処理モジュール57における、オーディオ信号に含まれるノイズに関連した処理について説明する。図4は、本実施の形態にかかる音声処理モジュール57における上述した処理の手順を示すフローチャートである。なお、図4に示すS401〜S403の処理と並行して、音声レベル及び音楽レベルを導出するための処理が行われているものとする。
まず、ノイズ用特徴量抽出部204が、入力されたオーディオ信号から、ノイズ抽出に効果のある複数の特徴量パラメータを生成する(ステップS401)。
次に、ノイズレベル判定部205が、雑音の種類毎に設けられた複数の判別式を用いて、ノイズらしさを示したノイズレベルの元となるベーススコアSn_baseを推定する。
その後、ノイズレベル補正部206が、所定期間の検出状況に従って、ノイズレベルを補正する(ステップS403)。
次に、レベル調停部207が、音声レベル及び音楽レベルを、音声/音楽用レベル補正部203から取得する(ステップS404)。同様に、レベル調停部207は、ノイズレベル補正部206から、ノイズレベルを取得する。
その後、レベル調停部207が、ノイズレベルに従って、音声レベル及び音楽レベルを補正する(ステップS405)。
そして、DSP208が、補正した後の音声レベル及び音楽レベルで、オーディオ信号に対する音響補正を行う(ステップS406)。
上述した処理手順により、高精度に抽出されたノイズレベルに従って調整された音楽レベル及び音声レベルに従って、オーディオ信号に対して音響補正が行われる。これにより、より適切な音響補正を行うことができる。
次に、図4に示すステップS401でノイズ用特徴量抽出部204で行っていた特徴量パラメータの生成手法について説明する。図5は、本実施の形態にかかるノイズ用特徴量抽出部204における上述した処理の手順を示すフローチャートである。
まず、ノイズ用特徴量抽出部204は、入力されたオーディオ信号をフレーム単位で分割した後、分割したフレームをさらに分割したサブフレームを抽出する(ステップS501)。
次に、ノイズ用特徴量抽出部204は、サブフレーム単位で、拍手を示すノイズ用のSFMを算出する(ステップS502)。さらに、ノイズ用特徴量抽出部204は、サブフレーム単位で、雑踏を示すノイズ用のSFMを算出する(ステップS503)。
その後、ノイズ用特徴量抽出部204は、サブフレーム単位で、ホワイトノイズに特徴量分布が近くなりやすい特徴量を、判別情報として算出する(ステップS504)。
さらに、さらに、ノイズ用特徴量抽出部204は、サブフレーム単位で、その他の判別情報を算出する(ステップS505)。これにより、m種類の判別情報が算出されたものとする。
そして、ノイズ用特徴量抽出部204は、上述したサブフレーム毎に、当該サブフレームに前後するサブフレームを含めたフレーム単位で判別情報を抽出する(ステップS506)。
その後、ノイズ用特徴量抽出部204は、抽出されたフレーム単位の各判別情報の統計値を求め、サブフレーム毎の特徴量パラメータχ1、……、χmを生成する(ステップS507)。
以降、このように生成された特徴量パラメータχ1、……、χmに基づいてノイズレベルの生成をしていくことになる。
次に、図4に示すステップS402のノイズレベル判定部205で行っていた、ノイズレベルの元となるベーススコアSn_baseの算出手法について説明する。図6は、本実施の形態にかかるノイズレベル判定部205における上述した処理の手順を示すフローチャートである。
まず、ノイズレベル判定部205は、各保持部に保持されているr個の判別式を読み出す(ステップS601)。
そして、ノイズレベル判定部205は、読み出したr個の判別式のそれぞれに対して、特徴量パラメータχ1、……、χmを代入する(ステップS602)。
次に、ノイズレベル判定部205は、特徴量パラメータが代入された各判別式で算出された判別式値のリストである判別式値リスト{Sn1、……、Snr}を生成する(ステップS603)。
その後、ノイズレベル判定部205は、判別式値リスト{Sn1、……、Snr}のうち、ノイズを示すスコア以上の値がk個以上存在するか否かを判定する(ステップS604)。ノイズを示すスコアとして例えば‘0’などがある。この場合、判別値が正であればノイズであると判定されたことを意味する。また、kは、r以下であって、ノイズを含んでいる判定基準として適切な値が設定されていればよい。
そして、k個以上と判定した場合(ステップS604:Yes)、ノイズレベル判定部205は、“Sn1、……、Snr”を代入した関数fから、ベーススコアSn_baseを算出する(ステップS605)。一方、k個より小さいと判定した場合(ステップS604:No)、ノイズレベル判定部205は、ベーススコアSn_baseとして‘0’を設定する(ステップS606)。つまり、k個より小さいと判定した場合、ノイズが含まれている可能性がほとんどないものとしてノイズレベルの初期値が設定される。
上述した処理手順により、ノイズレベル判定部205による、ノイズレベルの元となるベーススコアSn_baseの推定がなされる。上述した処理手順で算出したベーススコアSn_baseは、ノイズレベル補正部206にて補正・平滑化が行われる。
次に、図4に示すステップS403のノイズレベル補正部206で行っていた、ベーススコアSn_baseからノイズレベルの生成手法について説明する。図7は、本実施の形態にかかるノイズレベル補正部206における上述した処理の手順を示すフローチャートである。
まず、ノイズレベル補正部206は、ベーススコアSn_baseが、ノイズらしさの閾値thNsScを超えているか否かを判定する(ステップS701)。
そして、ノイズレベル補正部206が、閾値thNsScを超えていると判定した場合(ステップS701:Yes)、ノイズ継続性カウンタ変数であるcntNsをインクリメントする(ステップS702)。
次に、ノイズレベル補正部206が、ノイズ継続性カウンタ変数cntNsが、ノイズ継続性閾値thNsCnt以上か否かを判定する(ステップS703)。ノイズ継続性閾値thNsCntより小さいと判定した場合(ステップS703:No)、ステップS706の処理に進む。
一方、ノイズレベル補正部206が、ノイズ継続性カウンタ変数cntNsがノイズ継続性閾値thNsCnt以上と判定した場合(ステップS703:Yes)、ノイズと判定しうるスコア値が十分に連続したとみなし、ベーススコアへの補正変数Sn_enhにstep_nを加算する(ステップS706)。なお、step_nには予め定められた値が設定されているものとする。
そして、ノイズレベル補正部206が、ベーススコアSn_baseに対して、補正変数Sn_enhを加算することで、過去の判定状況を考慮して補正したノイズスコアSnが算出される(ステップS706)。
また、ノイズレベル補正部206が、ステップS701において、ベーススコアSn_baseがノイズ継続性閾値thNsScを超えないと判定した場合(ステップS701:No)、ノイズらしさが顕著には出ていないとみなし、ノイズ継続性カウンタ変数cntNsを‘0’にリセットするとともに、ベーススコアへの補正変数Sn_enhからstep_n’だけ減算する(ステップS705)。なお、step_n’には予め定められた値が設定されているものとする。
そして、ノイズレベル補正部206は、ステップS705で減じられた補正変数Sn_enhを、ベーススコアSn_baseに加算することで、ノイズスコアSnを算出する(ステップS706)。なお、補正値Sn_enhは、ステップS704及びS705においてサブフレーム単位で更新される以外、初期化等されることなく継続して値を保持している。
本シーケンスで示すように、ノイズレベル補正部206は、ベーススコアSn_baseが連続して大きい値の場合、ノイズスコアSnを安定して増加させる一方、ベーススコアSn_baseが小さい場合にはstep_n’を用いて補正値Sn_enhを段階的に減少させる。これにより、ノイズスコアSnの急激な変動を抑止できる。
そして、ノイズレベル補正部206は、ノイズスコアSnが際限なく増加、減少しないように予め定めた上限値、下限値(例えば下限値‘0’、上限値‘1.0’など)に収まるようクリッピングする(ステップS707)。
その後、ノイズレベル補正部206は、クリッピングした値を、予め定められた範囲(例えば‘1’から‘12’までの整数値)内の値をとるノイズレベルLnsに変換する(ステップS708)。これにより、最終的なノイズレベルLnsが得られることになる。
次に、図4に示すステップS405のレベル調停部207で行っていた、音楽レベルの補正手法について説明する。図8は、本実施の形態にかかるレベル調停部207における上述した処理の手順を示すフローチャートである。
まず、レベル調停部207は、音楽レベルLmsが、音楽レベル用の閾値thLvMsより大きいとともに、ノイズレベルLnsが、ノイズレベル用の閾値thLvNsより大きいか判定する(ステップS801)。
そして、レベル調停部207は、音楽レベルLms及びノイズレベルLnsがそれぞれ閾値より大きいと判定した場合(ステップS801:Yes)、音楽レベルLmsから、ノイズレベルLnsにN_factorを乗算した値を減算して終了する(ステップS802)。なお、N_factorは、ノイズレベルLnsを調整するために予め定められた値とする。
一方、レベル調停部207は、音楽レベルLms及びノイズレベルLnsのうち一方でも閾値より小さいと判定された場合(ステップS801:No)、特に処理を行わずに終了する。
上述した処理手順により、誤検出が比較的起こりやすい音楽-ノイズ間で適切な調停を行うことができる。なお、誤検出が比較的生じやすい音楽−ノイズ間での調停を例に挙げたが、音声-ノイズ間でも同様に調停を行うことができる。
本実施の形態にかかるオーディオ処理部57においては、上述した構成を備えることで、高精度でノイズレベルLnsを同定することが可能となる。
つまり、本実施の形態にかかるオーディオ処理部57においては、ノイズレベル判定部205において、雑音の種類毎に判別式を用意したことで、オーディオ信号に含まれる可能性のある様々な雑音に対応したノイズレベルの抽出処理を行うことができる。これにより、ノイズが含まれているか否かの判定を、従来と比べて高精度にすることができる。
また、本実施の形態にかかるデジタルテレビジョン放送受信装置1のオーディオ処理部57においては、ノイズレベル判定部205において、オーディオ信号から抽出した特徴量パラメータに対して、判定対象となるノイズの種別ごとに設定した複数の判定式を用いることで、音声/音楽/ノイズの3分類のロバストな識別を可能にする。これにより、音楽とノイズ間など混同しやすいオーディオ信号の区間の識別の精度が向上する。
さらに、本実施の形態にかかるオーディオ処理部57においては、ロバストな識別結果に基づいて、信号区分に応じて音質補正を柔軟に切り替えることで、より適切な音質補正を行うことができる。
また、本実施の形態にかかるオーディオ処理部57においては、ノイズの検出精度を向上させたい場合には、検出精度を向上させたいノイズの種類に対応する判別式の重み付けの変更や、再学習を行えばよいため、識別方式の改良が容易である。
また、本実施の形態にかかるオーディオ処理部57においては、ノイズ用特徴量抽出部204において、周波数構造の平坦さなどを示す特徴量パラメータを、拍手や雑踏音など雑音の種別に応じた帯域分布に変更した上で、雑音の種別に応じた重み付けを行う。これにより、雑音種別毎に行う判別がより正確になる。
また、本実施の形態にかかるオーディオ処理部57においては、レベル調停部207によりレベル間の調停を行うことで、音楽-ノイズ間などでの誤検出の影響を極力抑制する。
また、ノイズレベル判定部205において、拍手が含まれているか否かを判別する判別式として、拍手−音楽用の判別式、及び拍手−音声用の判別式の両方を用いるように設定することで、検出精度を向上できる。また、音楽の場合に、さらに傾向の異なるもので細かく分けるなどしてもよい。
さらに、ノイズレベル補正部206においては、所定時間の検出度合いに従って、ベーススコアSn_baseを調整するため、滑らかな音質補正を行うことができる。
1 デジタルテレビジョン放送受信装置
57 オーディオ処理部
201 音声/音楽用特徴量抽出部
202 音声/音楽用レベル判定部
203 音声/音楽用レベル補正部
204 ノイズ用特徴量抽出部
205 ノイズレベル判定部
206 ノイズレベル補正部
207 レベル調停部
208 DSP
211−1〜221−r 非ノイズ判定式保持部

Claims (3)

  1. 入力オーディオ信号の音種を表す信号音種別と、当該入力オーディオ信号に含まれる可能性のある雑音の種別と、の組み合わせ毎に、当該種別の雑音であるか否かを雑音の特徴に従って判定する判定手法を、複数保持する保持手段と、
    入力オーディオ信号に対して、前記保持手段に保持された前記複数の前記判定手法のうち、複数を用いて、前記入力オーディオ信号に雑音が含まれているか否かを判定する判定手段と、
    前記判定手段が判定した前記入力オーディオ信号に雑音が含まれているか否かを示す判定結果に従って、雑音である度合いを示す雑音レベルを導き出す雑音レベル導出手段と、
    前記入力オーディオ信号について、音楽であるか否かの度合いと音声であるか否かの度合いとを含む音情報レベルを取得する音楽レベル取得手段と、
    前記音情報レベルを、前記雑音レベルに従って調整する調整手段と、
    前記調整手段で調整された前記音情報レベルに従って、前記入力オーディオ信号の補正処理を行う補正手段と、を備え、
    前記保持手段が保持する前記判定手法は、入力オーディオ信号の周波数分布の平坦さから、前記種別の雑音であるか否かを判別する判別式であって、当該判別式では、入力オーディオ信号の周波数分布について、前記種別の雑音の特徴に応じた帯域に重み付けしていること、
    を特徴とする音情報判定装置。
  2. 前記入力オーディオ信号から、前記雑音の種別毎の特徴が表れた特徴量を抽出する特徴量抽出手段を、さらに備え、
    前記判定手段は、前記特徴量抽出手段が抽出した前記特徴量に対して、前記雑音の種別毎に保持された前記複数の前記判定手法を用いて、前記入力オーディオ信号に雑音が含まれているか否かを判定すること、
    を特徴とする請求項に記載の音情報判定装置。
  3. 音情報判定装置で実行される音情報判定方法であって、
    前記音情報判定装置は、入力オーディオ信号の音種を表す信号音種別と、当該入力オーディオ信号に含まれる可能性のある雑音の種別と、の組み合わせ毎に、当該種別の雑音であるか否かを雑音の特徴に従って判定する判定手法を、複数記憶する記憶手段を備え、
    判定手段が、入力オーディオ信号に対して、前記記憶手段に記憶された前記複数の前記判定手法のうち、当該入力オーディオ信号の信号音種に対応する判定手法を複数用いて、前記入力オーディオ信号に雑音が含まれているか否かを判定する判定ステップ
    雑音レベル導出手段が、前記判定ステップが判定した前記入力オーディオ信号に雑音が含まれているか否かを示す判定結果に従って、雑音である度合いを示す雑音レベルを導き出す雑音レベル導出ステップと、
    音楽レベル取得手段が、前記入力オーディオ信号について、音楽であるか否かの度合いと音声であるか否かの度合いとを含む音情報レベルを取得する音楽レベル取得ステップと、
    調整手段が、前記音情報レベルを、前記雑音レベルに従って調整する調整ステップと、
    補正手段が、前記調整ステップで調整された前記音情報レベルに従って、前記入力オーディオ信号の補正処理を行う補正ステップと、
    含むことを特徴とする音情報判定方法。
JP2010070797A 2010-03-25 2010-03-25 音情報判定装置、及び音情報判定方法 Expired - Fee Related JP4869420B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010070797A JP4869420B2 (ja) 2010-03-25 2010-03-25 音情報判定装置、及び音情報判定方法
US12/965,586 US20110235812A1 (en) 2010-03-25 2010-12-10 Sound information determining apparatus and sound information determining method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010070797A JP4869420B2 (ja) 2010-03-25 2010-03-25 音情報判定装置、及び音情報判定方法

Publications (2)

Publication Number Publication Date
JP2011203500A JP2011203500A (ja) 2011-10-13
JP4869420B2 true JP4869420B2 (ja) 2012-02-08

Family

ID=44656512

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010070797A Expired - Fee Related JP4869420B2 (ja) 2010-03-25 2010-03-25 音情報判定装置、及び音情報判定方法

Country Status (2)

Country Link
US (1) US20110235812A1 (ja)
JP (1) JP4869420B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013171089A (ja) * 2012-02-17 2013-09-02 Toshiba Corp 音声補正装置、方法、及びプログラム
US20160249047A1 (en) * 2013-10-23 2016-08-25 K-WILL Corporation Image inspection method and sound inspection method
KR102629385B1 (ko) * 2018-01-25 2024-01-25 삼성전자주식회사 바지-인 관련 직접 경로를 지원하는 저전력 보이스 트리거 시스템을 포함하는 애플리케이션 프로세서, 이를 포함하는 전자 장치 및 그 동작 방법
JP6994221B2 (ja) * 2018-07-13 2022-01-14 日本電信電話株式会社 抽出発生音補正装置、抽出発生音補正方法、プログラム

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0944186A (ja) * 1995-07-31 1997-02-14 Matsushita Electric Ind Co Ltd 雑音抑制装置
EP1041539A4 (en) * 1997-12-08 2001-09-19 Mitsubishi Electric Corp METHOD AND DEVICE FOR PROCESSING THE SOUND SIGNAL
US6200423B1 (en) * 1999-11-18 2001-03-13 Kimberly-Clark Worldwide, Inc. Method of controlling basis weight profile using multi-layer consistency dilution
JP3960834B2 (ja) * 2002-03-19 2007-08-15 松下電器産業株式会社 音声強調装置及び音声強調方法
JP3963850B2 (ja) * 2003-03-11 2007-08-22 富士通株式会社 音声区間検出装置
JP4301896B2 (ja) * 2003-08-22 2009-07-22 シャープ株式会社 信号分析装置、音声認識装置、プログラム、記録媒体、並びに電子機器
JP4456504B2 (ja) * 2004-03-09 2010-04-28 日本電信電話株式会社 音声雑音判別方法および装置、雑音低減方法および装置、音声雑音判別プログラム、雑音低減プログラム
JP4787979B2 (ja) * 2006-12-13 2011-10-05 富士通テン株式会社 雑音検出装置および雑音検出方法
JP2009003008A (ja) * 2007-06-19 2009-01-08 Advanced Telecommunication Research Institute International 雑音抑圧装置、音声認識装置、雑音抑圧方法、及びプログラム
JP4469882B2 (ja) * 2007-08-16 2010-06-02 株式会社東芝 音響信号処理方法及び装置
JP2009139894A (ja) * 2007-12-11 2009-06-25 Advanced Telecommunication Research Institute International 雑音抑圧装置、音声認識装置、雑音抑圧方法、及びプログラム
JP4364288B1 (ja) * 2008-07-03 2009-11-11 株式会社東芝 音声音楽判定装置、音声音楽判定方法及び音声音楽判定用プログラム

Also Published As

Publication number Publication date
US20110235812A1 (en) 2011-09-29
JP2011203500A (ja) 2011-10-13

Similar Documents

Publication Publication Date Title
JP6896135B2 (ja) ボリューム平準化器コントローラおよび制御方法
JP4439579B1 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
JP4621792B2 (ja) 音質補正装置、音質補正方法及び音質補正用プログラム
CN109616142B (zh) 用于音频分类和处理的装置和方法
CN104079247B (zh) 均衡器控制器和控制方法以及音频再现设备
US8295507B2 (en) Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
JP2011065093A (ja) オーディオ信号補正装置及びオーディオ信号補正方法
JP4837123B1 (ja) 音質制御装置及び音質制御方法
EP2538559B1 (en) Audio controlling apparatus, audio correction apparatus, and audio correction method
US20100166225A1 (en) Signal processing apparatus, signal processing method and program
US7844452B2 (en) Sound quality control apparatus, sound quality control method, and sound quality control program
JP5737808B2 (ja) 音響処理装置およびそのプログラム
JP4869420B2 (ja) 音情報判定装置、及び音情報判定方法
US8099276B2 (en) Sound quality control device and sound quality control method
US8837744B2 (en) Sound quality correcting apparatus and sound quality correcting method
JP2003274492A (ja) ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
US9042562B2 (en) Audio controlling apparatus, audio correction apparatus, and audio correction method
JP5695896B2 (ja) 音質制御装置、音質制御方法及び音質制御用プログラム
JP4886907B2 (ja) オーディオ信号補正装置及びオーディオ信号補正方法
EP1560354A1 (en) Method and apparatus for comparing received candidate sound or video items with multiple candidate reference sound or video items

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110712

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110908

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111025

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111115

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141125

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees