JP4645868B2 - ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 - Google Patents
ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 Download PDFInfo
- Publication number
- JP4645868B2 JP4645868B2 JP2000238893A JP2000238893A JP4645868B2 JP 4645868 B2 JP4645868 B2 JP 4645868B2 JP 2000238893 A JP2000238893 A JP 2000238893A JP 2000238893 A JP2000238893 A JP 2000238893A JP 4645868 B2 JP4645868 B2 JP 4645868B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- digital audio
- class
- pitch
- student
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Description
【発明の属する技術分野】
本発明はディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体に関し、レートコンバータ又はPCM(Pulse Code Modulation) 復号装置等においてディジタル信号に対してデータの補間処理を行うディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体に適用して好適なものである。
【0002】
【従来の技術】
従来、ディジタルオーディオ信号をディジタル/アナログコンバータに入力する前に、サンプリング周波数を元の値の数倍に変換するオーバサンプリング処理を行っている。これにより、ディジタル/アナログコンバータから出力されたディジタルオーディオ信号はアナログ・アンチ・エイリアス・フィルタの位相特性が可聴周波数高域で一定に保たれ、また、サンプリングに伴うディジタル系のイメージ雑音の影響が排除されるようになされている。
【0003】
かかるオーバサンプリング処理では、通常、線形一次(直線)補間方式のディジタルフィルタが用いられている。このようなディジタルフィルタは、サンプリングレートが変わったりデータが欠落した場合等に、複数の既存データの平均値を求めて直線的な補間データを生成するものである。
【0004】
【発明が解決しようとする課題】
ところが、オーバサンプリング処理後のディジタルオーディオ信号は、線形一次補間によって時間軸方向に対してデータ量が数倍に緻密になっているものの、オーバサンプリング処理後のディジタルオーディオ信号の周波数帯域は変換前とあまり変わらず、音質そのものは向上していない。さらに、補間されたデータは必ずしもA/D変換前のアナログオーディオ信号の波形に基づいて生成されたのではないため、波形再現性もほとんど向上していない。
【0005】
また、サンプリング周波数の異なるディジタルオーディオ信号をダビングする場合において、サンプリング・レート・コンバータを用いて周波数を変換しているが、かかる場合でも線形一次ディジタルフィルタによって直線的なデータの補間しか行うことができず、音質や波形再現性を向上することが困難であった。さらに、ディジタルオーディオ信号のデータサンプルが欠落した場合において同様である。
【0006】
本発明は以上の点を考慮してなされたもので、ディジタル信号の波形再現性を一段と向上し得るディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体を提案しようとするものである。
【0007】
【課題を解決するための手段】
かかる課題を解決するため本発明においては、ディジタルオーディオ信号のピッチを検出し、当該ピッチに基づいてディジタルオーディオ信号のクラスを分類し、分類されたクラスに対応した予測係数及びディジタルオーディオ信号の直流成分の値を用いてディジタルオーディオ信号を予測演算することによりディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するようにしたことにより、規則性を持ったオーディオ波形の特徴に基づく予測演算を行うことができると共にオーディオ波形の直流成分が補正できるので、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができる。
【0008】
また、かかる課題を解決するため本発明においては、ディジタルオーディオ信号のピッチを検出し、当該ピッチに基づいてディジタルオーディオ信号のクラスを分類すると共に、ディジタルオーディオ信号の直流成分の値のクラスを分類し、分類されたそれぞれのクラスを統合して新たなクラスを生成し、新たなクラスに対応した予測係数を用いてディジタルオーディオ信号を予測演算することによりディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するようにしたことにより、規則性を持ったオーディオ波形の特徴に基づく予測演算を行うことができると共にオーディオ波形の直流成分が補正できるので、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができる。
【0009】
【発明の実施の形態】
以下図面について、本発明の一実施の形態を詳述する。
【0010】
図1においてオーディオ信号処理装置10は、ディジタルオーディオ信号(以下これをオーディオデータと呼ぶ)のサンプリングレートを上げたり、オーディオデータを補間する際に、真値に近いオーディオデータをクラス分類適用処理によって生成するようになされている。因みに、ディジタルオーディオ信号とは、人や動物が発する声を表す音声信号、楽器が発する楽音を表す楽音信号、及びその他の音を表す信号を意味するものである。
【0011】
すなわち、オーディオ信号処理装置10において、ピッチ検出部11は入力端子TINから供給された図2又は図3に示す入力オーディオデータD10のピッチ(基本周波数)を例えば入力オーディオデータD10の自己相関に基づいて検出する。
【0012】
すなわちピッチ検出部11は、入力オーディオデータD10について、例えば時間軸領域に分割してなる種々の範囲ごとに自己相関値を検出し、当該自己相関値が所定の閾値よりも大きいときピッチが有ると判断する。そしてピッチ検出部11はピッチが有る場合のピッチ周期PITT 及びピッチサイズとその位置をピッチクラスとする。例えば、入力オーディオデータD10が図2に示すような波形を有している場合、ピッチ検出部11はカレントピッチPIT2に対してその前後に隣接する位置に前ピッチPIT1及び後ろピッチPIT3を検出する。因みに、ピッチ検出部11が検出する前ピッチPIT1及び後ろピッチPIT3は必ずしもカレントピッチPIT2に隣接するとは限らず、カレントピッチPIT2から所定距離離れている場合もある。
【0013】
ピッチ検出部11はカレントピッチPIT2に対応する前ピッチPIT1及び後ろピッチPIT3を検出すると、これらを切り出すための切り出し制御信号CONT11を可変クラス分類部抽出部12及び可変予測演算部抽出部13に供給する。
【0014】
可変クラス分類部抽出部12は切り出し制御信号CONT11に基づいて、前ピッチPIT1に対応するクラスタップCL1、カレントピッチPIT2に対応するクラスタップCL2及び後ろタップPIT3に対応するクラスタップCL3を入力オーディオデータD10から切り出し、これらをクラスタップデータD12としてクラス分類部14に供給する。
【0015】
クラス分類部14は、クラス分類抽出部12において切り出されたクラスタップについて、各ピッチ(前ピッチPIT1、カレントピッチPIT2及び後ろタップPIT3)ごとに個別に、又はこれらを統合し、そのクラスタップを圧縮して圧縮データパターンを生成するADRC(Adaptive Dynamic Range Coding) 回路部と、クラスタップデータD12の属するクラスコードを発生するクラスコード発生回路部とを有する。
【0016】
ADRC回路部はクラスタップデータD12に対して、例えば8ビットから2ビットに圧縮するような演算を行うことによりパターン圧縮データを形成する。このADRC回路部は、適応的量子化を行うものであり、ここでは、信号レベルの局所的なパターンを短い語長で効率的に表現することができるので、信号パターンのクラス分類のコード発生用に用いられる。
【0017】
具体的には、オーディオ波形上の6つの8ビットのデータ(クラスタップ)をクラス分類しようとする場合、248という膨大な数のクラスに分類しなければならず、回路上の負担が多くなる。そこで、この実施の形態のクラス分類部14ではその内部に設けられたADRC回路部で生成されるパターン圧縮データに基づいてクラス分類を行う。例えば6つのクラスタップに対して1ビットの量子化を実行すると、6つのクラスタップを6ビットで表すことができ、26 =64クラスに分類することができる。
【0018】
ここで、ADRC回路部は、切り出された領域内のクラスタップ(オーディオ波形)のダイナミックレンジをDR、ビット割り当をm、各クラスタップのデータレベルをL、量子化コードをQとすると、次式、
【0019】
【数1】
【0020】
に従って、領域内の最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して量子化を行う。なお、(1)式において{ }は小数点以下の切り捨て処理を意味する。かくして6つのクラスタップが、それぞれ例えば8ビット(m=8)で構成されているとすると、これらはADRC回路部においてそれぞれが2ビットに圧縮される。
【0021】
このようにして圧縮されたオーディオ波形データ(クラスタップ)をそれぞれqn (n=1〜6)とすると、クラス分類部14に設けられたクラスコード発生回路部は、圧縮されたオーディオ波形データqn に基づいて、次式、
【0022】
【数2】
【0023】
に示す演算を実行することにより、そのブロック(q1 〜q6 )が属するクラスを示すクラスコードclass を算出すると共に、当該算出されたクラスタップデータD12に基づくクラスコード classをクラスコードデータD14として予測係数メモリ15に供給する。このクラスコード classは、予測係数メモリ15から予測係数を読み出す際の読み出しアドレスを示す。因みに(2)式において、nは圧縮されたオーディオ波形データ(クラスタップ)qn の数を表し、この実施の形態の場合n=6であり、またPはビット割り当てを表し、この実施の形態の場合P=2である。
【0024】
このようにして、クラス分類部14はクラス分類部抽出部12において入力オーディオデータD10から切り出されたクラスタップのクラスコード classを生成し、これをクラスコードデータD14として予測係数メモリ15に供給する。
【0025】
予測係数メモリ15には、各クラスコードに対応する予測係数のセットがクラスコードに対応するアドレスにそれぞれ記憶されており、クラス分類部14から供給されるクラスコードデータD14に基づいて、当該クラスコードに対応するアドレスに記憶されている予測係数のセットw1 〜wn が読み出され、予測演算部16に供給される。
【0026】
この実施の形態の場合、可変予測演算部抽出部13から予測タップとして予測演算部16に供給されるオーディオ波形データD13に加えて、可変予測演算部抽出部13から出力されるオーディオ波形データの平均値(DC成分)D18が平均値算出部18において算出されてDC成分補正タップ(DC値クラス)として8ビットに正規化され予測演算部16に供給されるようになされている。予測演算部16での予測演算では、このDC成分補正タップによる補正項が付加されることにより、符号化歪み等で変化したDC成分が補正される。
【0027】
予測演算部16は、可変予測演算部抽出部13においてピッチ検出部11から供給される切り出し制御信号CONT11に応じて切り出された予測演算しようとするオーディオ波形データD13からなる予測タップ(x1 〜xn )と、予測係数w1 〜wn に対して、次式
【0028】
【数3】
【0029】
に示す積和演算を行うことにより、予測結果y′を得る。この予測値y′にDC成分補正項が付加された結果が、音質が改善されたオーディオデータD16として予測演算部16から出力される。
【0030】
因みに、ピッチ検出部11において入力オーディオデータD10にピッチが無いと判断した場合、ピッチ検出部11は前ピッチPIT1や後ろピッチPIT3を用いることなく、図3に示すようにカレントデータ近傍のオーディオ波形のレベルを切り出すための制御信号CONT11を可変クラス分類部抽出部12及び可変予測演算部抽出部13に供給することにより、カレントデータ近傍のオーディオ波形によりクラス分類及び予測演算を行う。
【0031】
なお、オーディオ信号処理装置10の構成として図1について上述した機能ブロックを示したが、この機能ブロックを構成する具体的構成として、この実施の形態においては図4に示すコンピュータ構成の装置を用いる。すなわち、図4において、オーディオ信号処理装置10は、バスBUSを介してCPU21、ROM(Read Only Memory)22、予測係数メモリ15を構成するRAM(Random Access Memory)15、及び各回路部がそれぞれ接続された構成を有し、CPU11はROM22に格納されている種々のプログラムを実行することにより、図1について上述した各機能ブロック(ピッチ検出部11、クラス分類部抽出部12、予測演算部抽出部13、クラス分類部14、予測演算部16及び平均値算出部18)として動作するようになされている。
【0032】
また、オーディオ信号処理装置10にはネットワークとの間で通信を行う通信インターフェース24、フロッピィディスクや光磁気ディスク等の外部記憶媒体から情報を読み出すリムーバブルドライブ28を有し、ネットワーク経由又は外部記憶媒体から図1について上述したクラス分類適用処理を行うための各プログラムをハードディスク装置25のハードディスクに読み込んみ、当該読み込まれたプログラムに従ってクラス分類適応処理を行うこともできる。
【0033】
ユーザは、キーボードやマウス等の入力手段26を介して種々のコマンドを入力することにより、CPU21に対して図1について上述したクラス分類処理を実行させる。この場合、オーディオ信号処理装置10はデータ入出力部27を介して音質を向上させようとするオーディオデータ(入力オーディオデータ)D10を入力し、当該入力オーディオデータD10に対してクラス分類適用処理を施した後、音質が向上したオーディオデータD16をデータ入出力部27を介して外部に出力し得るようになされている。
【0034】
因みに、図5はオーディオ信号処理装置10におけるクラス分類適応処理の処理手順を示し、オーディオ信号処理装置10はステップSP11から当該処理手順に入ると、続くステップSP12において入力オーディオデータD10のピッチをピッチ検出部11において算出する。
【0035】
この算出されたピッチ(前ピッチPIT1、カレントピッチPIT2、後ろピッチPIT3)はオーティオ波形のクラス分類を一段と確実にするためのもであり、オーディオ信号処理装置10は、ステップSP13においてピッチに応じたクラスタップの切り出しを行った後、ステップSP14においてクラス分類部14によりクラスタップ(オーディオ波形)をクラス分類する。そしてオーディオ信号処理装置10は、クラス分類の結果得られたクラスコードを用いて予測係数メモリ15から予測係数を読み出す。この予測係数は予め学習によりクラス毎に対応して格納されており、オーディオ信号処理装置10はクラスコードに対応した予測係数を読み出すことにより、このときのオーディオ波形の特徴に合致した予測係数を用いることができる。
【0036】
予測係数メモリ15から読み出された予測係数は、ステップSP15において予測演算部16の予測演算に用いられる。このとき、予測演算部16は可変予測部抽出部13において切り出されたオーディオ波形及びその平均値と予測係数を用いて予測演算することにより、入力オーディオデータD10はそのピッチに応じたクラスタップにより得られたクラスコードを用いて予測演算される。このとき、クラス分類部14においてオーディオ波形のダイナミックレンジで正規化された際に変化するオーディオ波形のDC成分を、可変予測抽出部13において切り出されたオーディオ波形の平均値で補正することにより、所望とするオーディオデータD16が得られる。かくして入力オーディオデータD10はその音質が改善されたオーディオデータD16に変換され、オーディオ信号処理装置10はステップSP16に移って当該処理手順を終了する。
【0037】
次に、図1について上述した予測係数メモリ15に記憶するクラス毎の予測係数のセットを予め学習によって得るための学習回路について説明する。
【0038】
図6において、学習回路30は、高音質の教師オーディオデータD30を生徒信号生成フィルタ37に受ける。生徒信号生成フィルタ37は、間引き率設定信号D39により設定された間引き率で教師オーディオデータD30を所定時間ごとに所定サンプル間引くようになされている。
【0039】
この場合、生徒信号生成フィルタ37における間引き率によって、生成される予測係数が異なり、これに応じて上述のオーディオ信号処理装置10で再現されるオーディオデータも異なる。例えば、上述のオーディオ信号処理装置10においてサンプリング周波数を高くすることでオーディオデータの音質を向上しようとする場合、生徒信号生成フィルタ37ではサンプリング周波数を減らす間引き処理を行う。また、これに対して上述のオーディオ信号処理装置10において入力オーディオデータD10の欠落したデータサンプルを補うことで音質の向上を図る場合には、これに応じて、生徒信号生成フィルタ37ではデータサンプルを欠落させる間引き処理を行うようになされている。
【0040】
かくして、生徒信号生成フィルタ37は教師オーディオデータ30から所定の間引き処理により生徒オーディオデータD37を生成し、これをピッチ検出部31、クラス分類部抽出部32及び予測演算部抽出部33にそれぞれ供給する。
【0041】
ピッチ検出部31は生徒信号生成フィルタ37から供給された生徒オーディオデータD37について、図2及び図3について上述したピッチ(基本周波数)を生徒オーディオデータD37の自己相関に基づいて検出する。
【0042】
そしてピッチ検出部31はカレントピッチPIT2に対応する前ピッチPIT1及び後ろピッチPIT3を検出すると、これらを切り出すための切り出し制御信号CONT31を可変クラス分類部抽出部32及び可変予測演算部抽出部33に供給する。
【0043】
可変クラス分類部抽出部32は切り出し制御信号CONT31に基づいて、前ピッチPIT1に対応するクラスタップCL1、カレントピッチPIT2に対応するクラスタップCL2及び後ろタップPIT3に対応するクラスタップCL3を生徒オーディオデータD37から切り出し、これらをクラスタップデータD32としてクラス分類部34に供給する。
【0044】
クラス分類部34は、クラス分類抽出部32において切り出されたクラスタップについて、当該クラスタップを圧縮して圧縮データパターンを生成するADRC(Adaptive Dynamic Range Coding) 回路部と、クラスタップデータD32の属するクラスコードを発生するクラスコード発生回路部とを有する。
【0045】
ADRC回路部はクラスタップデータD32に対して、例えば8ビットから2ビットに圧縮するような演算を行うことによりパターン圧縮データを形成する。このADRC回路部は、適応的量子化を行うものであり、ここでは、信号レベルの局所的なパターンを短い語長で効率的に表現することができるので、信号パターンのクラス分類のコード発生用に用いられる。
【0046】
具体的には、オーディオ波形上の6つの8ビットのデータ(クラスタップ)をクラス分類しようとする場合、248という膨大な数のクラスに分類しなければならず、回路上の負担が多くなる。そこで、この実施の形態のクラス分類部14ではその内部に設けられたADRC回路部で生成されるパターン圧縮データに基づいてクラス分類を行う。例えば6つのクラスタップに対して1ビットの量子化を実行すると、6つのクラスタップを6ビットで表すことができ、26 =64クラスに分類することができる。
【0047】
ここで、ADRC回路部は、切り出された領域内のクラスタップ(オーディオ波形)のダイナミックレンジをDR、ビット割り当をm、各クラスタップのデータレベルをL、量子化コードをQとして、上述の(1)式と同様の演算により、領域内の最大値MAXと最小値MINとの間を指定されたビット長で均等に分割して量子化を行う。かくしてオーディオ波形上の6つの波形データが、それぞれ例えば8ビット(m=8)で構成されているとすると、これらはADRC回路部においてそれぞれが2ビットに圧縮される。
【0048】
このようにして圧縮されたオーディオ波形データ(クラスタップ)をそれぞれqn (n=1〜6)とすると、クラス分類部34に設けられたクラスコード発生回路部は、圧縮されたオーディオ波形データqn に基づいて、上述の(2)式と同様の演算を実行することにより、そのブロック(q1 〜q6 )が属するクラスを示すクラスコードclass を算出し、当該算出されたクラスコードclass をクラスコードデータD34として予測係数算出部36に供給する。因みに(2)式において、nは圧縮されたオーディオ波形データ(クラスタップ)qn の数を表し、この実施の形態の場合n=6であり、またPはビット割り当てを表し、この実施の形態の場合P=2である。
【0049】
このようにして、クラス分類部34はクラスコードデータD34を生成し、これを予測係数算出部36に供給する。また、予測係数算出部36には、予測演算部抽出部33においてピッチ検出部11から供給される切り出し制御信号CONT11に応じて切り出された予測演算しようとするオーディオ波形データ(予測タップ)D13(x1 〜xn )と平均値算出部38において算出されたその平均値(DC値補正タップ)D38が供給される。
【0050】
予測係数算出部36は、クラス分類部34から供給されたクラスコードclass と、各クラスコードclass 毎に切り出された予測タップと、入力端TINから供給された高音質の教師オーディオデータD30とを用いて、正規方程式を立てる。
【0051】
すなわち、予測タップのnサンプルのレベル及び平均値をそれぞれx1 、x2 、……、xn として、それぞれにpビットのADRCを行った結果の量子化データをq1 、……、qn とする。このとき、この領域のクラスコードclass を上述の(2)式のように定義する。そして、上述のように予測タップのレベルをそれぞれ、x1 、x2 、……、xn とし、高音質の教師オーディオデータD30のレベルをyとしたとき、クラスコード毎に、予測係数w1 、w2 、……、wn によるnタップの線形推定式を設定する。これを次式、
【0052】
【数4】
【0053】
とする。学習前は、wn が未定係数である。
【0054】
学習回路30では、クラスコード毎に、複数のオーディオデータに対して学習を行う。データサンプル数がMの場合、上述の(4)式に従って、次式、
【0055】
【数5】
【0056】
が設定される。但しk=1、2、……Mである。
【0057】
M>nの場合、予測係数w1 、……wn は一意的に決まらないので、誤差ベクトルeの要素を次式、
【0058】
【数6】
【0059】
によって定義し(但し、k=1、2、……、M)、次式、
【0060】
【数7】
【0061】
を最小にする予測係数を求める。いわゆる、最小自乗法による解法である。
【0062】
ここで、(7)式によるwn の偏微分係数を求める。この場合、次式、
【0063】
【数8】
【0064】
を「0」にするように、各wn (n=1〜6)を求めれば良い。
【0065】
そして、次式、
【0066】
【数9】
【0067】
【数10】
【0068】
のように、Xij、Yi を定義すると、(8)式は行列を用いて次式、
【0069】
【数11】
【0070】
として表される。
【0071】
この方程式は、一般に正規方程式と呼ばれている。なお、ここではn=6である。
【0072】
全ての学習用データ(教師オーディオデータD30、クラスコードclass 、予測タップD33、D38)の入力が完了した後、予測係数算出部36は各クラスコードclass に上述の(11)式に示した正規方程式を立てて、この正規方程式を掃き出し法等の一般的な行列解法を用いて、各Wn について解き、各クラスコード毎に、予測係数を算出する。このとき、予測係数算出部36は、平均値算出部38から供給されたDC値補正タップを補正項として各予測係数の算出時に付加して演算することにより、クラス分類部34においてオーディオ波形のダイナミックレンジで正規化された際に変化するオーディオ波形のDC成分を、可変予測抽出部33において切り出されたオーディオ波形の平均値で補正することができ、所望とするオーディオデータD16が得られる。予測係数算出部36は、算出された各予測係数(D36)を予測係数メモリ15に書き込む。
【0073】
このような学習を行った結果、予測係数メモリ15には、量子化データq1 、……、q6 で規定されるパターン毎に、高音質のオーディオデータ(及び平均値)yを推定するための予測係数が、各クラスコード毎に格納される。この予測係数メモリ15は、図1について上述したオーディオ信号処理装置10において用いられる。かかる処理により、線形推定式に従って通常のオーディオデータから高音質のオーディオデータを作成するための予測係数の学習が終了する。
【0074】
このように、学習回路30は、オーディオ信号処理装置10において補間処理を行う程度を考慮して、生徒信号生成フィルタ37で高音質の教師オーディオデータの間引き処理を行うことにより、オーディオ信号処理装置10における補間処理のための予測係数を生成することができる。
【0075】
以上の構成において、学習回路30では、生徒オーディオデータD37のDC成分(平均値)を予測係数演算部36に供給することにより、予測係数算出部36では、クラス分類部34においてオーディオ波形のダイナミックレンジで正規化処理する際に劣化したオーディオ波形のDC成分を補正することができる。従って予測係数メモリ15には、DC成分が補正された係数が記憶される。
【0076】
これに対してオーディオ信号処理装置10では、入力オーディオデータD10のDC成分(平均値)を予測演算部16に供給することにより、予測演算部16では、クラス分類部14においてオーディオ波形のダイナミックレンジで正規化処理する際に劣化したオーディオ波形のDC成分を補正することができる。従ってDC成分が補正された予測タップとDC成分の劣化がない予測係数とを用いて予測演算が行われることにより、所望とする高音質のオーディオデータD16が得られる。
【0077】
以上の構成によれば、DC成分を抽出し、当該DC成分に基づいてオーディオ信号の変換時にDC成分を補正するようにしたことにより、一段と高音質のオーディオデータD16を得ることができる。
【0078】
なお上述の実施の形態においては、可変予測演算部抽出部13、33において切り出されたオーディオ波形の領域の平均値を算出する場合について述べたが、本発明はこれに限らず、例えば図1及び図6との対応部分に同一符号を付して示す図7及び図8に示すように、平均値算出部抽出部19、39において例えばオーディオ波形のゼロクロスや極性の個数等から平均値を算出する範囲を決定し、当該決定された範囲での平均値D19、D39を算出するようにしても良い。
【0079】
また上述の実施の形態においては、オーディオ信号処理装置10及び学習回路30において、平均値算出部18、38で算出された平均値(DC成分)D18、D38をDC成分補正タップ(DC値クラス)として8ビットに正規化して予測演算部16、36に供給する場合について述べたが、本発明はこれに限らず、例えば図1及び図6との対応部分に同一の符号を付して示す図9及び図10に示すように、平均値算出部18′、38′で算出された平均値(DC成分)をDC値クラスデータD18′、D38′としてクラス分類部14′、34′に供給するようにしても良い。
【0080】
この場合、クラス分類部14′、34′は、平均値算出部18′、38′から供給されるDC値クラスデータD18′、D38′と同様の時間軸領域に分割されたクラスタップデータD12、D32のクラスコードclass と、DC値クラスデータD18′、D38′のクラスコードCLASS とを対応させて統合したクラスコードデータ(class ′)D14、D34を生成する。
【0081】
このように平均値算出部18′、38′で算出された平均値(DC成分)をDC値クラスデータD18′、D38′としてクラス分類部14′、34′に供給するようにすれば、クラス分類の頻度を一段と多くすることができ、かくして、クラス分類された結果に基づく予測係数を用いて入力オーディオデータの予測演算を行うオーディオ信号処理装置10は、一段と高音質のオーディオデータに変換することができる。
【0082】
また上述の実施の形態においては、オーディオ信号処理装置10及び学習回路30において、ピッチ検出部11、31で検出されたピッチサイズとその位置とをピッチクラスとして可変クラス分類部抽出部12、32に供給する場合について述べたが、本発明はこれに限らず、例えば図1及び図6との対応部分に同一の符号を付して示す図11及び図12に示すように、ピッチ検出部11′、31′で検出されたピッチ数をピッチクラスデータD11、D31としてクラス分類部14′及び34′に供給するようにしても良い。
【0083】
この場合、クラス分類部14′及び34′は、可変クラス分類部抽出部12から供給されるピッチクラスデータD11、D31と同様の時間領域に分割されたクラスタップデータD12、D32のクラスコードclass と、ピッチクラスデータD11、D31のクラスコードCLASS とを対応させて統合したクラスコードデータ(class ′)D14、D34を生成する。
【0084】
このようにピッチ検出部11′、31′で検出されたピッチ数をピッチクラスデータD11、D31としてクラス分類部14′及び34′に供給するようにすれば、クラス分類の頻度を一段と多くすることができ、かくして、クラス分類された結果に基づく予測係数を用いて入力オーディオデータの予測演算を行うオーディオ信号処理装置10は、一段と高音質のオーディオデータに変換することができる。
【0085】
また上述の実施の形態においては、オーディオ信号処理装置10及び学習回路30において、平均値(DC成分)D18、D38をDC成分補正タップ(DC値クラス)として8ビットに正規化して予測演算部16、36に供給すると共に、ピッチ検出部11、31で検出されたピッチサイズとその位置とをピッチクラスとして可変クラス分類部抽出部12、32に供給する場合について述べたが、本発明はこれに限らず、図9及び図10に示したように、平均値算出部18′、38′で算出された平均値(DC成分)をDC値クラスデータD18′、D38′としてクラス分類部14′、34′に供給すると共に、図12及び図13に示したように、ピッチ検出部11′、31′で検出されたピッチ数をピッチクラスデータD11、D31としてクラス分類部14′及び34′に供給するようにしても良い。
【0086】
この場合、クラス分類部14′及び34′は、クラスタップデータD12、D32のクラスコードと、DC値クラスデータD18′、D38′のクラスコードと、ピッチクラスデータD11、D31のクラスコードとを対応させて統合したクラスコードデータを生成する。
【0087】
これによりオーディオ信号処理装置10及び学習回路30は、クラス分類の頻度をさらに一段と多くすることができ、かくして、クラス分類された結果に基づく予測係数を用いて入力オーディオデータの予測演算を行うオーディオ信号処理装置10は、一段と高音質のオーディオデータに変換することができる。
【0088】
また上述の実施の形態においては、オーディオ波形のピッチを検出する方法として自己相関を用いる場合について述べたが、本発明はこれに限らず、例えばオーディオ波形に対してフーリエ変換を施すケプストラム分析やパターン認識等、他の種々の方法を適用することができる。
【0089】
また上述の実施の形態においては、クラス分類のためのタップの切り出しサイズと、予測演算用のタップの切り出し領域とを同一サイズとした場合について述べたが、本発明はこれに限らず、クラス分類用のタップの切り出しサイズと予測演算用のタップの切り出しサイズは異なるようにしても良く、さらには、ピッチ検出部11において検出された自己相関の強さに応じて切り出しサイズを変化させるようにしても良い。この場合、例えば自己相関が強い程切り出しサイズを大きくすることができる。
【0090】
また上述の実施の形態においては、予測方式として線形一次による手法を用いる場合について述べたが、本発明はこれに限らず、要は学習した結果を用いるようにすれば良く、例えば多次関数による手法等の種々の予測方式を適用することができる。
【0091】
また上述の実施の形態においては、クラス分類部14においてADRCにより圧縮データパターンを生成する場合について述べたが、本発明はこれに限らず、可逆符号化(DPCM:Differrential Pulse Code Modulation) 又はベクトル量子化(VQ:Vector Quantize) 等の圧縮手段を用いるようにしても良い。
【0092】
また上述の実施の形態においては、学習回路30の生徒信号生成フィルタ37において教師オーディオデータD30から所定サンプルを間引く場合について述べたが、本発明はこれに限らず、例えばビット数を間引く等、他の種々の方法を適用することができる。
【0093】
また上述の実施の形態においては、ピッチ検出を行うオーディオ信号処理装置10及びその学習回路30に本発明を適用した場合について述べたが、本発明はこれに限らず、他の種々の方法(例えば包絡線に基づいてクラス分類する方法)等においても適用することができる。
【0094】
【発明の効果】
上述のように本発明によれば、ディジタルオーディオ信号のピッチを検出し、当該ピッチに基づいてディジタルオーディオ信号のクラスを分類し、分類されたクラスに対応した予測係数及びディジタルオーディオ信号の直流成分の値を用いてディジタルオーディオ信号を予測演算することによりディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するようにしたことにより、規則性を持ったオーディオ波形の特徴に基づく予測演算を行うことができると共にオーディオ波形の直流成分が補正できるので、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができ、かくして、ディジタルオーディオ信号の波形再現性を一段と向上した高音質のディジタルオーディオ信号への変換を行うことができる。
【0095】
また、上述のように本発明によれば、ディジタルオーディオ信号のピッチを検出し、当該ピッチに基づいてディジタルオーディオ信号のクラスを分類すると共に、ディジタルオーディオ信号の直流成分の値のクラスを分類し、分類されたそれぞれのクラスを統合して新たなクラスを生成し、新たなクラスに対応した予測係数を用いてディジタルオーディオ信号を予測演算することによりディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するようにしたことにより、規則性を持ったオーディオ波形の特徴に基づく予測演算を行うことができると共にオーディオ波形の直流成分が補正できるので、一段とディジタルオーディオ信号の特徴に適応した変換を行うことができ、かくして、ディジタルオーディオ信号の波形再現性を一段と向上した高音質のディジタルオーディオ信号への変換を行うことができる。
【図面の簡単な説明】
【図1】本発明によるディジタル信号処理装置の構成を示すブロック図である。
【図2】ディジタルオーディオ信号のピッチの説明に供する信号波形図である。
【図3】ピッチの無いディジタルオーディオ信号の処理の説明に供する信号波形図である。
【図4】オーディオ信号処理装置の構成を示すブロック図である。
【図5】オーディオ信号変換処理手順を示すフローチャートである。
【図6】本発明による学習装置の構成を示すブロック図である。
【図7】他の実施の形態によるオーディオ信号変換処理装置の構成を示すブロック図である。
【図8】他の実施の形態による学習装置の構成を示すブロック図である。
【図9】他の実施の形態によるオーディオ信号変換処理装置の構成を示すブロック図である。
【図10】他の実施の形態による学習装置の構成を示すブロック図である。
【図11】他の実施の形態によるオーディオ信号変換処理装置の構成を示すブロック図である。
【図12】他の実施の形態による学習装置の構成を示すブロック図である。
【符号の説明】
10……オーディオ信号処理装置、11、31……ピッチ検出部、11′、31′……ピッチ検出部、14、34……クラス分類部、14′、34′……クラス分類部、15……予測係数メモリ、16……予測演算部、18、38……平均値算出部、18′、38′……平均値算出部、19、39……平均値算出部抽出部、36……予測係数算出部、37……生徒信号生成フィルタ。
Claims (16)
- ディジタルオーディオ信号を変換するディジタル信号処理装置において、
上記ディジタルオーディオ信号のピッチを検出するピッチ検出手段と、
上記ピッチに基づいて上記ディジタルオーディオ信号のクラスを分類するクラス分類手段と、
上記分類されたクラスに対応した予測係数及び上記ディジタルオーディオ信号の直流成分の値を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算手段と
を具えることを特徴とするディジタル信号処理装置。 - 上記予測係数は予め所望とするディジタルオーディオ信号に基づいて学習により生成されている
ことを特徴とする請求項1に記載のディジタル信号処理装置。 - ディジタルオーディオ信号を変換するディジタル信号処理方法において、
上記ディジタルオーディオ信号のピッチを検出するピッチ検出ステップと、
上記ピッチに基づいて上記ディジタルオーディオ信号のクラスを分類するクラス分類ステップと、
上記分類されたクラスに対応した予測係数及び上記ディジタルオーディオ信号の直流成分の値を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算ステップと
を具えることを特徴とするディジタル信号処理方法。 - 上記予測係数は予め所望とするディジタルオーディオ信号に基づいて学習により生成されている
ことを特徴とする請求項3に記載のディジタル信号処理方法。 - ディジタルオーディオ信号を変換するディジタル信号処理装置の変換処理の予測演算に用いられる予測係数を生成する学習装置において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成手段と、
上記生徒ディジタルオーディオ信号のピッチを検出するピッチ検出手段と、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号のクラスを分類するクラス分類手段と、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記クラスに対応する予測係数を算出する予測係数算出手段と
を具えることを特徴とする学習装置。 - ディジタルオーディオ信号を変換するディジタル信号処理装置の変換処理の予測演算に用いられる予測係数を生成する学習方法において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成するステップと、
上記生徒ディジタルオーディオ信号のピッチを検出するピッチ検出ステップと、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号のクラスを分類するクラス分類ステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記クラスに対応する予測係数を算出するステップと
を具えることを特徴とする学習方法。 - ディジタルオーディオ信号を変換するディジタル信号処理装置において、
上記ディジタルオーディオ信号のピッチを検出するピッチ検出手段と、
上記ピッチに基づいて上記ディジタルオーディオ信号のクラスを分類すると共に、上記ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するクラス分類手段と、
上記新たなクラスに対応した予測係数を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成する予測演算手段と
を具えることを特徴とするディジタル信号処理装置。 - 上記予測係数は予め所望とするディジタルオーディオ信号に基づいて学習により生成されている
ことを特徴とする請求項7に記載のディジタル信号処理装置。 - ディジタルオーディオ信号を変換するディジタル信号処理方法において、
上記ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記ディジタルオーディオ信号のクラスを分類すると共に、上記ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するステップと、
上記新たなクラスに対応した予測係数を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するステップと
を具えることを特徴とするディジタル信号処理方法。 - 上記予測係数は予め所望とするディジタルオーディオ信号に基づいて学習により生成されている
ことを特徴とする請求項9に記載のディジタル信号処理方法。 - ディジタルオーディオ信号を変換するディジタル信号処理装置の変換処理の予測演算に用いられる予測係数を生成する学習装置において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成する生徒ディジタルオーディオ信号生成手段と、
上記生徒ディジタルオーディオ信号のピッチを検出するピッチ検出手段と、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号のクラスを分類すると共に、上記生徒ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するクラス分類手段と、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記新たなクラスに対応する予測係数を算出する予測係数算出手段と
を具えることを特徴とする学習装置。 - ディジタルオーディオ信号を変換するディジタル信号処理装置の変換処理の予測演算に用いられる予測係数を生成する学習方法において、
所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成するステップと、
上記生徒ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号のクラスを分類すると共に、上記生徒ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記新たなクラスに対応する予測係数を算出するステップと
を具えることを特徴とする学習方法。 - ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記ディジタルオーディオ信号をクラス分類するステップと、
上記分類されたクラスに対応した予測係数及び上記ディジタルオーディオ信号の直流成分の値を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。 - 所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成するステップと、
上記生徒ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号クラス分類するステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記クラスに対応する予測係数を算出するステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。 - ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記ディジタルオーディオ信号のクラスを分類すると共に、上記ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するステップと、
上記新たなクラスに対応した予測係数を用いて上記ディジタルオーディオ信号を予測演算することにより上記ディジタルオーディオ信号を変換してなる新たなディジタルオーディオ信号を生成するステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。 - 所望とするディジタルオーディオ信号から当該ディジタルオーディオ信号を劣化させた生徒ディジタルオーディオ信号を生成するステップと、
上記生徒ディジタルオーディオ信号のピッチを検出するステップと、
上記ピッチに基づいて上記生徒ディジタルオーディオ信号のクラスを分類すると共に、上記生徒ディジタルオーディオ信号の直流成分の値のクラスを分類し、上記分類されたそれぞれのクラスを統合して新たなクラスを生成するステップと、
上記ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号と上記生徒ディジタルオーディオ信号の直流成分の値とに基づいて上記新たなクラスに対応する予測係数を算出するステップと
を実行させるためのプログラムを記録したコンピュータ読取可能なプログラム格納媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000238893A JP4645868B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000238893A JP4645868B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2002049396A JP2002049396A (ja) | 2002-02-15 |
JP4645868B2 true JP4645868B2 (ja) | 2011-03-09 |
Family
ID=18730524
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000238893A Expired - Fee Related JP4645868B2 (ja) | 2000-08-02 | 2000-08-02 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4645868B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4538705B2 (ja) | 2000-08-02 | 2010-09-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4596197B2 (ja) | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
JP4596196B2 (ja) | 2000-08-02 | 2010-12-08 | ソニー株式会社 | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61262800A (ja) * | 1985-05-17 | 1986-11-20 | 富士通株式会社 | 音声符号化方式 |
JPS62102294A (ja) * | 1985-10-30 | 1987-05-12 | 株式会社日立製作所 | 音声符号化方式 |
JPH01204538A (ja) * | 1988-02-10 | 1989-08-17 | Kokusai Denshin Denwa Co Ltd <Kdd> | ベクトル量子化方式 |
JPH0540500A (ja) * | 1991-08-06 | 1993-02-19 | Sharp Corp | 音声符号化装置 |
JPH07147681A (ja) * | 1993-09-30 | 1995-06-06 | Sony Corp | ディジタル画像信号の階層符号化および復号装置 |
JPH08265711A (ja) * | 1995-03-22 | 1996-10-11 | Sony Corp | 信号変換装置及び信号変換方法 |
JPH09198097A (ja) * | 1996-01-16 | 1997-07-31 | Yamaha Corp | ピッチ検出装置 |
JPH10313251A (ja) * | 1997-05-12 | 1998-11-24 | Sony Corp | オーディオ信号変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体 |
JP2000092456A (ja) * | 1998-09-11 | 2000-03-31 | Sony Corp | 画像変換装置および方法、学習装置および方法、画像変換システム、並びに提供媒体 |
-
2000
- 2000-08-02 JP JP2000238893A patent/JP4645868B2/ja not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS61262800A (ja) * | 1985-05-17 | 1986-11-20 | 富士通株式会社 | 音声符号化方式 |
JPS62102294A (ja) * | 1985-10-30 | 1987-05-12 | 株式会社日立製作所 | 音声符号化方式 |
JPH01204538A (ja) * | 1988-02-10 | 1989-08-17 | Kokusai Denshin Denwa Co Ltd <Kdd> | ベクトル量子化方式 |
JPH0540500A (ja) * | 1991-08-06 | 1993-02-19 | Sharp Corp | 音声符号化装置 |
JPH07147681A (ja) * | 1993-09-30 | 1995-06-06 | Sony Corp | ディジタル画像信号の階層符号化および復号装置 |
JPH08265711A (ja) * | 1995-03-22 | 1996-10-11 | Sony Corp | 信号変換装置及び信号変換方法 |
JPH09198097A (ja) * | 1996-01-16 | 1997-07-31 | Yamaha Corp | ピッチ検出装置 |
JPH10313251A (ja) * | 1997-05-12 | 1998-11-24 | Sony Corp | オーディオ信号変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体 |
JP2000092456A (ja) * | 1998-09-11 | 2000-03-31 | Sony Corp | 画像変換装置および方法、学習装置および方法、画像変換システム、並びに提供媒体 |
Also Published As
Publication number | Publication date |
---|---|
JP2002049396A (ja) | 2002-02-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JPH10313251A (ja) | オーディオ信号変換装置及び方法、予測係数生成装置及び方法、予測係数格納媒体 | |
JPH0644712B2 (ja) | 信号処理方式 | |
JP4596196B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4596197B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4645868B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4645866B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP3472279B2 (ja) | 音声符号化パラメータ符号化方法及び装置 | |
JPH07199997A (ja) | 音声信号の処理システムにおける音声信号の処理方法およびその処理における処理時間の短縮方法 | |
JP4645869B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP4645867B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP2003511776A (ja) | ディジタル信号を補間する方法および装置 | |
US5696875A (en) | Method and system for compressing a speech signal using nonlinear prediction | |
JP4538705B2 (ja) | ディジタル信号処理方法、学習方法及びそれらの装置並びにプログラム格納媒体 | |
JP2005516442A6 (ja) | Pcm信号から量子化雑音を除去するための方法及びユニット | |
JP2005516442A (ja) | Pcm信号から量子化雑音を除去するための方法及びユニット | |
JP4538704B2 (ja) | ディジタル信号処理方法及びディジタル信号処理装置並びにプログラム格納媒体 | |
JP4618823B2 (ja) | 信号符号化装置及び方法 | |
CN113129920B (zh) | 一种基于u型网络和音频指纹的音乐与人声分离方法 | |
JP2003323200A (ja) | 音声符号化のための線形予測係数の勾配降下最適化 | |
JPH07118658B2 (ja) | 信号符号化方法 | |
JP3390923B2 (ja) | 音声処理方法 | |
Cheung | Application of CVSD with delayed decision to narrowband/wideband tandem | |
RU2022107245A (ru) | Формат со множественным запаздыванием для кодирования звука | |
JP2019035839A (ja) | 音声処理装置、音声処理方法、及び音声処理プログラム | |
WO1997016821A1 (en) | Method and system for compressing a speech signal using nonlinear prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070216 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090929 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091119 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100108 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101111 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101124 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131217 Year of fee payment: 3 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |