JP7542153B2 - 符号化方法、装置、電子機器及び記憶媒体 - Google Patents
符号化方法、装置、電子機器及び記憶媒体 Download PDFInfo
- Publication number
- JP7542153B2 JP7542153B2 JP2023534313A JP2023534313A JP7542153B2 JP 7542153 B2 JP7542153 B2 JP 7542153B2 JP 2023534313 A JP2023534313 A JP 2023534313A JP 2023534313 A JP2023534313 A JP 2023534313A JP 7542153 B2 JP7542153 B2 JP 7542153B2
- Authority
- JP
- Japan
- Prior art keywords
- audio signal
- determining
- encoding
- bit
- target frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims description 71
- 230000005236 sound signal Effects 0.000 claims description 133
- 230000003595 spectral effect Effects 0.000 claims description 23
- 238000004891 communication Methods 0.000 claims description 6
- 230000000873 masking effect Effects 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 33
- 238000004364 calculation method Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 16
- 238000013507 mapping Methods 0.000 description 10
- 238000012545 processing Methods 0.000 description 8
- 230000000694 effects Effects 0.000 description 7
- 238000007726 management method Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 3
- 238000001514 detection method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 238000012886 linear function Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001133 acceleration Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000005611 electricity Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000010897 surface acoustic wave method Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/002—Dynamic bit allocation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本出願は、2020年12月24日に中国で出願された、中国特許出願番号202011553903.4の優先権を主張し、その全ての内容が参照によって本出願に組み込まれる。
ターゲットフレームのオーディオ信号の符号化ビットレートに基づいて、ターゲットフレームのオーディオ信号の符号化帯域幅を決定するステップと、
符号化帯域幅に基づいてターゲットフレームのオーディオ信号の知覚エントロピーを決定し、知覚エントロピーに基づいてターゲットフレームのオーディオ信号のビット要求率を決定するステップと、
ビット要求率に基づいてターゲットビット数を決定し、ターゲットビット数に基づいてターゲットフレームのオーディオ信号を符号化するステップと、を含む、符号化方法を提供する。
ターゲットフレームのオーディオ信号の符号化ビットレートに基づいて、ターゲットフレームのオーディオ信号の符号化帯域幅を決定するための符号化帯域幅決定モジュールと、
符号化帯域幅に基づいてターゲットフレームのオーディオ信号の知覚エントロピーを決定するための知覚エントロピー決定モジュールと、
知覚エントロピーに基づいてターゲットフレームのオーディオ信号のビット要求率を決定するためのビット要求量決定モジュールと、
ビット要求率に基づいてターゲットビット数を決定し、ターゲットビット数に基づいてターゲットフレームのオーディオ信号を符号化するための符号化モジュールと、を含む、符号化装置を提供する。
ターゲットフレームのオーディオ信号の符号化ビットレートに基づいて、ターゲットフレームのオーディオ信号の符号化帯域幅を決定するステップ110と、
符号化帯域幅に基づいてターゲットフレームのオーディオ信号の知覚エントロピーを決定し、知覚エントロピーに基づいてターゲットフレームのオーディオ信号のビット要求率を決定するステップ120と、
ビット要求率に基づいてターゲットビット数を決定し、ターゲットビット数に基づいてターゲットフレームのオーディオ信号を符号化するステップ130と、を含んでもよい。
符号化帯域幅に基づいてターゲットフレームのオーディオ信号のスケールファクタバンドの数を決定するS1211と、
各スケールファクタバンドの知覚エントロピーを取得するS1212と、
スケールファクタバンドの数及び各スケールファクタバンドの知覚エントロピーに基づいて、ターゲットフレームのオーディオ信号の知覚エントロピーを決定するS1213と、を含んでもよい。
ターゲットフレームのオーディオ信号の修正離散コサイン変換(MDCT for Modified Discrete Cosine Transform,MDCT)後のMDCTスペクトル係数を決定するS1212aと、
MDCTスペクトル係数及びスケールファクタバンドオフセットテーブルに基づいて各スケールファクタバンドのMDCTスペクトル係数のエネルギーを決定するS1212bと、
MDCTスペクトル係数のエネルギー及び各スケールファクタバンドのマスキング閾値に基づいて、各スケールファクタバンドの知覚エントロピーを決定するS1212cと、を含んでもよい。
ターゲットフレームのオーディオ信号より前の所定数のフレームのオーディオ信号の平均知覚エントロピーを取得するS1221と、
知覚エントロピー及び平均知覚エントロピーに基づいてターゲットフレームのオーディオ信号の難易度係数を決定するS1222と、
難易度係数に基づいてターゲットフレームのオーディオ信号のビット要求率を決定するS1223と、を含んでもよい。
現在のビットプールにおける利用可能なビット数及びビットプールのサイズに基づいて、現在のビットプールの充満度を決定するS1311と、
充満度に基づいてターゲットフレームのオーディオ信号の符号化時のビットプール調節率を決定し、ビット要求率及びビットプール調節率に基づいて、符号化ビットファクタを決定するS1312と、
符号化ビットファクタに基づいて、ターゲットビット数を決定するS1313と、を含んでもよい。
ビットプールのサイズmaxbitRes=12288bits(6144 bit/channel)である。
サンプリング周波数Fs=48kHzである。
1フレームのオーディオ信号のフレーム長N=1024である。
各フレームの信号の平均符号化ビット数meanBits=1024×128×1000/48000=2731bitsである。
よって、en[n]の計算は以下のとおりである。
式中、kOffset[n]はスケールファクタバンドオフセットテーブルを表す。
式(4)中、offsetはオフセット定数であり、以下のように定義される。
式中、η()は難易度係数からビット要求率へのマッピング関数である。該マッピング関数は、相対難易度係数D[l]を引数とし、ビット要求率Rdemand[l]を関数値とする区分線形関数である。
F=bitRes/maxbitRes (8)
式中、φ()はビットプールの充満度からビットプール調節率へのマッピング関数である。該マッピング関数は、ビットプールの充満度Fを引数とし、ビットプール調節率Radjust[l]を関数値とする区分線形関数である。
式(11)中、設定されたビットレートに従って符号化する際に、各フレームの信号の平均符号化ビット数meanBitsの計算は以下のとおりである。
ステップ410で、ターゲットフレームのオーディオ信号の符号化帯域幅を決定する。
ステップ420で、ターゲットフレームのオーディオ信号の知覚エントロピーを計算する。
ステップ430で、所定数のフレームのオーディオ信号の平均知覚エントロピーを計算する。
ステップ440で、ターゲットフレームのオーディオ信号の難易度係数を計算する。
ステップ450で、ターゲットフレームのオーディオ信号のビット要求率を計算する。
ステップ460で、現在のビットプールの充満度を計算する。
ステップ470で、ターゲットフレームのオーディオ信号の符号化時のビットプール調節率を計算する。
ステップ480で、符号化ビットファクタを計算する。
ステップ490で、ターゲットビット数を決定する。
オーディオ出力ユニット903は、高周波ユニット901又はネットワークモジュール902が受信した又はメモリ909に記憶されているオーディオデータをオーディオ信号に変換して音声として出力することができる。且つ、オーディオ出力ユニット903は、電子機器900が実行する特定の機能に関するオーディオ出力(例えば、コール信号受信音、メッセージ受信音等)を提供することもできる。オーディオ出力ユニット903は、スピーカ、ブザー及び受話器等を含む。
Claims (15)
- ターゲットフレームのオーディオ信号の符号化ビットレートに基づいて、前記ターゲットフレームのオーディオ信号の符号化帯域幅を決定するステップと、
前記符号化帯域幅に基づいて前記ターゲットフレームのオーディオ信号の知覚エントロピーを決定し、前記知覚エントロピーに基づいて前記ターゲットフレームのオーディオ信号のビット要求率を決定するステップと、
前記ビット要求率に基づいてターゲットビット数を決定し、前記ターゲットビット数に基づいて前記ターゲットフレームのオーディオ信号を符号化するステップと、を含む、符号化方法。 - 前記ビット要求率に基づいてターゲットビット数を決定する前記ステップは、
現在のビットプールにおける利用可能なビット数及び前記ビットプールのサイズに基づいて、現在の前記ビットプールの充満度を決定するステップと、
前記充満度に基づいて前記ターゲットフレームのオーディオ信号の符号化時のビットプール調節率を決定し、前記ビット要求率及び前記ビットプール調節率に基づいて、符号化ビットファクタを決定するステップと、
前記符号化ビットファクタに基づいて、前記ターゲットビット数を決定するステップと、を含む、請求項1に記載の符号化方法。 - 前記符号化帯域幅に基づいて前記ターゲットフレームのオーディオ信号の知覚エントロピーを決定する前記ステップは、
前記符号化帯域幅に基づいて前記ターゲットフレームのオーディオ信号のスケールファクタバンドの数を決定するステップと、
各前記スケールファクタバンドの知覚エントロピーを取得するステップと、
前記スケールファクタバンドの数及び各前記スケールファクタバンドの知覚エントロピーに基づいて、前記ターゲットフレームのオーディオ信号の知覚エントロピーを決定するステップと、を含む、請求項1に記載の符号化方法。 - 前記知覚エントロピーに基づいて前記ターゲットフレームのオーディオ信号のビット要求率を決定する前記ステップは、
前記ターゲットフレームのオーディオ信号より前の所定数のフレームのオーディオ信号の平均知覚エントロピーを取得するステップと、
前記知覚エントロピー及び前記平均知覚エントロピーに基づいて前記ターゲットフレームのオーディオ信号の難易度係数を決定するステップと、
前記難易度係数に基づいて前記ターゲットフレームのオーディオ信号のビット要求率を決定するステップと、を含む、請求項1に記載の符号化方法。 - 各前記スケールファクタバンドの知覚エントロピーを取得する前記ステップは、
前記ターゲットフレームのオーディオ信号の修正離散コサイン変換MDCT後のMDCTスペクトル係数を決定するステップと、
前記MDCTスペクトル係数及びスケールファクタバンドオフセットテーブルに基づいて各前記スケールファクタバンドのMDCTスペクトル係数のエネルギーを決定するステップと、
前記MDCTスペクトル係数のエネルギー及び各前記スケールファクタバンドのマスキング閾値に基づいて、各前記スケールファクタバンドの知覚エントロピーを決定するステップと、を含む、請求項3に記載の符号化方法。 - ターゲットフレームのオーディオ信号の符号化ビットレートに基づいて、前記ターゲットフレームのオーディオ信号の符号化帯域幅を決定するための符号化帯域幅決定モジュールと、
前記符号化帯域幅に基づいて前記ターゲットフレームのオーディオ信号の知覚エントロピーを決定するための知覚エントロピー決定モジュールと、
前記知覚エントロピーに基づいて前記ターゲットフレームのオーディオ信号のビット要求率を決定するためのビット要求量決定モジュールと、
前記ビット要求率に基づいてターゲットビット数を決定し、前記ターゲットビット数に基づいて前記ターゲットフレームのオーディオ信号を符号化するための符号化モジュールと、を含む、符号化装置。 - 前記符号化モジュールは、具体的に、
現在のビットプールにおける利用可能なビット数及び前記ビットプールのサイズに基づいて、現在の前記ビットプールの充満度を決定すること、
前記充満度に基づいて前記ターゲットフレームのオーディオ信号の符号化時のビットプール調節率を決定し、前記ビット要求率及び前記ビットプール調節率に基づいて、符号化ビットファクタを決定すること、
前記符号化ビットファクタに基づいて、前記ターゲットビット数を決定すること、に用いられる、請求項6に記載の符号化装置。 - 前記知覚エントロピー決定モジュールは、
前記符号化帯域幅に基づいて前記ターゲットフレームのオーディオ信号のスケールファクタバンドの数を決定するための第一決定サブモジュールと、
各前記スケールファクタバンドの知覚エントロピーを取得するための取得サブモジュールと、
前記スケールファクタバンドの数及び各前記スケールファクタバンドの知覚エントロピーに基づいて、前記ターゲットフレームのオーディオ信号の知覚エントロピーを決定するための第2決定サブモジュールと、を含む、請求項6に記載の符号化装置。 - 前記ビット要求量決定モジュールは、具体的に、
前記ターゲットフレームのオーディオ信号より前の所定数のフレームのオーディオ信号の平均知覚エントロピーを取得すること、
前記知覚エントロピー及び前記平均知覚エントロピーに基づいて前記ターゲットフレームのオーディオ信号の難易度係数を決定すること、
前記難易度係数に基づいて前記ターゲットフレームのオーディオ信号のビット要求率を決定すること、に用いられる、請求項6に記載の符号化装置。 - 前記取得サブモジュールは、具体的に、
前記ターゲットフレームのオーディオ信号の修正離散コサイン変換MDCT後のMDCTスペクトル係数を決定すること、
前記MDCTスペクトル係数及びスケールファクタバンドオフセットテーブルに基づいて各前記スケールファクタバンドのMDCTスペクトル係数のエネルギーを決定すること、
前記MDCTスペクトル係数のエネルギー及び各前記スケールファクタバンドのマスキング閾値に基づいて、各前記スケールファクタバンドの知覚エントロピーを決定すること、に用いられる、請求項8に記載の符号化装置。 - プロセッサと、メモリと、前記メモリに記憶され且つ前記プロセッサ上で実行可能なプログラムもしくはコマンドとを含み、前記プログラムもしくはコマンドが前記プロセッサによって実行されると、請求項1~5のいずれか1項に記載の符号化方法のステップが実現される、電子機器。
- プログラムもしくはコマンドが記憶されており、前記プログラムもしくはコマンドがプロセッサによって実行されると、請求項1~5のいずれか1項に記載の符号化方法のステップが実現される、可読記憶媒体。
- 請求項1~5のいずれか1項に記載の符号化方法のステップを実行するように構成される、電子機器。
- 非揮発性記憶媒体に記憶されており、少なくとも1つのプロセッサによって実行されることで請求項1~5のいずれか1項に記載の符号化方法のステップを実現するコンピュータプログラム。
- プロセッサと、前記プロセッサに結合された通信インタフェースとを含むチップであって、前記プロセッサはプログラムもしくはコマンドを実行して、請求項1~5のいずれか1項に記載の符号化方法のステップを実現するために用いられる、チップ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011553903.4A CN112599139B (zh) | 2020-12-24 | 2020-12-24 | 编码方法、装置、电子设备及存储介质 |
CN202011553903.4 | 2020-12-24 | ||
PCT/CN2021/139070 WO2022135287A1 (zh) | 2020-12-24 | 2021-12-17 | 编码方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2023552451A JP2023552451A (ja) | 2023-12-15 |
JP7542153B2 true JP7542153B2 (ja) | 2024-08-29 |
Family
ID=75202376
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023534313A Active JP7542153B2 (ja) | 2020-12-24 | 2021-12-17 | 符号化方法、装置、電子機器及び記憶媒体 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20230326467A1 (ja) |
EP (1) | EP4270387A4 (ja) |
JP (1) | JP7542153B2 (ja) |
KR (1) | KR20230119205A (ja) |
CN (1) | CN112599139B (ja) |
WO (1) | WO2022135287A1 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112599139B (zh) * | 2020-12-24 | 2023-11-24 | 维沃移动通信有限公司 | 编码方法、装置、电子设备及存储介质 |
CN118694750A (zh) * | 2021-05-21 | 2024-09-24 | 华为技术有限公司 | 编解码方法、装置、设备、存储介质及计算机程序 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002196792A (ja) | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
JP2008268792A (ja) | 2007-04-25 | 2008-11-06 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびそのビットレート変換装置 |
JP2014016625A (ja) | 2008-01-04 | 2014-01-30 | Dolby International Ab | オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 |
US20200126572A1 (en) | 2017-07-03 | 2020-04-23 | Dolby International Ab | Low Complexity Dense Transient Events Detection and Coding |
Family Cites Families (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
KR960012473B1 (ko) * | 1994-01-18 | 1996-09-20 | 대우전자 주식회사 | 스테레오 디지탈 오디오 부호화 장치의 비트 할당 장치 |
US6647366B2 (en) * | 2001-12-28 | 2003-11-11 | Microsoft Corporation | Rate control strategies for speech and music coding |
CN1677493A (zh) * | 2004-04-01 | 2005-10-05 | 北京宫羽数字技术有限责任公司 | 一种增强音频编解码装置及方法 |
US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
CN101308659B (zh) * | 2007-05-16 | 2011-11-30 | 中兴通讯股份有限公司 | 一种基于先进音频编码器的心理声学模型的处理方法 |
CN101101755B (zh) * | 2007-07-06 | 2011-04-27 | 北京中星微电子有限公司 | 一种音频编码的比特分配及量化方法及音频编码装置 |
CN101494054B (zh) * | 2009-02-09 | 2012-02-15 | 华为终端有限公司 | 一种音频码率控制方法及系统 |
CN101853662A (zh) * | 2009-03-31 | 2010-10-06 | 数维科技(北京)有限公司 | 一种用于dra的abr码率控制方法和系统 |
JP5704018B2 (ja) * | 2011-08-05 | 2015-04-22 | 富士通セミコンダクター株式会社 | オーディオ信号符号化方法および装置 |
CN103366750B (zh) * | 2012-03-28 | 2015-10-21 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
CN109041024B (zh) * | 2018-08-14 | 2022-01-11 | Oppo广东移动通信有限公司 | 码率优化方法、装置、电子设备以及存储介质 |
CN112599139B (zh) * | 2020-12-24 | 2023-11-24 | 维沃移动通信有限公司 | 编码方法、装置、电子设备及存储介质 |
-
2020
- 2020-12-24 CN CN202011553903.4A patent/CN112599139B/zh active Active
-
2021
- 2021-12-17 KR KR1020237024094A patent/KR20230119205A/ko active Search and Examination
- 2021-12-17 WO PCT/CN2021/139070 patent/WO2022135287A1/zh active Application Filing
- 2021-12-17 JP JP2023534313A patent/JP7542153B2/ja active Active
- 2021-12-17 EP EP21909283.0A patent/EP4270387A4/en active Pending
-
2023
- 2023-06-12 US US18/333,017 patent/US20230326467A1/en active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2002196792A (ja) | 2000-12-25 | 2002-07-12 | Matsushita Electric Ind Co Ltd | 音声符号化方式、音声符号化方法およびそれを用いる音声符号化装置、記録媒体、ならびに音楽配信システム |
JP2008268792A (ja) | 2007-04-25 | 2008-11-06 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置およびそのビットレート変換装置 |
JP2014016625A (ja) | 2008-01-04 | 2014-01-30 | Dolby International Ab | オーディオコーディングシステム、オーディオデコーダ、オーディオコーディング方法及びオーディオデコーディング方法 |
US20200126572A1 (en) | 2017-07-03 | 2020-04-23 | Dolby International Ab | Low Complexity Dense Transient Events Detection and Coding |
JP2020525853A (ja) | 2017-07-03 | 2020-08-27 | ドルビー・インターナショナル・アーベー | 密集性の過渡事象の検出及び符号化の複雑さの低減 |
Non-Patent Citations (2)
Title |
---|
S. Meltzer, 外1名,"MPEG-4 HE-AAC v2 - audio coding for today's digital media world",EBU TECHNICAL REVIEW,2006年01月30日,305 |
TSG-SA WG4,3GPP TS 26.403 version 2.0.0 "Enhanced aacPlus General Audio Codec; Encoder specification; Advanced Audio Coding (AAC) part" (Release 6)[online],3GPP TSG-SA#25 SP-040635,インターネット<URL:http://www.3gpp.org/ftp/tsg_sa/TSG_SA/TSGS_25/Docs/ZIP/SP-040635.zip>,2004年09月16日 |
Also Published As
Publication number | Publication date |
---|---|
CN112599139B (zh) | 2023-11-24 |
EP4270387A4 (en) | 2024-05-22 |
US20230326467A1 (en) | 2023-10-12 |
JP2023552451A (ja) | 2023-12-15 |
WO2022135287A1 (zh) | 2022-06-30 |
KR20230119205A (ko) | 2023-08-16 |
CN112599139A (zh) | 2021-04-02 |
EP4270387A1 (en) | 2023-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107731223B (zh) | 语音活性检测方法、相关装置和设备 | |
CN109511037B (zh) | 耳机音量调节方法、装置及计算机可读存储介质 | |
JP7542153B2 (ja) | 符号化方法、装置、電子機器及び記憶媒体 | |
CN106782613B (zh) | 信号检测方法及装置 | |
CN111477243B (zh) | 音频信号处理方法及电子设备 | |
US11315582B2 (en) | Method for recovering audio signals, terminal and storage medium | |
CN109994127B (zh) | 音频检测方法、装置、电子设备及存储介质 | |
CN107993672B (zh) | 频带扩展方法及装置 | |
CN107562406B (zh) | 一种音量调节方法、移动终端及计算机可读存储介质 | |
CN106847307B (zh) | 信号检测方法及装置 | |
CN110457716B (zh) | 一种语音输出方法及移动终端 | |
KR102216881B1 (ko) | 전자장치에서 마이크의 감도에 따른 자동 이득 조절 방법 및 장치 | |
CN109817241B (zh) | 音频处理方法、装置及存储介质 | |
CN109754823A (zh) | 一种语音活动检测方法、移动终端 | |
WO2021008458A1 (en) | Method for voice recognition via earphone and earphone | |
CN111093137B (zh) | 一种音量控制方法、设备及计算机可读存储介质 | |
JP7332688B2 (ja) | 受信方法、送信方法、端末及びネットワーク側機器 | |
CN108924319B (zh) | 一种接近检测方法和移动终端 | |
CN108900706B (zh) | 一种通话语音调整方法及移动终端 | |
CN105244037B (zh) | 语音信号处理方法及装置 | |
CN104038626B (zh) | 移动计算装置与配件装置的通信方法 | |
CN115312036A (zh) | 模型训练数据的筛选方法、装置、电子设备及存储介质 | |
CN106020646A (zh) | 媒体音量调整方法、装置和终端设备 | |
CN106293607B (zh) | 自动切换音频输出模式的方法及系统 | |
CN106790963B (zh) | 音频信号的控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230606 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230606 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20240730 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20240731 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20240819 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7542153 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |