Nothing Special   »   [go: up one dir, main page]

CN1638479A - 数字音频水印插入/检测装置及方法 - Google Patents

数字音频水印插入/检测装置及方法 Download PDF

Info

Publication number
CN1638479A
CN1638479A CNA2004101034340A CN200410103434A CN1638479A CN 1638479 A CN1638479 A CN 1638479A CN A2004101034340 A CNA2004101034340 A CN A2004101034340A CN 200410103434 A CN200410103434 A CN 200410103434A CN 1638479 A CN1638479 A CN 1638479A
Authority
CN
China
Prior art keywords
scale factor
watermark
digital audio
watermark signal
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004101034340A
Other languages
English (en)
Other versions
CN100505873C (zh
Inventor
吴贤午
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN1638479A publication Critical patent/CN1638479A/zh
Application granted granted Critical
Publication of CN100505873C publication Critical patent/CN100505873C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种数字音频水印插入/检测方法及装置。本发明提供具有通过利用比例因子表对数字音频信号进行编码的步骤的数字音频水印插入方法,该方法包括以下步骤:将数字音频信号变换为多个子带样本;提取比例因子,该比例因子为变换的子带样本的幅度因子;通过比例因子表将提取的比例因子变换为比例因子索引;以及在变换提取的比例因子时将水印信号插入到比例因子索引中。因此,本发明具有当水印被有效的插入时不会产生另外的噪声或失真的效果。

Description

数字音频水印插入/检测装置及方法
本发明要求于2003年12月27日在韩国提交的申请号为P2003-98069的申请的优先权,并一起作为参考。
技术领域
本发明设计数字音频水印,更确切地说,涉及到在高质量音频解码过程中在位流(bit stream)内插入(insert)和检测(detect)水印信息的装置和方法。
背景技术
标记水印是指将称为“水印”的机密信息嵌入如视频、图象、音频及文本的媒体中。嵌入的水印信息能够仅限于由了解该信息的人提取。具有水印的媒体在一般用户看来与普通媒体相同。
特别地,由于与类似媒体相比,其中通过电波或通信网络,存取、传输、编辑和保管容易而且数据分布时不产生数据消减的优势,数字媒体产生新的版权保护的问题。数字水印作为保护版权的方法而受到注意。
数字水印不仅用于插入信息来辨别所有者以保护版权,也用于插入反盗版、分布确认(distribution confirmation)、广播监控等的控制信息或用于将信息如演示时间控制信息、同步(lip-sync)、内容信息和歌词插入到实时媒体如音频、视频等并传送插入的信息。
这样,数字水印根据各种使用目的而具有不同的特性,但不可见性(imperceptibility)和鲁棒性(robustness)无疑是主要的。
作为最基本要求的不可见性是指当用户进行视或听时,原始媒体和插入有水印的媒体不能彼此区分。
鲁棒性是指,即使插入有水印的媒体受到如分布及传送需要的滤波、压缩、噪声加入和消减而变形,插入的水印也应该被保留。
尤其,用于版权保护和反盗版的水印应该是稳固的以便其能够对付旨在消除该水印的有意攻击。同时,当其变形或被操作时没有伪造的水印容易消除。
另外,用于将附加信息如演示时间控制信息、lip-sync、内容信息和歌词嵌入媒体的水印具有抵抗有意攻击或失真的相对低的鲁棒性。
图1所示为数字水印的一般方法。
如图1所示,通过水印插入系统1,水印数据嵌入数字媒体(音频、视频、图象、文本等)中。这时,根据水印算法,能够另外使用用于安全的密或公钥。
其后,通过水印提取系统2,插入的水印能够从插入有水印的媒体中提取出来。这时,根据水印算法可能需要原始媒体,并且仅使用插入时需要的公钥也能进行解码。
在水印提取过程不需要原始媒体的系统被称为“盲水印(blindwatermarking)”。
在水印方法中,音频信号水印方法有多种实例,如LSB(最低有效位:Least Significant Bit)编码方法、回音隐藏(echo hiding)方法、及扩展频谱(spread spectrum)通信方法等。
在LSB编码方法中,量化的音频样本的最低有效位被变形以插入期望的信息。LSB编码方法利用了音频信号最低有效位的变形几乎不影响音质这一特征。LSB编码方法的优点在于,插入和检测易于进行并且音质较少地失真,但其缺点在于,对于信号处理如有损压缩或滤波来说易受攻击。
另外,在回音隐藏方法中,一个听不到的回音被插入到音频信号中。也就是说,回音隐藏方法根据将被插入的二进制水印信息,将具有不同时间延迟的回音插入并编码到以预定间隔细分的音频信号中。在解码过程中,通过检测每一细分的持续时间内的回音时间延迟,二进制信息被解码。这样,插入的信号不是噪声,而是具有与原始信号相同特性的音频信号本身。因此,即使插入的信号被听到,插入的信号也不会被识别为失真信号。插入信号还被认为提供更好的音色。因此,回音隐藏方法适用于高质量音频水印,但其缺点在于,因为通过倒谱(Cepstrum)操作进行检测,解码的操作数量非常高,而且如果在时域细分的持续时间同步缺失,便无法进行解码。
另外,扩展频谱通信方法是一种典型的水印方法,其在视频水印中流行并最多用于音频水印的研究。在扩展频谱通信方法中,音频信号通过离散傅立叶变换(DFT)变换为频率,并其后二进制水印信息被频率扩展到PN(伪噪声)序列以将扩展信息插入频率变换的音频信号中。利用PN序列的高自动关联特性,插入的水印能够通过相关器(correlator)检测,并具有抗干扰的鲁棒性以及优良的加密性的特性。反之,扩展频谱通信方法其缺点在于:声音质量下降,插入和检测的操作数量非常高,而且如果在插入有大功率水印以增强其鲁棒性时压缩编码不能被完成。
这样,概括传统的音频水印,传统的音频水印缺点在于:因为通常在原始信号被压缩和解码前水印信息被插入到原始信号中,其实现方法复杂,因此当其压缩时需要较多的操作数量并且原始信号容易变形。
发明内容
因此,本发明的涉及一种能够实质性的消除由于现有技术缺点而造成的一个或多个问题的数字音频水印插入/检测装置及方法。
本发明的一个目的在于提供一种数字音频水印插入/检测装置及方法,其中当数字音频数据被压缩和编码时水印数据被插入到位流中,以防止原始信号和插入的水印的失真并且易于水印数据的插入。
本发明其他的优点、目的和特征部分地将在以下的说明中被阐述,并且部分地对于本领域普通技术人员通过对下面的说明的考察能够理解本发明或从本发明的实践中认识。本发明的目的和其他优点可通过文字说明书及其权利要求和附图中特别指出的结构得到实现和获得。
为达到这些目的和其他优点并结合本文所述的本发明的目的,提供一种具有通过利用比例因子表对数字音频信号进行编码的步骤的数字音频水印插入方法,该方法包括以下步骤:将数字音频信号变换为多个子带样本(sub-band sample);提取比例因子,该比例因子为变换的子带样本的幅度因子;通过比例因子表将提取的比例因子变换为比例因子索引;以及在提取的比例因子的变换中,将水印信号插入比例因子索引。
当插入水印信号时,按照水印信号的一位分配一个比例因子索引。
比例因子索引根据水印信号的一位“0”或“1”而变为偶数或奇数。
如果比例因子索引为“0”,那么水印信号没有被插入。
将被传送的每帧水印信号的最小位数量是预定的。
如果传送的比例因子少于水印信号的预定位数量,一个位被强制性地分配给一任意子带,其后水印信号被插入到相应的比例因子索引中。
对于强制性地分配位以插入水印信号的子带,子带样本全部定义为“0”。
尤其,理想的是被传送的帧被打包以调整水印位率(bit rate)。
密/公钥用于使插入的水印信号区别于其他信号。
在本发明的另一方面,提供一种数字音频水印插入方法,其中通过数字音频编码步骤水印信号被插入到数字音频信号中,该方法包括以下步骤:将数字音频信号变换为多个子带样本以消除数字音频信号的统计冗余;提取比例因子,该比例因子为变换的子带样本的幅度因子;接收数字音频信号以通过傅立叶变换将该接收的音频信号变换为频率范围;在变换的频率范围中根据所提取的比例因子,获得听不到的噪声电平的掩蔽阈值,并且以所获的掩蔽阈值为基础在各子带样本计算SMR(Signal-to-Mask Ratio);在计算的SMR上将一个位分配给各子带样本;接收提取的比例因子以根据数字音频信号的编码标准通过比例因子表将该接收的比例因子变换为比例因子索引;在比例因子的变换中,改变比例因子索引以将水印信号插入比例因子索引;通过分配给各子带样本的位和比例因子索引,分别量化多个子带样本;以及产生量化的信号作为位流。
对于没有分配位的子带样本,该方法包括以下步骤:根据每帧将被传送的水印信号的预定最小位数量,强制性地分配位给没有分配位的子带样本;设置对应将被插入的水印信号的比例因子一任意偶或奇数;以及将所有强制性地分配位的子带样本定义为“0”。
在本发明另一个方面,提供一种数字水印检测方法,其中从数字音频信号的压缩和传送的位流中检测水印信号,该方法包括以下步骤;从位流中提取比例因子索引信息;和确定提取的比例因子索引的偶数/奇数以提取“0”和“1”二进制水印信息。
在本发明又一个方面,提供一种数字音频水印插入装置,其中通过数字音频编码器,水印信号被插入到数字音频信号(PCM)中,该装置包括:一个子带滤波器组,用于将数字音频信号(PCM)变换为多个子带样本;一个比例因子提取器,用于提取比例因子,该比例因子为变换的子带样本的幅度因子;以及一个水印插入及比例因子编码单元,用于根据数字音频信号的编码标准通过比例因子表将提取的比例因子变换为比例因子索引,并改变变换的比例因子索引以将水印信号插入比例因子索引。
在本发明又一个方面,提供一种数字音频水印检测装置,其中从数字音频信号的压缩和传送的位流中检测水印信号,该装置包括:一个多路分解器,用于从位流中提取比例因子索引信息;和一个水印提取器,用于确定提取的比例因子索引的偶数/奇数以提取“0”或“1”的二进制水印信息。
因此,本发明具有当水印被有效地插入时不会产生另外的噪声或失真的效果。
可以理解本发明上述一般说明和下述详细说明是示例性的和说明性的并旨在对要求的本发明提供进一步的解释。
附图说明
本发明包含的附图提供对本发明进一步的理解,结合并组成本发明的一部分,图示本发明的实施例并将与说明一起解释本发明的原理。
附图中:
图1为一般数字音频水印方法的概念图;
图2为根据本发明整个数字音频水印系统的视图;
图3为具有根据本发明的数字音频水印插入装置的运动图像专家组(MPEG)音频解码器的结构的框图;
图4为根据本发明使用的MPEG音频编码方法的比例因子表的视图;
图5为MPEG音频位流结构的视图,其中根据本发明水印被插入到比例因子索引;以及
图6为具有本发明的数字音频水印检测装置的MPEG音频解码器的框图。
具体实施方式
下面详细描述本发明的优选实施方案,其实施例在附图中说明。只要可能,在整个附图中,相同的数字表示相同或相似的部分。
贯穿于本发明,选用的是普及的通用术语,但由于特定术语是申请人随意选择的且其意义在本发明的详细描述中作了详细描述,所以对本发明的理解应基于术语的意义,而非术语的名称。
根据本发明,在高质量音频编码过程中,水印被插入位流中,且执行盲水印处理(blind watermarking)以检测插入的水印,而不需要原始媒体。
为此,根据作为一种高质量音频编码方法的MPEG层-II音频编码方法,描述本发明的实施方案。
图2为表示根据本发明的整个数字音频水印系统的视图。
如图2所示,数字音频水印系统包括高质量音频编码器10和高质量音频解码器20,以插入和提取水印信号。
高质量音频编码器10同时编码高质量音频信号和水印信号。高质量音频编码器10通过利用数字音频水印插入装置插入水印信号,而该数字音频水印插入装置通过部分改变一般高质量音频编码器的结构获得。这一内容由图3表示。
进而,高质量音频解码器20通过利用数字音频水印提取装置提取插入的水印信息,而该数字音频水印提取装置通过部分改变用于解码音频位流以生成输出音频信号的一般高质量音频解码器的结构获得。
这时,不具有水印提取装置的解码器解码音频位流以仅生成不具有水印信号的输出音频信号(PCM)。这一内容由图6所示。
参考附图,上述结构的水印系统的描述如下。
如上所述,图3是表示根据本发明的具有数字音频水印插入装置的运动图像专家组(MPEG)音频编码器的结构的框图。特别地,运动图像专家组(MPEG)音频编码器作为高质量音频编码器的示例。
首先,与其它高质量音频编码技术类似,MPEG音频编码器采用基于人类听觉特征的心理声学模型,以消除音频信号的知觉冗余(perceptual redundancy),并具有与一般数据压缩方式接合的类型,以消除音频信号的统计冗余。
如图3所示,根据本发明与MPEG音频编码器连接的音频水印插入装置包括:子带滤波器组11,用于将音频信号(PCM)转变为32子带样本,以消除音频信号(PCM)的统计冗余;比例因子提取器12,用于提取作为子带样本的幅度因子的比例因子;快速傅立叶转换器(FFT)13,用于接收音频信号(PCM),以通过傅立叶转换将接收的音频信号转换为频率范围(frequency area);信号掩蔽比(SMR:Signal-to-Mask Ratio)计算器14,用于在转换的频率范围中参考提取的比例因子而获得听不到的噪音电平的掩蔽阈值,并基于获得的掩蔽阈值计算各子带处的SMR;位分配器15,用于基于SMR将位分配给各子带;水印插入及比例因子编码装置16,用于接收和编码提取的比例因子,并改变提取的比例因子的编码过程,以插入二进制水印信息;量化器17,用于利用分配的位和编码的比例因子分别量化32子带;以及多路复用器18,用于生成量化的子带与附加信息一起作为位流。
下面描述根据本发明的与MPEG音频编码器连接的上述结构的水印插入装置的操作。
首先,子带滤波器组11将音频信号转换为子带样本,以消除音频信号(PCM)的统计冗余。该子带滤波器组11包括32权重叠加相加子带滤波器(32 weighted-superposition adding sub-band filter)。
SMR计算器14获得作为听不到的噪音电平的掩蔽阈值,以通过基于心理声学模型的人类听觉特征消除音频信号的知觉冗余,并基于获得的掩蔽阈值计算各子带的SMR。
位分配器15基于计算的SMR将位分配到各子带,从而量化噪声能够由信号主观地掩蔽(参考文档:ISO/IEC JTC/SC29/WG11 71号“高达1.5兆比特/秒的数字存储媒体的运动图象和相关音频的编码-CD11172-3(第三部分.MPEF-音频)”,1992)。
同时,比例因子提取器12接收32子带样本以提取为大小因子(sizefactor)的比例因子。
每一子带具有三个比例因子。换句话说,在一个子带的36个样本被分别分成3个区组(granule)后,每一区组的最大值成为比例因子备选值(candidate value)。
然而,实际上是一个六位的比例因子索引,而不是比例因子本身,被传送到位流。
换句话说,与真实比例因子最相似的值(大于真实比例因子的值中最相似的值)出现在具有63个项的比例因子表中以传送相应索引。比例因子表如图4所示。
或者,在根据本发明实施例的MPEG层-II编码过程中,根据比例因子选择信息(SCFSI),一到三个比例因子分别以不同的模式传送,以减小比例因子索引的传送数量。
也就是说,确定在一个子带中计算的三个比例因子指数(indices)的是否相似。如果确定三个比例因子指数互相相似,那么其中一个作为代表值发送,而如果确定它们互相不同,那么它们被分别发送。
另外,位分配器15根据每一子带的位分配信息控制不传送比例因子选择信息(SCFSI)和没有分配有位的子带的比例因子索引。因此,将被传送的比例因子根据帧能够在数量上不同。
如果在特定帧传送的子带数量为30,那么为立体声模式,并且位分配给全部子带,传送的比例因子数量最大为180(30*2*3)。这样,结果每秒传送约6,890个比例因子。
根据本发明,水印插入及比例因子编码单元16将水印信号插入到MPEG音频位流的比例因子索引部分。
换句话说,一位二进制水印被插入到传送的比例因子索引中。这在下文中将详细说明。
如果插入到当前比例因子索引的二进制水印为“0”,那么相应比例因子索引设为偶数。如果将被插入的二进制水印为“1”,那么相应比例因子索引设为奇数。
例如,如果当前比例因子索引(SI)为35而将插入到当前比例因子索引的二进制水印为“0”,那么比例因子索引(SI)变为34。如果将被插入的二进制水印为“1”,那么比例因子索引(SI)保持为35不变。
如果上述例子中将被插入的二进制水印为“0”,那么比例因子索引(SI)应主要变为34,而不是36。这是因为比例因子索引低,在比例因子表上比例因子高(参见图4)。
这时,如果当前比例因子索引为“0”,则二进制数1不能被表示。因此,水印信号没有插入。
下表1表示根据本发明的水印方法,将12位水印(例如,“011010101100”)插入到12比例因子指数中变形。
表1
  0   1
  将插入的二进制水印
  比例因子索引(插入前)   5   2   3   5   8   1   0   1   1   3   7   1
  比例因子索引(插入后)   4   1   3   4   7   0   9   0   1   3   6   0
在表1中,如果将被插入的二进制水印为“0”,那么相应的比例因子索引表示为偶数。因此,例如,比例因子索引(SI)由35变为34。另外,如果将被插入的二进制水印为“1”,那么相应的比例因子索引表示为奇数。因此,例如,比例因子索引(SI)由32变为31。
量化器17利用使用水印插入的变形的比例因子索引和在位分配器15中分配的位来量化子带样本。
量化信号、分配的位信息和转换的比例因子索引从多路复用其18接收并转换为位流以产生压缩的位流。产生的位流不与常规的音频位流相区别。
产生的位流的例子如图5所示。
换句话说,图5为MPEG音频位流的结构视图,其中根据本发明水印插入到比例因子索引中。
如图5所示,音频位流结构包括:一个32位包头部分,其具有采样频率、位率、层等信息;一个CRC码,用于16位误差校正;一个位分配部分,用于在每一子带表示位分配信息的2到4位;2位字比例因子选择信息(SCFSI)部分,用于表示涉及比例因子的选择信息;一个标记水印的比例因子(ScaleFactor)部分,用于存储6位字标记水印和变形的比例因子索引;样本(Sample)部分,用于存储量化的样本;以及辅助数据部分,用于存储辅助信息如歌词信息。
在结合MPEG音频编码器的水印插入方法中,利用通过在MPEG音频编码过程中的水印插入而变形的比例因子索引,子带样本被划分和量化,并且转换的比例因子索引被传送。因此,水印的插入不会产生另外的噪声或失真。
然而,在水印插入方法中即通过比例因子索引变形的水印插入方法,需要注意的方面是:比例因子索引的变形利用比例因子选择信息(SCFSI)结合位分配和传送模式确定过程来进行。
换句话说,如上所述,在每一子带确定的三个初始比例因子索引可能不被SCFSI传送。这样,因为没有分配位的子带没有进行传送,那么水印根据这样的信息被插入。
或者,使用MPEG音频解码器的检测插入的二进制水印的方法如图6所示。
图6为具有本发明的音频水印检测装置的MPEG音频解码器的框图。
如图6所示,MPEG音频解码器包括:一个多路分解器21,用于从传送的位流中提取必要的信息;一个水印提取及比例因子解码单元23,用于以提取的信号为基础对比例因子进行解码和提取水印;一个反量化器22,用于通过解码的比例因子和位分配信息,反向量化子带样本;以及一个合成子带滤波器组24,用于将反量化的子带样本转换为时域样本并合成转换的时域样本以输出最终的音频信号。
换言之,使用水印提取装置的MPEG音频解码过程执行MPEG音频编码过程的逆过程。首先,譬如位分配信息、比例因子选择信息,比例因子索引,及除了头信息外的量化子带样本等必要的信息从多路分解器21中的压缩和传输的位流中提取。
比例因子在提取的信息的基础上解码。此时,为了检测插入的二进制水印,提取的比例因子索引顺序地排列并且确定偶数/奇数,以提取0和1二进制水印信息。这在下表2中被排列。
表2
  0   1
    比例因子索引   4   1   3   4   7   0   9   0   1   3   6   0
    偶/奇
    提取的二进制水印
表2表示了从传送给解码阶段的12个比例因子索引中检测水印的过程。
如表2所示,通过使用表1的比例因子索引,比例因子索引的偶数/奇数决定了插入到编码过程中的二进制水印‘011010101100’。
通过上述过程,在水印提取和比例因子解码单元23中提取水印。
同时,水印提取及比例因子解码单元23通过比例因子索引对比例因子进行解码。反量化器22通过使用解码的比例因子和较早提取的位分配信息反向量化子带样本。
合成子带滤波器组24将反向量化的子带样本转换成时域样本并合成转换的时域样本,以获得最终解码的音频信号(PCM)。
此时,即使在水印没有插入到比例因子索引中的普通音频位流的比例因子索引输入到水印提取器23中的情况下,也可以确定比例因子是否是偶数/奇数。因此可以检测二进制值。
由于二进制值是无意义的信息,所以使用密/公钥,或者规定的同步信号(syncword)在插入水印信号的位流的时候插入,从而将有意义的水印信息和无意义的信息进行区别。
作为选择,如上所述,使用水印插入的比例因子索引的变形在音频压缩编码和解码过程中不产生另外的噪声或失真。
这是因为实子带样本在编码过程中根据比例因子索引进行标准化以进行最终传输,并且解码阶段通过相同的比例因子恢复子带样本。
作为选择,根据本发明使用比例因子的位流水印具有由于传输的比例因子的编号不固定,所以可传输的水印的信息量不能精确地预计的缺点。
特殊地,在对应空(哑)间隔的音频帧被编码的情况下,分配位的子带可以不提供,并且水印在音频帧处不能传输。
因此,为了解决这个问题,预先设定每个帧将要传输的水印的最小位数量(bit number)。此外,仅在比例因子的数量少于每个帧将要传输的水印的最小位数量的情况下,位被强制地分配给一个没有分配位的任意的子带。而且,传输相应带的比例因子索引。
此时,子带样本全部定义为零并被传输用于强制分配了位的子带,用于水印传输。
通过这样做,在解码过程中提供了“0”的结果。因此,在对音质没有任何影响的情况下,水印可以和期望的位数量一样多地额外地插入。
然而,在这种情况下,比MPEG音频编码所需要的更多的位用于进行编码。由于这些来自于零填充部分(zero stuffing portion)的额外的位出现在相应帧内以保持固定的位速率,所以这不能认为是位的浪费。
作为选择,通过将几个帧打包以调整在各个大单元处的水印位率而不是在各个帧保持固定的水印位率,在各个局部帧处水印的传输数量可以变化。
同时,在上述说明中,本发明应用于作为高质量音频编码方法之一的MPEG层-II音频编码方法中。然而,本发明不仅适用于其他涉及具有比例因子索引等的表格的高质量音频编码方法,而且还适用于图像和视频编码方法等等。
如上所述,根据本发明的数字音频水印装置和方法具有下述效果。
首先,当通过改变要传输的比例因子索引以在高质量音频编码过程中将水印插入到位流内时,具有不产生额外的噪声或失真的效果。
第二,根据本发明通过水印插入产生具有与传统的解码器兼容的位流,具有不同于音频信号的单独的信息被传送给规定的解码器的效果。也就是,具有在保证单独信息传输信道的同时,保持与传统的解码器兼容的效果。
第三,根据本发明的水印提取方法仅通知给特定用户的情况下,具有相应水印被利用为保密通信的效果。
第四,具有由于插入和提取过程非常简单,所以根据本发明的高质量音频编码和音频水印方法仅通过增加很小的工作量就能实现的效果。
对于本领域的技术人员来说能够对本发明作出各种修改和改变是很显然的。因而,本发明旨在覆盖落在所附权利要求及其等价范围内的对本发明作出的修改和改变。

Claims (21)

1、一种具有通过比例因子表对数字音频信号进行编码的步骤的数字音频水印插入方法,该方法包括以下步骤:
将数字音频信号变换为多个子带样本;
提取比例因子,该比例因子为变换的子带样本的幅度因子;
通过使用比例因子表将提取的比例因子变换为比例因子索引;以及
在变换提取的比例因子时,将水印信号插入比例因子索引。
2、如权利要求1所述的方法,其特征在于,当插入水印信号时,按照水印信号的一位分配一个比例因子索引。
3、如权利要求2所述的方法,其特征在于,根据水印信号的一位为“0”或“1”,比例因子索引变为偶数或奇数。
4、如权利要求3所述的方法,其特征在于,如果水印信号的位为“0”,那么比例因子索引变为偶数。
5、如权利要求3所述的方法,其特征在于,如果水印信号的位为“1”,那么比例因子索引变为奇数。
6、如权利要求1所述的方法,其特征在于,如果比例因子索引为“0”,那么水印信号没有被插入。
7、如权利要求1所述的方法,其特征在于,将被传送的每帧水印信号的最小位数量是预定的。
8、如权利要求7所述的方法,其特征在于,如果传送的比例因子少于水印信号预定位数量,那么一个位被强制性地分配给一任意子带,并且其后水印信号被插入到相应的比例因子索引中。
9、如权利要求8所述的方法,其特征在于,对于强制性地分配位以插入水印信号的子带,子带样本全部定义为“0”。
10、如权利要求7所述的方法,其特征在于,将被传送的帧被打包以调整水印位率。
11、如权利要求1所述的方法,其特征在于,使用密/公钥使插入的水印信号区别于其他信号。
12、如权利要求1所述的方法,其特征在于,预定的同步信号被插入以使插入的水印信号区别于其他信号。
13、一种数字音频水印插入方法,其中通过数字音频编码步骤水印信号被插入到数字音频信号中,该方法包括以下步骤:
将数字音频信号变换为多个子带样本以消除数字音频信号的统计冗余;
提取比例因子,该比例因子为变换的子带样本的幅度因子;
接收数字音频信号以通过傅立叶变换将该接收的音频信号变换为频率范围;
在变换的频率范围中根据所提取的比例因子,获得为听不到的噪声电平的掩蔽阈值,并且根据所获的掩蔽阈值在每一子带样本中计算信号掩蔽率SMR;
在计算的SMR上将一个位分配给各子带样本;
接收提取的比例因子,以根据数字音频信号的编码标准通过使用比例因子表将该接收的比例因子变换为比例因子索引;
当变换比例因子时改变比例因子索引以将水印信号插入比例因子索引;
通过使用分配给每一子带样本的位和比例因子索引分别量化多个子带样本;以及
产生量化的信号作为位流。
14、如权利要求13所述的方法,其特征在于,水印信号的插入包括:根据水印信号的一个位为“0”或“1”,通过水印信号的一位分配一比例因子索引,以将比例因子索引改变为偶数或奇数的步骤。
15、如权利要求13所述的方法,其特征在于,对于没有分配位的子带样本,该方法包括以下步骤:
根据每帧将被传送的水印信号的预定最小位数量,强制性地分配位给没有分配位的子带样本;
设置对应将被插入的水印信号比例因子索引一任意偶或奇数;以及
将所有强制性地分配位的子带样本定义为“0”。
16、一种数字水印检测方法,其中从数字音频信号的压缩和传送的位流中检测水印信号,该方法包括以下步骤:
从位流中提取比例因子索引信息;和
确定提取的比例因子索引的偶数/奇数以提取“0”和“1”的二进制水印信息。
17、如权利要求16所述的方法,其特征在于,如果比例因子索引为偶数,那么插入的水印信号的一位为“0”。
18、如权利要求16所述的方法,其特征在于,如果比例因子索引为奇数,那么插入的水印信号的一位为“1”。
19、一种数字音频水印插入装置,其中通过使用数字音频编码器,水印信号被插入到数字音频信号PCM中,该装置包括:
一个子带滤波器组,用于将数字音频信号PCM变换为多个子带样本;
一个比例因子提取器,用于提取比例因子,该比例因子为变换的子带样本的幅度因子;以及
一个水印插入及比例因子编码单元,用于根据数字音频信号的编码标准规范通过使用比例因子表将提取的比例因子变换为比例因子索引,并改变变换的比例因子索引以将水印信号插入到比例因子索引。
20、如权利要求19所述的装置,其特征在于,根据水印信号的一个位为“0”或“1”,水印插入及比例因子编码单元根据水印信号的一位分配一个比例因子索引,以使比例因子索引变为偶数或奇数。
21、一种数字音频水印检测装置,其中从数字音频信号的压缩和传送的位流中检测水印信号,该装置包括:
一个多路分解器,用于从位流中提取比例因子索引信息;和
一个水印提取器,用于确定提取的比例因子索引的偶数/奇数以提取“0”或“1”的二进制水印信息。
CNB2004101034340A 2003-12-27 2004-12-27 数字音频水印插入/检测装置及方法 Expired - Fee Related CN100505873C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020030098069 2003-12-27
KR1020030098069A KR100595202B1 (ko) 2003-12-27 2003-12-27 디지털 오디오 워터마크 삽입/검출 장치 및 방법

Publications (2)

Publication Number Publication Date
CN1638479A true CN1638479A (zh) 2005-07-13
CN100505873C CN100505873C (zh) 2009-06-24

Family

ID=34698575

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004101034340A Expired - Fee Related CN100505873C (zh) 2003-12-27 2004-12-27 数字音频水印插入/检测装置及方法

Country Status (4)

Country Link
US (1) US7565296B2 (zh)
KR (1) KR100595202B1 (zh)
CN (1) CN100505873C (zh)
CA (1) CA2491688C (zh)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101290773B (zh) * 2008-06-13 2011-03-30 清华大学 自适应的mp3数字水印嵌入和提取方法
CN102194459A (zh) * 2011-05-11 2011-09-21 北京航空航天大学 一种基于avs音频编码的信息隐藏方法
CN102222504A (zh) * 2011-06-10 2011-10-19 深圳市金光艺科技有限公司 数字音频多层水印植入及提取方法
CN101115124B (zh) * 2006-07-26 2012-04-18 日电(中国)有限公司 基于音频水印识别媒体节目的方法和装置
CN103430234A (zh) * 2011-03-17 2013-12-04 国际商业机器公司 具有编码信息的语音变换
CN105706467A (zh) * 2013-09-17 2016-06-22 韦勒斯标准与技术协会公司 用于处理音频信号的方法和设备
CN106416302A (zh) * 2013-12-23 2017-02-15 韦勒斯标准与技术协会公司 生成用于音频信号的滤波器的方法及其参数化装置
CN107871509A (zh) * 2016-09-23 2018-04-03 李庆成 数字音频信号处理方法
CN108475510A (zh) * 2015-12-23 2018-08-31 马尔科姆·罗 透明无损的音频水印增强
CN111192593A (zh) * 2014-07-15 2020-05-22 尼尔森(美国)有限公司 受众测量计量器、受众测量方法和计算机可读存储介质

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7460684B2 (en) 2003-06-13 2008-12-02 Nielsen Media Research, Inc. Method and apparatus for embedding watermarks
MX2007000076A (es) 2004-07-02 2007-03-28 Nielsen Media Res Inc Metodos y aparatos para mezclar corrientes comprimidas de bits digitales.
KR100644627B1 (ko) * 2004-09-14 2006-11-10 삼성전자주식회사 음장 제어 정보 부호화 방법 및 이에 적합한 음장 처리 방법
KR100617165B1 (ko) * 2004-11-19 2006-08-31 엘지전자 주식회사 워터마크 삽입/검출 기능을 갖는 오디오 부호화/복호화장치 및 방법
EP1892702A4 (en) * 2005-06-17 2010-12-29 Panasonic Corp POST-FILTER, DECODER AND POST-FILTRATION METHOD
JP2009516402A (ja) * 2005-09-14 2009-04-16 エルジー エレクトロニクス インコーポレイティド 符号化/復号化方法及び装置
EP1798686A1 (en) * 2005-12-16 2007-06-20 Deutsche Thomson-Brandt Gmbh Method and apparatus for decoding watermark information items of a watermarked audio or video signal using correlation
KR20080029446A (ko) * 2006-09-29 2008-04-03 (주)이스트랩 오디오 워터마킹을 이용하여 정보를 제공하는 시스템 및 그제공 방법.
US8078301B2 (en) 2006-10-11 2011-12-13 The Nielsen Company (Us), Llc Methods and apparatus for embedding codes in compressed audio data streams
FR2910766A1 (fr) * 2006-12-22 2008-06-27 France Telecom Procede et systeme de detection d'un message dans un signal numerique tatoue
US10885543B1 (en) * 2006-12-29 2021-01-05 The Nielsen Company (Us), Llc Systems and methods to pre-scale media content to facilitate audience measurement
WO2008149307A1 (en) * 2007-06-08 2008-12-11 Koninklijke Philips Electronics N.V. Watermark generation and embedding
ES2375192T3 (es) * 2007-08-27 2012-02-27 Telefonaktiebolaget L M Ericsson (Publ) Codificación por transformación mejorada de habla y señales de audio.
DE102008014409A1 (de) * 2008-03-14 2009-09-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Einbetter zum Einbetten eines Wasserzeichens in eine Informationsdarstellung, Detektor zum Detektieren eines Wasserzeichens in einer Informationsdarstellung, Verfahren und Computerprogramm
US8805689B2 (en) * 2008-04-11 2014-08-12 The Nielsen Company (Us), Llc Methods and apparatus to generate and use content-aware watermarks
JP5668687B2 (ja) * 2009-09-18 2015-02-12 日本電気株式会社 音声品質解析装置、音声品質解析方法およびプログラム
CN103548079B (zh) * 2011-08-03 2015-09-30 Nds有限公司 音频水印
US9305559B2 (en) * 2012-10-15 2016-04-05 Digimarc Corporation Audio watermark encoding with reversing polarity and pairwise embedding
CN102916803B (zh) * 2012-10-30 2015-06-10 山东省计算中心 基于公用电话交换网的文件隐传方法
EP2881941A1 (en) * 2013-12-09 2015-06-10 Thomson Licensing Method and apparatus for watermarking an audio signal
EP3109860A1 (en) * 2015-06-26 2016-12-28 Thomson Licensing Method and apparatus for increasing the strength of phase-based watermarking of an audio signal
CN107993669B (zh) * 2017-11-20 2021-04-16 西南交通大学 基于修改最低有效位数权重的语音内容认证和篡改恢复方法
KR102150639B1 (ko) * 2018-05-21 2020-09-03 대한민국 디지털 데이터의 무결성을 검증할 수 있는 장치 및 디지털 데이터의 무결성을 검증할 수 있는 방법
CN110197054B (zh) * 2019-04-26 2022-08-02 平安科技(深圳)有限公司 MusicXML格式文件水印嵌入及提取方法、装置及存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7113596B2 (en) * 1993-11-18 2006-09-26 Digimarc Corporation Embedding information related to a subject of an identification document in the identification document
US5508949A (en) * 1993-12-29 1996-04-16 Hewlett-Packard Company Fast subband filtering in digital signal coding
US6760463B2 (en) * 1995-05-08 2004-07-06 Digimarc Corporation Watermarking methods and media
US6381341B1 (en) * 1996-05-16 2002-04-30 Digimarc Corporation Watermark encoding method exploiting biases inherent in original signal
US6061793A (en) * 1996-08-30 2000-05-09 Regents Of The University Of Minnesota Method and apparatus for embedding data, including watermarks, in human perceptible sounds
US6330672B1 (en) * 1997-12-03 2001-12-11 At&T Corp. Method and apparatus for watermarking digital bitstreams
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
US7006555B1 (en) * 1998-07-16 2006-02-28 Nielsen Media Research, Inc. Spectral audio encoding
GB2363300B (en) * 1998-12-29 2003-10-01 Kent Ridge Digital Labs Digital audio watermarking using content-adaptive multiple echo hopping
US6952774B1 (en) * 1999-05-22 2005-10-04 Microsoft Corporation Audio watermarking with dual watermarks
US7020285B1 (en) * 1999-07-13 2006-03-28 Microsoft Corporation Stealthy audio watermarking
US6571144B1 (en) * 1999-10-20 2003-05-27 Intel Corporation System for providing a digital watermark in an audio signal
JP3630071B2 (ja) * 2000-04-05 2005-03-16 日本電気株式会社 電子透かし検出器及びそれに用いる電子透かし検出方法
US6633654B2 (en) * 2000-06-19 2003-10-14 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
US6879652B1 (en) * 2000-07-14 2005-04-12 Nielsen Media Research, Inc. Method for encoding an input signal
WO2002049363A1 (en) * 2000-12-15 2002-06-20 Agency For Science, Technology And Research Method and system of digital watermarking for compressed audio

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101115124B (zh) * 2006-07-26 2012-04-18 日电(中国)有限公司 基于音频水印识别媒体节目的方法和装置
CN101290773B (zh) * 2008-06-13 2011-03-30 清华大学 自适应的mp3数字水印嵌入和提取方法
CN103430234A (zh) * 2011-03-17 2013-12-04 国际商业机器公司 具有编码信息的语音变换
CN103430234B (zh) * 2011-03-17 2015-06-10 国际商业机器公司 具有编码信息的语音变换
CN102194459A (zh) * 2011-05-11 2011-09-21 北京航空航天大学 一种基于avs音频编码的信息隐藏方法
CN102222504A (zh) * 2011-06-10 2011-10-19 深圳市金光艺科技有限公司 数字音频多层水印植入及提取方法
CN105706467A (zh) * 2013-09-17 2016-06-22 韦勒斯标准与技术协会公司 用于处理音频信号的方法和设备
CN105706467B (zh) * 2013-09-17 2017-12-19 韦勒斯标准与技术协会公司 用于处理音频信号的方法和设备
CN106416302A (zh) * 2013-12-23 2017-02-15 韦勒斯标准与技术协会公司 生成用于音频信号的滤波器的方法及其参数化装置
CN106416302B (zh) * 2013-12-23 2018-07-24 韦勒斯标准与技术协会公司 生成用于音频信号的滤波器的方法及其参数化装置
CN111192593A (zh) * 2014-07-15 2020-05-22 尼尔森(美国)有限公司 受众测量计量器、受众测量方法和计算机可读存储介质
US11942099B2 (en) 2014-07-15 2024-03-26 The Nielsen Company (Us), Llc Audio watermarking for people monitoring
CN111192593B (zh) * 2014-07-15 2024-05-17 尼尔森(美国)有限公司 受众测量计量器、受众测量方法和计算机可读存储介质
CN108475510A (zh) * 2015-12-23 2018-08-31 马尔科姆·罗 透明无损的音频水印增强
CN107871509A (zh) * 2016-09-23 2018-04-03 李庆成 数字音频信号处理方法

Also Published As

Publication number Publication date
KR20050066722A (ko) 2005-06-30
CA2491688A1 (en) 2005-06-27
US20050144006A1 (en) 2005-06-30
KR100595202B1 (ko) 2006-06-30
US7565296B2 (en) 2009-07-21
CA2491688C (en) 2013-09-24
CN100505873C (zh) 2009-06-24

Similar Documents

Publication Publication Date Title
CN1638479A (zh) 数字音频水印插入/检测装置及方法
CN1244904C (zh) 声频信号编码方法和设备
CA2418722C (en) Modulating one or more parameters of an audio or video perceptual coding system in response to supplemental information
CN1144400C (zh) 视频的压缩后隐藏数据的传送
CN1154087C (zh) 提高低比特率音频编码系统音质的方法、编码器和译码器
CN1663281A (zh) 用于从压缩多媒体内容中生成散列的方法
CN1808568A (zh) 具有水印插入/提取功能的音频编码/解码设备及其方法
CN1288624C (zh) 感觉噪声替换的方法和装置
CN101304522A (zh) 一种以jpeg2000压缩图像为载体的大容量信息隐藏方法
WO2003036624A1 (en) Method of transmission of wideband audio signals on a transmission channel with reduced bandwidth
CN1290054C (zh) 原始信息嵌水印、传带水印信息、重构水印的装置和方法
CN1231890C (zh) 编码设备、解码设备和广播系统
CN1795494A (zh) 位流水印嵌入
EP2248263A1 (en) Method and device of bitrate distribution/truncation for scalable audio coding
CN1792096A (zh) 在载体信号中嵌入二进制有效数据片断的设备和方法
KR20080105184A (ko) H.264/avc 표준용 워터마크 삽입 방법 및 시스템
CN1485849A (zh) 数字音频编码器及解码方法
Singh et al. Audio watermarking based on quantization index modulation using combined perceptual masking
KR101381602B1 (ko) 계층적 부호화 및 복호화 방법 및 장치
Xu et al. Performance analysis of data hiding in MPEG-4 AAC audio
CN111292756A (zh) 一种抗压缩音频无声水印嵌入和提取方法及系统
KR100685974B1 (ko) 워터마크 삽입/검출을 위한 장치 및 방법
CN1774067A (zh) 数字音频水印插入/检测装置及其方法
CN111968654A (zh) 一种自适应混合域音频水印嵌入方法
Deng et al. A novel steganography method based on modifying quantized spectrum values of MPEG/audio layer III

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090624

Termination date: 20171227

CF01 Termination of patent right due to non-payment of annual fee