CN101404171B - 音频/视频记录装置、音频/视频记录方法 - Google Patents
音频/视频记录装置、音频/视频记录方法 Download PDFInfo
- Publication number
- CN101404171B CN101404171B CN2008101499219A CN200810149921A CN101404171B CN 101404171 B CN101404171 B CN 101404171B CN 2008101499219 A CN2008101499219 A CN 2008101499219A CN 200810149921 A CN200810149921 A CN 200810149921A CN 101404171 B CN101404171 B CN 101404171B
- Authority
- CN
- China
- Prior art keywords
- audio
- video
- frame
- pts
- recording medium
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/02—Editing, e.g. varying the order of information signals recorded on, or reproduced from, record carriers
- G11B27/031—Electronic editing of digitised analogue information signals, e.g. audio or video signals
- G11B27/034—Electronic editing of digitised analogue information signals, e.g. audio or video signals on discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2562—DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Management Or Editing Of Information On Record Carriers (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Television Signal Processing For Recording (AREA)
- Indexing, Searching, Synchronizing, And The Amount Of Synchronization Travel Of Record Carriers (AREA)
Abstract
本发明涉及音频/视频记录装置、音频/视频记录方法。在记录时仅记录编辑点(步骤S4)。再现时,包含视频连接点,计算应最后再现的音频帧与应最初再现的音频帧的交迭时间(A_overlap),再根据该交迭时间来算出偏移时间(步骤S12)。通过使用算出的偏移时间来再现音频数据(步骤S14),可在连接点附近,消除音频帧的缝隙后再现。在连接点附近,通过在编码器侧和解码器侧进行音频数据的加幕处理,使连接源与连接目的的音频采样彼此平滑地结合。
Description
本申请为2004年4月2日递交的、国家申请号为200480009080.1、发明名称为“音频/视频记录装置、记录方法、再现装置、再现方法、再现程序和记录程序”的专利申请的分案申请。
技术领域
本发明涉及一种音频/视频记录装置以及音频/视频记录方法,尤其是涉及如下音频/视频记录装置以及音频/视频记录方法,即将同步记录于光盘等记录媒体中的视频数据与音频数据的组作为视频对象,记录在记录媒体中,连续再现多个视频对象各自的一部分或全部。
背景技术
将音频数据与视频数据记录在记录媒体中的方法有多种多样,有对录像磁带的模拟记录或数字记录、对盘媒体的模拟记录或数字记录,但近年来,因其高品位与存取性等,对盘媒体的数字记录成为主流。代表例是DVD(Digital Versatile Disc),使高品位的视频数据和音频数据无缝地对DVD-RW、DVD-RAM等记录型媒体进行记录/再现(例如参照再公表特许WO97/13364号公报(图47、图61))。
这里,作为视频数据的编码方式,一般使用MPEG(Moving Picture ExpertsGroup)视频。MPEG视频(主要是MPEG2视频)中,具有I图片、P图片、B图片种类来编码视频数据的各帧(或字段)。所谓I图片是可独立解码的图片,I是Intra的缩写。所谓P图片是使用I图片或其它P图片的前方预测来编码的图片,P是Prediction的缩写。所谓B图片是使用I图片或P图片的前方/后方预测来编码的图片,B是Bi-directional-prediction的缩写。另外,NTSC方式下的视频帧周期约为1/30秒(正确地是1/29.97秒),在PAL方式的情况下为1/25秒。
另一方面,作为音频数据的编码方式,大致存在线性PCM方式与压缩编码方式两种。在压缩编码方式中,多使用杜比数字(AC-3)或DTS(DigitalTheater System)、MPEG音频等。
在线性PCM方式中,传输采样及量子化后的数字数据。传输比特数使用16、20、24等。在采样频率中使用48kHz等。音频帧周期的设定是任意的。例如,使用1/600秒(在48kHz时,为80采样大小)等。
在压缩编码方式中,使用正交变换或听觉模块来压缩线性PCM数据。多数情况下,音频帧周期适用2的幂的采样数(或其整数倍),例如若在48kHz时为1024采样,则音频帧周期约为21msec(=1024/48000)。在压缩编码方式中,对音频帧使用2的幂的采样数的理由在于,将线性PCM采样数据变换为频谱的正交变换适于将2的幂的采样设为输入输出。
但是,在编码带声音的视频信号并记录在DVD等记录媒体中的情况下,由上述编码方式编码视频数据与音频数据,并由MPEG系统多路复用,例如作为MPEG程序流,记录在记录媒体上。下面,将这种多路复用流数据称为视频对象(VOB)。
此时,虽然VOB内的视频数据与音频数据同步,但视频帧周期与音频帧周期几乎不一致,以各个周期来记录。这是因为视频帧周期依赖于TV系统来唯一确定,音频帧周期另外设定例如考虑了压缩编码的效率化的最佳长度。图1中示出该方式。
如图1所示,视频帧周期(TV)与音频帧周期(TA)不同。是一连串的视频数据与音频数据被同步记录的实例,是在数据开头部分、视频数据与音频数据的帧开头一致的典型实例。在数据的中途,视频帧交界与音频帧交界基本上不一致(除去视频帧周期与音频帧周期的最小公倍数的位置)。
这里,考虑连续编辑分别记录的两个VOB的全部或各个部分并连续再现的用途。图2示出一例。图中示出从VOB(i)的时刻X连续到VOB(j)的时刻Y的实例。添加于视频帧的I、P、B文字表示已说明的图片类型。另外,请注意图中视频帧和音频帧都按再现时的顺序显示。在实际的VOB中,需要按Ii1、Pi1、Bi1、Bi2的顺序记录,Bi1或Bi2的解码可使用Ii1与Pi1来执行。
这里,为了在再现时再现VOB(i)的从时刻A至时刻X的各图片,并接着再现VOB(j)的从时刻Y至时刻B的各图片,必需注意该再现路线中包含的时刻X和时刻Y附近的图片类型。即,VOB(i)的Bi3与Bi4的解码中必需Pi2,而Pi2不存在于该再现路线中。因此,必需将例如Bi4变换为P图片类型Pi4’,将Bi3变换为Bi3’(Bi3’根据Pi1与Pi4’来编码)。
同样,VOB(j)的Pj1的解码需要Ij1,但Ij1不存在于该再现路线中。因此,必需例如将Pj1变换为I图片类型Ij1’。由此,可以Pi1→Bi3’→Pi4’→Ij1’→Bj3→Bj4等路线再现数据。为了方便,将连接后的连接点设为Z。
另外,上述说明是视频编码方式为使用MPEG等帧间预测的方式时的一例,例如如DV方式那样,在编码在各帧处完结的情况下,不必这种图片的变换处理。另外,即便在MPEG等情况下,例如选择连接源在I图片之前的B图片结束、连接对象在I图片开始的连接点的情况等下,也不必图片变换处理。
下面,考虑在连接点Z的视频帧的再现。在上述实例中,要求基本上没有在再现1视频帧周期的Pi4’帧之后再现Ij1’帧、即没有在Z点终止视频帧图像的无缝再现。为了执行无缝再现,一般需要满足以下条件。
(1)解码A→Z→B的路线所需的视频帧的数据包含于该路线中(上述说明)。
(2)配置记录数据,使系统中规定的缓冲器在A→Z→B的路线的数据读入中不引起缓冲器下溢。出于该目的,有时将Z附近的数据或A→Z→B的路线的数据全部或部分再记录在与连续编辑前的位置不同的位置上。
(3)在连接点Z的前后,执行复位系统时钟(STC)的处理。这是因为一般VOB(i)中的时间轴与VOB(j)中的时间轴不同,因此,时刻X的STC值与时刻Y的STC值具有不同的值。
这里,用图2来考虑连续编辑中的音频帧的处理。如上所述,在构成数据以使无缝连接视频帧之间的情况下,基本上在连接点无法无缝连接音频帧。这是因为音频帧周期与视频帧周期不同,不能期待在任意连接点,连接源的最终音频帧的再现结束时刻与连接对象的开头音频帧的再现开始时刻一致。因此,如图2中G所示,以前允许在音频帧之间存在缝隙。
图3表示考虑了图2的连结编辑时的现有再现装置的一例的框图。
图中,由未图示的再现机构从记录媒体101中读出的、图2中A→Z→B所示的路线的数据经由轨道缓冲器102(track buffer)输入到多路分配器103(demultiplexer)。多路分配器103解除视频帧与音频帧(或其它帧,未图示)的多路复用,视频帧经由视频缓冲器104输入视频解码器105,音频帧经由音频缓冲器106输入音频解码器107。
在视频解码器105与音频解码器107中,分别进行视频与音频的解码。在视频编码方式为MPEG等情况下,在视频解码器105的输出侧,装配将图片顺序改换为再现顺序的重排序缓冲器109。这里,STC电路108是根据从来自多路分配器103的VOB数据中抽取出的系统时钟参考(SCR)等基准时刻信号、计数STC的电路。在连接点Z也进行STC的复位。另外,在图2中G所示的音频再现的缝隙发生的位置,还担当发生表示该情况的控制信号(这里称为静音(mute)信号),并在缝隙期间静音音频解码器107。
之后,如图4所示,考虑在连续编辑点连接源的最终音频帧的再现结束时刻X与连接对象的开头音频帧的再现开始时刻Y一致的实例。此时,VOB(i)的Bi3与Bi4的解码中必需Pi2,但Pi2不存在于该再现路线中。因此,例如需要将Bi4变换为P图片类型Pi4’,将Bi3变换为Bi3’(Bi3’由Pi1与Pi4’编码而成)。
同样,VOB(j)的Pj1的解码中必需Ij1,但Ij1不存在于该再现路线中。因此,例如需要将Pj1变换为I图片类型Ij1’。由此,可由Pi1→Bi3’→Pi4’→Ij1’→Bj3→Bj4路线来再现数据。
另一方面,就音频数据而言,因为在连续编辑点连接源的最终音频帧的再现结束时刻X与连接对象的开头音频帧的再现开始时刻Y一致,所以如图4所示,在连接源的音频帧与连接对象的音频帧之间不产生缝隙。
发明内容
但是,上述说明的现有音频/视频记录再现方法和装置中,在任意的VOB彼此的连续编辑中、在连接点的音频再现中存在问题。即,在以无缝连接视频帧为基准的情况下,如图2所示,在以A→Z→B的路线无缝再现视频帧的情况下,在连接源与连接对象的音频帧之间产生缝隙G,音频再现在Z点附近的缝隙点瞬间静音,存在不能无缝再现的问题。
另外,如图4所示,即便在连续编辑点连接源的最终音频帧的再现结束时刻X与连接对象的开头音频帧的再现开始时刻Y一致的情况下,连接源的最后音频采样值与连接对象的最初音频采样值一般不连续,所以如图5所示,在解码的连接源音频波形a与解码的连接对象音频波形b的连接点Z产生噪声。这种音频采样的不连续在线性PCM或MPEG音频层I、II等基本上不正交变换音频信号而作为时间波形编码的全部方式下,连接原来不连续的音频帧彼此时被发现。
本发明鉴于上述问题而做出,其目的在于提供一种无噪声地无缝连续再现记录在光盘等记录媒体中的两个不同音频数据与视频数据组的音频/视频记录装置、记录方法、再现装置、再现方法、再现程序和记录程序。
为了实现上述目的,第1发明是一种音频/视频记录装置,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其中,具有音频编码单元,对于应记录的音频信号,执行包含加幕(curtaining)处理与正交变换处理的编码,输出音频数据;视频数据变换单元,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;编辑点确定单元,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;和记录单元,将编辑点作为登录信息记录在记录媒体中。
在本发明中,在可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中时,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧,并且,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻,并将该编辑点作为管理信息记录在记录媒体中,所以不用在记录时计算交迭时间或偏移时间。
另外,为了实现上述目的,第2发明是一种音频/视频记录方法,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其中,包含第1步骤,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;第2步骤,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;第3步骤,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;和第4步骤,将编辑点作为管理信息记录在记录媒体中。本发明与第1发明一样,不用在记录时计算交迭时间或偏移时间。
另外,为了实现上述目的,第3发明的音频/视频再现装置根据再现管理信息,从由第1发明的记录装置记录了视频对象和管理信息的记录媒体中,再现视频数据和音频数据,其中,具有交迭时间计算单元,包含根据再现管理信息得到的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间;偏移时间算出单元,在编辑点是指定的再现序列内的最初连接点的情况下,将计算出的交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把计算出的交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前编辑点的音频PTS偏移时间,并且,输出表示在规定条件下应在连接源的视频对象最后再现的音频帧不必在连接时再现的规定值的音频下落(drop)标志;复位单元,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;偏移单元,根据算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS;视频数据再现单元,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;音频帧再现单元,在根据偏移后的PTS再现从记录媒体中再现的音频帧的同时,当音频下落标志是规定值时,进行控制,以使不再现应在连接源的视频对象最后再现的音频帧;和音频解码单元,对由音频帧再现单元再现的音频帧,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,包含根据再现管理信息得到的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间,并且,计算用于偏移从记录媒体中读出的音频帧的PTS的音频PTS偏移时间,所以可根据偏移后的PTS来再现从记录媒体中再现的音频帧。
另外,为了实现上述目的,第4发明的音频/视频再现方法根据再现管理信息,从由第2发明的记录方法记录了视频对象和管理信息的记录媒体中,再现视频数据和音频数据,其特征在于:包含第1步骤,包含根据再现管理信息得到的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间;第2步骤,在编辑点是指定的再现序列内的最初连接点的情况下,将计算出的交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把计算出的交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前编辑点的音频PTS偏移时间,并且,输出表示在规定条件下应在连接源的视频对象最后再现的音频帧不必在连接时再现的规定值的音频下落标志;第3步骤,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;第4步骤,根据在第2步骤算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS;第5步骤,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;第6步骤,在根据在第4步骤偏移后的PTS再现从记录媒体中再现的音频帧的同时,当第3步骤中输出的音频下落标志是规定值时,进行控制,以使不再现应在连接源的视频对象最后再现的音频帧;和第7步骤,对由第6步骤再现的音频帧,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,与第3发明一样,包含根据再现管理信息得到的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间,并且,计算用于偏移从记录媒体中读出的音频帧的PTS的音频PTS偏移时间,所以可根据偏移后的PTS来再现从记录媒体中再现的音频帧。
另外,为了实现上述目的,第6发明的音频/视频记录装置,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其特征在于:具有音频编码单元,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;多路复用单元,多路复用音频数据与视频数据,生成视频对象;控制单元,在多路复用单元进行多路复用时,控制多路复用单元,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,并且,生成表示该音频多路复用状态的标志;和记录单元,将从由控制单元控制的多路复用单元输出的视频对象、与由控制单元生成的表示音频多路复用状态的标志一起记录在记录媒体中。
在本发明中,因为将音频数据多路复用于视频数据中来记录,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,所以,即便在再现时最大延迟1音频帧周期后再现的情况下,也不会产生音频缓冲器的上溢。
另外,为了实现上述目的,第7发明的音频/视频记录装置除第6发明外,其特征在于:还包括视频数据变换单元,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;编辑单元,确定音频帧的编辑点,并编辑音频帧,以便在连接点前后,使连接源的视频对象的音频帧的再现期间与连接对象的视频对象的音频帧的再现期间产生部分交迭;和第2记录单元,将编辑点作为登录信息记录在记录媒体中。
另外,为了实现上述目的,第8发明的音频/视频记录方法在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其特征在于:包含第1步骤,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;第2步骤,在将音频数据与视频数据多路复用时,进行控制,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下;和第3步骤,将表示在第2步骤控制下的音频多路复用状态的标志、与在第2步骤的控制下多路复用所得到的视频对象一起记录在记录媒体中。
在本发明中,因为将音频数据多路复用于视频数据中来记录,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,所以,即便在再现时最大延迟1音频帧周期后再现的情况下,也不会产生音频缓冲器的上溢。
另外,为了实现上述目的,第9发明的音频/视频记录方法除上述第8发明之外,其特征在于:还包含第4步骤,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;第5步骤,确定音频帧的编辑点,并编辑音频帧,以便在连接点前后,使连接源的视频对象的音频帧的再现期间与连接对象的视频对象的音频帧的再现期间产生部分交迭;和第6步骤,将编辑点作为管理信息记录在记录媒体中。
另外,为了实现上述目的,第10发明的音频/视频再现装置根据再现管理信息,从由第7发明的记录装置记录了视频对象和管理信息的记录媒体中,再现视频数据和音频数据,其中,具有交迭时间计算单元,对再现管理信息内的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间;偏移时间算出单元,在编辑点是指定的再现序列内的最初连接点的情况下,将计算出的交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把计算出的交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前编辑点的音频PTS偏移时间,并且,输出表示在规定条件下应在连接源的视频对象最后再现的音频帧不必在连接时再现的规定值的音频下落标志;复位单元,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;偏移单元,根据算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS;视频数据再现单元,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;音频帧再现单元,在根据偏移后的PTS再现从记录媒体中再现的音频帧的同时,当音频下落标志是规定值时,进行控制,以使不再现应在连接源的视频对象最后再现的音频帧;和音频解码单元,对由音频帧再现单元再现的音频帧,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,在从如下记录媒体再现视频数据和音频数据时,其中该记录媒体将音频数据多路复用于视频数据中来记录,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,即便在再现时最大延迟1音频帧周期后再现的情况下,也不会产生音频缓冲器的上溢。
另外,为了实现上述目的,第11发明的音频/视频再现装置的特征在于,第3发明或第10发明的偏移时间算出单元是如下单元,即在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志。
在本发明中,连接点之后的音频帧与视频帧的同步错位可设为1音频帧期间以内或±0.5音频帧期间以内的、基本上不能被检测为对口形(lip sync)错位的量。
另外,为了实现上述目的,第12发明的音频/视频再现方法根据再现管理信息,从由第9发明的记录方法记录了视频对象和管理信息的记录媒体中,再现视频数据和音频数据,其中,利用与第4发明一样的第1-第7步骤来进行再现。由此,包含根据再现管理信息得到的编辑点,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间,并且,计算用于偏移从记录媒体中读出的音频帧的PTS的音频PTS偏移时间,所以可根据偏移后的PTS来再现从记录媒体中再现的音频帧。
另外,为了实现上述目的,第13发明的音频/视频再现方法的特征在于:第4发明或第12发明的第2步骤在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志。
在本发明中,连接点之后的音频帧与视频帧的同步错位可设为1音频帧期间以内或±0.5音频帧期间以内的、基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第5发明或第14发明的音频/视频再现程序的特征在于,让计算机执行如下再现方法,即根据再现序列,从利用第2发明或第9发明的记录方法记录了包含视频对象和再现序列的记录媒体中,再现视频数据和音频数据。
另外,为了实现上述目的,第15发明的音频/视频记录装置,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其中,具有音频编码单元,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;视频数据变更单元,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;编辑点确定单元,确定音频帧的编辑点,使应在连接源的视频对象最后再现的音频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;交迭时间计算单元,包含连接点,计算应在最后再现的音频帧、与应在最初再现的音频帧的交迭时间;和记录单元,至少将交迭时间作为管理信息记录在记录媒体中。
在本发明中,在可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中时,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧,并且,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻,并包含连接点,算出应最后再现的音频帧与应最初再现的音频帧的交迭时间,作为管理信息记录在记录媒体中,所以不用在再现时计算交迭时间。
另外,为了实现上述目的,第16发明的音频/视频记录方法在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其特征在于:包含第1步骤,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;第2步骤,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;第3步骤,确定音频帧的编辑点,使应在连接源的视频对象最后再现的音频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;第4步骤,包含连接点,计算应在最后再现的音频帧、与应在最初再现的音频帧的交迭时间;和第5步骤,至少将交迭时间作为管理信息记录在记录媒体中。
在本发明中,与第15发明一样,因为包含连接点,算出应最后再现的音频帧与应最初再现的音频帧的交迭时间,作为管理信息记录在记录媒体中,所以不用在再现时计算交迭时间。
另外,为了实现上述目的,第17发明是一种音频/视频再现装置,根据再现序列,从由第15发明的记录装置记录了视频对象和该再现序列的记录媒体中,再现视频数据和音频数据,其特征在于:具有交迭时间再现单元,从记录媒体中再现交迭时间;偏移时间算出单元,在编辑点是再现序列内的最初连接点的情况下,将从记录媒体再现的交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把从记录媒体再现的交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前连接点的音频PTS偏移时间,并且,输出表示在规定条件下应在连接源的视频对象最后再现的音频帧不必在连接时再现的规定值的音频下落标志;复位单元,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;偏移单元,根据算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS;视频数据再现单元,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;音频帧再现单元,在根据偏移后的PTS再现从记录媒体中再现的音频帧的同时,当音频下落标志是规定值时,进行控制,以使不再现应在连接源的视频对象最后再现的音频帧;和音频解码单元,对由音频帧再现单元再现的音频帧,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,根据再现时从记录媒体读出的交迭时间,根据从记录媒体读出的连接点是再现序列内的最初连接点还是第2个之后的连接点,在作为当前连接点下的音频PTS偏移时间算出的同时,在规定的条件下输出规定值的音频下落标志,并根据算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,所以可不必算出再现侧的音频数据无缝再现用的音频PTS偏移时间。
另外,为了实现上述目的,第18发明的音频/视频再现装置的特征在于:第17发明中的偏移时间算出单元是如下单元,即在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志。
在本发明中,连接点之后的音频帧与视频帧的同步错位可设为1音频帧期间以内或±0.5音频帧期间以内的、基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第19发明的音频/视频再现方法根据再现序列,从由第16发明的记录方法记录了视频对象和该再现序列的记录媒体中,再现视频数据和音频数据,其特征在于:包含第1步骤,从记录媒体中再现交迭时间;第2步骤,在编辑点是再现序列内的最初连接点的情况下,将从记录媒体再现的交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把从记录媒体再现的交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前连接点的音频PTS偏移时间,并且,输出表示在规定条件下应在连接源的视频对象最后再现的音频帧不必在连接时再现的规定值的音频下落标志;第3步骤,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;第4步骤,根据第2步骤中算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS;第5步骤,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;第6步骤,在根据第4步骤中偏移后的PTS再现从记录媒体中再现的音频帧的同时,当第3步骤中输出的音频下落标志是规定值时,进行控制,以使不再现应在连接源的视频对象最后再现的音频帧;和第7步骤,对由第6步骤再现的音频帧,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,与第17发明一样,根据从记录媒体读出的交迭时间,作为当前连接点下的音频PTS偏移时间算出,并根据算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,所以可不必算出再现侧的音频数据无缝再现用的音频PTS偏移时间。
另外,为了实现上述目的,第20发明的音频/视频再现方法的特征在于:第19发明的第2步骤在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志。
并且,为了实现上述目的,将第21发明的音频/视频再现程序设为如下音频/视频再现程序,让计算机执行如下再现方法,该再现方法根据再现序列,从由第16发明的音频/视频记录方法记录了视频对象和该再现序列的记录媒体中,再现视频数据和音频数据。
另外,为了实现上述目的,第22发明的音频/视频记录装置在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其中,具有音频编码单元,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;视频数据变更单元,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;编辑点确定单元,确定音频帧的编辑点,使应在连接源的视频对象最后再现的音频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;交迭时间计算单元,包含连接点,计算应在最后再现的音频帧、与应在最初再现的音频帧的交迭时间;偏移时间算出单元,在编辑点是再现序列内的最初连接点的情况下,将交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前连接点的音频PTS偏移时间;和记录单元,至少将音频PTS偏移时间作为管理信息记录在记录媒体中。
在本发明中,在可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中时,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧,并且,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻,在编辑点是再现序列内的最初连接点的情况下,将交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前连接点的音频PTS偏移时间,作为管理信息记录在记录媒体中,所以连接点之后的音频帧与视频帧的同步错位可设为基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第23发明的音频/视频记录装置的特征在于:第22发明的偏移时间算出单元是如下单元,即在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志,记录单元将音频PTS偏移时间与音频下落标志作为管理信息记录在记录媒体中。在本发明中,连接点之后的音频帧与视频帧的同步错位可设为1音频帧期间以内或±0.5音频帧期间以内的、基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第24发明的音频/视频记录方法在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体中时,可指定连续再现多个视频对象各自的部分或全部的再现序列地记录在记录媒体中,其特征在于:包含第1步骤,对于应记录的音频信号,执行包含加幕处理与正交变换处理的编码,输出音频数据;第2步骤,根据需要变更视频数据,以使在连接点无缝再现应在连接源的视频对象最后再现的视频帧、和应在连接对象的视频对象最初再现的视频帧;第3步骤,确定音频帧的编辑点,使应在连接源的视频对象最后再现的音频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻;第4步骤,包含连接点,计算应在最后再现的音频帧、与应在最初再现的音频帧的交迭时间;第5步骤,在编辑点是再现序列内的最初连接点的情况下,将交迭时间设为再现连接对象的视频对象的音频帧时的音频PTS偏移时间,在编辑点是再现序列内的第2个之后的连接点的情况下,将把交迭时间与一个之前的连接点处的音频PTS偏移时间相加后的值算出作为在当前连接点的音频PTS偏移时间;和第6步骤,至少将音频PTS偏移时间作为管理信息记录在记录媒体中。在本发明中,与第22发明的音频/视频记录装置一样,连接点之后的音频帧与视频帧的同步错位可设为基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第25发明的音频/视频记录方法的特征在于:第24发明的第5步骤是如下步骤,即在算出的连接点处的音频PTS偏移时间比音频帧时间的n倍(其中,n为1或1/2)的期间大的情况下,算出从该音频PTS偏移时间中减去音频帧期间后的值,作为最终的音频PTS偏移时间,并且,输出表示应在连接源的视频对象最后再现的音频帧在连接时不必再现的规定值的音频下落标志,第6步骤将音频PTS偏移时间与音频下落标志作为管理信息记录在记录媒体中。本发明与第23发明的音频/视频记录装置一样,连接点之后的音频帧与视频帧的同步错位可设为1音频帧期间以内或±0.5音频帧期间以内的、基本上不能被检测为对口形错位的量。
另外,为了实现上述目的,第26发明的音频/视频再现装置根据再现序列,从由第22或第23发明的记录装置记录了视频对象和该再现序列的记录媒体中,再现视频数据和音频数据,其中,具有复位单元,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;偏移单元,根据从记录媒体读出的音频PTS偏移时间,偏移从该记录媒体中读出的音频帧的PTS;视频数据再现单元,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;音频数据再现单元,根据偏移后的PTS,再现从记录媒体中再现的音频数据;下落处理单元,进行控制,当从记录媒体再现的音频下落标志是规定值时,不再现应在该视频对象的最后再现的音频帧;和音频解码单元,对由音频帧再现单元再现的音频数据,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,因为根据再现时从记录媒体中读出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,所以不必算出再现侧的音频数据无缝再现用的音频PTS偏移时间。
另外,为了实现上述目的,第27发明的音频/视频再现方法根据再现序列,从由第22或第23发明的记录装置记录了视频对象和该再现序列的记录媒体中,再现视频数据和音频数据,其特征在于:包含第1步骤,复位装置的系统时钟(STC),以在再现序列中包含的视频对象的各连接点处,无缝连接连接对象的视频帧彼此;第2步骤,根据从记录媒体读出的音频PTS偏移时间,偏移从该记录媒体中读出的音频帧的PTS;第3步骤,根据附带于该视频数据的视频PTS,再现从记录媒体中再现的视频数据;第4步骤,根据偏移后的PTS,再现从记录媒体中再现的音频数据;第5步骤),进行控制,当从记录媒体再现的音频下落标志是规定值时,不再现应在该视频对象的最后再现的音频帧;和第6步骤,对由第4步骤再现的音频数据,执行包含加幕处理与正交逆变换处理的解码,输出音频信号。
在本发明中,与第26发明的音频/视频再现装置一样,因为根据再现时从记录媒体中读出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,所以不必算出再现侧的音频数据无缝再现用的音频PTS偏移时间。
另外,本发明的第28发明的音频/视频记录程序的特征在于,由计算机执行第24发明的音频/视频记录方法,本发明的第29发明的音频/视频再现程序的特征在于,由计算机执行第27发明的音频/视频再现方法。
附图说明
图1是表示视频帧与音频帧的关系一例的图。
图2是现有的连接编辑与视频/音频再现的原理图。
图3是现有的再现装置一例的框图。
图4是现有的连接编辑与视频/音频再现的另一原理图。
图5是现有的连接点处的音频波形的一例。
图6是本发明的连接编辑与视频/音频再现的原理图。
图7是本发明主要部分的音频编码块和音频解码块的一实施方式的框图及表示窗口函数一例的图。
图8是本发明的第1实施方式的连接编辑与视频/音频再现的原理图。
图9是本发明的视频/音频记录装置的实施方式I的框图。
图10是本发明的视频/音频记录方法的实施方式I的流程图。
图11是本发明的视频/音频再现装置的实施方式I的框图。
图12是本发明的视频/音频再现方法的实施方式I的流程图。
图13是考虑了音频缓冲器占有量的情况下的、本发明记录方法一实施方式的流程图。
图14是考虑了音频缓冲器占有量的情况下的、本发明编辑方法一实施方式的流程图。
图15是本发明的第2实施方式的连接编辑与视频/音频再现的原理图。
图16是本发明的视频/音频记录装置的实施方式II的框图。
图17是本发明的视频/音频记录方法的实施方式II的流程图。
图18是本发明的视频/音频再现装置的实施方式II的框图。
图19是本发明的视频/音频再现方法的实施方式II的流程图。
图20是本发明的视频/音频记录装置的实施方式III的框图。
图21是本发明的视频/音频记录方法的实施方式III的流程图。
图22是本发明的视频/音频再现装置的实施方式III的框图。
图23是本发明的视频/音频再现方法的实施方式III的流程图。
具体实施方式
下面,参照附图来说明本发明的实施方式。
图6表示本发明的音频/视频记录装置、记录方法、再现装置、再现方法和再现程序的一实施方式中的连接编辑与音频/视频再现的实例。图中,向与图2相同的部分附加相同符号,省略其说明。图6的实施方式与图2的现有例一样,是从VOB(i)时刻X连接到VOB(j)时刻Y的实例,但在本实施方式中,以下两点与现有例不同。
(1)在连接编辑后VOB(i)中有效的最后音频帧是包含时刻X的音频帧(在音频帧的再现结束时刻与时刻X相等的情况下,包含 (*1)。)。同样,在连接编辑后VOB(j)中有效的最初音频帧是包含时刻Y的音频帧(在音频帧的再现开始时刻与时刻Y相等的情况下,包含(*2)。)。即,在连接后的Z点,VOB(i)最后的音频帧与VOB(j)的最初音频帧交迭。图6中由OL表示的交迭部分在本说明书中被称为音频交迭(A_overlap)。另外,同时满足上述*1与*2的情况下,A_overlap为0。
(2)在VOB(j)的音频再现中,以取消上述A_overlap的大小来偏移音频帧的再现时刻(PTS:Presentation Time Stamp)后再现。该偏移量在本说明书中被称为音频PTS偏移(A_PTS_offset_。
这样,在本实施方式中,可偏移后续的VOB的音频帧,并在连接后附近,消除音频帧的缝隙地连接,解决上述问题之一。
另外,因为不产生连接点处的不连续噪声,所以在本实施方式中,致力于音频编码方式的选择。
图7(A)表示本发明的音频/视频记录装置和再现装置的音频编码块和音频解码块的一实施方式的框图。
如图7(A)所示,在音频编码块中,输入音频信号由加幕部11进行基于与窗口函数的乘法的加幕处理之后,提供给正交变换部12,进行正交变换,再提供给量化/编码部13,根据规定采样频率,进行量化后,执行规定方式的压缩编码。由此得到的压缩编码音频数据与由未图示的音频数据记录系统压缩编码的视频数据一起,由未图示的多路复用部通过MPEG系统的多路复用,例如作为MPEG程序流,由公知的记录单元记录在记录媒体14上。
另一方面,由公知的再现单元从记录媒体14中再现的多路复用流在由未图示的分离部分离成音频数据与视频数据之后,将视频数据输出到未图示的视频数据再现系统,将音频数据提供给音频解码块内的解码/逆量化部15,进行解码。进行了解码和逆量化的音频数据由正交逆变换部16进行正交逆变换之后,提供给加幕部17,进行基于与规定窗口函数的乘法的加幕处理,之后,恢复成音频信号。
下面,参照图7(B)-(D)来说明加幕部11和17使用的窗口函数。各音频帧的窗口函数如图7(C)所示,形成将左肩设为f(x)、将右肩设为g(x)的左右对称形。这里,中央的平坦部分可有可无。在图7(B)中模式表示的相邻音频帧(i)与(i+1)之间,音频帧(i)的窗口函数g(x)部分与音频帧(i+1)的窗口函数f(x)部分交迭。
这里,请注意实际上由音频帧(i)编码的音频采样为图7(B)所示的(i)范围所示的部分。若考虑在编码侧的加幕部11与解码侧的加幕部17各执行两次加幕,则上述音频帧(i)与(i+1)的交迭部分需要满足
f(x)2+g(x)2=1.0...[式1]
作为这种窗口函数的一例,有
f(x)=sin(x)...[式2]
g(x)=cos(x)...[式3]
但只要满足[式1],则无论是何函数均无妨。
在采用使用这种窗口函数的音频编码方式的情况下,即便连续原本不连续的音频帧彼此的情况下,也如图7(D)所示,由于利用基于2次加幕的f(x)2与g(x)2的窗口函数,音频采样彼此平滑地结合,所以在连接点不会产生不连续噪声。因此,解决第二个问题。即,由上述解决共计两个问题,实现音频帧彼此的无缝连接。
<第1实施方式的连续编辑与音频/音频再现>
下面,使用与图关联的算式,详细说明第1实施方式。图8表示按顺序连续编辑VOB1、VOB2、VOB3各自一部分时的音频/视频记录方法和再现方法的第1实施方式(另外,这里省略连接前的VOB1、VOB2、VOB3的图。为了方便,图8的各VOB中包含的视频/音频帧数少,但请注意,现实中,各VOB中包含相当于从数十秒至数小时程度的帧群。)。另外,在图8和后述的图15中,Tv是已说明的视频帧周期。
图8中,由虚线矩形表示的音频帧群是连接前的状态,由实线矩形表示的音频帧群是连接后的状态。另一方面,视频帧群全部以连接后的状态显示。下面,参照图8和之后的图来统一说明本实施方式中使用的变量种类。另外,以下的k为正整数,在图8的实例中,代入1、2、3之一。
图8中,STCk是表示VOBk再现中使用的STC值的相加的模式表现。STC_deltak是STC(k-1)与STCk的差,由下式表示。
STC_deltak=STC(k—1)—STCk...[式4]
另外,TA如上所述,是音频帧周期。A_overlapk如上所述,是VOBk与VOB(k-1)之间的音频帧彼此的交迭时间。另外,在本例中,由于VOB1是开头,所以A_overlap1=0。
另外,A_PTS_offsetk如上所述,是对VOBk再现时的音频PTS的必需的偏移时间。另外,在本例中,因为VOB1是开头,所以A_PTS_offset1=0。PTSkaudio_end是VOBk的最后音频帧的再现开始时刻(PTS值)。另外,这是连续编辑前的值。
PTSkaudio_start是VOBk的最初音频帧的再现开始时刻(PTS值)。另外,这是连续编辑前的值。此时,可如下计算A_overlapk。
A_overlapk=(PTSk-1audio_end+TA)—(PTSkaudio_start+STC_deltak)...
[式5]
另外,[式5]的右边第二项为了将STCk上的时刻映射到STC(k-1)上,追加STC_deltak。
之后,由于A_PTS_offsetk是偏移后续的VOB的音频帧群以使A_overlapk基本上为零的量,所以就图8的k=2而言,成立
A_PTS_offset2=A_overlap2...[式6]
并且,就图8的k=3而言,由于k=2时已按A_PTS_offset2的量来偏移VOB2的音频帧群,所以除了原来的A_overlap3外,还将A_PTS_offset2大小的交迭量相加。因为这为零,所以就k=3而言,基本上要求
A_PTS_offset3=A_overlap3+A_PTS_offset2...[式7]
。因此,作为一般式,成立
A_PTS_offsetk=A_overlapk+A_PTS_offsetk-1。
但是,这里在A_PTS_offsetk比音频帧周期TA大的情况下,通过从再现开始去除VOB(k-1)的最后的音频帧,可减少A_PTS_offsetk的量。图8中,使由X标记表示的帧脱落。下面示出该条件式。这里,AF_dropk-1是在使VOB(k-1)的最后音频帧脱落的情况下保持值1(不脱落的情况保持值0)的音频下落标志。图8的情况下,有AF_drop2=1。
If(A_PTS_offsetk>=TA){
A_PTS_offsetk=A_PTS_offsetk—TA;
AF_dropk-1=1;
}else AF_dropk-1=0;...[式9]
若执行这种脱落处理,则可防止在VOB的连接次数增加的情况下,A_PTS_offset的值累积而变得过大。
在本发明中,在连接后的VOBk处,根据与原来的视频帧的同步关系,将音频帧错位A_PTS_offset大小后再现。一般,该错位对对口形造成影响,若错位比1-2视频帧周期大,则可检测对口形的恶化。因此,最好A_PTS_offset值不会变得过大。例如,若音频帧周期TA为视频帧周期Tv以下,则将的A_PTS_offset抑制在音频帧周期TA以内是有效的。
<音频/视频记录装置的实施方式I>
下面,说明本发明的音频/视频记录装置的实施方式I。图9表示本发明的音频/视频记录装置的实施方式I的框图。这里,设多个VOB的记录结束,说明它们的连接编辑动作。
图9中,用户接口部25、管理信息控制部26和对象控制部27构成MPU块22,由MPU(Micro Processing Unit)的软件处理实现。
首先,通过用户接口部25从用户提供编辑指示。管理信息控制部26使用对应的管理信息来确认连接编辑点。此时,首先如上所述,确定音频帧的编辑点,以在连接点处存在音频帧的交迭。之后,根据需要对视频帧进行图片类型的变换处理。这通过对象控制部27、视频/音频编码块24、媒体记录控制部23来进行,写入记录媒体21中。
<音频/视频记录方法的实施方式I>
下面,进行音频无缝连接用的计算与记录。参照图10的流程图来说明本发明的音频/视频记录方法的实施方式I的音频无缝连接用的计算与记录。
首先,管理信息控制部26确定连接对象VOB,并且,确定视频连接点(应在连接源的VOB最后再现的视频帧、与应在连接对象的VOB最初再现的视频帧的连接点)(步骤S1)。之后,根据视频连接点,判断是否需要视频图片类型的变更处理,在需要的情况下,进行变更的具体准备(步骤S2)。
之后,应对于视频连接点,确定音频帧编辑点(步骤S3)。即,确定音频帧编辑点,以使应在连接源的VOB最后再现的音频帧的再现期间包含视频帧连接点的时刻,并且,应在连接对象的VOB最初再现的音频帧的再现期间包含视频连接点的时刻。最后,将编辑后的VOB(连接点附近的数据)通过对象控制部27和媒体记录控制部23写入记录媒体21中(步骤S4)。此时,上述编辑点的信息也作为管理信息写入记录媒体21中。另外,视频/音频编码块24中的音频编码块具有图7(A)的编码侧的构成。
另外,图10中说明的记录方法可由图9说明的专用装置来实施,另一方面,请注意,也可作为具有该记录媒体的记录功能的计算机上的程序来实施。
<音频/视频再现装置的实施方式I>
下面,说明本发明的音频/视频再现装置的实施方式I。图11表示本发明的音频/视频再现装置的实施方式I的框图。
图11中,在记录媒体31中记录由图9所示的记录装置编辑记录的编辑后的VOB。另外,用户接口部36、管理信息控制部37、A_overlap计算部38、A_PTS_offset计算部39和对象控制部40构成MPU块41。
在该再现装置中,首先,经用户接口部36将再现指示取到管理信息控制部37。由再现指示来指定一般应再现哪个再现序列。设在再现序列中登录连续再现多个VOB的信息。下面,表示VOB数据再现的基本步骤。
登录在再现序列中的VOB的再现关联信息由管理信息控制部37判断,经对象控制部40和媒体再现控制部32从记录媒体31读出VOB数据。另外,编辑点等管理信息已经媒体再现控制部32从记录媒体31读出,始终保存在MPU块40内的存储器(未图示)中。
由媒体再现控制部32将读出的VOB数据提供给多路分配器33,这里,分离成视频数据与音频数据,将视频数据提供给视频解码块34,将音频数据提供给具有示为图7(A)的解码侧的构成的音频解码块35,根据附带于该视频数据的视频PTS来解码视频数据,构成视频帧,另外,根据偏移后的PTS来解码音频数据。另外,在AF_drop=1的情况下,不再现该VOB的最后的音频帧。
此时,SCR等时钟信息由多路分配器33解读,根据需要传递给MPU块40。另外,将STC等时钟信息从MPU块40传递给多路分配器33、视频解码块34和音频解码块35,依据STC来控制再现定时。
下面,详细说明音频的再现。在本实施方式中,因为记录媒体31中应在所述连接源的视频对象最后再现的音频帧、应在连接对象的视频对象最初再现的音频帧的交迭时间A_overlap、与表示用于偏移后续的VOB的音频帧群以使A_overlap为零后进行再现的偏移量的A_PTS_offset未记录在记录媒体31中,所以在再现侧计算使用。
即,A_overlap计算部38将根据输入到管理信息控制部37中的再现序列信息得到的编辑点处的信息代入上述[式5]中,计算交迭时间A_overlap。另外,A_PTS_offset计算部39经管理信息控制部37输入由A_overlap计算部38计算的连接点处的A_overlap后,计算A_PTS_offset。
A_PTS_offset计算部39根据输入的A_overlap,利用[式8]的运算式,算出A_PTS_offset,再根据[式9]的条件式,算出AF_drop,并将它们提供给管理信息控制部37。管理信息控制部37将输入的A_PTS_offset及AF_drop提供给音频解码块35,并将音频帧的再现定时偏移A_PTS_offset大小后再现。另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频帧。
<音频/视频再现方法的实施方式I>
下面,用图12的流程图来说明本发明的音频/视频再现方法的实施方式I。
首先,确定应再现的序列,确认该序列中包含的VOB的信息(步骤S11)。之后,在每个VOB连接点,由A_overlap计算部38计算连接点处的A_overlap,再根据该A_overlap,由A_PTS_offset计算部39计算A_PTS_offset(和AF_drop)(步骤S12)。
接着,与VOB的再现开始同时或在这之前,复位STC,以便能无缝连接,并且,将由A_PTS_offset计算部39计算的A_PTS_offset(和AF_drop)设置到音频解码块35(步骤S13)。
之后,从记录媒体31中实际读出VOB数据,经媒体再现控制部32和多路分配器33,将视频数据提供给视频解码块34,将音频数据提供给音频解码块35,分别进行解码,再现视频帧和音频帧(步骤S14)。在AF_drop=1的情况下,进行处理,以不再现VOB的最后的音频帧(步骤S15)。
如此再现的音频帧在由音频解码块35内的图7(A)所示的解码器进行包含加幕处理与正交逆变换处理的编码后,作为音频信号输出。之后,对再现序列中的全部VOB判断是否实施了上述处理(步骤S16),若是最终的VOB,则结束再现(步骤S17)。
另外,图12中说明的再现方法可由图11中说明的再现装置来实施,但另一方面,应注意也可作为具有该记录媒体的再现功能的计算机上的程序来实施。
这样,根据本实施方式,除视频帧的无缝连接外,音频帧也可不产生连接点处的不连续噪声地无缝连接。
下面,就图11的再现装置,说明包含于音频解码块35中的音频缓冲器(未图示)。一般,所需的音频缓冲器的量由音频编码方式的种类与运用时的比特速率来确定。在本发明的第1实施方式中,从音频缓冲器至音频解码器的数据传输最大延迟1音频帧周期大小。因此,本发明中所需的音频缓冲器的量为在未适用本发明的‘A_PTS_offset=0’时的音频缓冲器量中加上1音频帧大小的数据量后的量。
因此,在对音频缓冲器尺寸设置上限的情况下,在记录包含音频流的VOB时,若将从音频缓冲器尺寸上限中减去1音频帧大小的数据量的缓冲器占有量设为上限,多路复用音频数据,则即便在再现时最大延迟1音频帧周期后再现的情况下,也不会产生音频缓冲器的下溢。此时,若在盘上记录表示在音频缓冲器占有量不超过(音频缓冲器尺寸上限-1音频帧大小的数据量)下被多路复用的标志(这里设为audio_mux_status标志),则得到构成本发明的音频无缝连接时的指标。
图13表示考虑audio_mux_status标志后记录VOB时的本发明的音频/视频记录方法的一实施方式的流程图。这里,在多路复用以使得音频缓冲器尺寸占有量为(音频缓冲器尺寸上限-1音频帧大小的数据量)以下的情况下,设audio_mux_status=1,否则,定义为0。
下面,参照图13和图9来说明上述记录方法。首先,MPU块22内的管理信息控制部26确定是否多路复用,以满足该音频缓冲器条件(规定的音频多路复用状态)(图13的步骤S21)。此时,根据需要,经用户接口部25接收用户的指示。
在满足上述条件的情况下,利用来自从管理信息控制部26接收条件满足通知的对象控制部27的指示,视频/音频编码块24将音频数据与视频数据多路复用,使音频缓冲器占有量为从规定的音频缓冲器上限中减去1音频帧大小的数据量后的值以下,并经媒体记录控制部23将该多路复用后得到的VOB记录在记录媒体21中(图13的步骤S22)。另外,管理信息控制部26将表示音频多路复用状态的audio_mux_status标志设为1,与其它管理信息一起,经媒体记录控制部23记录在记录媒体21中(图13的步骤S23)。
另一方面,在步骤S21中,管理信息控制部26判断为不满足音频缓冲器条件(或不保障满足条件)的情况下,利用来自从管理信息控制部26接收条件满足否定通知的对象控制部27的指示,视频/音频编码块24经媒体记录控制部23,将由通常的音频缓冲器条件得到的VOB记录在记录媒体21中(图13的步骤S24)。另外,由管理信息控制部26与其它管理信息一起生成的、将值设定成0的上述audio_mux_status经媒体记录控制部23记录在记录媒体21中(图13的步骤S25)。
图14表示在考虑audio_mux_status标志来编辑VOB的情况下的、本发明的音频/视频编辑方法的一实施方式的流程图。与图10一样,图9的管理信息控制部26确定连接对象VOB,并且,确定视频连接点(应在连接源的VOB最后再现的视频帧与应在连接对象的VOB最初再现的视频帧的连接点)(图14的步骤S31)。之后,根据视频连接点,判断是否需要视频图片类型的变更处理,在需要的情况下,进行变更的具体准备(图14的步骤S32)。
之后,在确定视频连接点之后,管理信息控制部26确认关联于经图9的媒体记录控制部23从记录媒体21读出的管理信息内的连接对象的VOB的audio_mux_status标志值是否为1(图14的步骤S33)。在audio_mux_status标志值为1的情况下,根据本发明,确定音频帧编辑点,以构成音频交迭(图14的步骤S34)。在audio_mux_status标志值为0的情况下,根据现有技术,确定音频帧编辑点,以构成音频缝隙(图14的步骤S35)。
在步骤S34或S35的处理之后,编辑后的VOB(连接点附近的数据)通过对象控制部27和媒体记录控制部23写入记录媒体21中,并且,编辑点的信息也作为管理信息写入记录媒体21中(图14的步骤S36)。
另外,在上述第1实施方式中,就编辑后的数据(视频数据、音频数据)的记录部位而言,只要在考虑了使用的记录媒体或依赖于构成前提的再现装置的寻轨条件等的情况下,能保障无缝再现即可,不特别限定为本发明。即,无论数据的记录部位如何,在实质上具有音频交迭后构成编辑数据,具有音频PTS偏移后能再现的情况下,满足本发明的精神。
<第2实施方式的连接编辑与视频/音频再现>
下面,就本发明的第2实施方式而言,主要说明与第1实施方式的差异。在图8中示出连接编辑与视频/音频再现原理的第1实施方式中,A_PTS_offset的值通常为零以上(时间延迟)。相反,在图15所示的第2实施方式中,也允许A_PTS_offset的值为负(时间前进)。换言之,在第1实施方式中,基本上为0≦A_PTS_offset<TA,而在第2实施方式中,基本上为-0.5×TA<A_PTS_offset≦0.5×TA(或-0.5×TA≦A_PTS_offset<0.5×TA)时的实例。
第2实施方式虽可原样适用[式4]-[式8],但[式9]如上所述,由于规定A_PTS_offset的值域,所以被置换为下式。
If(A_PTS_offsetk>0.5×TA){
A_PTS_offsetk=A_PTS_offsetk-TA;
AF_dropk-1=1;
}else AF_dropk-1=0;...[式10]
这里,进一步说明图15中的计算。在图15的第一连接点中,首先,由[式6],A_PTS_offset2=A_overlap2,但在本实例中,因为A_PTS_offset2比0.5×TA大,所以[式10]的If语句为真,A_PTS_offset2为负值(偏移变为时间前进)。同时,AF_drop1=1。即,VOB1的最后音频帧从再现中脱落。图15中示出脱落后的状态。
之后,在图15的第二连接点,由[式7],A_PTS_offset3被计算为A_overlap3与A_PTS_offset2之和。在本实例中,因为A_PTS_offset2为负值,所以A_PTS_offset3为比A_overlap3小的值。另外,因为A_PTS_offset3比0.5×TA小,所以[式10]的If语句为假,A_PTS_offset3为正值(偏移变为时间延迟)。同时,AF_drop2=0。
第2实施方式的上述以外的构成与第1实施方式一样。即,如图9、图10、图11、图12所示的记录/编辑装置和方法、再现装置和再现方法那样,在再现时,在每个VOB连接点,计算A_overlap,再根据该A_overlap,计算A_PTS_offset(和AF_drop),将计算出的A_PTS_offset(和AF_drop)提供给音频解码块35,进行控制,使得音频帧的再现定时偏移A_PTS_offset大小后再现,另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频帧。
这样,本实施方式也与第1实施方式一样,除视频帧的无缝连接外,音频帧也可不产生连接点处的不连续噪声地无缝连接。另外,本实施方式也与第1实施方式一样,编辑方法或再现方法也可作为计算机上的程序来实施。
下面,就图11的再现装置,说明包含于音频解码块35中的音频缓冲器(未图示)。一般,所需的音频缓冲器的量由音频编码方式的种类与运用时的比特速率来确定。在本发明的第1实施方式中,从音频缓冲器至音频解码器的数据传输最大延迟1音频帧周期大小。因此,本发明中所需的音频缓冲器的量为在未适用本发明的‘A_PTS_offset=0’时的音频缓冲器量中加上1音频帧大小的数据量后的量。
另一方面,在第2实施方式中,若考虑最大0.5音频帧周期延迟,则所需的音频缓冲器的量为在未适用本发明的‘A_PTS_offset=0’时的音频缓冲器量中加上1音频帧大小的数据量后的量。并且,在第2实施方式中,若考虑提前最大0.5音频帧周期从音频缓冲器向音频解码器传输数据,则在生成VOB时,必需进行使再现时的音频缓冲器占有量始终为1音频帧数据量以上的多路复用。
因此,在对音频缓冲器尺寸设置上限的情况下,在记录包含音频流的VOB时,若将从音频缓冲器尺寸上限中减去1音频帧大小的数据量的缓冲器占有量设为上限,多路复用音频数据,则即便在再现时最大延迟0.5音频帧周期后再现的情况下,也不会产生音频缓冲器的下溢。此时,若在盘上记录表示在音频缓冲器占有量不超过(音频缓冲器尺寸上限-1音频帧大小的数据量)下被多路复用的标志(这里设为audio_mux_status标志),则得到构成本发明的音频无缝连接时的指标。
另外,在第2实施方式的情况下,若准备表示多路复用以使得音频缓冲器占有量始终为1音频帧数据量以上的标志,则根据该实施方式,得到构成音频无缝连接时的指标。该标志与在先的audio_mux_status标志可以是不同标志,也可以是相同标志。在第2实施方式中,除在音频缓冲器条件中加入音频缓冲器占有量始终为1音频帧数据量以上的条件外,可由与图13和图14相同的处理步骤来进行记录与编辑。
另外,就编辑后的数据(视频数据、音频数据)的记录部位而言,只要在考虑了使用的记录媒体或依赖于构成前提的再现装置的寻轨条件等的情况下,能保障无缝再现即可,不特别限定为本发明。即,无论数据的记录部位如何,在实质上具有音频交迭后构成编辑数据,具有音频PTS偏移后能再现的情况下,满足本发明的精神。
<音频/视频记录/再现的其它实施方式>
下面,说明在先说明的本发明的音频/视频记录装置/方法和再现装置/方法的其它实施方式。
<音频/视频记录装置的实施方式II>
图16表示本发明的音频/视频记录装置的实施方式II的框图。这里,设多个VOB的记录结束,说明它们的连接编辑动作。
图16中,用户接口部45、管理信息控制部46、A_overlap计算部47、和对象控制部48构成MPU块42,由MPU(Micro Processing Unit)的软件处理实现。
首先,通过用户接口部45从用户提供编辑指示。管理信息控制部46使用对应的管理信息来确认连接编辑点。此时,首先如上所述,确定音频帧的编辑点,以在连接点处存在音频帧的交迭。之后,根据需要对视频帧进行图片类型的变换处理。这通过对象控制部48、视频/音频编码块44、媒体记录控制部43来进行,写入记录媒体41中。
<音频/视频记录方法的实施方式II>
下面,进行音频无缝连接用的计算与记录。参照图17的流程图来说明本发明的音频/视频记录方法的实施方式II的音频无缝连接用的计算与记录。
首先,管理信息控制部46确定连接对象VOB,并且,确定视频连接点(应在连接源的VOB最后再现的视频帧、与应在连接对象的VOB最初再现的视频帧的连接点)(步骤S41)。之后,根据视频连接点,判断是否需要视频图片类型的变更处理,在需要的情况下,进行变更的具体准备(步骤S42)。
之后,应对于视频连接点,确定音频帧编辑点(步骤S43)。即,确定音频帧编辑点,以使应在连接源的VOB最后再现的音频帧的再现期间包含视频帧连接点的时刻,并且,应在连接对象的VOB最初再现的音频帧的再现期间包含视频连接点的时刻。
之后,A_overlap计算部47进行所述的A_overlap计算(步骤S44)。最后,将编辑后的VOB(连接点附近的数据)、计算出的A_overlap与再现序列等管理信息通过对象控制部48和媒体记录控制部43写入记录媒体41中(步骤S45)。再现序列中包含应再现的VOB的信息、连接点的信息等。另外,视频/音频编码块44中的音频编码块具有图7(A)的编码侧的构成。
另外,图17中说明的记录方法可由图16说明的专用装置来实施,另一方面,请注意,也可作为具有该记录媒体的记录功能的计算机上的程序来实施。
<音频/视频再现装置的实施方式II>
下面,说明本发明的音频/视频再现装置的实施方式II。图18表示本发明的音频/视频再现装置的实施方式II的框图。
图18中,在记录媒体51中记录由图16所示的记录装置编辑记录的编辑后的VOB或管理信息。另外,用户接口部56、管理信息控制部57、A_PTS_offset计算部58和对象控制部59构成MPU块60。
在该再现装置中,首先,经用户接口部56将再现指示取到管理信息控制部57。由再现指示来指定一般应再现哪个再现序列。设在再现序列中登录连续再现多个VOB的信息。下面,表示VOB数据再现的基本步骤。
登录在再现序列中的VOB的再现关联信息由管理信息控制部57判断,经对象控制部59和媒体再现控制部52从记录媒体51读出VOB数据。另外,再现序列等管理信息已经媒体再现控制部52从记录媒体51读出,始终保存在MPU块60内的存储器(未图示)中。
由媒体再现控制部52将读出的VOB数据提供给多路分配器53,这里,分离成视频数据与音频数据,将视频数据提供给视频解码块54,将音频数据提供给具有示为图7(A)的解码侧的构成的音频解码块55,分别解码,输出解码后的视频帧、音频帧。此时,由多路分配器53来解读SCR等时钟信息,根据需要传递给MPU块60。另外,将STC等时钟信息从MPU块60传递给多路分配器53、视频解码块54和音频解码块55,依据STC来控制再现定时。
下面,详细说明音频的再现。在本实施方式中,因为记录媒体51中记录包含连接点处的A_overlap的管理信息,所以由媒体再现控制部52从记录媒体51读出的管理信息经对象控制部59提供给管理信息控制部57,这里,从管理信息中取出连接点处的A_overlap,提供给A_PTS_offset计算部58。
A_PTS_offset计算部58根据输入的A_overlap,利用[式8]的运算式,算出A_PTS_offset,再根据[式9]的条件式,算出AF_drop,并将它们提供给管理信息控制部57。管理信息控制部57将输入的A_PTS_offset及AF_drop提供给音频解码块55,并将音频帧的再现定时偏移A_PTS_offset大小后再现。另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频帧。
<音频/视频再现方法的实施方式II>
下面,用图19的流程图来说明本发明的音频/视频再现方法的实施方式I。
首先,确定应再现的序列,确认该序列中包含的VOB的信息(步骤S51)。之后,在每个VOB连接点,根据再现的A_overlap,由A_PTS_offset计算部58计算A_PTS_offset(和AF_drop)(步骤S52)。
接着,与VOB的再现开始同时或在这之前,复位STC,以便能无缝连接,并且,将由A_PTS_offset计算部58计算的A_PTS_offset(和AF_drop)设置到音频解码块55(步骤S53)。
之后,从记录媒体51中实际读出VOB数据,经媒体再现控制部52和多路分配器53,将视频数据提供给视频解码块54,将音频数据提供给音频解码块55,分别进行解码,再现视频帧和音频帧(步骤S54)。在AF_drop=1的情况下,进行处理,以不再现VOB的最后的音频帧(步骤S55)。
如此再现的音频帧在由图7(A)所示的解码器进行包含加幕处理与正交逆变换处理的编码后,作为音频信号输出。之后,对再现序列中的全部VOB判断是否实施了上述处理(步骤S56),若是最终的VOB,则结束再现(步骤S57)。
另外,图19中说明的再现方法可由图18中说明的再现装置来实施,但另一方面,应注意也可作为具有该记录媒体的再现功能的计算机上的程序来实施。
这样,根据本实施方式,除视频帧的无缝连接外,音频帧也可不产生连接点处的不连续噪声地无缝连接。
<音频/视频记录装置的实施方式III>
下面,说明本发明的音频/视频记录装置的实施方式III。图20表示本发明的音频/视频记录装置的实施方式III的框图。这里,设多个VOB的记录结束,说明它们的连接编辑动作。
图20中,用户接口部65、管理信息控制部66、A_overlap计算部67、A_PTS_offset计算部68和对象控制部69构成MPU块62,由MPU(MicroProcessing Unit)的软件处理实现。
首先,通过用户接口部65从用户提供编辑指示。管理信息控制部66使用对应的管理信息来确认连接编辑点。此时,首先如上所述,确定音频帧的编辑点,以在连接点处存在音频帧的交迭。之后,根据需要对视频帧进行图片类型的变换处理。这通过对象控制部69、视频/音频编码块64、媒体记录控制部63来进行,写入记录媒体61中。
<音频/视频记录方法的实施方式III>
下面,进行音频无缝连接用的计算与记录。参照图21的流程图来说明本发明的音频/视频记录方法的实施方式III的音频无缝连接用的计算与记录。
首先,管理信息控制部66确定连接对象VOB,并且,确定视频连接点(应在连接源的VOB最后再现的视频帧、与应在连接对象的VOB最初再现的视频帧的连接点)(步骤S61)。之后,根据视频连接点,判断是否需要视频图片类型的变更处理,在需要的情况下,进行变更的具体准备(步骤S62)。
之后,根据视频连接点,确定音频帧编辑点(步骤S63)。即,确定音频帧编辑点,以使应在连接源的VOB最后再现的音频帧的再现期间包含视频帧连接点的时刻,并且,应在连接对象的VOB最初再现的音频帧的再现期间包含视频连接点的时刻。
之后,A_overlap计算部67进行所述的A_overlap计算(步骤S64),A_PTS_offset计算,68进行所述的A_PTS_offset(和AF_drop)的计算(步骤S65)。
最后,将编辑后的VOB(连接点附近的数据)、至少A_PTS_offset(和AF_drop)与再现序列等管理信息通过对象控制部69和媒体记录控制部63写入记录媒体61中(步骤S66)。此时,A_overlap是否也写入记录媒体中是任意的。再现序列中包含应再现的VOB的信息、连接点的信息等。另外,视频/音频编码块64中的音频编码块具有图7(A)的编码侧的构成。
另外,图21中说明的记录方法可由图20说明的专用装置来实施,另一方面,请注意,也可作为具有该记录媒体的记录功能的计算机上的程序来实施。
<音频/视频再现装置的实施方式III>
下面,说明本发明的音频/视频再现装置的实施方式III。图22表示本发明的音频/视频再现装置的实施方式III的框图。
图22中,在记录媒体71中记录由图20所示的记录装置编辑记录的编辑后的VOB或管理信息。另外,用户接口部76、管理信息控制部77和对象控制部78构成MPU块79。
在该再现装置中,首先,经用户接口部76将再现指示取到管理信息控制部77。由再现指示来指定一般应再现哪个再现序列。设在再现序列中登录连续再现多个VOB的信息。下面,表示VOB数据再现的基本步骤。
登录在再现序列中的VOB的再现关联信息由管理信息控制部77判断,经对象控制部78和媒体再现控制部72从记录媒体71读出VOB数据。另外,再现序列等管理信息已经媒体再现控制部72从记录媒体71读出,始终保存在MPU块79内的存储器(未图示)中。
由媒体再现控制部72将读出的VOB数据提供给多路分配器73,这里,分离成视频数据与音频数据,将视频数据提供给视频解码块74,将音频数据提供给具有示为图7(A)的解码侧的构成的音频解码块75,分别解码,输出解码后的视频帧、音频帧。此时,由多路分配器73来解读SCR等时钟信息,根据需要传递给MPU块79。另外,将STC等时钟信息从MPU块79传递给多路分配器73、视频解码块74和音频解码块75,依据STC来控制再现定时。
下面,详细说明音频的再现。在本实施方式中,因为记录媒体71中记录连接点处的A_PTS_offset,所以从管理信息中读出连接点处的A_PTS_offset(和AF_drop)。将得到的A_PTS_offset(和AF_drop)提供给音频解码块75,将音频帧的再现定时偏移A_PTS_offset大小后再现。另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频帧。
<音频/视频再现方法的实施方式III>
下面,用图23的流程图来说明本发明的音频/视频再现方法的实施方式I。
首先,确定应再现的序列,确认该序列中包含的VOB的信息(步骤S71)。之后,与VOB的再现开始同时或在这之前,复位STC,以便能无缝连接,并且,将从记录媒体71中再现的A_PTS_offset设置到音频解码块75(步骤S72)。
之后,从记录媒体71中实际读出VOB数据,经媒体再现控制部72和多路分配器73,将视频数据提供给视频解码块74,将音频数据提供给音频解码块75,分别进行解码,再现视频帧和音频帧(步骤S73)。在AF_drop=1的情况下,进行处理,以不再现VOB的最后的音频帧(步骤S74)。之后,对再现序列中的全部VOB判断是否实施了上述处理(步骤S75),若是最终的VOB,则结束再现(步骤S76)。
另外,图23中说明的再现方法可由图22中说明的再现装置来实施,但另一方面,应注意也可作为具有该记录媒体的再现功能的计算机上的程序来实施。
这样,根据本实施方式,除视频帧的无缝连接外,音频帧也可不产生连接点处的不连续噪声地无缝连接。
另外,就在先说明的本发明的第2实施方式而言,也可代替与第1实施方式相同部分中、图4、图5、图6、图7所示的记录/编辑装置和方法、再现装置和再现方法(即实施方式I的部分),而采用图16、图17、图18、图19所示的记录/编辑装置和方法、再现装置和再现方法(即实施方式II所示,在记录时算出连接点处的A_overlap,并将该A_overlap记录在记录媒体中,再现时根据从记录媒体中读出的A_overlap,算出A_PTS_offset(和AF_drop),将该A_PTS pffset(和AF drop)提供给音频解码块55,并进行控制,使音频帧的再现定时偏移A_PTS_offset大小后再现,另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频),或采用图20、图21、图22、图23所示的记录/编辑装置和方法、再现装置和再现方法(即实施方式III所示,在记录时算出连接点处的A_overlap与A_PTS_offset(和AF_drop),至少将A_PTS_offset(和AF_drop)记录在记录媒体中,再现时将从记录媒体中读出的A_PTS_offset(和AF_drop)提供给音频解码块75,并进行控制,使音频帧的再现定时偏移A_PTS_offset大小后再现,另外,在AF_drop=1的情况下,进行控制,以不再现该VOB的最后的音频)。
产业上的可利用性
根据本发明,除视频帧的无缝连接用视频数据的变更处理外,确定音频帧的编辑点,以使应在连接源的视频对象最后再现的视频帧的再现期间包含视频帧的连接点的时刻,并且,应在连接对象的视频对象最初再现的音频帧的再现期间包含连接点的时刻,之后,进行偏移处理,使连接点之后的音频帧与视频帧的同步错位可设为基本上不能被检测为对口形(lip sync)错位的量,所以音频帧也可不产生连接点处的不连续噪声地无缝连接。
另外,根据本发明,确定音频帧的编辑点,并将该编辑点作为管理信息记录在记录媒体中,在再现侧,根据再现管理信息,计算应在连接源的视频对象最后再现的音频帧、与应在连接对象的视频对象最初再现的音频帧的交迭时间、和用于偏移从记录媒体中读出的音频帧的PTS的音频PTS偏移时间,由此在记录侧不计算上述交迭时间与音频PTS偏移时间,所以可将记录侧的负担变为最小。
另外,根据本发明,当从如下记录媒体再现视频数据和音频数据时,即便在再现时最大延迟1音频帧周期后再现的情况下,也不会产生音频缓冲器的上溢,该记录媒体将音频数据多路复用于视频数据中来记录,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下。
另外,根据本发明,通过对应于根据再现时从记录媒体中读出的交迭时间算出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,从而不必计算用于算出再现侧的音频数据无缝再现用的音频PTS偏移时间的交迭时间,所以可减轻再现侧的无缝再现时的负担。
另外,根据本发明,通过对应于再现时从记录媒体中读出的音频PTS偏移时间,偏移从记录媒体中读出的音频帧的PTS,从而不必算出再现侧的音频数据无缝再现用的音频PTS偏移时间,可将再现侧的无缝再现时的负担减为最小。
Claims (2)
1.一种音频/视频记录装置,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体(21)中时,以能够指定应通过哪个再现序列来进行再现的方式记录在所述记录媒体中,该再现序列用于连续再现多个所述视频对象各自的部分或全部,其特征在于:具有
音频编码单元(24(11、12、13)),对于应记录的音频信号,执行包含基于与预定的窗口函数的乘法的加幕处理与正交变换处理的编码,输出所述音频数据;
多路复用单元(24),多路复用所述音频数据与所述视频数据,生成所述视频对象;
控制单元(24、26),在所述多路复用单元(24)进行多路复用时,控制所述多路复用单元(24),以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,并且,生成表示该音频多路复用状态的标志;和
记录单元(23),将从由所述控制单元(24、26)控制的所述多路复用单元(24)输出的所述视频对象、与由所述控制单元(24、26)生成的表示所述音频多路复用状态的标志一起记录在记录媒体(21)中。
2.一种音频/视频记录方法,在将同步的视频数据与音频数据的组作为视频对象记录在记录媒体(21)中时,以能够指定应通过哪个再现序列来进行再现的方式记录在所述记录媒体中,该再现序列用于连续再现多个所述视频对象各自的部分或全部,其特征在于:包含
第1步骤,对于应记录的音频信号,执行包含基于与预定的窗口函数的乘法的加幕处理与正交变换处理的编码,输出所述音频数据;
第2步骤(S22),在将所述音频数据与视频数据多路复用来生成所述视频对象时进行控制,以使音频缓冲器占有量为从规定的音频缓冲器尺寸上限中减去1音频帧的数据量后的值以下,并且,生成表示该音频多路复用状态的标志;和
第3步骤(S23),将表示在所述第2步骤(S22)控制下的音频多路复用状态的标志、与在所述第2步骤(S22)的控制下多路复用所得到的所述视频对象一起记录在记录媒体(21)中。
Applications Claiming Priority (12)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003-101236 | 2003-04-04 | ||
JP2003101238 | 2003-04-04 | ||
JP2003-101237 | 2003-04-04 | ||
JP2003101237 | 2003-04-04 | ||
JP2003101237 | 2003-04-04 | ||
JP2003101236 | 2003-04-04 | ||
JP2003-101238 | 2003-04-04 | ||
JP2003101238 | 2003-04-04 | ||
JP2003101236 | 2003-04-04 | ||
JP2003-417551 | 2003-12-16 | ||
JP2003417551 | 2003-12-16 | ||
JP2003417551 | 2003-12-16 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800090801A Division CN100479511C (zh) | 2003-04-04 | 2004-04-02 | 音频/视频记录装置、记录方法、再现装置、再现方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101404171A CN101404171A (zh) | 2009-04-08 |
CN101404171B true CN101404171B (zh) | 2011-08-31 |
Family
ID=33163087
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008101499219A Expired - Fee Related CN101404171B (zh) | 2003-04-04 | 2004-04-02 | 音频/视频记录装置、音频/视频记录方法 |
CNB2004800090801A Expired - Lifetime CN100479511C (zh) | 2003-04-04 | 2004-04-02 | 音频/视频记录装置、记录方法、再现装置、再现方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800090801A Expired - Lifetime CN100479511C (zh) | 2003-04-04 | 2004-04-02 | 音频/视频记录装置、记录方法、再现装置、再现方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7941030B2 (zh) |
EP (1) | EP1613075A4 (zh) |
JP (2) | JP4906344B2 (zh) |
CN (2) | CN101404171B (zh) |
WO (1) | WO2004091204A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7471337B2 (en) * | 2004-06-09 | 2008-12-30 | Lsi Corporation | Method of audio-video synchronization |
US7624021B2 (en) | 2004-07-02 | 2009-11-24 | Apple Inc. | Universal container for audio data |
EP1854293A2 (en) | 2005-02-07 | 2007-11-14 | Thomson Licensing | METHOD AND APPARATUS FOR REPLAYING A VIDEO SIGNAL AND ONE OR MORE AUDIO SIGNALS RELATED TO AUDIO/VIDEO DATA THAT ARE BASED ON A 24Hz FRAME FREQUENCY VIDEO SIGNAL |
US20070006238A1 (en) * | 2005-07-01 | 2007-01-04 | Microsoft Corporation | Managing application states in an interactive media environment |
JP2009111608A (ja) * | 2007-10-29 | 2009-05-21 | Panasonic Corp | 再生装置および再生方法 |
EP2104103A1 (en) * | 2008-03-20 | 2009-09-23 | British Telecommunications Public Limited Company | Digital audio and video clip assembling |
EP2104105A1 (en) * | 2008-03-20 | 2009-09-23 | British Telecommunications Public Limited Company | Digital audio and video clip encoding |
US8913189B1 (en) * | 2013-03-08 | 2014-12-16 | Amazon Technologies, Inc. | Audio and video processing associated with visual events |
US10224055B2 (en) * | 2015-02-10 | 2019-03-05 | Sony Semiconductor Solutions Corporation | Image processing apparatus, image pickup device, image processing method, and program |
US11183202B2 (en) | 2015-07-28 | 2021-11-23 | Dolby Laboratories Licensing Corporation | Audio discontinuity detection and correction |
KR102625410B1 (ko) * | 2018-08-01 | 2024-01-17 | 베이징 마이크로라이브 비전 테크놀로지 컴퍼니 리미티드 | 비디오 녹화 방법 및 장치 |
US10986378B2 (en) | 2019-08-30 | 2021-04-20 | Rovi Guides, Inc. | Systems and methods for providing content during reduced streaming quality |
US11184648B2 (en) | 2019-08-30 | 2021-11-23 | Rovi Guides, Inc. | Systems and methods for providing content during reduced streaming quality |
US11005909B2 (en) * | 2019-08-30 | 2021-05-11 | Rovi Guides, Inc. | Systems and methods for providing content during reduced streaming quality |
CN113194528B (zh) * | 2021-03-18 | 2023-01-31 | 深圳市汇顶科技股份有限公司 | 同步控制方法、芯片、电子设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000175152A (ja) * | 1998-12-04 | 2000-06-23 | Sony Corp | 多重化装置、多重化方法及び記録媒体 |
CN1374795A (zh) * | 2001-03-05 | 2002-10-16 | 松下电器产业株式会社 | 记录装置及记录方法 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3186412B2 (ja) * | 1994-04-01 | 2001-07-11 | ソニー株式会社 | 情報符号化方法、情報復号化方法、及び情報伝送方法 |
TW436777B (en) | 1995-09-29 | 2001-05-28 | Matsushita Electric Ind Co Ltd | A method and an apparatus for reproducing bitstream having non-sequential system clock data seamlessly therebetween |
JPH10200858A (ja) | 1997-01-08 | 1998-07-31 | Sony Corp | 映像信号および音声信号の符号化装置、符号化方法、復号装置および復号方法並びに記録媒体 |
JP3890655B2 (ja) * | 1997-03-19 | 2007-03-07 | ソニー株式会社 | ディジタル信号再生方法及び装置 |
JP3911768B2 (ja) | 1997-06-02 | 2007-05-09 | ソニー株式会社 | 画像符号化方法及び画像符号化装置 |
JPH1175157A (ja) * | 1997-08-29 | 1999-03-16 | Sony Corp | 映像信号及び音声信号の記録装置 |
KR100532738B1 (ko) * | 1997-09-17 | 2005-12-01 | 마츠시타 덴끼 산교 가부시키가이샤 | 비디오 데이터 편집장치, 비디오 데이터 편집장치의 기록매체로서 이용하기 위한 광디스크 및 편집 프로그램을 저장한 컴퓨터 판독가능한 기록매체 |
JP3383663B2 (ja) | 1998-01-21 | 2003-03-04 | 株式会社東芝 | 情報記録媒体・情報記録方法及び装置及び再生装置 |
JP3224371B2 (ja) | 1998-11-30 | 2001-10-29 | 松下電器産業株式会社 | 符号化av信号の同期方法 |
JP4517267B2 (ja) | 2000-04-21 | 2010-08-04 | ソニー株式会社 | 記録装置および方法、再生装置および方法、プログラム、並びに記録媒体 |
JP4411499B2 (ja) | 2000-06-14 | 2010-02-10 | ソニー株式会社 | 情報処理装置および情報処理方法、並びに記録媒体 |
JP3748243B2 (ja) | 2001-05-30 | 2006-02-22 | 日本ビクター株式会社 | Mpegデータ記録装置 |
-
2004
- 2004-04-02 CN CN2008101499219A patent/CN101404171B/zh not_active Expired - Fee Related
- 2004-04-02 WO PCT/JP2004/004857 patent/WO2004091204A1/ja active Application Filing
- 2004-04-02 EP EP04725479A patent/EP1613075A4/en not_active Withdrawn
- 2004-04-02 US US10/551,766 patent/US7941030B2/en active Active
- 2004-04-02 CN CNB2004800090801A patent/CN100479511C/zh not_active Expired - Lifetime
- 2004-04-02 JP JP2005505271A patent/JP4906344B2/ja not_active Expired - Fee Related
-
2009
- 2009-12-14 JP JP2009282710A patent/JP2010061803A/ja active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000175152A (ja) * | 1998-12-04 | 2000-06-23 | Sony Corp | 多重化装置、多重化方法及び記録媒体 |
CN1374795A (zh) * | 2001-03-05 | 2002-10-16 | 松下电器产业株式会社 | 记录装置及记录方法 |
Also Published As
Publication number | Publication date |
---|---|
JPWO2004091204A1 (ja) | 2006-07-06 |
WO2004091204A1 (ja) | 2004-10-21 |
JP4906344B2 (ja) | 2012-03-28 |
CN1768529A (zh) | 2006-05-03 |
EP1613075A4 (en) | 2011-12-21 |
CN100479511C (zh) | 2009-04-15 |
US20060140575A1 (en) | 2006-06-29 |
EP1613075A1 (en) | 2006-01-04 |
US7941030B2 (en) | 2011-05-10 |
CN101404171A (zh) | 2009-04-08 |
JP2010061803A (ja) | 2010-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101404171B (zh) | 音频/视频记录装置、音频/视频记录方法 | |
CN101425314B (zh) | 信息记录装置及信息记录方法 | |
US20100092158A1 (en) | Recording apparatus, recording method, and record medium | |
KR100585429B1 (ko) | 음성/영상 정보 기록 재생 장치 및 방법, 멀티미디어 정보 기록 재생 장치 | |
CN101827202A (zh) | 图像处理设备、图像处理方法和程序 | |
EP1353508B1 (en) | RECORDING APPARATUS AND RECORDING METHOD for a modified QuickTime file format | |
CN101577834B (zh) | 记录可以高速转换的流的信息记录装置和记录方法 | |
EP2034483A1 (en) | Format converter, format converting method, and moving image decoding system | |
CN101854507B (zh) | 信息记录装置和信息转换方法 | |
JP2010050616A (ja) | 記録装置および記録方法、再生装置および再生方法、プログラム、並びに記録再生装置 | |
CN101207777B (zh) | 图像记录再现装置及其特殊再现方法 | |
WO2006088090A1 (ja) | エンコード装置、エンコード方法およびエンコードを行うためのコンピュータプログラム | |
CN101707705B (zh) | 记录可以高速转换的流的信息记录介质,及其记录装置和记录方法 | |
JP4062832B2 (ja) | データ記録再生装置及びデータ記録再生方法 | |
CN100536554C (zh) | 数据处理装置及方法 | |
JP2007243414A (ja) | 記録装置 | |
JP3991540B2 (ja) | 記録装置および方法、並びに記録媒体 | |
CN101587727B (zh) | Av数据记录方法、av数据记录装置、数据记录媒体、程序和程序记录媒体 | |
KR100633805B1 (ko) | 음성/영상 정보 기록 재생 장치 및 방법, 및 음성/영상정보 기록 재생 장치 및 방법을 이용하여 정보가 기록된기록 매체 | |
KR100547103B1 (ko) | 가변속 모드를 위한 기록 및/또는 재생방법 및 그 장치 | |
CN100542245C (zh) | 记录方法,记录设备,再现方法,再现设备和图像拾取设备 | |
JP2008500762A (ja) | スライドショーへの連続的音声発生方法及び装置 | |
CN101477821B (zh) | 将信息记录到信息记录介质的装置及方法 | |
JP2004362747A (ja) | 信号処理装置 | |
JP2006155783A (ja) | 情報記録再生装置および情報記録再生方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: JVC KENWOOD CORPORATION Free format text: FORMER OWNER: VICTORY CO. LTD. Effective date: 20140305 |
|
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20140305 Address after: Kanagawa Patentee after: JVC Kenwood Corp. Address before: Kanagawa Patentee before: Victory Co., Ltd. |
|
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20110831 Termination date: 20180402 |