NTT开发的声音可逆压缩技术成为MPEG国标

2006-01-06 15:27:21来源:日经BP社 作者:dvbcn热度:

图1:利用最新款电脑进行可逆压缩时,各技术的压缩率和解码时间比较。

  2005年12月27日,NTT宣布由其主导开发的声音可逆压缩(无损编码)技术日前已被批准为MPEG国际标准规格“MPEG-4 ALS”。据称,此技术可用于主数据(Master Data)保存和高音质声音数据收发等用途。

  所谓可逆压缩,就是指能够准确无误地重现原始数字波形数据的压缩方式。不过,数据压缩率通常都低于MP3等非可逆压缩方式。MPEG-4 ALS的压缩率取决于采样频率和音乐类型,一般在15%~70%之间。

  过去的可逆压缩技术包括微软开发的“Windows Media Audio Lossless”,苹果电脑的“Apple Lossless”,以及免费软件“Monkeys”、“FLAC”和“OptimFrog”等。此次的技术不仅压缩率优于上述老技术,而且解码时间也缩短了(图1)。以48KHz的频率进行采样的30秒声音数据,据称在最新款电脑上不足1秒即可完成解码。除此之外,与免费软件相比,专利权等权利关系更为明确,能够得到长期的技术支持,这些都是它的优点。“希望该技术100年后仍能使用”(NTT通信科学基础研究所 人类信息研究部长守谷健弘)。

  NTT表示,准备在一年以后在MPEG LA之下成立一家MPEG-4 ALS技术授权管理团体。估计授权将是有偿的。“打个比方,假设微软取得MPEG-4 ALS技术授权,并在Windows中嵌入编解码的话,谁都将可以自由使用MPEG-4 ALS”(守谷)。

  MPEG-4 ALS的采样频率最大为192KHz。能够对由整数或浮点组成的32位声音数据进行压缩。可同时压缩的声道最多可达65536。如能有效利用这一优点,其用途将会扩展到声音以外的其他数据压缩。比如,在大脑中的不同部位,利用数百个通道同时对脑磁场数据进行检测。各声道之间的数据相关性越强,压缩率就越高。脑磁场的数据压缩率约为15%。

责任编辑:DVBCN编辑部

为您推荐

MPEG-4的音频标准

曾制定出MPEG-1和MPEG-2视音频压缩标准的运动图像专家组(MPEG)目前正在发展最新的MPEG-4标准,其目标是提供未来的交互式多媒体应用。MPEG-4将制定出与以往不同的、具有高度灵活性和可扩展性的未来新一代国际标准。在音频标准的制定方面,比较以前的音频编码标准,MPEG-4增加了许多新的关于合成内容及场景描述等领域的工作,增加了诸如可分级性、音调变化、可编辑性及延迟等新功能。MPEG-4将以前发展良好但相互分离的高质量音频编码、计算机音乐及合成语音等第一次合成并在一起,在诸多领域内给予高度的灵活性。MPEG-4中关于音频信号将包括:传统的音频编码标准,即所谓“自然音频”(natur

MPEG4之前世今生

MPEG全称是MovingPicturesExpertsGroup,动态图象专家组的英文缩写,MPEG的缔造者们原先打算开发四个版本:MPEG1-MPEG4,以适用于不同带宽和数字影像质量的要求。后由于MPEG3被放弃,所以现存只有三个版本的MPEG:MPEG-1,MPEG-2,MPEG-4。总体来说,MPEG在三方面优于其他压缩/解压缩方案。首先,由于在一开始它就是做为一个国际化的标准来研究制定,所以,MPEG具有很好的兼容性。其次,MPEG能够比其他算法提供更好的压缩比,最高可达200:1。更重要的是,MPEG在提供高压缩比的同时,对数据的损失很小。DIVX视频编码技术实际就是MPEG4压

MPEG-7标准及其应用简介

MPEG-7标准及其应用简介人们如何在海量的媒体信息中迅速找到自己所需的内容,并对其进行个性化的访问?MPEG-7媒体内容描述规范使无法通过现有的搜索引擎查询视频、音频等内容的难题迎刃而解。本文分析了MPEG-7的描述方案,并重点分析了它的集中应用。一、引言国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(MultimediaContentDescriptionInterface),其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩

采用MPEG-4方式的VBI数据广播系统(上)

关键词:MPEG-4,VBI数据广播,图文电视,教育信息网目前MPEG-4数据压缩格式已经广泛应用于低码流的视音频传输和纪录系统中。中国教育电视台的VBI数据广播系统就是采用MPEG-4方式。MPEG-4对视、音频信号的处理范围很广,是一种能将巨大的数字包压缩成能在线传输的小型文件的音视频处理技术。该技术,很象目前一些通用的媒体格式,如MP3、RealVideo和WindowsMedia。但更重要的是MPEG-4可以提供交互式功能。一、VBI数据广播系统VBI(VerticalBlankingInterval)是指利用电视画面的逆程消隐期间传送数字信号的技术。我们知道电视图像画面是通过电视的正