选择显示字体大小

各种主流音频编码(或格式)介绍

  1、pcm编码

  pcm 脉冲编码调制是pulse code modulation的缩写。前面的文字我们提到了pcm大致的工作流程,我们不需要关心pcm最终编码采用的是什么计算方式,我们只需要知道pcm编码的音频流的优点和缺点就可以了。pcm编码的最大的优点就是音质好,最大的缺点就是体积大。我们常见的audio cd就采用了pcm编码,一张光盘的容量只能容纳72分钟的音乐信息。

  2、wave

  这是一种古老的音频文件格式,由微软开发。wav是一种文件格式,符合 piff resource interchange file format规范。所有的wav都有一个文件头,这个文件头音频流的编码参数。wav对音频流的编码没有硬性规定,除了pcm之外,还有几乎所有支持acm规范的编码都可以为wav的音频流进行编码。很多朋友没有这个概念,我们拿avi做个示范,因为avi和wav在文件结构上是非常相似的,不过avi多了一个视频流而已。我们接触到的avi有很多种,因此我们经常需要安装一些decode才能观看一些avi,我们接触到比较多的divx就是一种视频编码,avi可以采用divx编码来压缩视频流,当然也可以使用其他的编码压缩。同样,wav也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被pcm编码处理的wav,但这不表示wav只能使用pcm编码,mp3编码同样也可以运用在wav中,和avi一样,只要安装好了相应的decode,就可以欣赏这些wav了。
在windows平台下,基于pcm编码的wav是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,wav也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于pcm编码的wav被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如mp3转换成wma。

  2、mp3编码

  mp3作为目前最为普及的音频压缩格式,为大家所大量接受,各种与mp3相关的软件产品层出不穷,而且更多的硬件产品也开始支持mp3,我们能够买到的vcd/dvd播放机都很多都能够支持mp3,还有更多的便携的mp3播放器等等,虽然几大音乐商极其反感这种开放的格式,但也无法阻止这种音频压缩的格式的生存与流传。mp3发展已经有10个年头了,他是mpeg(mpeg:moving picture experts group) audio layer-3的简称,是mpeg1的衍生编码方案,1993年由德国fraunhofer iis研究院和汤姆生公司合作发展成功。mp3可以做到12:1的惊人压缩比并保持基本可听的音质,在当年硬盘天价的日子里,mp3迅速被用户接受,随着网络的普及,mp3被数以亿计的用户接受。mp3编码技术的发布之初其实是非常不完善的,由于缺乏对声音和人耳听觉的研究,早期的mp3编码器几乎全是以粗暴方式来编码,音质破坏严重。随着新技术的不断导入,mp3编码技术一次一次的被改良,其中有2次重大技术上的改进。
  vbr:mp3格式的文件有一个有意思的特征,就是可以边读边放,这也符合流媒体的最基本特征。也就是说播放器可以不用预读文件的全部内容就可以播放,读到哪里播放到哪里,即使是文件有部分损坏。虽然mp3可以有文件头,但对于mp3格式的文件却不是很重要,正因为这种特性,决定了mp3文件的每一段每一帧都可以单独的平均数据速率,而无需特别的解码方案。于是出现了一种叫vbr(variable bitrate,动态数据速率)的技术,可以让mp3文件的每一段甚至每一帧都可以有单独的bitrate,这样做的好处就是在保证音质的前提下最大程度的限制了文件的大小。这种技术的优越性是显而易见的,但要运用确实是一件难事,因为这要求编码器知道如何为每一段分配bitrate,这对没有波形分析的编码器而言,这种技术如同虚设。正是如此,vbr技术并没有一出现就显得光彩夺目。

    听觉模型的导入:专家们通过长期的声学研究,发现人耳存在遮蔽效应。声音信号实际是一种能量波,在空气或其他媒介中传播,人耳对声音能量的多少即响度或声压最直接的反应就是听到这个声音的大小,我们称它为响度,表示响度这种能量的单位为分贝(db)。即使是同样响度的声音,人们也会因为它们频率不同而感觉到声音大小不同。人耳最容易听到的就是4000hz的频率,不管频率是否增高或降低,即使是响度在相同的情况下,大家都会觉得声音在变小。但响度降到一定程度时,人耳就听不到了,每一个频率都有着不同的值。当频率超过15000hz时,人耳的会感觉到声音很小,很多听觉不是很好的人,根本就听不到20000hz的频率,不管响度有多大。当人耳同时听到两个不同频率、不同响度的声音时,响度较小的那个也会被忽略,例如:在白天我们很难听到电脑中散热风扇的声音,晚上却成了噪声源,根据这种原理,编码器可以过滤掉很多听不到的声音,以简化信息复杂度,增加压缩比,而不明显的降低音质。这种遮蔽被称为同时遮蔽效应。但声音a被声音b遮蔽,如果a处于b为中心的遮蔽范围内,遮蔽会更明显,这个范围叫临界带宽。每一种频率的临界带宽都不一样,频率越高的临界带宽越宽。

 

xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

频率(hz)

临界带宽(hz)

频率(hz)

临界带宽(hz)

50

80

1850

280

150

100

2150

320

350

100

2500

380

450

110

3400

550

570

120

4000

700

700

140

4800

900

840

150

5800

1100

1000

160

7000

1300

1170

190

8500

1800

1370

210

10500

2500

1600

240

13500

3500


 


关键字 本文所属关键字

相关 与本文相关文章

分类 所有文章关键字导航

源码编程相关

Java   Asp   PHP   .Net   XML   C/C++   CGI   VB   Jsp   J2ee   J2se   J2me   EJB   Servlet   Tomcat   Resin   Struts   Weblogic   Eclipse   ANT   GUI   JMS   Web servise   IDEA   Webphere   Hibernate   Spring   Jboss   Applet   Swing   Socket   Javamail   Perl   Ajax   P2P   安全   模式   框架   测试   开源   游戏

SQL数据库相关

My-SQL   Ms-SQL   Access   DB2   Oracle   Sybase   SQLserver   索引   存储过程   加密   数据库   分页   视图  

手机无线相关

3G   Wap   CDMA   GRPS   GSM   IVR   彩信   短信   无线   增值业务

网页设计制作相关

HTML   CSS   网页配色   网页特效   Javascript   VBscript   Dreamweaver   Frontpage   JS   Web   网站设计

网站建设推广相关

建站经验   网站优化   网站排名   推广   Alexa

操作系统/服务器相关

Windows XP   Windows 2000   Windows 2003   Windows Me   Windows 9.x   Linux   UNIX   注册表   操作系统   服务器   应用服务器

图形图像多媒体相关

Photoshop   Fireworks   Flash   Coreldraw   Illustrator   Freehand   Photoimpact   多媒体   图形图像

标准 网站致力的规范

Valid CSS!

无不良内容,无不良广告,无恶意代码

Valid XHTML 1.0 Transitional

creativecommons