采样率
和 比特率
就像是坐标轴上的横纵坐标。
横坐标的 采样率
表示了每秒钟的采样次数。
纵坐标的 比特率
表示了用数字量来量化模拟量的时候的精度。
可以使用 MediaInfo来查看媒体文件的信息;
基础知识
对于人类的语音信号而言,实际处理一般经过以下步骤:
人说话——>声电转换——>抽样(模数转换)——>量化(将数字信号用适当的数值表示)——>编码(数据压缩)——>
传输(网络或者其他方式)——>解码(数据还原)——>反抽样(数模转换)——>电声转换——>人耳听声。
采样率(sampleRate)
采样:采样即采集样本,是模拟信息数字化的一个环节。即对模拟信号进行离散采样,使之成为数字信号。
采样率:采样速度或者采样频率,定义了每秒从连续信号中提取并组成离散信号的采样个数,它用赫兹(Hz)来表示。采样率是指将模拟信号转换成数字信号时的采样频率,也就是单位时间内采样多少点。一个采样点数据有多少个比特。
声音信号为模拟信号,想要在实际中处理必须为数字信号,即采用抽样、量化、编码的处理方案。
处理的第一步为抽样,即模数转换。简单地说就是通过波形采样的方法记录1秒钟长度的声音,需要多少个数据。
根据奈魁斯特(NYQUIST)采样定理,用两倍于一个正弦波的频繁率进行采样就能完全真实地还原该波形。所以,对于声音信号而言,要想对离散信号进行还原,必须将抽样频率定为40KHz以上。
实际中,一般定为44.1KHz。44.1KHz采样率的声音就是要花费44000个数据来描述1秒钟的声音波形。原则上采样率越高,声音的质量越好,采样频率一般共分为22.05KHz、44.1KHz、48KHz三个等级。22.05 KHz只能达到FM广播的声音品质,44.1KHz则是理论上的CD音质界限,48KHz则已达到DVD音质了。
采样位深(bitsPerSample)
采样时模数转换的分辨率,也就是每个样本用几位来表示,一般是 8bits 或是 16bits。
我们常见的16Bit(16比特),可以记录大概96分贝的动态范围。那么,您可以大概知道,每一个比特大约可以记录6分贝的声音。同理,20Bit可记录的动态范围大概就是120dB;24Bit就大概是144dB。假如,我们定义0dB为峰值,那么声音振幅以向下延伸计算,那么,CD音频可的动态范围就是 -96dB~0dB。
,依次类推,24Bit的HD-Audio
高清音频的的动态范围就是 -144dB~0dB。
。由此可见,位深度较高时,有更大的动态范围可利用,可以记录更低电平的细节。
声道数(NumChannels)
1 => 单声道 | 2 => 双声道
比特率(Bit Per Second)
俗称码率,表示经过编码(压缩)后的音频数据每秒传送的比特(bit)数。 单位为 bps(Bit Per Second)或kbps即千位每秒,比特率越高,传送的数据越大,音质越好。与体积成正比:码率越大,体积越大;码率越小,体积越小。
PCM编码的公式:
比特率 =采样率 x 采用位数 x声道数
关于比特率的计算,比如,采样率为44.1KHz,采样大小为16bit,声道数为2,那么它的音频比特率的计算为:44.1kHz162 = 1411.2 kbps,然后我们在除以8,将bit转化为Byte,所以1秒钟的数据量就是:1411.2Kbps/8 = 176.4KB/s。这表示存储一秒钟采样率为44.1KHz,采样大小为16bit,双声道的PCM编码的音频信号,需要176.4KB的空间,1分钟则约为10.34M。这对大部分用户是不可接受的,尤其是喜欢在电脑上听音乐的朋友,要降低磁盘占用,只有2种方法,降低采样指标或者压缩。降低指标是不可取的,因此专家们研发了各种压缩方案。最原始的有DPCM、ADPCM,其中最出名的为MP3。所以,采用了数据压缩以后的码率远小于原始码率。
对于音频信号而言,实际上必须进行编码。在这里,编码指信源编码,即数据压缩。如果,未经过数据压缩,直接量化进行传输则被称为PCM(脉冲编码调制)。
参考: