当声音被录制进你的摄影机或电脑时, 它们就被数字化了, 它们从我们听到的声音被转化成了0和1的组合代码。 重放的时候, 电脑将这些代码再次重组为我们可以理解的声音。 是不是很神奇? 事实上, 这个过程更像是数学而不是魔术。 要理解这个数学公式, 我们先要了解一些基础的概念: 采样率和位元深度。 在数码视频中, 声音是以每秒钟 48,000次进行采样的(通常被称为48kHz)– 好像在瞬间对声音进行了快照一样。 通过每秒48,000次的采样, 我们可以得到一份对音频非常详细的描述信息。 作为比较, CD音频以44。1kHz作为采样率。 其中包含有许多奇妙的数学定理, 最基本的为奈奎斯特定理, 即通常所说的抽样定理。
定理简单描述如下: 当你需要精确重述一个声音时, 你必须以这个声音最高音的双倍频率进行采样。 人类的听力识别范围在20~20,000Hz之间, 所以我们每秒至少采样40,000次。 48kHz则提供了比这更精确的采样率。
让我们将上面的知识再扩展一些。 每个音频采样都包含一个16位元深度。 想象一个16位以1和0组合成的数字。 在16位元下, 每个音频中的声音强度都可以有65,536种表现方式。 所以在一秒钟的音频内, 有多达48,000个声音采样, 超过65,000个种类。 在这种情况下, 你肯定可以在这样庞大的媒体库中为你的视频重新塑造清晰的音频。 当为CD音轨制作音频文件时, 更高的采样率及位元深度将被使用在录制过程中。 新的HD-DVD系统使用杜比数码增强代码, 它支持7。1通道声音输出, 拥有96kHz的采样率及24位元深度, 音频的世界正在不断改变!
尽管数码音频有很多好处, 它还是有很多特定的限制。 例如, 数码音频很容易过于庞大或扭曲原始音频。 回到原始的磁带上, 当录制指示表超过0时, 你的声音录制仍然不会被影响。 但在数码音频世界里, 当16位元被设置为“1”时, 它就不能再前进至任何地方。 任何再这之后录制的声音都将被彻底破坏。 数码音频破坏并不想普通磁带录制那样产生嘶嘶的噪音, 它会产生粗糙刺耳的, 你绝对不想在你的音频中听到的声音。 一些摄影设备自带音频减噪功能。 这个附件会自动调整音量, 降低过响的音源或让其听起来更加柔和, 甚至可以让空调和其它环境声音协调至同一水平。 如果你的摄影机带有此类设备, 请记得学会在录制过程中正确使用它们。
手动的音频调节系统可以让你选择最合适的音频信号, 但同时也为可能的音频破坏打开了大门。 如果你使用了混合器, 确保麦克风的音量, 但切记不要过分。 当你将混合器与摄影机相连时, 不要忘记让演员大笑或响亮地说话来测试音量。 将这个音量作为你的最大音量并且不要改变它。 只有这样你才可以在后期剪辑中得到清晰的音频文件。
16位元深度, 48kHz的立体声音频大小约为11MB每分钟。 这是一个较为庞大的容量, 尤其当你的视频文件比较长的时候。 为了节约你的硬盘空间, 你可能会尝试使用一些音频压缩格式例如Mp3, AAC或WMA。 虽然几乎所有的音频编辑软件都带有将音频文件压缩至这些格式的功能, 但你应该避免这种尝试。 压缩格式的音乐适合互联网的使用, 但在专业的视频或音频处理中, 它们并不适用。
压缩音频格式使用一种叫做 “感知编码”的方式进行编码。 为了达到极大压缩音频文件的目的。 感知编码将音频文件重组并且决定哪些采样是可以被直接抛弃的, 这种编码方式是建立在人耳对较高和较低频率的声音无法认知的基础上的。 比较一个cd音频和它的压缩版本, 你会听到被降低的高音, 松弛不紧凑的低音和稍有些怪异的中音。 压缩音频的另一个秘密是分割原始音频中的位元频率。 一个立体声音频文件大约需要两倍于单声道音频的位元频率。
所以, 你所听到的128kHz的MP3实际上只有64kHz。 它们在地铁或是你的汽车里可能听起来不错, 但一个可能在家庭影院中被播放的视频就会马上让这些压缩中损失的东西体现出来。 如果你必须使用压缩的音频格式, 尽可能选择较高的位元频率。
尽管有上述这么多理由, 压缩文件格式仍然适用于很多情况下。 例如, 许多音乐销售商将其曲目放置于互联网上以供用户下载。 如果你在网络上发现了一首中意的曲目并在当天就付费购买。 一定要记住你是在以音频质量换取便利。 另外一个理想的使用是在语音文件中, 你可以通过电话或email, 雇用专业的播音员为你的视频工作。 你将语音剧本email给他们, 它们将录制好的音频压缩成mp3再email回来。 混合有一些音乐, 一个只有语音的128kHz单音轨音频文件几乎很难与其未压缩原始文件分辨出差别。