从爱迪生发明留声机开始|音频格式——mp3到底丢失了什么( 二 )


心想tnnd你一个教授都做不出来 , 我小小一博士生怎么做的出来 , 但导师交待的任务又不能不完成 , 所以他就打算用几年的时间来证明这事儿不可能 , 然后论文一写 , 把博士学位混到手算球!而就在他证明“不可能发明一个比CD小12倍的音频文件”的过程中 , 他却发现 , 哎 , 这事还真是有可能的 。
心理声学与MP3
让Brandenburg觉得这事儿有戏的关键 , 是一个极其冷门的学科 , 叫心理声学(Psychoacoustics) 。
这是一门心理物理学的分支研究 , 最早源于人们对音乐和乐器的探索 , 后来成为了研究人的生理感官和客观声音世界之间关系的学科 。 听起来很复杂 , 其实很好理解 , 比如人耳的声音定位 , 听力范围这类研究 , 都属于心理声学的范畴 。
在心理声学里有一个非常经典的研究 , 就是等响曲线 。 这个曲线告诉我们 , 人耳对于不同频率的声音 , 感知相差极大 。 人类的听觉范围在20-20000Hz之间 , 而在这个范围里的不同频率下 , 我们听到的响度是不一样的 。
从爱迪生发明留声机开始|音频格式——mp3到底丢失了什么
文章图片
低频的声音需要更大的声压才能和中频较小的声压 , 所形成的声音大小听起来相等 。
就比如贝斯就需要更大的音量 , 才能跟吉他声听起来差不多大 。 这也是为什么贝斯这类低音乐器的音箱要比其他音箱的体积大得多 。
而图中的最低点出现在3000Hz左右 , 所以说明人对这个频率的声音最敏感 , 只需要比较小的声压就能听到 。 比如我们听到的大部分的警报声 , 基频都在1000-3000Hz , 这样人耳才能更容易捕捉这些声音 , 从而避免危险 。
有意思的是 , 随着年龄增大 , 我们对于声音的接收范围也在变小 , 大多数成年人听不到频率在16000Hz以上的声音 。
沿着这个方向 , 等响曲线的发现者又研究出了一个更加神奇的事情 , 让我们意识到我们的感官和客观到底差距有多么巨大 。
这个东西 , 就是“掩蔽”(Masking) 。
从爱迪生发明留声机开始|音频格式——mp3到底丢失了什么
文章图片
声音掩蔽SoundMasking
1958年的某天下午 , 一个叫Licklider的心理学家去看牙医 , 他跟医生说 , 我不需要打麻药 。 然后掏出了一副耳机 , 开始听震耳欲聋的音乐 。 在巨大的音乐声中 , 牙医帮他搞定了三颗龋齿 , 而他就像被打了麻醉剂一样 , 竟然没有感觉到疼 。
Licklider把这项技术命名为Audiac , 之后他带着这玩意和牙医一起巡诊拔牙 , 还帮助了不少妇女缓解了分娩时的疼痛 。
Audiac用了一种强烈的听觉刺激来抑制疼痛 , 这就是一种跨感官的掩蔽效果 。
在听觉系统中 , 一种声音也会被另一种同时发出的声音所掩盖 。 比如在一个乐队里 , 往往是吉他声在C位 , 但如果突然有相似频率的乐器加入 , 比如小号 。 那吉他的声音就会被短暂的淹没 。 这一过程叫作同频掩蔽 。
我们用一个动画来举例子 , 当一个频率从低到高的噪音经过一个正弦音的时候 , 这个声音会被噪音掩盖 。
从爱迪生发明留声机开始|音频格式——mp3到底丢失了什么】再比如你上课的时候 , 想用一声咳嗽来掩盖自己放屁的声音 , 那你最好要满足三个条件 , 一是咳嗽声的时长大于等于屁声 , 二是咳嗽声的响度要大于等于屁声 。 三是要保证二者的频率接近 。 这三个条件都满足 , 才是一次出色的掩蔽 。
那这和MP3有什么关系呢?MP3的算法就是利用了人耳的这种特性 , 将歌曲中不同频率里被淹没的声音瞬间 , 给丢掉了 。 这样就可以在减少文件体积的条件下 , 最小程度的损失音质 。