爱吱声

标题: 声音数模转换及保真 [打印本页]

作者: tonyxu    时间: 2020-12-17 10:08
标题: 声音数模转换及保真
声音模拟信号数字化,需要经历的三个过程是:抽样,量化,编码。4 m% N( Q6 Z! b

, z. ~3 w5 C6 C8 C9 M( N) ~: ~8 v人耳的感知音域范围大约在20Hz~20kHz, 极少数人的感知极限可能会达到30kHz。$ e/ g& J2 L/ p7 r' ^* p

6 a9 X2 a" |$ d: w) z) y$ D/ N奈奎斯特定律说了,当抽样频率大于信号最高频率的二倍时,就可以不失真的恢复原信号。( T1 x2 i5 g1 e+ M9 X$ H! }+ T- ]! h

' k! M1 v' X- [5 n" I所以,抽样频率采用40kHz,就基本满足绝大多数的听觉范围了。当年录像带大行其道,为了配合录像带记录声音,就把声音的抽样频率定在了44.1kHz。& ~* ~/ |) R) o* t" c

+ P; ^7 {9 x) D" }0 I( `( O  m+ n当然,电脑的音频格式很多采用了48kHz,专业的音视频设备,抽样频率会达到96kHz甚至192kHz。) C0 o' v$ C1 e, Z8 X

$ C4 n2 ^0 o. n+ ~/ M- X  \而传统的程控电话,采用8kHz抽样,因为人们的语音特性大多数包含在4kHz以内。
1 b2 `1 \& m1 H8 q  I/ H
$ l6 @9 z; X( [2 a& W. G* V: I8 U# R) {- j这是第一步,抽样阶段,理论上是可以做到保真的。
+ d* E$ ^) o- O. Y1 H( T' @  u- L; ~1 @2 n  g. A3 l. N
抽样出来的数值,其范围也是在某区域内的无限个数值,是无法进行数字储存、传输的。; V) n$ t* Y( X, `, a2 p: X

5 `0 Z; z. u" S" P: k" e" \8 t# p. [因此就需要对这些采样出来的数值进行量化、编码,量化及编码按照需要使用一定的规律和精度,比如8位量化、16位量化、32位量化等等。特定规律下,位数越高,保真度也越高。
3 U( i$ ?* n, @$ N" }9 K2 n. D) z6 r9 n8 K; [  {1 r$ ?" l' Y5 W; K
量化值和抽样值之间必然会有偏差,这个偏差就叫做量化噪音。
* B. E7 x: t& J' x2 ?  C  f" [: [  Z" m) W8 p  m! @
普通的程控电话传输信道,主要采用A律13折线特性进行量化,8位编码。8kX8=64kbps。北美采用μ律15折线特性。% H6 O5 T' @: j
# c; N3 J) V/ p5 ?; h/ C
以上是第二、三步,量化、编码阶段,由于存在量化噪音,这个阶段是不能做到绝对保真的,只能做到尽量高保真。要是做到了人耳的辨别极限,有少许的量化噪音又有什么关系?5 ?3 ^  v: S3 `) e* u% A; J* |

( F& U' T; X) G% w我还真就认识一个朋友,据说他的耳朵辨别率很高。他除了自己外企本职工作,还经常到处兜售黑胶高保真胶片,我公司楼下的一个英国品牌高级音响店的发烧友主顾他都熟识,经常去发烧友家里辨别个声音就便推销黑胶什么的。他的兼职收入比本职工资都要高了。7 Q# B  d: j; j4 e1 M( \/ x

- I  J( q5 I/ @3 Z3 L# M9 t" ^别跟保真迷们抬杠。他们有的可能真是天赋异禀懂得欣赏,有的是有钱有闲热衷玩儿发烧器材你觉得是装13,有的就是一门养家糊口的好生意。
作者: 清凉山    时间: 2020-12-17 16:16
人耳,指所有年龄段加起来的,频响20-20k是没错,但20来岁就很少有人能到18k了,玩发烧的一般都中年,15~16 k到顶。但是就有人愿意相信商人的忽悠,认为自己有副金耳朵
作者: 看客    时间: 2020-12-18 10:03
清凉山 发表于 2020-12-17 16:16: @( K( M" t% B
人耳,指所有年龄段加起来的,频响20-20k是没错,但20来岁就很少有人能到18k了,玩发烧的一般都中年,15~16  ...

# I+ O1 T% g( K6 h1 H5 ^哈,刚好在观网评论区看到这么一段:8 o! O6 k. t; t
我参加过某厂高级音箱的开发会议,当时这款音箱做了几十个不同的声音样品。请了一群国内顶级发烧友来评选,大家评选出其中一个样品的声音最好,厂家以这款产品为最终设计定型。我当时就对厂家提意见,认为这群评委年纪偏大,对高音不敏感,他们认为舒服的高音,对年轻人而言是折磨。9 A) z  u% r/ Z( M" H( H% X
可惜厂家没采纳我的意见,果不其然,产品上市后,年轻人的网络评论多数认为这款音箱高音太刺耳,听着不舒服。当我看到某些顶级发烧友在媒体上发表这款音箱的主观评价文章:什么高音细腻,声音通透,中音明亮。。。我只能是一声叹息。

( h4 {% {! ~0 `: n, y% b( t$ f* O+ V3 b2 c
" L5 X5 Q# i" o- J; D

作者: 雨楼    时间: 2020-12-18 10:39
频谱分析仪说话。其他的都是玄学,或者直白些,忽悠。
作者: MacArthur    时间: 2020-12-18 11:25
看客 发表于 2020-12-17 21:03! k0 O2 o' T9 }3 I% \% `
哈,刚好在观网评论区看到这么一段:

5 x* q1 x. J$ x$ w- }问题在于,到底是年轻人有钱,还是中年发烧友们有钱?
( j& X4 G" Z* a% v5 p4 e2 F
作者: 看客    时间: 2020-12-18 11:42
MacArthur 发表于 2020-12-18 11:25" C) J* P- D2 B; ~: ]# G9 r/ n4 o
问题在于,到底是年轻人有钱,还是中年发烧友们有钱?

& H2 w1 C% j$ H. {5 ]如果产品的目标人群就是年轻人,显然中年人再怎么有钱也不会花在这上头的。
作者: 清凉山    时间: 2020-12-18 14:28
关于44.1k的采样频率,记得是飞利浦跟索尼联合开发cd时定下来的。有一说法是Sony老总希望一张cd能容下贝九,44.1正好满足要求,但是这一传说被证伪了。反正高于44.1的其实没人能听出差别来。
作者: 清凉山    时间: 2020-12-18 15:18
看客 发表于 2020-12-18 10:03$ N% t5 l+ w5 Y* U
哈,刚好在观网评论区看到这么一段:

0 r1 Y3 [6 ?5 R这算什么,那些面向年轻人的唱片调音大师们有几个不是五十往上的




欢迎光临 爱吱声 (http://129.226.69.186/bbs/) Powered by Discuz! X3.2