양자화 (Quantization)
이전 글에서 표본화(Sampling)란 연속 신호를 이산 신호로 변환하는 것이라고 하였다.
양자화 또한 아날로그 신호의 연속된 값을 이산 값으로 변환하는 것이다.
그렇다면 표본화와 양자화의 차이는 무엇일까?
오디오 신호에서 표본화는 시간축을 따라 연속된 시간을 이산 값으로 변환한다.
양자화는 진폭 축을 따라 연속된 진폭(파형의 높이)을 이산 값으로 변환한다.
일반적으로 아래 그림과 같이 샘플링을 통해 일정한 주기로 표본을 나누고, 양자화를 통해 표본 각각의 진폭 값(파형의 높이)을 구해 디지털화를 수행한다.
오디오 신호를 8bit로 양자화한다면 256(2^8) 단계의 음으로 소리를 표현할 수 있다.
만약 16bit로 양자화한다면 65536(2^16) 단계의 음으로 소리를 표현할 수 있을 것이다.
양자화를 정교하게 할수록 원음에 가깝게 디지털화된다.
반면, 음을 표현하기 위해 할당된 bit 수에 비례하여 데이터 용량 또한 커질 것이다.
Linear vs Non-Linear PCM
양자화 시 연속된 진폭 값을 이산 값으로 근사화시킬 때 발생하는 오차를 양자화 잡음(quantization noise)이라고 한다.
양자화 잡음이 크면 당연히 데이터의 품질이 떨어지므로 이를 최소화시킬 필요가 있다.
그러나 위에서 언급한 것처럼 양자화를 세밀하게 하게 되면 데이터의 크기가 커진다.
이를 해소하기 위한 방법이 Non-Linear(비선형) 양자화 방식이다.
사람의 귀는 높은음(고주파)보다 낮은음(저주파)에 더 민감하다.
이를 이용하여 낮은음 구간은 양자화를 더 세밀하게 진행하고 높은음 구간은 양자화를 대충 한다면, 사람이 느끼기에는 더욱 좋은 품질의 오디오가 될 것이다.
Non-Linear 양자화를 하는 방법에는 A-law와 μ-law방식이 있다. (A-law는 주로 유럽 전화망에서 사용되며, μ-law는 북미에서 사용됨)
CD 품질에 대하여... (44.1kHz 16bit)
오디오 CD를 44.1kHz로 샘플링하는 이유는 이전 글에서 다뤘었다.
이번에는 왜 오디오 CD를 16bit로 양자화하는지 알아보자.
위의 표에서 볼 수 있듯이 오디오 신호의 진폭을 16bit로 양자화하는 경우 약 96dB의 Dynamic Range를 가진다.
일상생활에서 사람이 대화하는 소리는 50dB ~ 70dB이며, 공장에서 나는 소리나 전기톱 소리가 100dB이다.
100dB의 소리에 2시간 이상 노출되면 위험하다고 한다.
따라서 16bit로 양자화 한 오디오 CD의 경우, 일반적인 상황에서 우리가 96dB 이하의 소리를 재생하는데 문제가 없다.