[디지털오디오] 표본화(Sampling) - 나이키스트(Nyquist) 이론
Media/Media Science

[디지털오디오] 표본화(Sampling) - 나이키스트(Nyquist) 이론

728x90
반응형

표본화 (Sampling)

표본화(Sampling)란 연속 신호를 이산 신호로 변환하는 것이다.

즉, 연속된 시간 또는 공간에서 일정한 주기(간격)로 표본 값을 추출하는 것을 의미한다.

 

오디오 신호의 경우, 연속된 아날로그 파형의 시간축을 샘플링하여 디지털 신호로 변환한다.

이때 1초 동안의 샘플링 횟수를 나타내는 수치를 Sampling Rate 라고하며, Hz 단위를 사용한다.

(20Hz는 초당 20개의 샘플을 가진다는 뜻이다.)

 

Under Sampling vs Over Sampling

Sampling Rate가 높을수록 아날로그 신호에 가깝게 디지털화할 수 있을 것이다.

그러나, 이에 비례하여 디지털 데이터의 크기 또한 커질 것이다.

 

그렇다고 Sampling Rate를 줄이면, 데이터의 품질이 떨어질 것이다.

또한 고주파 성분끼리의 간섭이 일어나 에일리어스 신호(Aliased signal)가 발생할 가능성도 있다.

 

우리는 가장 적절한 Sampling Rate로 샘플링을 진행하여야 한다.

 

Nyquist-Shannon Sampling theorem

스웨덴 출신의 미국 전기통신 공학자인 나이키스트 (Harry Nyquist)가 나이퀴스트 표본화 정리 이론을 내놓았다.

 

 

신호를 주파수 영역으로 표현했을 때 가장 빠른 주파수 성분을 fmax(fm)라고 한다면, 신호 내에 있는 유효한 정보를 디지털로 모두 표현하기 위해서는 적어도 fmax의 2배 이상으로 샘플링해야 한다.

즉, 가장 빠른 주파수의 2배 이상으로 샘플링해야 한다는 것이다.

 

샤논(Claude Shannon)은 나이키스트의 이론을 확장하여 Sampling Rate가 Nyquist Samping Rate 이상(fs ≥ 2fm)일 때 에일리어싱(Aliasing)이 생기지 않는다는 것을 정리하였다.

 

실생활에서 이를 적용한 예를 찾아보자.

전화 음성의 주파수 대역은 약 0.3 ~ 3.4kHz이다.

따라서 전화 음성의 Sampling Rate는 3.4kHz의 2배 이상인 8kHz로 채택되어 사용된다.

 

또한, 사람의 가청 주파수 대역은 약 20Hz ~ 20kHz이다.

따라서 오디오 CD의 경우, Sampling Rate를 가청 최대 주파수의 2배 이상인 44.1kHz로 채택하였다.

사실 40kHz 이상이면 되지만 44.1kHz로 채택된 흥미로운 이유가 있다.

 

과거엔 디스크 드라이브의 용량이 적어 장시간 오디오 데이터를 저장하기 힘들었고, 마그네틱 테이프에 영상 파형을 만들어 오디오 샘플을 저장하였다.

마그네틱 테이프에는 주사선을 이용하여 영상을 기록하며, 세계적으로 NTSC(Natijonal Television System Committe)와 PAL(Phase Alternation by Line), SECAM(Sequential Color and Memory) 규격을 표준으로 사용한다.

NTSC의 경우 60Hz에 30fps이며 프레임당 525개의 주사선을 가진다.

PAL과 SECAM의 경우 50Hz에 25fps이며 프레임당 625개의 주사선을 가진다.

따라서 두개의 표준을 모두 호환하기 위해 44100이라는 숫자가 나왔다고 한다.

- 60 * 245 * 3 = 44100

- 50 * 294 * 3 = 44100

(참고 : http://www.cs.columbia.edu/~hgs/audio/44.1.html)

728x90
반응형