Audio Compression

디지털 오디오를 압축 시키는 기술과 포맷에 대하여 이야기 합니다.

데이터 압축을 사용하는 이유는 일반적인 LPCM 오디오 파일의 데이터의 크기가 상당히 커서 온라인을 통해 전송하거나 저장하는것이 쉽지 않기 때문이다. 데이터 압축 기술을 사용하면 데이터 저장 공간과 파일 저장을 위한 메모리의 크기를 줄일수있게 되며 그 결과로 파일 전송 시간 또한 줄일수 있게 된다.    

데이터 압축 기술은 두가지가 있는데 데이터 압축이 소리 음질에 영향을 가하는  Lossy 방식과 데이터 압축이 되더라도 음질에는 변화가 없는 Lossless 방식으로 구분 된다. 데이터 압축에는 다양한 코댁을 사용하고 있는데 그들 코덱 특성에 따라 사운드 특성 또한 다양하게 나타나며 코덱 마다 다른 특성을 지니며 그 사용 목적 또한 다르다.

Lossy Codec 

데이터 손실 코댁 방식은 시그널 데이터가 마스킹 또는 커버 될수있는 것을 삭제하여 파일의 크기를 줄이는 방식이다. 불필요한 데이터를 삭제 시킴으로 삭제된 데이터를 다시 본래 상태로 되돌릴수는 없게 되는데 그러한 특성에 의해 이 방식을 손실 형 압축 방식이라 한다.  

소스의 특성과 코댁 파라메터 세팅에 따라 손실 압축 방식에 의하여 손실된 부분이 청각상 감지가 어려운 상태로 되거나 감지 가능한 상태로 될수있다.  손실 압축 방식에 의한 사운드 손실이 가청 가능한 상태로 나타난다 할지라도 일반적인 용도로는 괜찮은 음질 특성을 내 보임에 따라 다양한 용도로 사용 되고있다.  

 

MP3  

MP3는 정확하게 MPEG-1 Audio Layer3로 표기 된다. MP3파일은 대중적으로 널리 사용 되는 것으로  웨이브 파일이 압축된 형태의 파일이다. MPEG-1파일은 웨이브 파일의 크기에 12분의1 정도의 크기로 압축 되며 이와같은 크기로 웨이브 파일을 압축 시킴에 따라  수백 수천곡의 파일을 저장하는 것이 가능하게 된다.  

 

AAC 

AAC 파일은 Advanced Audio Codec으로  Dolby, FhG, AT&T, SONY, Nokia 등 MPEG그룹에 의해 만들어졌다.  AAC파일은 다음의 특징을 지닌다. 

  • MP3 는 6Hz에서 48KHz까지의 샘플링 사용이 가능한 반면 AAC 는 8Hz에서 96KHz까지의 샘플링 사용이 가능하다.  
  • 48채널까지 사용 가능하다.  
  • 높은 코딩 효율성을 내보이며 그로인한 음질의 향상과 낮은 비트 비율 특성을 지닌다.  
  • 16KHz이상 주파수 처리가 매우 수월하다.  
  • 파일 전송이 매우 용이 하다.  

AAC는  MPEG-4(.mp4, .m4a)를 감싸는 것으로 매우 빠르게 발전되고있다. 애플의 iPod은 AAC로서 MPEG-4에 대한 완전한 호환성을 내보이는 장치이다.  

 

MPEG-4   

MPEG-4는 새로운 기준의 포맷으로 MP3와는 아무런 관련이 없는 것이다. MPEG-4기술은 컨텐츠를 그들 각각의 요소로 분산 시키는 프로세스에 의해 작용하는 것이다. 이 기술을 통해 영화에 오디오, 타이틀, 서브 타이틀, 영상의 4가지 요소가 함께하며 하나의 완전한 영화를 만들게 된다.  

최상의 음질을 요구하는 경우가 아니라면 가장 낮은 디스크 공간을 사용하고 각 요소를 분석하고 그에 적절한 압축 포맷을 사용하도록 하고있다. 예를들자면 영화에서 장면이 전화 통화를 하는 장면인 경우 오케스트라가 연주하는 장면과 달리 낮은 음질의 압축 포맷을 선택 사용하도록 하여 디스크 공간 사용을 최적화 한다는 것이다. 또한 전화 통화를 하는 연기자의 입모양 만이 화면에 나타나는 장면 이라면 전체 오케스트라가 나타나는 화면과 달리 낮은 등급의 화질을 선택 사용할수 있다는 것이다.  MPEG-4 는 다음의 다양한 확장자를 지니고있다.  

  • .mp4 는 오디오와 비디오를 위한 MPEG-4의 공식 확장자 
  • m4a 는 애플 컴퓨터에 의해 만들어진 것으로 Apple Lossless Audio Codec파일을 위한 것이다.
    .m4a는 mp4로 표기 하기도 한다.  
  • .m4p : digital right management (DRM), 디지털 소유 관리 파일로 애플 itune 에서 판매되는 파일이 지니는 포맷이다.  
  • .m4e : .sdp의 새로운 이름으로 스트리밍을 위한 Envivio 에 의해 사용 되는 파일이다.  
  • .m4v, mp4v, cmp, divx, xvid 는 비디오 만을 위한 것으로 raw MPEG-4비디오 스트리밍이다.  
  • .3gp, .3g2 : 스마트폰에 사용 되는 것이다.  

  

WMA (window Media Audio)  

 WMA는 MP3를 상대하기 위해 Microsoft사 에서 만들어낸 오디오 파일 포맷이다. WMA파일은 항상 ASF (Advanced File Format)파일 내에 넣어져야 한다.  파일이 오디오 만을 위해 사용 되는 경우 파일이 suffix.wma 또는 .asf와 .wma suffix 확장자를 필히 지녀야 한다.  ASF파일 포맷은 파일이 어떻게 인코드 되었는지를 명시하는 것으로 MP3파일의 ID3와 비슷한 것이다.  

 

OGG (Ogg Vorbis)  

MP3와 비슷한 또 다른 압축 소스 코드이다. WMA와 같이 이 데이터 압축 방식은 효율적으로 파일 크기를 줄이도록 하는 압축 포맷이다. Ogg Vorbis는 오픈 소스로 사용을 위한 라이센스 취득을 필요로 하지 않는다.  MP3인코더가 일관적인 비트 비율로 데이터를 압축 시키는 것과 달리 Ogg 는 변환가능한 압축 율을 사용한다.  

 

mu-Law

mu-Law는 압축된 음성 수준 음질에 대한 국제적 기준이 되는 파일 포맷이다.  이 포맷의 압축 비율은 2 :1 이다. 이 포맷은 음성에 특성화 되어있으며 미국내 통신 시스템에 대한 압축 기술의 기준으로 되어있다.  인터넷을 통해서는 mu-law가 .au파일 포맷으로 사용 되고 있으며 Sun audio 포맷으로도 알려져있다.   

 

AC-3 (Dolby Digital)  

돌비 디지털은 DVD비디오에 기준이 되는 오디오 코댁이다. 돌비 디지털 ( AC-3)는 최대 6개 채널의 48KHz/ 24비트 오디오 정보 처리가 가능하며 약 11:1 비율의 압축과 최대 640kbps의 비트 비율을 내보인다 (평균 비율은 384kbps로 된다). 

 

DTS (DTS Coherence Acoustics)  

 DTS의 본래 이름은 DTS Coherence Acoustics 이다. DTS는 48KHz샘플링의 5.1채널에 대한 다양한 비트 비율과 압축 비율을 제공한다.
DTS는 DVD 비디오에서 옵션으로 사용이 가능하며 3:1 압축 비율과 평균 데이터 전송비율이 1.4Mbps 로 된다.  DTS 코댁을 만든 회사가 Digital Theater Systems이며 이 회사는 영화 감독 스티븐 스필버그가 공동 설립자겸 공동 소유자로 되어있다. 이 포맷을 사용한 작업이 1991년 시작되었으나 공식적으로는 1993년 스필버그 감독의 영화 쥬라기 공원을 통해 처음으로 선보였다.  

DTS인코드 파일의 확장자는 .cpt, .dts, .wav로 된다. 대부분의 DVD 오소링 워크스테이션이 .dts파일보다 컴팩트한 .cpt파일을 사용하고 있다.  .cpt파일은 프로젝트의 시작 시간을 위한 마크를 지니고있다. .wav파일은 주로 5.1 음악 디스크로서 독립된 오디오 디스크에 사용 되거나 체크용 디스크로 사용 되고 있다.  

 

Dolby-EX 와 DTS-ES  

돌비와 DTS의 7개 채널 시스템인 6.1 오디오 엔코딩 포맷으로 후방 센터 스피커 를 사용하는 포맷에 주로 사용된다.  

 

Dolby Digital Plus 

돌비의 새로운 오디오 코댁으로 현존하는 돌비 디지털 코댁과 함께 backward 호환이 가능한 것이다. 돌비 디지털 플러스는 14채널 (13.1 서라운드) 가 가능하며 최대 6Mbps의 데이터 비율 전송이 가능하다. 돌비 디지털 플러스는  HD-DVD비디오의 기준이 되는 것이며 블루레이 디스크에서는 옵션 선택 포맷으로 사용 되고 있다.  

 

Lossless Codec 비손실 코댁  

 비손실 포맷 오디오는 약 2;1의 압축 비율을 사용하나 압축으로 인한 그 어떠한 데이터 또는 음질의 손실을 내보이지 않도록 하는 것이다. 그럼 으로 이들 파일의 압축 상태를 풀면 오리지널 파일과 동일한 상태로 되돌아 오게된다.  

 

FLAC (Free Lossless Audio Codec)  

 FLAC은 4에서 32비트의 리솔루션을 내보이는PCM 샘플로 1Hz증가에 따라 1Hz에서 1,048,570Hz의 샘플 비율을 지원하며 1에서 8개 채널을 각각 독립적으로 필요에 따라 스트리밍 시키는 것이 가능하며 여러개 파일을 합쳐 적절한 파일 컨테이너 상태로 만드는 것 또한 가능하다. FLAC은 .flac확장자와 함께 저장된다.  

 

MLP (meridian Lossless Packing)  

DVD 오디오 디스크에 기준으로 사용 되는 압축 방식으로 최대 6개 채널의 고해상도 96/24비트 오디오 또는 192/24의 2채널 오디오 저장이 가능하다.  MLP 의 뜻은 특성을 나타내는 것으로 데이터 압축 프로세스 동안 그 어떠한 데이터 손실도 없음을 의미하는 것이다. MLP 는 1.85 : 1의 압축 비율을 사용하며 돌비 연구소로 부터 라이센스를 얻어야 사용할수 있다.  

DTS-HD  
 

DTS-HD는 DTS Coherent Acoustics 오디오 코딩 시스템의 확장 세트이다. 차세대 광 디스크의 기준이며 DTS 디코더는 모든 HD DVD 또는 블루레이 디스크 플레이어에 장착되고있다. DTS 디지털 서라운드 (DTS core 5.1) 는 블루레이와 HD-DVD에 법정 의무 오디오 기술로 선택되어있다.  

 

Dolby True HD  
 

고해상도 디스크 매체를 위한 돌비의 차세대 비손실 오디오 기술이다. Dolby True HD는 8채널 이상의 18Mbps 전송률의 96/24 오디오를 지원한다.  

 

Apple Lossless  

 Apple Lossless 인코더 또는 Apple Lossless Audio Codec (ALAC) 으로 알려져있으며 비손실 디지털 음악을 위해 애플 컴퓨터에서 만든 오디오 코댁이다.  Apple Lossless 데이터는 MP4콘테이터 내에 저장이 되며 .m4a파일 확장자명을 지닌다. ALAC 압축 파일은 오리지널 파일 크기의 60%로 된다. 다른 포맷들에 비하여 Apple Lossless는 디코드 하는것이 어렵지 않으며 iPod와 같이 전력이 제한된 장치에 매우 효율적인 것으로 되고있다. Apple Lossless 인코더는 본래 Quick Time과  iTunes의 한 요소로서 소개된 것이다.