글 이무제 기자 자료제공 플랫톤즈(주)
최근 Immersive Sound가 화두의 중심이 되면서 많은 제조사들이 시장 요구에 대응하는 것을 넘어 업계 표준을 선점하기 위해 발등에 불이 떨어진 듯 움직이고 있다. 프로페셔널 스피커 제조사 측에서는 라이브 상황에서도 3D 음향을 제공하고 실시간으로 콘트롤 및 프로세싱이 가능한 다양한 솔루션을 내놓고 있다. L-Acoustics의 L-ISA나 d&b audiotechnik의 Soundscape 등이 바로 그것이다. 브로드웨이 뮤지컬계에서 오랜시간 갈고 닦아온 Meyer Sound도 자사의 Constellation 시스템을 활용한 새로운 입체음향 솔루션을 준비하고 있다는 소식이다. 한편 프로세서 분야에서도 도전이 오래 이어져왔다. Iosono나 Astro Spatial, 그리고 소프트웨어 기반으로는 Flux의 Spat Revolution도 이 분야의 강자다. 영화 분야에서는 3D 사운드 기술을 처음 시도하여 선점에 성공한 Auro 3D와 이제는 후발주자의 모양새가 된 Dolby Atmos의 격돌이 이어지고 있다.
그리고 이제 마이크로폰 분야에서도 격돌이 발생할 조짐이 보인다. Sennheiser, Røde, DPA 등 전통적인 마이크로폰 시장의 강자는 물론 4차 앰비소닉을 지원하는 Eigenmike를 생산하는 mk acoustics, 3차 앰비소닉에 그치지만 저렴한 가격으로 승부하는 Zylia의 ZM-1, 2차 앰비소닉을 지원하는 Coresound의 OctoMic 등 신생업체들도 전쟁에 뛰어들며 정면승부를 준비하고 있다. 이 가운데 ‘마이크 끝판왕’이라 칭해지는 Schoeps가 참전을 선언했다. Schoeps CCM 41 및 41V 마이크로폰이 8개 조합된 ORTF-3D 마이크로폰이다.
(주)플랫톤즈가 보유한 Schoeps ORTF-3D는 국내 최초로 도입된 것으로, VR이나 게임은 물론 방송, 클래식 녹음, 영화 등 고품질의 프로덕션 환경에도 대응이 가능한 유일한 마이크로폰이다.
3D 마이크로폰의 시장 동향
3D에 있어서 마이크로폰 분야는 아직까지는 무주공산(無主空山)에 가깝다. 현재는 Røde와 한 식구가 된 Soundfiled가 오랫동안 이 분야에 매진해왔지만 1차 앰비소닉 방식에 그쳐 드라마틱한 3D 효과 및 고음질을 구현하기에는 다소 한계가 있었다. 1차 앰비소닉 방식은 단 4채널만으로도 앰비소닉 B-Format을 생성할 수 있어서 호환성이 높고 다양한 분야에 적용할 수 있지만 아무리 마이크로폰의 퀄리티를 높이더라도 극복할 수 없는 근본적인 한계가 있다. 바로 [r = lc / 2πf]라는, 앰비소닉 차수에 따른 공간해상력이 문제가 되는 것이다. 여기서 r은 앰비소닉 반경(m), l은 앰비소닉 차수, c는 음속을 말한다. f는 주파수인데, r값이 인체의 머리 크기보다 커야 방향성이 제대로 표현된다. 위 계산식에 따르면 1차 앰비소닉에서 600Hz일 때의 r값은 약 0.09정도가 나오므로 인체의 머리 반경과 비슷해진다. 즉 600Hz 이하에서만 방향성이 표현되고 그 이상은 잘 표현되지 않는다는 것이다. 이 자체로도 문제지만 1963년 Franssen의 연구에 의하면 인체는 대략 700Hz 정도 이하의 대역은 대체로 시간차를 통해 방향성을 인지하게 된다. 즉, 모처럼 앰비소닉 신호를 다양한 포맷으로 디코딩한다고 해도 큰 의미가 없어지는 것이다.
Eigenmike는 앰비소닉 방식으로는 현존하는 가장 높은 4차까지 지원하는 마이크이지만 32개에 이르는 입력 채널을 녹음 및 프로세싱해야 하며 또한 각 마이크 프리앰프의 노이즈가 그대로 서밍된다는 단점이 있다.
이에 따라 시장은 고차 앰비소닉으로 옮겨가고 있는 추세다. 온라인 유통 매체 중 유일하게 2차 앰비소닉을 지원하는 Facebook은 얼마전 시행한 자사의 인코딩 소프트웨어 Suite 업데이트에서 3차 앰비소닉의 지원을 공식적으로 발표하면서 곧 온라인으로도 3차 앰비소닉 콘텐츠를 즐길 수 있게 될 전망이다. 또한 게임용 사운드 미들웨어로 유명한 Wwise 역시 기본적으로 3차 앰비소닉을 지원한다. 또한 시장에서는 마이크로폰의 개별 퀄리티를 높이기보다는 Mems 마이크로폰 등을 이용해 트랜스듀서의 개수를 늘려 저렴한 가격으로 고차 앰비소닉을 지원하는 마이크들이 등장하고 있다. 앞으로의 방향성이 명확해지는 것이다.
그런데 앰비소닉 포맷은 차수를 늘릴수록 필요한 채널 수가 기하급수적으로 늘어나는 치명적인 단점이 있다. 20kHz까지 명확한 방향성을 지원하려면 32차까지 가야하는데, 이 경우 필요한 채널 수가 1,000개를 넘어서기 때문에 현실적으로 불가능하며, 현실적인 10kHz 정도까지 방향성을 부여하려면 7차 앰비소닉, 즉 64개 채널이 필요하다. 이는 기존의 A-Format 방식으로 마이크로폰을 배치한다면 고스란히 채널 수만큼의 마이크로폰이 필요하다. 즉, 3차 앰비소닉 구현에는 16개 이상, 4차에 25개 이상, 5차는 36채널 이상이 필요하다는 것이다. 또한 작은 마이크로폰이 다량 어레이 및 서밍되는 방식이기에 SNR도 무시할 수 없게 된다. 다이어프램의 면적은 출력 볼티지와 비례 관계에 있기 때문에 적정 감도를 얻기 위해서는 프리앰프에서 증폭을 해야 하는데, 이 과정에서 SNR 특성이 나빠지게 된다. 이런 마이크로폰이 20~30여개 이상 서밍된다면 섬세한 다이나믹의 녹음에서 큰 손해를 보게 된다.
이에 따라 Schopes가 내놓은 ORTF-3D 방식이 새롭게 주목받고 있다. 방송이나 영화 녹음 등에서 널리 사용되는 ORTF 스테레오 테크닉의 확장판인 ORTF-3D는 단 8개의 마이크로폰으로도 사실적인 고품질의 3D 음향을 실현하는 유일한 마이크로폰으로 평가받고 있다. 출시 초기에는 적당한 플러그인이나 소프트웨어를 찾기 힘들었기 때문에 주로 Auro 3D나 Dolby Atmos 등의 채널 기반 작업에서 선호되었으나 IEM Plug-in Suite(https://plugins.iem.at/)가 무료로 배포되면서 ORTF-3D의 고품질 음원을 고차 앰비소닉으로 인코딩할 수 있는 길이 열렸다. Schoeps의 정평난 고품질 마이크로폰을 단 8개만 사용하기 때문에 SNR 면에서 현존하는 3D 마이크로폰 중 가장 뛰어나기 때문에 현장의 다이나믹한 소리를 실감나게 담아내기에 부족함이 없다.
IEM Plug-in Suite 개요
현재 IEM Plug-in Suite에서 지원하는 앰비소닉 인코딩은 최대 7차, 즉 64채널이다. 이를 위해 IEM Plug-in Suite를 최대 성능으로 사용하려면 64채널을 지원하는 플러그인 버스 구조를 갖춰야 한다. 다행스럽게도 매우 저렴하게 구할 수 있는 DAW 소프트웨어인 Reaper가 해당 기능을 지원한다. 이에 따라 워크플로우는 Reaper를 기준으로 설명할 것이다. IEM Plug-in Suite 웹사이트에서도 Reaper를 기준으로 각종 설명과 예시를 들고 있다.
IEM Plug-in Suite를 설치하면 총 20개의 Ambisonics 관련 플러그인들이 설치된다. 지면상 모든 플러그인들을 다 설명하긴 어려우므로 ORTF-3D 마이크로폰 작업을 위해 필수적인 플러그인만 우선 다뤄보자.
AllRADecoder 이 플러그인은 앰비소닉 신호를 실제 스피커 배치로 디코딩해주는 역할을 한다. 가장 먼저 소개했지만, 시그널 상으로는 가장 나중에 배치되어야 한다. 이론적으로는 AllRAD(All-Round Ambisonic Panning and Decoding) 접근법에 기반하는데, 간단히 설명하자면 스피커와 스피커 사이의 음량 조절로 팬텀이미지를 만들어내 가상의 음상을 형성하는 VBAP(Vector-Base Amplitude-Panning) 방식으로 앰비소닉 신호를 디코딩하는 것이다. 이에 대한 자세한 설명은 [http://www.aes.org/e-lib/browse.cfm?elib=16554]에서 참고할 수 있다. 스피커 레이아웃 정보는 .json 파일로 익스포트 할 수 있는데, 이를 이어 설명할 Simple Decorder에 집어넣으면 서브우퍼 신호까지 따로 필터링 및 라우팅이 가능해진다.
BinauralDecoder 상황에 따라 가장 중요할 수도 있는 플러그인이 바로 Binaural Decoder이다. 현재 Neumann KU 100 더미헤드를 이용해서 측정한 HRTF 데이터를 활용하고 있어서 높은 수준의 디코딩이 가능하다. 원리는 간단하다. 고차 앰비소닉 B-Format 사운드를 HRTF 데이터를 이용해서 2채널의 바이노럴로 변환하는 것이다. 인터넷 스트리밍 등으로 이어폰이나 헤드폰 등을 통한 입체 음향을 구현해야 할 때 매우 유용하다.
MultiEncoder ‘MultiEncoder’는 멀티트랙 오디오 신호를 고차 앰비소닉으로 전환해주는 플러그인이다. 이를 통해 3D 사운드를 포함한 다양한 오디오 소스를 앰비소닉 3차원 공간 안에 배치할 수 있다. ORTF-3D 마이크로폰의 신호를 고차 앰비소닉으로 전환해주는 핵심적인 역할을 수행한다.
SimpleDecoder 서브우퍼가 없다면 AllRADecoder만으로도 충분하다. 하지만 서브우퍼를 사용해야 하는 환경이라면 AllRADecoder는 스피커 레이아웃 데이터를 추출하는데만 사용하고 지금 소개하는 SimpleDecoder를 사용할 것을 권한다. AllRADecoder에서 .json 파일을 익스포트한 후 해당 파일을 SimpleDecoder에서 불러들이면 해당 스피커의 레이아웃이 그대로 구현된다. 그리고 별도의 서브우퍼를 필터링하고 채널에 배치할 수 있기에 매우 유용하다.
IEM Plug-in Suite는 이 외에도 룸 리버브를 시뮬레이션하는 RoomEncoder나 씬을 회전시킬 수 있는 SceneRotator, 거리감을 조절할 수 있는 DistanceCompensator, 모노 소스를 앰비소닉 음원으로 배치할 수 있는 DirectivityShaper, 방향성에 따른 컴프레싱을 할 수 있는 DirectionalCompressor, 찾기 힘든 3D 리버브 머신인 FdnReverb 등을 제공하고 있으므로 상상하는 거의 모든 앰비소닉 기반 작업이 가능하다.
채널 기반 Vs. 앰비소닉 기반
블루레이 디스크나 극장 등에 배포할 소스를 작업하는 것이라면 채널 기반으로 작업하는 것이 음질면에서 확실히 유리하다. 예컨대 Auro 3D 기본 구성인 9.1채널, 혹은 5.1.4 구성이라면 기본적으로 수평 레이어 5.1채널에 상단 레이어 4채널이 추가된 구조이기 때문에 ORTF-3D의 8개 채널은 각각 L, R, LS, RS, LH, RH, LSH, RSH 채널에 대응시키면 된다. ORTF-3D로 녹음한 소스를 앰비언스로만 사용할 경우에는 이것만으로도 충분하며 주로 센터 채널에는 배우의 대화 정보가 담기게 된다. ORTF-3D 소스를 주 음원으로 사용할 경우에는 L, R을 M/S 프로세싱하여 M 채널만 센터로 라우팅하면 된다. 그 외에 Dolby Atmos나 Auro 3D, 혹은 SPAT Rev. 의 패너를 사용할 경우에는 3D Cube 소스로 인식하게끔 하면 손쉽게 공간 음향의 회전 등의 후가공 작업을 할 수 있다.
앰비소닉으로 변환하는 이유는 단 한가지이다. 실시간으로 방향정보를 반영할 수 있는 유일한 포맷이기 때문이다. 물론 이는 HRTF를 이용한 바이노럴로도 어느정도 가능하지만 바이노럴은 헤드폰에서만 3D 사운드의 실현이 가능하다는 치명적인 단점이 있다. 앰비소닉은 어떤 형태의 스피커 배치든지, 헤드폰이든지간에 상관없이 균일한 결과를 얻을 수 있으며 5차 이상의 앰비소닉을 사용할 경우에는 상업용으로도 받아들여질 수 있는 높은 퀄리티의 구현까지 가능하다. 엄밀히 따지자면 손실없이 바로 출력 채널로 라우팅되는 채널 기반 작업이 음질 면에서는 더 뛰어나지만 앰비소닉의 차수만 충분히 높다면 굳이 피할 필요는 없다.
Schoeps ORTF-3D with IEM Plug-in Suite 워크플로우
가장 먼저 준비해야 할 것은 3D 모니터링 환경이다. 이미 기존에 5.1채널 서라운드 구성을 취하고 있는 유저라면 상단 레이어 4채널만 더 추가하면 되기 때문에 비용적으로 큰 부담은 없다. 새로 구성하는 경우 여의치 않다면 서브우퍼 없이 단 8개의 스피커만 사용하는 ‘3D Cube’ 배치를 해도 된다. 이도 저도 할 수 있는 상황이 아니라면 BinauralDecoder를 사용해서 헤드폰 위주로 작업한 후, AllRADecoder에서 2채널 스테레오 스피커를 실제 스피커로, 나머지 3차원 스피커들을 가상으로 배치해서라도 간단히 체험해볼 수는 있다. 구체적인 방법은 이어서 설명하겠다. Reaper 및 IEM Plug-in Suite의 인스톨 방법은 따로 설명하지는 않을 것이다. 작업 기준은 7차 앰비소닉이다.
입출력 라우팅 가장 먼저 해야할 것은 입출력 라우팅이다. ORTF-3D의 녹음 데이터는 8채널 멀티트랙이다. 여기서 프로세싱 및 앰비소닉의 인코딩이 된 후에는 64채널로 바뀌므로, 이 시그널을 어디에서 보내서 어떻게 모니터링하고 익스포트 할 것인지를 먼저 생각해야 한다. 필자의 작업환경은 Focusrite Clarett 8Pre로 아날로그 출력 10개 채널을 이용해 Auro 3D 레이아웃을 빌린 9.1 환경을 구성했다. 안타깝게도 Clarett 8Pre의 두 개의 헤드폰 단자는 아날로그 출력을 공유하도록 설계되었기 때문에 헤드폰 모니터링용으로 사용할 수는 없게 되었다. 필자는 이에 따라 SPDIF 컨버팅 기능이 있는 헤드폰 앰프를 별도로 추가하여 Clarett 8Pre의 SPDIF 출력과 연결했다. 이에 따라 스피커 아웃은 Clarett 8Pre의 아날로그 아웃, 헤드폰 아웃은 SPDIF 아웃으로 루팅된다.
1~10채널의 스피커는 순서대로 L, R, LS, RS, LH, RH, LSH, RSH로 8채널을 점유하며 9번째 채널에는 Center 스피커가, 그리고 마지막 10번째 채널에는 서브우퍼가 연결되었다. 필자가 사용하는 스피커 시스템은 JBL LSR 308Mk2를 중심으로 LSR 10 서브우퍼와 함께 Control 1을 위성스피커로 구성했다.
MultiEncoder 셋업 가장 먼저 할 일은 8채널 소스에 MultiEncoder 플러그인을 걸어둔 후 좌측 상단의 입력 채널 수를 8개로 셋팅하는 것이다. 그러면 8개의 입력 방향 셋팅 노브들이 뜨게 된다. 필자의 경우 ORTF-3D의 실제 배치 레이아웃을 그대로 따랐다. 구체적인 수치는 첨부한 캡쳐를 보면 힌트를 얻을 수 있을 것이다.
AllRADecoder 및 SimpleDecoder 셋업 스피커 모니터링 트랙에 우선 AllRADecoder 플러그인을 띄우고 스피커를 배치해본다. Auro 3D 9.1 레이아웃은 하단 레이어 0°, 상단 레이어 30°가 기준이지만 이대로 셋업하면 하단 음원 정보를 표현할 수 없기 때문에 에러 메시지가 뜬다. 필자는 이를 피하기 위해 하단 레이어 -5°, 상단 레이어는 25°로 셋업했다. 서브우퍼를 뺀 총 9개의 스피커를 배치하게 되는데, 이렇게 하면 공간 표현력이 다소 균일해지지 않으므로 상단과 하단에 추가적인 가상 스피커를 배치했다. 필자는 0°방향, 상단 90° 지점, 그리고 같은 방향 하단 -90° 지점에 가상 스피커를 배치했다. 스피커를 추가한 후 ‘Imaginary’에 체크하면 가상 스피커가 배치되어 실제 스피커 레이아웃은 9.1이지만 전체 에너지가 한층 균일하게 확장되는 것을 확인할 수 있다. 이후 우측 하단의 Decoder와 Layout에 모두 체크한 후 Export를 눌러 .json 파일을 만들어 둔다.
이후 SimpleDecoder를 같은 트랙에 띄우고 AllRA-Decoder는 삭제하거나 비활성화시킨다. SimpleDecoder에서 먼저 Load Configuration을 누르고 미리 저장해둔 .json 파일을 부르면 스피커 레이아웃이 지정된다. 또한 우측의 서브우퍼 셋팅해서는 별도의 실제 서브우퍼를 사용할 것이므로 discrete로 셋팅하고 서브우퍼의 출력 채널을 10번째로 지정한다. 그 다음 원하는 크로스오버 포인트를 셋팅하면 스피커 출력을 위한 준비가 다 끝난 셈이다. 이 트랙을 이용해 10채널을 익스포트하면 9.1 채널 기반 감상 및 배포를 위한 소스를 만들 수 있다.
BinauralDecoder 셋업 미리 만들어둔 헤드폰 모니터링 트랙에 BinauralDecoder 플러그인을 걸면 64채널의 7차 앰비소닉 시그널이 2트랙의 바이노럴 신호로 디코딩된다. 비록 무료 플러그인이지만 현재 인기있는 헤드폰에 대한 EQ 프리셋까지 있어서 한층 정확한 모니터링이 가능해진다. 또한 이 트랙을 이용해 2트랙을 익스포트하게 되면 손쉽게 인터넷 스트리밍 등을 위한 바이노럴 소스가 만들어진다.
글 이무제 기자 자료제공 플랫톤즈(주)
최근 Immersive Sound가 화두의 중심이 되면서 많은 제조사들이 시장 요구에 대응하는 것을 넘어 업계 표준을 선점하기 위해 발등에 불이 떨어진 듯 움직이고 있다. 프로페셔널 스피커 제조사 측에서는 라이브 상황에서도 3D 음향을 제공하고 실시간으로 콘트롤 및 프로세싱이 가능한 다양한 솔루션을 내놓고 있다. L-Acoustics의 L-ISA나 d&b audiotechnik의 Soundscape 등이 바로 그것이다. 브로드웨이 뮤지컬계에서 오랜시간 갈고 닦아온 Meyer Sound도 자사의 Constellation 시스템을 활용한 새로운 입체음향 솔루션을 준비하고 있다는 소식이다. 한편 프로세서 분야에서도 도전이 오래 이어져왔다. Iosono나 Astro Spatial, 그리고 소프트웨어 기반으로는 Flux의 Spat Revolution도 이 분야의 강자다. 영화 분야에서는 3D 사운드 기술을 처음 시도하여 선점에 성공한 Auro 3D와 이제는 후발주자의 모양새가 된 Dolby Atmos의 격돌이 이어지고 있다.
그리고 이제 마이크로폰 분야에서도 격돌이 발생할 조짐이 보인다. Sennheiser, Røde, DPA 등 전통적인 마이크로폰 시장의 강자는 물론 4차 앰비소닉을 지원하는 Eigenmike를 생산하는 mk acoustics, 3차 앰비소닉에 그치지만 저렴한 가격으로 승부하는 Zylia의 ZM-1, 2차 앰비소닉을 지원하는 Coresound의 OctoMic 등 신생업체들도 전쟁에 뛰어들며 정면승부를 준비하고 있다. 이 가운데 ‘마이크 끝판왕’이라 칭해지는 Schoeps가 참전을 선언했다. Schoeps CCM 41 및 41V 마이크로폰이 8개 조합된 ORTF-3D 마이크로폰이다.
(주)플랫톤즈가 보유한 Schoeps ORTF-3D는 국내 최초로 도입된 것으로, VR이나 게임은 물론 방송, 클래식 녹음, 영화 등 고품질의 프로덕션 환경에도 대응이 가능한 유일한 마이크로폰이다.
3D 마이크로폰의 시장 동향
3D에 있어서 마이크로폰 분야는 아직까지는 무주공산(無主空山)에 가깝다. 현재는 Røde와 한 식구가 된 Soundfiled가 오랫동안 이 분야에 매진해왔지만 1차 앰비소닉 방식에 그쳐 드라마틱한 3D 효과 및 고음질을 구현하기에는 다소 한계가 있었다. 1차 앰비소닉 방식은 단 4채널만으로도 앰비소닉 B-Format을 생성할 수 있어서 호환성이 높고 다양한 분야에 적용할 수 있지만 아무리 마이크로폰의 퀄리티를 높이더라도 극복할 수 없는 근본적인 한계가 있다. 바로 [r = lc / 2πf]라는, 앰비소닉 차수에 따른 공간해상력이 문제가 되는 것이다. 여기서 r은 앰비소닉 반경(m), l은 앰비소닉 차수, c는 음속을 말한다. f는 주파수인데, r값이 인체의 머리 크기보다 커야 방향성이 제대로 표현된다. 위 계산식에 따르면 1차 앰비소닉에서 600Hz일 때의 r값은 약 0.09정도가 나오므로 인체의 머리 반경과 비슷해진다. 즉 600Hz 이하에서만 방향성이 표현되고 그 이상은 잘 표현되지 않는다는 것이다. 이 자체로도 문제지만 1963년 Franssen의 연구에 의하면 인체는 대략 700Hz 정도 이하의 대역은 대체로 시간차를 통해 방향성을 인지하게 된다. 즉, 모처럼 앰비소닉 신호를 다양한 포맷으로 디코딩한다고 해도 큰 의미가 없어지는 것이다.
Eigenmike는 앰비소닉 방식으로는 현존하는 가장 높은 4차까지 지원하는 마이크이지만 32개에 이르는 입력 채널을 녹음 및 프로세싱해야 하며 또한 각 마이크 프리앰프의 노이즈가 그대로 서밍된다는 단점이 있다.
이에 따라 시장은 고차 앰비소닉으로 옮겨가고 있는 추세다. 온라인 유통 매체 중 유일하게 2차 앰비소닉을 지원하는 Facebook은 얼마전 시행한 자사의 인코딩 소프트웨어 Suite 업데이트에서 3차 앰비소닉의 지원을 공식적으로 발표하면서 곧 온라인으로도 3차 앰비소닉 콘텐츠를 즐길 수 있게 될 전망이다. 또한 게임용 사운드 미들웨어로 유명한 Wwise 역시 기본적으로 3차 앰비소닉을 지원한다. 또한 시장에서는 마이크로폰의 개별 퀄리티를 높이기보다는 Mems 마이크로폰 등을 이용해 트랜스듀서의 개수를 늘려 저렴한 가격으로 고차 앰비소닉을 지원하는 마이크들이 등장하고 있다. 앞으로의 방향성이 명확해지는 것이다.
그런데 앰비소닉 포맷은 차수를 늘릴수록 필요한 채널 수가 기하급수적으로 늘어나는 치명적인 단점이 있다. 20kHz까지 명확한 방향성을 지원하려면 32차까지 가야하는데, 이 경우 필요한 채널 수가 1,000개를 넘어서기 때문에 현실적으로 불가능하며, 현실적인 10kHz 정도까지 방향성을 부여하려면 7차 앰비소닉, 즉 64개 채널이 필요하다. 이는 기존의 A-Format 방식으로 마이크로폰을 배치한다면 고스란히 채널 수만큼의 마이크로폰이 필요하다. 즉, 3차 앰비소닉 구현에는 16개 이상, 4차에 25개 이상, 5차는 36채널 이상이 필요하다는 것이다. 또한 작은 마이크로폰이 다량 어레이 및 서밍되는 방식이기에 SNR도 무시할 수 없게 된다. 다이어프램의 면적은 출력 볼티지와 비례 관계에 있기 때문에 적정 감도를 얻기 위해서는 프리앰프에서 증폭을 해야 하는데, 이 과정에서 SNR 특성이 나빠지게 된다. 이런 마이크로폰이 20~30여개 이상 서밍된다면 섬세한 다이나믹의 녹음에서 큰 손해를 보게 된다.
이에 따라 Schopes가 내놓은 ORTF-3D 방식이 새롭게 주목받고 있다. 방송이나 영화 녹음 등에서 널리 사용되는 ORTF 스테레오 테크닉의 확장판인 ORTF-3D는 단 8개의 마이크로폰으로도 사실적인 고품질의 3D 음향을 실현하는 유일한 마이크로폰으로 평가받고 있다. 출시 초기에는 적당한 플러그인이나 소프트웨어를 찾기 힘들었기 때문에 주로 Auro 3D나 Dolby Atmos 등의 채널 기반 작업에서 선호되었으나 IEM Plug-in Suite(https://plugins.iem.at/)가 무료로 배포되면서 ORTF-3D의 고품질 음원을 고차 앰비소닉으로 인코딩할 수 있는 길이 열렸다. Schoeps의 정평난 고품질 마이크로폰을 단 8개만 사용하기 때문에 SNR 면에서 현존하는 3D 마이크로폰 중 가장 뛰어나기 때문에 현장의 다이나믹한 소리를 실감나게 담아내기에 부족함이 없다.
IEM Plug-in Suite 개요
현재 IEM Plug-in Suite에서 지원하는 앰비소닉 인코딩은 최대 7차, 즉 64채널이다. 이를 위해 IEM Plug-in Suite를 최대 성능으로 사용하려면 64채널을 지원하는 플러그인 버스 구조를 갖춰야 한다. 다행스럽게도 매우 저렴하게 구할 수 있는 DAW 소프트웨어인 Reaper가 해당 기능을 지원한다. 이에 따라 워크플로우는 Reaper를 기준으로 설명할 것이다. IEM Plug-in Suite 웹사이트에서도 Reaper를 기준으로 각종 설명과 예시를 들고 있다.
IEM Plug-in Suite를 설치하면 총 20개의 Ambisonics 관련 플러그인들이 설치된다. 지면상 모든 플러그인들을 다 설명하긴 어려우므로 ORTF-3D 마이크로폰 작업을 위해 필수적인 플러그인만 우선 다뤄보자.
AllRADecoder 이 플러그인은 앰비소닉 신호를 실제 스피커 배치로 디코딩해주는 역할을 한다. 가장 먼저 소개했지만, 시그널 상으로는 가장 나중에 배치되어야 한다. 이론적으로는 AllRAD(All-Round Ambisonic Panning and Decoding) 접근법에 기반하는데, 간단히 설명하자면 스피커와 스피커 사이의 음량 조절로 팬텀이미지를 만들어내 가상의 음상을 형성하는 VBAP(Vector-Base Amplitude-Panning) 방식으로 앰비소닉 신호를 디코딩하는 것이다. 이에 대한 자세한 설명은 [http://www.aes.org/e-lib/browse.cfm?elib=16554]에서 참고할 수 있다. 스피커 레이아웃 정보는 .json 파일로 익스포트 할 수 있는데, 이를 이어 설명할 Simple Decorder에 집어넣으면 서브우퍼 신호까지 따로 필터링 및 라우팅이 가능해진다.
BinauralDecoder 상황에 따라 가장 중요할 수도 있는 플러그인이 바로 Binaural Decoder이다. 현재 Neumann KU 100 더미헤드를 이용해서 측정한 HRTF 데이터를 활용하고 있어서 높은 수준의 디코딩이 가능하다. 원리는 간단하다. 고차 앰비소닉 B-Format 사운드를 HRTF 데이터를 이용해서 2채널의 바이노럴로 변환하는 것이다. 인터넷 스트리밍 등으로 이어폰이나 헤드폰 등을 통한 입체 음향을 구현해야 할 때 매우 유용하다.
MultiEncoder ‘MultiEncoder’는 멀티트랙 오디오 신호를 고차 앰비소닉으로 전환해주는 플러그인이다. 이를 통해 3D 사운드를 포함한 다양한 오디오 소스를 앰비소닉 3차원 공간 안에 배치할 수 있다. ORTF-3D 마이크로폰의 신호를 고차 앰비소닉으로 전환해주는 핵심적인 역할을 수행한다.
SimpleDecoder 서브우퍼가 없다면 AllRADecoder만으로도 충분하다. 하지만 서브우퍼를 사용해야 하는 환경이라면 AllRADecoder는 스피커 레이아웃 데이터를 추출하는데만 사용하고 지금 소개하는 SimpleDecoder를 사용할 것을 권한다. AllRADecoder에서 .json 파일을 익스포트한 후 해당 파일을 SimpleDecoder에서 불러들이면 해당 스피커의 레이아웃이 그대로 구현된다. 그리고 별도의 서브우퍼를 필터링하고 채널에 배치할 수 있기에 매우 유용하다.
IEM Plug-in Suite는 이 외에도 룸 리버브를 시뮬레이션하는 RoomEncoder나 씬을 회전시킬 수 있는 SceneRotator, 거리감을 조절할 수 있는 DistanceCompensator, 모노 소스를 앰비소닉 음원으로 배치할 수 있는 DirectivityShaper, 방향성에 따른 컴프레싱을 할 수 있는 DirectionalCompressor, 찾기 힘든 3D 리버브 머신인 FdnReverb 등을 제공하고 있으므로 상상하는 거의 모든 앰비소닉 기반 작업이 가능하다.
채널 기반 Vs. 앰비소닉 기반
블루레이 디스크나 극장 등에 배포할 소스를 작업하는 것이라면 채널 기반으로 작업하는 것이 음질면에서 확실히 유리하다. 예컨대 Auro 3D 기본 구성인 9.1채널, 혹은 5.1.4 구성이라면 기본적으로 수평 레이어 5.1채널에 상단 레이어 4채널이 추가된 구조이기 때문에 ORTF-3D의 8개 채널은 각각 L, R, LS, RS, LH, RH, LSH, RSH 채널에 대응시키면 된다. ORTF-3D로 녹음한 소스를 앰비언스로만 사용할 경우에는 이것만으로도 충분하며 주로 센터 채널에는 배우의 대화 정보가 담기게 된다. ORTF-3D 소스를 주 음원으로 사용할 경우에는 L, R을 M/S 프로세싱하여 M 채널만 센터로 라우팅하면 된다. 그 외에 Dolby Atmos나 Auro 3D, 혹은 SPAT Rev. 의 패너를 사용할 경우에는 3D Cube 소스로 인식하게끔 하면 손쉽게 공간 음향의 회전 등의 후가공 작업을 할 수 있다.
앰비소닉으로 변환하는 이유는 단 한가지이다. 실시간으로 방향정보를 반영할 수 있는 유일한 포맷이기 때문이다. 물론 이는 HRTF를 이용한 바이노럴로도 어느정도 가능하지만 바이노럴은 헤드폰에서만 3D 사운드의 실현이 가능하다는 치명적인 단점이 있다. 앰비소닉은 어떤 형태의 스피커 배치든지, 헤드폰이든지간에 상관없이 균일한 결과를 얻을 수 있으며 5차 이상의 앰비소닉을 사용할 경우에는 상업용으로도 받아들여질 수 있는 높은 퀄리티의 구현까지 가능하다. 엄밀히 따지자면 손실없이 바로 출력 채널로 라우팅되는 채널 기반 작업이 음질 면에서는 더 뛰어나지만 앰비소닉의 차수만 충분히 높다면 굳이 피할 필요는 없다.
Schoeps ORTF-3D with IEM Plug-in Suite 워크플로우
가장 먼저 준비해야 할 것은 3D 모니터링 환경이다. 이미 기존에 5.1채널 서라운드 구성을 취하고 있는 유저라면 상단 레이어 4채널만 더 추가하면 되기 때문에 비용적으로 큰 부담은 없다. 새로 구성하는 경우 여의치 않다면 서브우퍼 없이 단 8개의 스피커만 사용하는 ‘3D Cube’ 배치를 해도 된다. 이도 저도 할 수 있는 상황이 아니라면 BinauralDecoder를 사용해서 헤드폰 위주로 작업한 후, AllRADecoder에서 2채널 스테레오 스피커를 실제 스피커로, 나머지 3차원 스피커들을 가상으로 배치해서라도 간단히 체험해볼 수는 있다. 구체적인 방법은 이어서 설명하겠다. Reaper 및 IEM Plug-in Suite의 인스톨 방법은 따로 설명하지는 않을 것이다. 작업 기준은 7차 앰비소닉이다.
입출력 라우팅 가장 먼저 해야할 것은 입출력 라우팅이다. ORTF-3D의 녹음 데이터는 8채널 멀티트랙이다. 여기서 프로세싱 및 앰비소닉의 인코딩이 된 후에는 64채널로 바뀌므로, 이 시그널을 어디에서 보내서 어떻게 모니터링하고 익스포트 할 것인지를 먼저 생각해야 한다. 필자의 작업환경은 Focusrite Clarett 8Pre로 아날로그 출력 10개 채널을 이용해 Auro 3D 레이아웃을 빌린 9.1 환경을 구성했다. 안타깝게도 Clarett 8Pre의 두 개의 헤드폰 단자는 아날로그 출력을 공유하도록 설계되었기 때문에 헤드폰 모니터링용으로 사용할 수는 없게 되었다. 필자는 이에 따라 SPDIF 컨버팅 기능이 있는 헤드폰 앰프를 별도로 추가하여 Clarett 8Pre의 SPDIF 출력과 연결했다. 이에 따라 스피커 아웃은 Clarett 8Pre의 아날로그 아웃, 헤드폰 아웃은 SPDIF 아웃으로 루팅된다.
1~10채널의 스피커는 순서대로 L, R, LS, RS, LH, RH, LSH, RSH로 8채널을 점유하며 9번째 채널에는 Center 스피커가, 그리고 마지막 10번째 채널에는 서브우퍼가 연결되었다. 필자가 사용하는 스피커 시스템은 JBL LSR 308Mk2를 중심으로 LSR 10 서브우퍼와 함께 Control 1을 위성스피커로 구성했다.
MultiEncoder 셋업 가장 먼저 할 일은 8채널 소스에 MultiEncoder 플러그인을 걸어둔 후 좌측 상단의 입력 채널 수를 8개로 셋팅하는 것이다. 그러면 8개의 입력 방향 셋팅 노브들이 뜨게 된다. 필자의 경우 ORTF-3D의 실제 배치 레이아웃을 그대로 따랐다. 구체적인 수치는 첨부한 캡쳐를 보면 힌트를 얻을 수 있을 것이다.
AllRADecoder 및 SimpleDecoder 셋업 스피커 모니터링 트랙에 우선 AllRADecoder 플러그인을 띄우고 스피커를 배치해본다. Auro 3D 9.1 레이아웃은 하단 레이어 0°, 상단 레이어 30°가 기준이지만 이대로 셋업하면 하단 음원 정보를 표현할 수 없기 때문에 에러 메시지가 뜬다. 필자는 이를 피하기 위해 하단 레이어 -5°, 상단 레이어는 25°로 셋업했다. 서브우퍼를 뺀 총 9개의 스피커를 배치하게 되는데, 이렇게 하면 공간 표현력이 다소 균일해지지 않으므로 상단과 하단에 추가적인 가상 스피커를 배치했다. 필자는 0°방향, 상단 90° 지점, 그리고 같은 방향 하단 -90° 지점에 가상 스피커를 배치했다. 스피커를 추가한 후 ‘Imaginary’에 체크하면 가상 스피커가 배치되어 실제 스피커 레이아웃은 9.1이지만 전체 에너지가 한층 균일하게 확장되는 것을 확인할 수 있다. 이후 우측 하단의 Decoder와 Layout에 모두 체크한 후 Export를 눌러 .json 파일을 만들어 둔다.
이후 SimpleDecoder를 같은 트랙에 띄우고 AllRA-Decoder는 삭제하거나 비활성화시킨다. SimpleDecoder에서 먼저 Load Configuration을 누르고 미리 저장해둔 .json 파일을 부르면 스피커 레이아웃이 지정된다. 또한 우측의 서브우퍼 셋팅해서는 별도의 실제 서브우퍼를 사용할 것이므로 discrete로 셋팅하고 서브우퍼의 출력 채널을 10번째로 지정한다. 그 다음 원하는 크로스오버 포인트를 셋팅하면 스피커 출력을 위한 준비가 다 끝난 셈이다. 이 트랙을 이용해 10채널을 익스포트하면 9.1 채널 기반 감상 및 배포를 위한 소스를 만들 수 있다.
BinauralDecoder 셋업 미리 만들어둔 헤드폰 모니터링 트랙에 BinauralDecoder 플러그인을 걸면 64채널의 7차 앰비소닉 시그널이 2트랙의 바이노럴 신호로 디코딩된다. 비록 무료 플러그인이지만 현재 인기있는 헤드폰에 대한 EQ 프리셋까지 있어서 한층 정확한 모니터링이 가능해진다. 또한 이 트랙을 이용해 2트랙을 익스포트하게 되면 손쉽게 인터넷 스트리밍 등을 위한 바이노럴 소스가 만들어진다.