3. 객관적인 주관 평가
by 이신렬 음향공학박사 글, 이무제 정리, 자료제공: A49, 소니캐스트

객관적인 주관 평가에서 주관적이라는 단어와 객관적 측정이라는 단어를 함께 사용하는 것이 모순적으로 보일 수 있습니다. 하지만 청취 테스트를 통해 항상 반복적으로 일정한 수치를 얻을 수 있다면 이 설명이 맞습니다. 이중 맹검 청취 테스트에서 충실도 10점 척도로 표준 편차라는 분산 값을 사용했을 때, 청취 훈련을 받은 사람의 경우 반복 평가에서 5% 내외의 표준 편차를 나타냈습니다. 이것은 일반적인 측정장비 표준 편차와 비슷하기 때문에 이 결과를 측정값으로 보아도 됩니다.
이러한 객관적인 주관평가를 통해 측정 데이터와의 상관관계를 살펴볼 수 있게 되었습니다. 측정값이 변하지 않고 아무리 정확하고 반복 가능하더라도, 이 측정값을 제대로 해석하는 방법이 없다면 무용지물이 될 것입니다. 객관적인 주관 측정은 오디오 기기의 심리음향학적 상관관계를 밝히는데 매우 중요한 기초를 제공합니다. 정확한 주관 평가를 위한 핵심 요소는 주관 평가에 영향을 미칠 수 있는 모든 요인들을 통제하거나 제거하는 것입니다. 이것은 지금까지 오디오업계에서 간과되어 온 부분으로, 이는 우리가 듣는 것을 정확하게 측정할 수 없다는 잘못된 믿음에서 나온 것입니다.
우리는 흔히 음악가들이 우수한 오디오기기 주관 평가자로 알고 있습니다. 하지만 이들 일부는 직업적으로 큰 소리에 장시간 노출되어 청력 손실을 가지고 있었고, 일부는 음향보다는 음악에 더 관심이 많아 열악한 스피커에서도 악기 소리에 대한 적절한 해석을 찾아낼 수 있습니다. 음악가들 중 우수한 주관 평가자는 대체로 오디오를 취미로 하고 있는 분들입니다.
주관 평가자들은 음악을 들으면서 다른 제품들을 자유롭게 전환할 수 있어야 합니다. 음원이 변경되면 스피커의 개성이 드러나지 않습니다. 집에 스피커를 가져가서 듣는 주관 평가에서는 이런 스피커 간 차이가 명확하게 드러나지 않습니다. A와 B 스피커를 한 장소에서 동시에 비교하지 않으면 스피커 문제는 밝혀내기 어렵습니다.
오디오 애호가는 대체로 스피커를 보고 브랜드와 모델까지 알아볼 수 있고, 과거 청음 기억과 당시의 평가 그리고 다른 사람들의 오디오 리뷰들을 떠올리고 가격도 짐작할 수 있습니다. 이 모든 것을 무시하고 소리만으로 평가를 내릴 수 있는 자제력을 가진 사람은 매우 드뭅니다.
오디오 엔지니어는 주관 평가가 가장 중요함을 인정하고, 자신의 과학적, 기술적 역량을 총 동원해서 더 많은 장소에서 더 많은 사람들에게 만족스러운 경험을 제공할 수 있는 방법을 찾습니다. 무언가 잘못된 소리가 나면 잘못된 것입니다. 잘못된 소리가 나는 원인을 측정을 통해 찾아내고, 소리가 올바르게 들리는 데 기여하는 측정값을 찾아내는 것이 핵심 과제입니다.

3.1 블라인드 테스트의 중요성
많은 오디오 매장들이 사라지면서 소비자는 스피커를 직접 들어볼 기회가 거의 없어졌고, 제품을 공정하게 평가할 수 있는 환경은 거의 사라졌습니다. 쇼핑이 온라인으로 옮겨가면서 소비자들은 유튜버의 의견과 리뷰에 점점 더 의존하고 있습니다. 한 개인의 주관적인 의견을 최소화하고, 소비자가 신뢰할 수 있는 유용한 측정 데이터가 필요합니다.
하만 인터내셔널 연구소에서는 블라인드 테스트 시설을 설치하였고 두 가지 청취 평가를 실시하였습니다. 한 쪽은 제품이 보이지 않도록 블라인드로 처리하였고, 다른 한 쪽은 모든 제품이 보이도록 구성하였습니다. 40명의 청취자들이 제품 정보가 노출된 상황에서 객관성을 과연 유지할 수 있을지에 대한 실험에 참여했습니다. 참가자들은 통제된 청취 테스트 경험이 있는 청취자 그룹과 그렇지 않은 미경험자 그룹으로 거의 동등하게 나눴습니다.

그림1: 4개의 스피커에 대한 블라인드 테스트와 제품이 보이는 테스트 선호도 결과. 세로 막대 상단 선은 95% 신뢰 오차를 나타냄. Toole and Olive(1994)에서 발췌.
그림 1은 블라인드 테스트에서 동일한 스피커를 다르게 튜닝한 두 개의 유럽풍 디자인 제품과 나머지 두 제품간 비교 결과를 보여줍니다. 제품이 보이는 테스트에서는 브랜드 충성도가 높은 유럽 제품에 더 높은 점수를 주었습니다. 작고 저렴한 서브/위성 스피커 시스템은 점수가 크게 떨어졌는데 아마 외관 때문인 것 같습니다. 청취자들은 스피커를 눈으로 보게 되면 자신이 들었다고 생각하는 소리가 달라집니다.
스피커 배치 위치는 저 주파수 음량과 음질에 큰 영향을 미치고, 주관 평가에서 큰 차이를 나타냅니다. 스피커를 전혀 다른 사운드로 만들 수 있는 두 위치에 배치하여 청취 테스트를 진행했습니다.

그림2: 청취실 내 서로 다른 두 위치에 배치한 스피커 선호도 비교 결과. Toole and Olive(1994)에서 발췌.
그림 2는 스피커 배치 위치에 따른 스피커 선호도 차이를 보여줍니다. 블라인드 테스트의 경우 같은 색의 막대 높이가 서로 다른데, 이는 스피커가 서로 다른 위치에 있을 때 서로 다른 선호도를 나타낸다는 것을 보여줍니다. 이와 대조적으로 제품이 보이는 테스트에서는 블라인드 테스트에서는 분명하게 들었던 음질 차이가 거의 사라졌습니다.

그림3: 제품이 보이는 테스트에서 서로 다른 음원에 의한 선호도. Toole and Olive(1994)에서 발췌.
그림 3은 음원에 따른 제품 선호도 차이로 블라인드 테스트에서는 오른쪽으로 갈수록 점수가 낮아지는 경향을 확인할 수 있는데, 제품이 보이는 테스트에서는 이러한 변화가 사라졌습니다. 청취자들의 뇌는 눈에 보이는 것에 의해 지배되고, 소리가 달라지더라도 경향성은 바뀌지 않았습니다. 그 효과는 매우 큽니다.

그림4: 청취 경험과 성별이 스피커 주관 평가에 미치는 영향. Toole and Olive(1994)에서 발췌.
그림 4는 청취 경험과 성별이 스피커 주관 평가에 미치는 영향을 나타낸 것으로 청취 경험이 많은 남성이 모든 스피커에 더 낮은 점수를 매겨 다른 그룹과 차이를 보여줍니다. 이는 숙련된 청취자들 사이에서 흔히 나타나는 특징입니다. 하지만, 평가 경향은 미숙련 남성과 여성에서 매우 유사했습니다. 여성 청취자는 청취 테스트에서 꾸준히 좋은 성적을 거두었는데, 그 이유 중 하나는 남성보다 청력이 우수하기 때문입니다. 남녀 모두에서 청음 평가 부족은 응답 편차를 크게 나타내지만, 평균을 내면 경험이 많은 청취자와 유사한 경향을 보입니다. 숙련된 청취자를 사용할 경우 통계적으로 신뢰할 수 있는 데이터를 더 짧은 시간에 얻을 수 있습니다.
결론적으로 스피커 정보를 알면 주관 평가 등급이 크게 달라질 수 있다는 것은 분명합니다. 이는 스피커에 대한 솔직한 의견을 얻고자 한다면 반드시 블라인드 테스트를 진행해야 한다는 것을 의미합니다.

3.2 청력 저하가 음질 평가에 미치는 영향
음질 평가는 청력에 기반하기 때문에 청력이 저하되면 소리를 제대로 듣지 못할 뿐 아니라, 평가 결과 역시 크게 달라질 수 있습니다. 이어폰 청취가 일반화된 오늘날 청력 손실은 매우 흔하고, 증상은 사람마다 크게 다르며 청력 손실이 있는 사람의 주관 평가는 다른 사람 주관 평가와 연관성이 없습니다.
청력 문제는 녹음 엔지니어, 프로듀서, 음악가 등 음을 장시간 청취하는 사람들을 대상으로 하는 스피커 청음 평가에서 자주 발견할 수 있습니다. 안타깝게도 직업적인 요인으로 인해 많은 사람들이 청력 손실을 가지고 있습니다. 훈련된 정상 청력인은 스피커를 여러 번 반복해서 들었을 때 전체 음질 등급을 놀라울 정도로 일관되게 평가했습니다. 반면에 청력에 문제가 있는 사람들은 덜 일관되고, 오전에는 제품이 마음에 들었다가 오후에는 마음에 들지 않는 등 매우 변동성이 컸습니다.
청력에 따른 청취자의 주관 평가 결과를 분석한 결과 청력 손실이 정상에 가장 가까운 청취자들의 편차가 가장 적었습니다. 고 주파수 청력 레벨보다 1kHz 이하 저 주파수 청력 레벨이 주관 평가 변동성과 상관 관계가 있는 것으로 나타났습니다.
소음성 난청은 약 4kHz 주변 청력 저하가 높아지는 것이 특징이고, 나이가 들면서 발생하는 노인성 난청은 높은 주파수에서 점차 낮은 주파수 대역으로 확대됩니다. 고 주파수 청력 손실이 있는 청취자는 저 주파수에서는 정상 청력을 가지지만, 저 주파수 청력 손실이 있는 청취자는 고 주파수까지 광범위한 청력 손실을 나타냅니다. 특히 청력 저하를 가진 프로오디오 종사자들은 저음역대 다이나믹레인지의 많은 부분을 듣지 못합니다. 음악과 목소리의 작은 음향적 디테일이나 낮은 음량의 잡음과 왜곡 음을 들을 수 없기 때문에 음질에 대한 일관된 평가를 내리는 데 문제가 있어 제품에 대해 일관되지 않은 평가를 내리게 됩니다.
청력 저하가 있어도 주관 평가 의견을 내거나, 음악에서 즐거움을 얻거나, 들은 바를 명료하게 글로 표현하는 데는 아무런 지장이 없지만, 그들의 견해는 정상 청력을 가진 사람들과는 다릅니다. 주관 평가 참가자들은 청력 검사를 반드시 받아야 하고, 광대역 청력 역치가 약 20dB를 초과하는 사람들은 주관 평가에서 반드시 배제시켜야 합니다.
합리적인 음질 판단 기회가 주어진다면 약간의 훈련을 통해 일반인들도 이를 알아차릴 수 있습니다. 안타까운 점은 오디오 매장에서 유효한 비교 청음을 할 수 있는 기회가 거의 없고, 고객이 구매 결정을 내릴 때 도움을 받을 수 있는 객관적인 주관 평가 데이터를 공급해주는 곳이 없다는 것입니다.
오디오 평론가 혹은 유튜버 의견을 특별하게 존중한다는 것은 역설적입니다. 이들이 왜 그렇게 신뢰받는 위치에 있을까요? 그들이 수행하는 청취 테스트는 편향성을 제거하기 위한 가장 기본적인 원칙을 지키지 않습니다. 그들의 청력에 별 문제가 없다는 것을 증명할 수 있는 청력검사 결과도 청취 평가 역량에 대한 검증도 어떠한 자격도 제시하지 않습니다. 게다가 대부분의 제품 리뷰는 유의미한 측정 데이터조차 제공하지 않습니다.

3.3 청음 스트레스가 주관 평가에 미치는 영향
주관 평가 회의론자들은 이중 맹검 테스트가 청취자에게 과도한 스트레스를 주어 청취 평가에 온전히 집중하지 못하게 한다고 비판해 왔습니다. 이는 음악 청취과정에서 나타나는 차이를 듣지 못하는 이유를 설명하기 위한 것으로 추정됩니다. 하지만 수많은 청취자를 대상으로 테스트를 실시한 결과 짧은 적응 기간이 지나면 청취자들은 청취 평가에 쉽게 적응하는 것으로 나타났습니다. 일반적인 청취자들은 이중 맹검 테스트 기간 중에 전혀 불안해하지 않습니다.
소리만을 평가하는 단 하나의 임무만 주어진다면 더 간단해집니다. 눈에 보이는 것에 영향을 받는 것은 아닌지, 특정 브랜드 제품을 못 맞추는 건 아닌지 등을 고민을 할 필요가 없습니다. 그리고 오래 전에 들었던 제품이 있을 경우 청취 기억을 떠올리는 것 역시 방해 요소로 작용합니다.
청음 음악 샘플 길이가 너무 짧아 제대로된 청취가 어렵고 시간 제한이 스트레스가 될 수 있다는 지적이 있습니다. 오랜기간 동안 시간 제한없이 원하는 시간만큼 테스트한 결과와 잘 발췌한 짧은 음악들을 듣는 것과는 차이가 없음이 이미 확인되었습니다.

3.4 모노, 스테레오, 서라운드 음원이 청취 평가에 미치는 영향
우리는 거의 모든 음악을 스테레오로 듣습니다. 하지만 아이러니하게도 스테레오로 이중 맹검 청취 테스트를 하는 것은 합리적이지 않습니다. 청취자들은 모노로 청취할 때 사운드 이미징에 관하여 더 강한 의견을 제시합니다. 뿐만 아니라 청취자들은 스테레오보다 모노 테스트에서 라우드스피커의 상대적인 음질에 대해 훨씬 더 적극적으로 의견을 제시했습니다. 수년에 걸쳐 모노와 스테레오 주관 평가를 수행한 결과 모노에서 이긴 라우드스피커가 스테레오에서도 이겼지만, 스테레오에서는 모든 것이 좋게 들리는 경향이 있어 그 차이가 작게 나타났습니다.
사운드 이미징은 녹음과 스피커 음질에 의존하고, 강한 상호 작용이 있습니다. 상호 연관성이 없는 L 및 R 채널 정보가 많은 클래식 녹음의 경우 스피커 영향을 적게 받는 경향이 있습니다. 그러나 근접 마이킹, 패닝 및 이퀄라이징 믹스가 주로 사용되는 대중 음악 및 재즈 녹음의 경우에는 스피커 영향을 받게 됩니다.

그림5: 모노, 스테레오 및 5.1 멀티채널 주관 평가 결과.
그림 5는 모노, 스테레오 및 멀티채널 스피커 주관 평가 결과를 나타내며, 모노 청취에서 음색 간 음질 선호도가 가장 명확하게 나타났습니다. 주관 평가 시 채널이 추가됨에 따라 서로 다른 음색을 구별하는 능력이 조금씩 저하됩니다. 이퀄라이징 조건 "B"는 모노 청취에서는 공명으로 인한 착색이 심해 음질이 가장 나빴지만, 스테레오 및 멀티채널 테스트에서는 우수한 시스템에 가까운 것으로 평가되었습니다.
모노 평가방식에 대한 설득력 있는 명분으로는 영화와 텔레비전 프로그램에서 센터 채널이 대부분의 작업을 수행하는 현실, 즉 모노 음원을 꼽을 수 있습니다. 센터 채널은 멀티채널 시스템에서 가장 중요한 스피커라고 할 수 있습니다. 대중 음악 및 재즈 레코딩에서 이미지는 종종 왼쪽 또는 오른쪽 스피커로 하드 패닝되는데, 이 역시 모노 음원이고, 팬텀 센터 이미지는 더블 모노의 산물로서 L과 R 스피커에서 나오는 동일한 사운드의 결과물입니다.
청력이 정상에 매우 가까운 청취자만이 스테레오와 모노 테스트에서 비슷한 역량을 발휘할 수 있습니다. 청력손실이 조금만 높아져도 스테레오 테스트 편차가 급격히 증가하여 데이터 신뢰성이 떨어집니다. 청력 손실은 공간에서 여러음향을 구분하는 능력에 영향을 미칩니다. 스테레오 방향성 및 음장의 복잡성은 스피커 소리를 공간에서 분리해내는 능력을 방해합니다.
청취 음원의 경우 스테레오 채널 중 한 채널을 사용해야 한다고 주장하지만, 많은 스테레오 음원에서 채널을 모노로 합산하는 것이 가능하므로 모노 호환이 가능한 프로그램을 찾으면 됩니다.
모노 청취 환경에서 음질에 대한 가장 강력한 인지적 차별화가 발생한다는 것은 불편한 진실입니다. 청취 테스트 목적이 스피커의 고유한 음질을 평가하는 것이라면 모노로 들어야 합니다. 즐거움을 느끼거나 다른 사람에게 깊은 인상을 남기고 싶다면 스테레오 또는 멀티채널 모드로 청취하면 됩니다.
여러 대의 스피커가 동시에 동작하면 녹음에서 서로 상관관계가 낮은 공간음향이 청취자의 음질 판단 능력을 방해합니다. 음질과 공간감 평가 결과는 매우 유사합니다. 청취자는 자연스러움의 50%가 공간감, 즐거움의 70%도 공간감에 기인한다고 생각합니다. 따라서 공간 효과는 매우 중요하며, 스테레오 및 멀티채널 청취에서 음질에 대한 평가를 내리는 것은 분명히 복잡한 문제입니다.
사운드 이미징 때문에 스테레오 청취시에만 나타나는 스피커 특성이 있다고 생각할 수 있습니다. 스펙트럼 응답이 심하게 나쁘거나 비 축 성능이 불규칙하여 좌우 채널 음향 비대칭을 발생시키는 스피커에 의해 이러한 문제가 발생할 수 있지만 제대로 설계된 스피커를 사용하면 우리가 듣는 공간감은 녹음 자체의 정보에 의해 지배됩니다.
음상 정위는 스피커가 아닌 녹음 상의 문제이며, 큰 문제가 있는 스피커는 주파수 특성 측정이나 왜곡측정을 통해 쉽게 알아볼 수 있습니다. 스테레오 시스템은 좌우 스피커 성능이 동일해야 하고, 청취실이 좌우 대칭이어야 합니다. 이 요구사항이 항상 충족되는 것은 아니며, 다양한 형태의 청각적 결함이 들릴 수 있으며 그 원인은 명확하지 않을 수 있습니다.
3. 객관적인 주관 평가
by 이신렬 음향공학박사 글, 이무제 정리, 자료제공: A49, 소니캐스트
객관적인 주관 평가에서 주관적이라는 단어와 객관적 측정이라는 단어를 함께 사용하는 것이 모순적으로 보일 수 있습니다. 하지만 청취 테스트를 통해 항상 반복적으로 일정한 수치를 얻을 수 있다면 이 설명이 맞습니다. 이중 맹검 청취 테스트에서 충실도 10점 척도로 표준 편차라는 분산 값을 사용했을 때, 청취 훈련을 받은 사람의 경우 반복 평가에서 5% 내외의 표준 편차를 나타냈습니다. 이것은 일반적인 측정장비 표준 편차와 비슷하기 때문에 이 결과를 측정값으로 보아도 됩니다.
이러한 객관적인 주관평가를 통해 측정 데이터와의 상관관계를 살펴볼 수 있게 되었습니다. 측정값이 변하지 않고 아무리 정확하고 반복 가능하더라도, 이 측정값을 제대로 해석하는 방법이 없다면 무용지물이 될 것입니다. 객관적인 주관 측정은 오디오 기기의 심리음향학적 상관관계를 밝히는데 매우 중요한 기초를 제공합니다. 정확한 주관 평가를 위한 핵심 요소는 주관 평가에 영향을 미칠 수 있는 모든 요인들을 통제하거나 제거하는 것입니다. 이것은 지금까지 오디오업계에서 간과되어 온 부분으로, 이는 우리가 듣는 것을 정확하게 측정할 수 없다는 잘못된 믿음에서 나온 것입니다.
우리는 흔히 음악가들이 우수한 오디오기기 주관 평가자로 알고 있습니다. 하지만 이들 일부는 직업적으로 큰 소리에 장시간 노출되어 청력 손실을 가지고 있었고, 일부는 음향보다는 음악에 더 관심이 많아 열악한 스피커에서도 악기 소리에 대한 적절한 해석을 찾아낼 수 있습니다. 음악가들 중 우수한 주관 평가자는 대체로 오디오를 취미로 하고 있는 분들입니다.
주관 평가자들은 음악을 들으면서 다른 제품들을 자유롭게 전환할 수 있어야 합니다. 음원이 변경되면 스피커의 개성이 드러나지 않습니다. 집에 스피커를 가져가서 듣는 주관 평가에서는 이런 스피커 간 차이가 명확하게 드러나지 않습니다. A와 B 스피커를 한 장소에서 동시에 비교하지 않으면 스피커 문제는 밝혀내기 어렵습니다.
오디오 애호가는 대체로 스피커를 보고 브랜드와 모델까지 알아볼 수 있고, 과거 청음 기억과 당시의 평가 그리고 다른 사람들의 오디오 리뷰들을 떠올리고 가격도 짐작할 수 있습니다. 이 모든 것을 무시하고 소리만으로 평가를 내릴 수 있는 자제력을 가진 사람은 매우 드뭅니다.
오디오 엔지니어는 주관 평가가 가장 중요함을 인정하고, 자신의 과학적, 기술적 역량을 총 동원해서 더 많은 장소에서 더 많은 사람들에게 만족스러운 경험을 제공할 수 있는 방법을 찾습니다. 무언가 잘못된 소리가 나면 잘못된 것입니다. 잘못된 소리가 나는 원인을 측정을 통해 찾아내고, 소리가 올바르게 들리는 데 기여하는 측정값을 찾아내는 것이 핵심 과제입니다.
3.1 블라인드 테스트의 중요성
많은 오디오 매장들이 사라지면서 소비자는 스피커를 직접 들어볼 기회가 거의 없어졌고, 제품을 공정하게 평가할 수 있는 환경은 거의 사라졌습니다. 쇼핑이 온라인으로 옮겨가면서 소비자들은 유튜버의 의견과 리뷰에 점점 더 의존하고 있습니다. 한 개인의 주관적인 의견을 최소화하고, 소비자가 신뢰할 수 있는 유용한 측정 데이터가 필요합니다.
하만 인터내셔널 연구소에서는 블라인드 테스트 시설을 설치하였고 두 가지 청취 평가를 실시하였습니다. 한 쪽은 제품이 보이지 않도록 블라인드로 처리하였고, 다른 한 쪽은 모든 제품이 보이도록 구성하였습니다. 40명의 청취자들이 제품 정보가 노출된 상황에서 객관성을 과연 유지할 수 있을지에 대한 실험에 참여했습니다. 참가자들은 통제된 청취 테스트 경험이 있는 청취자 그룹과 그렇지 않은 미경험자 그룹으로 거의 동등하게 나눴습니다.
그림1: 4개의 스피커에 대한 블라인드 테스트와 제품이 보이는 테스트 선호도 결과. 세로 막대 상단 선은 95% 신뢰 오차를 나타냄. Toole and Olive(1994)에서 발췌.
그림 1은 블라인드 테스트에서 동일한 스피커를 다르게 튜닝한 두 개의 유럽풍 디자인 제품과 나머지 두 제품간 비교 결과를 보여줍니다. 제품이 보이는 테스트에서는 브랜드 충성도가 높은 유럽 제품에 더 높은 점수를 주었습니다. 작고 저렴한 서브/위성 스피커 시스템은 점수가 크게 떨어졌는데 아마 외관 때문인 것 같습니다. 청취자들은 스피커를 눈으로 보게 되면 자신이 들었다고 생각하는 소리가 달라집니다.
스피커 배치 위치는 저 주파수 음량과 음질에 큰 영향을 미치고, 주관 평가에서 큰 차이를 나타냅니다. 스피커를 전혀 다른 사운드로 만들 수 있는 두 위치에 배치하여 청취 테스트를 진행했습니다.
그림2: 청취실 내 서로 다른 두 위치에 배치한 스피커 선호도 비교 결과. Toole and Olive(1994)에서 발췌.
그림 2는 스피커 배치 위치에 따른 스피커 선호도 차이를 보여줍니다. 블라인드 테스트의 경우 같은 색의 막대 높이가 서로 다른데, 이는 스피커가 서로 다른 위치에 있을 때 서로 다른 선호도를 나타낸다는 것을 보여줍니다. 이와 대조적으로 제품이 보이는 테스트에서는 블라인드 테스트에서는 분명하게 들었던 음질 차이가 거의 사라졌습니다.
그림3: 제품이 보이는 테스트에서 서로 다른 음원에 의한 선호도. Toole and Olive(1994)에서 발췌.
그림 3은 음원에 따른 제품 선호도 차이로 블라인드 테스트에서는 오른쪽으로 갈수록 점수가 낮아지는 경향을 확인할 수 있는데, 제품이 보이는 테스트에서는 이러한 변화가 사라졌습니다. 청취자들의 뇌는 눈에 보이는 것에 의해 지배되고, 소리가 달라지더라도 경향성은 바뀌지 않았습니다. 그 효과는 매우 큽니다.
그림4: 청취 경험과 성별이 스피커 주관 평가에 미치는 영향. Toole and Olive(1994)에서 발췌.
그림 4는 청취 경험과 성별이 스피커 주관 평가에 미치는 영향을 나타낸 것으로 청취 경험이 많은 남성이 모든 스피커에 더 낮은 점수를 매겨 다른 그룹과 차이를 보여줍니다. 이는 숙련된 청취자들 사이에서 흔히 나타나는 특징입니다. 하지만, 평가 경향은 미숙련 남성과 여성에서 매우 유사했습니다. 여성 청취자는 청취 테스트에서 꾸준히 좋은 성적을 거두었는데, 그 이유 중 하나는 남성보다 청력이 우수하기 때문입니다. 남녀 모두에서 청음 평가 부족은 응답 편차를 크게 나타내지만, 평균을 내면 경험이 많은 청취자와 유사한 경향을 보입니다. 숙련된 청취자를 사용할 경우 통계적으로 신뢰할 수 있는 데이터를 더 짧은 시간에 얻을 수 있습니다.
결론적으로 스피커 정보를 알면 주관 평가 등급이 크게 달라질 수 있다는 것은 분명합니다. 이는 스피커에 대한 솔직한 의견을 얻고자 한다면 반드시 블라인드 테스트를 진행해야 한다는 것을 의미합니다.
3.2 청력 저하가 음질 평가에 미치는 영향
음질 평가는 청력에 기반하기 때문에 청력이 저하되면 소리를 제대로 듣지 못할 뿐 아니라, 평가 결과 역시 크게 달라질 수 있습니다. 이어폰 청취가 일반화된 오늘날 청력 손실은 매우 흔하고, 증상은 사람마다 크게 다르며 청력 손실이 있는 사람의 주관 평가는 다른 사람 주관 평가와 연관성이 없습니다.
청력 문제는 녹음 엔지니어, 프로듀서, 음악가 등 음을 장시간 청취하는 사람들을 대상으로 하는 스피커 청음 평가에서 자주 발견할 수 있습니다. 안타깝게도 직업적인 요인으로 인해 많은 사람들이 청력 손실을 가지고 있습니다. 훈련된 정상 청력인은 스피커를 여러 번 반복해서 들었을 때 전체 음질 등급을 놀라울 정도로 일관되게 평가했습니다. 반면에 청력에 문제가 있는 사람들은 덜 일관되고, 오전에는 제품이 마음에 들었다가 오후에는 마음에 들지 않는 등 매우 변동성이 컸습니다.
청력에 따른 청취자의 주관 평가 결과를 분석한 결과 청력 손실이 정상에 가장 가까운 청취자들의 편차가 가장 적었습니다. 고 주파수 청력 레벨보다 1kHz 이하 저 주파수 청력 레벨이 주관 평가 변동성과 상관 관계가 있는 것으로 나타났습니다.
소음성 난청은 약 4kHz 주변 청력 저하가 높아지는 것이 특징이고, 나이가 들면서 발생하는 노인성 난청은 높은 주파수에서 점차 낮은 주파수 대역으로 확대됩니다. 고 주파수 청력 손실이 있는 청취자는 저 주파수에서는 정상 청력을 가지지만, 저 주파수 청력 손실이 있는 청취자는 고 주파수까지 광범위한 청력 손실을 나타냅니다. 특히 청력 저하를 가진 프로오디오 종사자들은 저음역대 다이나믹레인지의 많은 부분을 듣지 못합니다. 음악과 목소리의 작은 음향적 디테일이나 낮은 음량의 잡음과 왜곡 음을 들을 수 없기 때문에 음질에 대한 일관된 평가를 내리는 데 문제가 있어 제품에 대해 일관되지 않은 평가를 내리게 됩니다.
청력 저하가 있어도 주관 평가 의견을 내거나, 음악에서 즐거움을 얻거나, 들은 바를 명료하게 글로 표현하는 데는 아무런 지장이 없지만, 그들의 견해는 정상 청력을 가진 사람들과는 다릅니다. 주관 평가 참가자들은 청력 검사를 반드시 받아야 하고, 광대역 청력 역치가 약 20dB를 초과하는 사람들은 주관 평가에서 반드시 배제시켜야 합니다.
합리적인 음질 판단 기회가 주어진다면 약간의 훈련을 통해 일반인들도 이를 알아차릴 수 있습니다. 안타까운 점은 오디오 매장에서 유효한 비교 청음을 할 수 있는 기회가 거의 없고, 고객이 구매 결정을 내릴 때 도움을 받을 수 있는 객관적인 주관 평가 데이터를 공급해주는 곳이 없다는 것입니다.
오디오 평론가 혹은 유튜버 의견을 특별하게 존중한다는 것은 역설적입니다. 이들이 왜 그렇게 신뢰받는 위치에 있을까요? 그들이 수행하는 청취 테스트는 편향성을 제거하기 위한 가장 기본적인 원칙을 지키지 않습니다. 그들의 청력에 별 문제가 없다는 것을 증명할 수 있는 청력검사 결과도 청취 평가 역량에 대한 검증도 어떠한 자격도 제시하지 않습니다. 게다가 대부분의 제품 리뷰는 유의미한 측정 데이터조차 제공하지 않습니다.
3.3 청음 스트레스가 주관 평가에 미치는 영향
주관 평가 회의론자들은 이중 맹검 테스트가 청취자에게 과도한 스트레스를 주어 청취 평가에 온전히 집중하지 못하게 한다고 비판해 왔습니다. 이는 음악 청취과정에서 나타나는 차이를 듣지 못하는 이유를 설명하기 위한 것으로 추정됩니다. 하지만 수많은 청취자를 대상으로 테스트를 실시한 결과 짧은 적응 기간이 지나면 청취자들은 청취 평가에 쉽게 적응하는 것으로 나타났습니다. 일반적인 청취자들은 이중 맹검 테스트 기간 중에 전혀 불안해하지 않습니다.
소리만을 평가하는 단 하나의 임무만 주어진다면 더 간단해집니다. 눈에 보이는 것에 영향을 받는 것은 아닌지, 특정 브랜드 제품을 못 맞추는 건 아닌지 등을 고민을 할 필요가 없습니다. 그리고 오래 전에 들었던 제품이 있을 경우 청취 기억을 떠올리는 것 역시 방해 요소로 작용합니다.
청음 음악 샘플 길이가 너무 짧아 제대로된 청취가 어렵고 시간 제한이 스트레스가 될 수 있다는 지적이 있습니다. 오랜기간 동안 시간 제한없이 원하는 시간만큼 테스트한 결과와 잘 발췌한 짧은 음악들을 듣는 것과는 차이가 없음이 이미 확인되었습니다.
3.4 모노, 스테레오, 서라운드 음원이 청취 평가에 미치는 영향
우리는 거의 모든 음악을 스테레오로 듣습니다. 하지만 아이러니하게도 스테레오로 이중 맹검 청취 테스트를 하는 것은 합리적이지 않습니다. 청취자들은 모노로 청취할 때 사운드 이미징에 관하여 더 강한 의견을 제시합니다. 뿐만 아니라 청취자들은 스테레오보다 모노 테스트에서 라우드스피커의 상대적인 음질에 대해 훨씬 더 적극적으로 의견을 제시했습니다. 수년에 걸쳐 모노와 스테레오 주관 평가를 수행한 결과 모노에서 이긴 라우드스피커가 스테레오에서도 이겼지만, 스테레오에서는 모든 것이 좋게 들리는 경향이 있어 그 차이가 작게 나타났습니다.
사운드 이미징은 녹음과 스피커 음질에 의존하고, 강한 상호 작용이 있습니다. 상호 연관성이 없는 L 및 R 채널 정보가 많은 클래식 녹음의 경우 스피커 영향을 적게 받는 경향이 있습니다. 그러나 근접 마이킹, 패닝 및 이퀄라이징 믹스가 주로 사용되는 대중 음악 및 재즈 녹음의 경우에는 스피커 영향을 받게 됩니다.
그림5: 모노, 스테레오 및 5.1 멀티채널 주관 평가 결과.
그림 5는 모노, 스테레오 및 멀티채널 스피커 주관 평가 결과를 나타내며, 모노 청취에서 음색 간 음질 선호도가 가장 명확하게 나타났습니다. 주관 평가 시 채널이 추가됨에 따라 서로 다른 음색을 구별하는 능력이 조금씩 저하됩니다. 이퀄라이징 조건 "B"는 모노 청취에서는 공명으로 인한 착색이 심해 음질이 가장 나빴지만, 스테레오 및 멀티채널 테스트에서는 우수한 시스템에 가까운 것으로 평가되었습니다.
모노 평가방식에 대한 설득력 있는 명분으로는 영화와 텔레비전 프로그램에서 센터 채널이 대부분의 작업을 수행하는 현실, 즉 모노 음원을 꼽을 수 있습니다. 센터 채널은 멀티채널 시스템에서 가장 중요한 스피커라고 할 수 있습니다. 대중 음악 및 재즈 레코딩에서 이미지는 종종 왼쪽 또는 오른쪽 스피커로 하드 패닝되는데, 이 역시 모노 음원이고, 팬텀 센터 이미지는 더블 모노의 산물로서 L과 R 스피커에서 나오는 동일한 사운드의 결과물입니다.
청력이 정상에 매우 가까운 청취자만이 스테레오와 모노 테스트에서 비슷한 역량을 발휘할 수 있습니다. 청력손실이 조금만 높아져도 스테레오 테스트 편차가 급격히 증가하여 데이터 신뢰성이 떨어집니다. 청력 손실은 공간에서 여러음향을 구분하는 능력에 영향을 미칩니다. 스테레오 방향성 및 음장의 복잡성은 스피커 소리를 공간에서 분리해내는 능력을 방해합니다.
청취 음원의 경우 스테레오 채널 중 한 채널을 사용해야 한다고 주장하지만, 많은 스테레오 음원에서 채널을 모노로 합산하는 것이 가능하므로 모노 호환이 가능한 프로그램을 찾으면 됩니다.
모노 청취 환경에서 음질에 대한 가장 강력한 인지적 차별화가 발생한다는 것은 불편한 진실입니다. 청취 테스트 목적이 스피커의 고유한 음질을 평가하는 것이라면 모노로 들어야 합니다. 즐거움을 느끼거나 다른 사람에게 깊은 인상을 남기고 싶다면 스테레오 또는 멀티채널 모드로 청취하면 됩니다.
여러 대의 스피커가 동시에 동작하면 녹음에서 서로 상관관계가 낮은 공간음향이 청취자의 음질 판단 능력을 방해합니다. 음질과 공간감 평가 결과는 매우 유사합니다. 청취자는 자연스러움의 50%가 공간감, 즐거움의 70%도 공간감에 기인한다고 생각합니다. 따라서 공간 효과는 매우 중요하며, 스테레오 및 멀티채널 청취에서 음질에 대한 평가를 내리는 것은 분명히 복잡한 문제입니다.
사운드 이미징 때문에 스테레오 청취시에만 나타나는 스피커 특성이 있다고 생각할 수 있습니다. 스펙트럼 응답이 심하게 나쁘거나 비 축 성능이 불규칙하여 좌우 채널 음향 비대칭을 발생시키는 스피커에 의해 이러한 문제가 발생할 수 있지만 제대로 설계된 스피커를 사용하면 우리가 듣는 공간감은 녹음 자체의 정보에 의해 지배됩니다.
음상 정위는 스피커가 아닌 녹음 상의 문제이며, 큰 문제가 있는 스피커는 주파수 특성 측정이나 왜곡측정을 통해 쉽게 알아볼 수 있습니다. 스테레오 시스템은 좌우 스피커 성능이 동일해야 하고, 청취실이 좌우 대칭이어야 합니다. 이 요구사항이 항상 충족되는 것은 아니며, 다양한 형태의 청각적 결함이 들릴 수 있으며 그 원인은 명확하지 않을 수 있습니다.