법정 증거 DOCKET № — 2026/CR

목소리는 지문인가, 성문 분석이 1962년 법정에 선 진짜 이야기

목소리는 지문인가, 성문 분석이 1962년 법정에 선 진짜 이야기

광고 · 쿠팡 파트너스

이 포스팅은 쿠팡 파트너스 활동의 일환으로, 이에 따른 일정액의 수수료를 제공받습니다.

협박 전화 한 통이 남긴 줄무늬

범인은 아무것도 남기지 않았다. 얼굴도, 이름도, 지문도 없었다. 1960년대 초 뉴욕의 항공사들을 공포에 빠뜨린 폭탄 위협 전화의 범인이 남긴 것은 오직 수화기 너머의 목소리 한 줄기뿐이었다. 그런데 한 엔지니어가 등장해 충격적인 주장을 내놓았다. 사람의 목소리는 손가락 끝의 지문과 똑같이 고유하다는 것이었다. 그는 종이 위에 그려진 검은 줄무늬 한 장으로, 범인을 특정할 수 있다고 자신했다.

이 줄무늬의 이름은 성문, 영어로는 보이스프린트였다. 그리고 1962년, 이 한 장의 그림이 미국 법정의 문을 두드렸다. 과연 목소리는 지울 수 없는 증거가 될 수 있었을까. 그 답을 찾는 60년의 여정이 이때 시작되었다.

scene-2

폭탄 위협이 부른 의뢰

1960년대 초, 뉴욕시 경찰은 항공사를 겨냥한 끊임없는 협박 전화에 시달렸다. 경찰은 범인의 얼굴을 볼 수 없었고, 손에 쥔 단서라곤 통화 녹음이 전부였다. 다급해진 미국 연방수사국은 벨연구소에 도움을 요청했다. 사람의 목소리만으로 한 사람을 특정할 수 있느냐는, 당시로서는 공상에 가까운 질문이었다.

이 임무를 맡은 사람이 벨연구소의 선임 엔지니어 Kersta였다. 그는 이미 1943년부터 음성을 눈에 보이는 형태로 바꾸는 연구를 해 온 인물이었다. 수화기 속 떨림을 그림으로 바꾸는 일, 그것이 모든 이야기의 출발점이었다. 그는 2년이 넘는 시간 동안 무려 5만 개가 넘는 음성을 분석했다.

당시 벨연구소는 세계 최고의 음향 연구 기관이었다. 전화기를 발명한 회사의 연구소답게, 사람의 목소리를 전기 신호로 바꾸고 다시 소리로 되살리는 기술에 관한 한 그들을 따라올 곳이 없었다. 폭탄 위협이라는 사회적 공포가, 이 거대한 기술력과 만난 셈이었다. 만약 목소리로 범인을 잡을 수 있다면, 그것은 지문에 버금가는 혁명이 될 것이었다. 기대는 컸고, 그만큼 검증의 책임도 무거웠다.

목소리를 그림으로 바꾸는 원리

사람의 목소리는 단순한 소리가 아니다. 그 안에는 시간과 주파수와 세기라는 세 가지 정보가 동시에 담겨 있다. Kersta가 사용한 음향 스펙트로그래프는 바로 이 세 가지를 분리해, 전기에 반응하는 특수한 종이 위에 그림으로 그려냈다.

가로축은 시간의 흐름을, 세로축은 소리의 높낮이를 나타냈다. 짙고 옅은 농담은 소리의 세기였다. 그렇게 완성된 그림이 바로 성문이었다. 사람마다 성대의 길이가 다르고, 입과 코로 이어지는 공명 공간의 모양이 다르다. Kersta는 이 미세한 차이가 그림 위에 고유한 무늬로 남는다고 보았다.

조금 더 구체적으로 들여다보자. 우리가 같은 단어를 발음하더라도, 그 소리는 성대에서 만들어진 뒤 목과 입과 코를 거치며 변형된다. 이 통로의 길이와 모양은 사람마다 조금씩 다르다. 그 결과 같은 모음이라도 어떤 주파수 대역이 강하게 울리는지가 사람마다 달라진다. 이 강조된 주파수 대역을 음향학에서는 포먼트라고 부른다. 성문 분석은 바로 이 포먼트의 위치와 흐름을 그림으로 포착해 비교하는 기술이었다. 이론적으로는 매우 그럴듯했고, 실제로 같은 사람의 목소리는 비슷한 무늬를 보였다.

scene-3

20년의 집념과 99.65%라는 숫자

이 기술은 하루아침에 나온 것이 아니었다. Kersta가 음성의 시각화에 처음 손을 댄 것은 1943년이었고, 보이스프린트라는 용어를 세상에 처음 내놓은 것은 1962년이었다. 그 사이의 시간은 20년에 가까웠다.

그는 5만 개가 넘는 목소리를 하나하나 그림으로 바꾸어 비교했다. 같은 사람의 목소리는 닮았고, 다른 사람의 목소리는 달랐다. 이 방대한 작업 끝에 그는 99.65%라는 놀라운 정확도를 발표했다. 숫자는 압도적이었고, 언론은 열광했다. 목소리가 곧 신분증이 되는 시대가 온 것처럼 보였다.

scene-4

숫자의 무게, 실험실과 현실의 간극

그러나 과학에서 숫자는 누가, 어떻게 검증했느냐에 따라 그 무게가 달라진다. Kersta의 실험은 통제된 환경에서 진행되었다. 같은 단어를 또박또박 말하게 한 깨끗한 녹음이었다.

반면 현실의 협박 전화는 결코 깨끗하지 않았다. 잡음이 섞이고, 감정이 떨리고, 때로는 일부러 목소리를 바꾸기도 했다. 실험실의 99.65%가 법정에서도 같은 숫자일지는 아무도 확신할 수 없었다. 한 법원은 명확하게 지적했다. Kersta의 정확도 주장은 과학적으로 검증된 방법으로 충분히 뒷받침되지 못했다는 것이었다.

scene-5

엔지니어, 법정에 서다

scene-6

Kersta는 단순한 발명가에 머무르지 않았다. 그는 검찰 측 증인으로 법정에 직접 출석해, 피고인의 목소리와 협박 전화의 목소리가 같다고 증언했다. 두 장의 스펙트로그램을 나란히 놓고, 같은 무늬를 손으로 가리켰다.

그의 자신감에는 흔들림이 없었다. 20년을 바친 기술이었고, 5만 개의 데이터가 뒷받침했기 때문이다. 하지만 바로 그 확신이, 과학계의 가장 날카로운 반론을 불러오게 된다.

법정이 던진 세 가지 질문

법정은 보이스프린트를 향해 세 가지 날카로운 질문을 던졌다.

첫 번째는 목소리가 정말 평생 변하지 않느냐는 물음이었다. 감기에 걸리거나, 나이가 들거나, 흥분하면 목소리는 분명히 달라졌다. 두 번째는 누가 이 그림을 읽느냐는 문제였다. 같은 스펙트로그램을 보고도 전문가마다 판단이 갈릴 수 있었다. 마지막은 이 기술이 과학계의 일반적 인정을 받았느냐는 질문이었다.

scene-7

당시 미국 법정에서 새로운 과학 증거가 인정받으려면, 그 분야 전문가 다수가 신뢰해야 한다는 기준이 있었다. 보이스프린트는 바로 이 세 번째 관문 앞에서 가장 크게 흔들렸다.

일곱 명의 반박

가장 치열했던 법정은 캘리포니아의 People v. King 사건이었다. 검찰은 Kersta를 음성 식별 전문가로 내세웠다. 그러자 변호인 측은 무려 일곱 명의 음성 과학자와 엔지니어를 불러 세웠다. 한 사람의 확신에 맞서, 일곱 명의 반박이 정면으로 맞붙은 것이다.

scene-9

그들은 입을 모아, 보이스프린트가 아직 확립된 과학이 아니며 같은 그림을 보고도 다르게 읽을 수 있다고 주장했다. 한 사람의 권위 있는 확신과 일곱 과학자의 집단적 의심이 부딪힌 이 장면은, 과학 증거가 법정에서 어떻게 검증되는지를 보여주는 상징적인 순간이었다.

최소한의 자리, 보강 증거

그렇다고 보이스프린트가 완전히 버려진 것은 아니었다. 미네소타 대법원은 절묘한 선을 그었다. 스펙트로그램만으로 사람을 단정 지을 수는 없지만, 귀로 들어서 내린 판단을 보강하는 용도로는 받아들일 수 있다고 본 것이다.

scene-8

단독 증거로는 부족하고, 보조 증거로는 가능하다는 뜻이었다. 이 판결은 이후 수십 년간 미국 여러 주에서 성문 분석을 다루는 기본 원칙이 되었다. 과학과 법 사이에서 절충점을 찾은 현명한 판단이었다.

흥미로운 점은, 같은 기술을 두고 주마다 판단이 엇갈렸다는 사실이다. 어떤 주는 성문 분석을 아예 배척했고, 어떤 주는 보강 증거로 받아들였으며, 또 어떤 주는 조건부로 허용했다. 이런 혼란은 새로운 과학 기술이 법정에 들어올 때 겪는 전형적인 진통이었다. 검사법이 정밀해 보일수록 오히려 더 엄격한 검증이 요구되었다. 화려한 숫자 뒤에 숨은 전제, 즉 어떤 조건에서 그 정확도가 측정되었는지가 가장 중요한 쟁점이 되었기 때문이다.

기술은 어떻게 발전했나

intro

초창기의 성문 분석은 사람이 두 장의 그림을 눈으로 비교하는 방식이었다. 이 방식은 판독자의 경험과 주관에 크게 의존했다. 시간이 흐르며 음향 과학자들은 청각 분석과 시각 분석을 결합한 청음 스펙트로그래프 방식을 발전시켰다. 귀로 듣고, 눈으로 그림을 비교하는 두 단계를 함께 거치는 방식이었다.

오늘날에는 컴퓨터와 인공지능이 이 과정을 보조한다. 사람의 목소리에서 수십 가지의 음향 특징을 자동으로 추출해, 통계적으로 두 음성의 유사도를 계산한다. Kersta가 한 장씩 손으로 비교하던 작업이, 이제는 수초 만에 끝난다. 그러나 정밀해진 기술이 곧바로 법정의 신뢰로 이어지는 것은 아니다. 기계가 계산한 유사도 역시, 그 한계를 명확히 밝혀야 증거로서 가치를 가진다.

오늘의 목소리, 그리고 남은 질문

60년이 흐른 지금도, 목소리는 여전히 증거이자 의심의 대상이다. 오늘날 한국의 보이스피싱 수사관들은 통화 녹음을 분석해 같은 목소리를 추적한다. 인공지능 기반의 음성 비교 기술은 Kersta 시대와 비교할 수 없이 정교해졌다.

scene-10

그러나 그 출발점에 던져졌던 질문은 그대로 남아 있다. 목소리는 정말 지울 수 없는 지문인가. 한 엔지니어의 확신과 일곱 과학자의 반박 사이에서, 우리는 한 가지 교훈을 얻는다. 아무리 빛나는 숫자도, 충분한 검증 없이는 한 사람의 운명을 결정해서는 안 된다는 사실이다. 다음에 어떤 증거를 마주하든, 그 숫자가 어디서 왔는지부터 물어야 한다.

성문 분석이 우리에게 남긴 것

보이스프린트의 역사는 단순히 한 기술의 흥망성쇠가 아니다. 그것은 과학이 법정이라는 무대에 설 때 반드시 거쳐야 하는 검증의 본질을 보여준다. 어떤 기술이든 처음에는 화려한 정확도와 압도적인 데이터를 앞세우며 등장한다. 그러나 법정은 그 숫자가 어떤 조건에서 만들어졌는지, 누가 그것을 판독하는지, 그리고 동료 과학자들이 그것을 신뢰하는지를 집요하게 따져 묻는다.

Kersta의 99.65%는 실험실에서는 진실이었을지 모른다. 하지만 잡음과 위장과 감정이 뒤섞인 현실에서, 그 숫자는 다른 의미를 가졌다. 이 간극을 인정하고 보강 증거로만 활용하기로 한 미네소타 대법원의 판단은, 오늘날에도 새로운 법과학 기술을 평가하는 데 중요한 기준점이 된다. 지문, DNA, 디지털 포렌식, 그리고 인공지능 음성 분석에 이르기까지, 모든 증거는 같은 질문 앞에 선다. 이 증거는 얼마나 확실하며, 그 확실함은 어디서 검증되었는가. 성문 분석의 60년은 바로 그 질문의 무게를 우리에게 가르쳐 준 셈이다. 한 엔지니어의 빛나는 확신도, 검증이라는 차가운 시험 앞에서는 겸손해질 수밖에 없었다. 그 겸손함이야말로, 과학이 정의의 도구가 되기 위해 반드시 거쳐야 할 통과 의례인지도 모른다.

광고 · AliExpress

AliExpress 추천 상품

이 링크를 통해 구매 시 일정액의 수수료를 제공받습니다.