우리나라에서 여론조사는 정치과정에서 ‘매우 큰 의미’를 가지고 있다. 필자들이 ‘매우 큰 의미’라고 강조한 것은 그것이 좋은 의미를 가지고 있다는 것을 강조하기 위함이 아니다. 언론과 국민들이 누가 선거 과정에서 앞서나가고 있는지, 어떠한 정책이 어느 정도의 지지를 받고 있는지 가늠하는 것에 그치지 않고, 정부와 정당이 여론조사의 결과를 마치 투표 결과처럼 사용하고 있는 기현상을 비판하기 위함이다.
정당의 공천과정에서 사용되고 있는 여론조사를 보도록 하자. 우리나라 정당들은 대통령 선거를 비롯하여 상당 부분의 선거에서 여론조사 결과를 활용하여 후보를 결정해왔다. 대부분 여론조사의 결과가 그 통계학적 의미와는 상관없이(심지어는 오차범위 내의 차이라고 하더라도) 소수점 밑의 숫자까지도 점수로 변환되어 후보들 간의 경선 점수에 반영되기 때문에 후보들 간에는 여론조사의 비율을 어느 정도로 할 것인지 다투기도 하고, 질문방식을 어떻게 할 것인지에 대해 첨예하게 대립하기도 한다. 경선 참가 후보들이 질문방식에 이렇게 예민한 이유는 질문 방식에 따라 여론조사의 결과가 차이가 날 수 있으며, 그 작은 차이가 점수로 변환되어 경선 결과를 결정지을 수 있기 때문이다.
그러한 의미에서 우리는 여론조사를 이렇게 점수화하여 경선에 사용하는 것이 과연 타당한 것인지 심각하게 생각해보아야 한다.
아산정책연구원이 1월 정기조사에서 밝혀낸 조사결과는 매우 큰 반향을 일으켰다. 아마도 그 까닭은 지금까지 얼마나 부정확한 여론조사에 기대어 많은 중요한 의사 결정을 내렸는가에 대한 반성의 의미일 것이다. 아산정책연구원이 유선전화 임의번호걸기(Random Digit Dialing:RDD)방식의 여론조사를 사용하여 발표하기 이전에는 한국 여론조사에서 쓰였던 방법론에 어떤 결점이 있었는지에 대한 심각한 논의조차 없었다. 그러한 폐습에서 벗어나기 위한 노력이나 시도 없이 습관적으로 그와 같은 여론조사를 사용해왔던 것이다. 아산정책연구원의 1월 조사 결과에 따르면 그동안 우리나라 여론조사회사들이 사용해오던 전화번호부 표본 추출방식은 심각한 결함을 가지고 있는 것으로 나타났다. 전화번호부에 자기 번호를 등재하고 있는 사람들과 등재를 원하지 않는 사람들 사이에는 큰 인구통계학적 차이(연령, 학력, 직업 등)가 존재하고 있으며, 그러한 인구통계학적 차이가 정치적 의사결정에 있어서도 큰 차이를 가져오는 것을 밝혀낸 것이다.
RDD 조사 방법을 사용함으로써 기존의 여론조사보다 표집틀이 두 배 이상 커지게 되었다. 다시 말해, 기존의 여론조사에 비하여 조사 대상으로 선정될 가능성이 있는 사람의 수가 두 배 이상이 되었다는 것이다. 전화번호부에 자기 번호를 등재한 사람이 40% 정도에 머물기 때문에 RDD 방식을 사용하게 되면 표본에 포함될 확률을 가진 사람의 수가 두 배 이상 늘어난다는 것이다.
그러나 문제는 이렇듯 기존의 전화번호부에 의존한 여론조사보다 진일보한 방식이라고 생각되는 RDD에 의한 표본추출 방식 역시 완벽과는 거리가 멀다는 것이다. 유선전화 RDD를 통해서는 설계상의 문제로 인해 070으로 시작하는 인터넷전화 보유가구와 휴대전화만을 소유하고 있는 가구들은 표본에 선정될 수 없다는 한계를 가지고 있다. 아직까지 우리나라에 인터넷 전화 보유 가구와 휴대전화만을 소유한 가구들에 대한 정확한 통계치나 추정치가 존재하지 않는 관계로 국내 총 성인 인구 중 어느 정도가 유선전화 RDD 조사 과정에서 제외되는지 정확히 알 수는 없다. 하지만 아산정책연구원 휴대전화 RDD를 이용한 3월 조사에 따르면 집에 지역 번호로 시작하는 기존의 유선전화 없이 070으로 시작하는 인터넷 전화를 가지고 있는 사람 이 20.2%, 휴대전화만을 가지고 있는 사람이 26.2% 정도인 것으로 나타났다. 미국 역시 가구에 유선전화 없이 휴대전화만을 가지고 있는 가구의 수를 25% 정도로 추정하고 있다.
그렇다면, 휴대전화를 통하여 조사하는 방법은 여론조사 정확도 향상의 궁극의 해결책이 될 수 있을 것인가? 필자들은 그렇지 않다고 생각한다. 아산정책연구원의 3월 휴대전화 RDD 방식의 여론조사 결과를 보면 휴대전화 RDD 조사는 기존의 유선 전화와는 정반대의 문제점을 가지고 있는 것으로 나타났다. 기존 유선전화 여론조사의 가장 큰 문제점은 집에서 전화 받을 확률, 즉 재택율이 높은 사람들이 과대 표집 된다는 것이다. 주로 집에서 전화를 받을 확률이 높은 주부들이나 노장년층의 사람들이 주로 조사되고, 청년층, 남성들의 경우에는 조사가 제대로 이루어지지 않는다는 것이다. 이번 3월 조사결과로 보면 휴대전화 여론조사는 정반대로 청년층과 남성이 과대 조사되고, 주부와 노장년층이 적게 조사되는 것으로 나타났다.
물론, 여론조사라는 것이 투표와 같이 조사된 하나의 경우가 바로 1,000명의 샘플 중 하나가 되는 것은 아니기 때문에 특정 계층이 적게 조사된다고 하더라도 보정이 가능하다. 여기서 여론조사를 공천과정에 쓰면 안 되는 문제점이 또 등장한다. 예를 들어, 2010년 현재 우리나라 인구 통계상 서울에 사는 20대 남성의 수가 788,804명으로 전체 성인인구 중 약 2%이다.1 따라서 1,000명 기준의 여론조사 시 서울에 사는 20대 남성이 20명이 최종적으로 조사에 포함되면 그 조사는 비교적 지역, 성, 연령 비율이 잘 맞는 조사를 하게 된 것이다. 그런데 모든 조사가 이렇게 완벽하게 되기를 기대하는 것은 어렵다. 다시 예로 돌아가서, RDD로 조사하였더니(기존 여론 조사에서 사용되었던 할당 표본추출법은 이미 논의의 가치가 없음을 미리 밝힌다.), 서울지역 20대 남성이 인구비례와 달리 8명이 조사되었다고 치자. 그렇게 되면, 8명의 조사결과를 인구비례인 20명에 맞도록 가중치를 주어 조정하여야 한다. 만약 인구비례와 실제 조사치가 큰 차이가 없다면 가중치를 주어 보정하는 과정에서 생기는 왜곡이 덜 할 것이다. 그러나 실제 인구비례는 20명인데, 실제 조사는 그 반도 안되는 8명이 되었다면, 그 반을 가지고 두 배 이상의 가중치를 주어야 하는 셈이 된다.
그렇다면, 성, 지역, 연령에 따른 가중치를 주는 방법은 최상인가? 그렇지 않다. 실제에 가장 근접한 결과를 생산해내기 위해서는 학력, 직업 등도 고려한 가중치를 주어야 한다. 문제는 그러한 기준에 따른 자료도 없거니와, 그렇게 가중치를 줄 수 있을 만큼 조사를 하려면 상상하기도 어려울 정도의 막대한 비용과 시간이 들어갈 것이다. 우리가 가지고 있는 한계를 인식하여야 한다. 여론 조사는 시간과 비용의 한계 안에서 어느 정도의 부정확함을 감수하고 의사결정에 참고하고자 하는 것이지 의사결정을 온전히 맡기기 위해 하는 것은 아니다.
그렇다면, 정당과 후보들에게 질문을 던져본다. 어떠한 방식의 여론조사와 어떠한 방식의 가중치 적용을 하는 것이 최상의 공천방식 혹은 단일화 방식이 될 것인가?
여론조사는 여론조사일 뿐이다. 그 한계점을 인식하여 대중의 의견 변화를 읽어내는 수단으로 생각하여야 한다. 투표를 여론조사로 대치하지 못하는 이유가 여기에 있다. 마찬가지로 정당의 공천 역시 여론조사로 대치하는 것, 일정 부분이라도 여론 조사를 점수로 변환하여 사용하는 것은 문제가 있다. 후보자 선정은 정당의 몫이다. 정당은 여론에 공천의 책임을 떠넘기지 말아야 한다.
* 본 문건의 내용은 필자의 견해로 아산정책연구원의 공식 입장과는 다를 수도 있습니다.
-
1
행정안전부의 연령별 인구 현황표를 참조했음. http://rcps.egov.go.kr:8081/jsp/stat/ppl_stat_jf.jsp