상단영역

미디어협동조합 시그널

본문영역

여론조사 바르게 읽는 법

  • 기자명 미디어협동조합 시그널
  • 입력 2024.03.29 11:41
이 기사를 공유합니다

여론조사 바르게 읽는 법

 

대한민국의 운명을 결정하는 총선일이 13일 앞으로 다가왔다. 어떻게 될까?

객관적, 합리적 방법으로 선거 판세를 예측해 볼 수 있는 방법은 현재로선 여론조사 방법밖에 없다. 피부미터가 있다고는 하지만 대체로 자의적, 주관적 경향이 커 객관적 지표로 사용하기는 어렵다. 25년간의 선거컨설팅 경험에 비춰보면 실제로 주변 분위기만 보고 이길 줄 알았다가 크게 지는 낭패를 경험하는 경우가 종종 있었다. 1987년 대선에서 최초로 여론조사가 실시된 이래 여론조사는 때론 투표결과와 상당히 다르기도 하였지만 대체로는 표본오차와 크게 다르지 않은 결과를 보여줌으로써 신뢰를 형성해 왔다. 따라서 이번 선거 또한 여론조사를 통해 예측해 볼 수밖에 없다.

그렇다면 선거일을 앞두고 홍수처럼 쏟아지는 여론조사를 어떻게 바라봐야 할까? 2월에 실시된 조사결과와 완전이 달라진 3월 조사결과를 어떻게 읽어야 할까? 3월 말 발표되는 여론조사 결과는 투표결과로 이어질까?

여론조사는 기본적으로 표심을 객관적으로 분석해 선거전략을 수립하기 위해서 하지만 밴드왜건 효과, 언더독 효과를 자극하기 위해 전략적으로 사용되기도 한다. 이기고 있는 후보는 대세론을 확산하기 위해, 열세인 후보는 동정심을 자극하기 위해 여론조사를 활용한다. 물론 너무 차이가 큰 경우, 언더독은 독으로 작용하기도 한다.

 

그렇다면 여론조사에서 가장 중요한 개념은 무엇일까? 바로 신뢰수준과 표본오차이다. 여론조사 결과를 보면 95% 신뢰수준이란 말이 나오는데 95% 믿을 수 있다는 뜻이 아니라 100번 조사하면 표본오차 범위 내에서 95번은 같은 결과가 나올 수 있다는 말이다.

오차범위는 샘플 수가 클수록 작아지는데 총선의 경우 지역구 최저 샘플은 500 이상이다. 500 샘플의 오차범위는 4.4%, 1000 샘플은 3.1%, 2000 샘플은 2.2%포인트로 외워두는 것이 편하다.

다음으로 중요한 것이 응답률인데, 조사방식에 따라 차이가 크다. 전화면접조사의 경우 대략 10% 이상, ARS조사의 경우 5% 내외 정도로 나타나는데 응답률이 낮다고 꼭 신뢰도가 낮은 건 아니다.

신뢰도에 더 큰 영향을 주는 것은 일반적으로 표본추출방식과 조사방식이다. 특히 표본추출방식이 중요한데, 통신사 제공 휴대전화 가상번호 100%냐 아니면 휴대전화 가상번호에 유선전화 RDD를 어느 정도 섞었냐에 따라 결과는 크게 달라진다.

유선전화를 쓰는 경우 70대 이상의 농촌, 노인과 자영업자들이 많이 표집되는데, 이 계층의 이념적 성향이 과대표집될 가능성이 크기 때문이다. 따라서 여론조사 결과를 볼 때는 발표된 종합숫자만이 아니라 조사개요를 꼼꼼히 확인하고 비교해 봐야 조사결과의 정확한 의미를 알 수 있다. 조사방식은 전화면접방식이나 ARS방식인데 각기 장단점이 있으므로 어느 것이 더 맞는다고 단정하긴 힘들다. 다만 조사방식의 특성상 ARS방식에 비해 면접방식의 경우 무당층, 각 이슈에 대한 무결정층이 좀 더 높게 나타난다는 점은 주목할 필요가 있다. 선거일이 다가올수록 수렴되는 경향이 있다.

그럼 최근 발표되는 총선 관련 여론조사 결과에 대한 논쟁적 이슈에 대해 살펴보자.

먼저 3월 조사결과를 두고 벌어지는 여론조사 전문가들 사이의 가장 큰 논쟁은 진보층의 과표집에 관한 것이다. 2월 조사는 정상적인데, 3월 조사는 대단히 비정상적으로 진보가 과대표집되고, 보수가 과소표집되었다는 것이다.

대표적으로 거론되는 것이 한국리서치가 조사한 중·성동갑 318~20일 조사이다. 이 조사에서 윤희숙 국민의힘 후보가 28%, 전현희 민주당 후보가 45%로 집계됐는데 엄경영 시대정신연구소장은 우리나라 이념지형은 보수 30% 초중반, 진보 20% 중반, 중도 30% 중후반대인데, 이 조사 사례 수를 보면 진보 150, 보수 138, 가중값을 적용하면 진보 168, 보수 127명이 됐다샘플표집이 정상적으로 됐다면 전현희 35, 윤희숙 35 정도로 나와야 정상이라며, 실제 선거지형을 봤을 때 중·성동갑은 국민의힘이 이긴다는 것이다.

 

우리나라 이념지형을 엄소장의 경우처럼 분석하는 것이 옳은지는 별개로 하더라도 여론조사는 한 번의 숫자로 보기보단 추세로 보아야 한다는 것이 정설이어서 큰 의미가 있을 것 같지 않지만, 이 같은 주장이 언론 지면에 그럴듯하게 실리고, 그 결과 여론지형이 왜곡될 수 있어 간단히 짚고 넘어가고자 한다.

위 조사의 경우 지지율 차이는 17%인데 비슷한 차이의 무선전화면접, 휴대전화가상번호로 진행한 다른 조사결과를 살펴보자. 먼저 322~4일 실시된 케이스탯여론조사는 두 후보 간 격차가 16%로 가중값 적용기준 진보 137, 보수 146, 중도 185, 엄소장 주장하는 이념지형이 부합하는 조건에서도 전현희 후보가 비슷하게 앞섰다. 317~18일 넥스트리서치 조사는 두 후보 간 격차가 9%로 줄었는데, 가중값 적용기준 진보 138, 보수 156, 중도 161로 중도는 좀 줄었고, 보수는 좀 많이 표집된 결과를 보여줬지만 대세를 바꿀 정도는 아니다.

종합해보면 엄소장의 주장처럼 두 후보 간 격차가 없어야 한다는 것은 대단히 무리한 주장임을 알 수 있고, 현재의 판세는 전현희 후보가 오차범위 밖에서 앞서고 있다고 해석함이 옳다.

해운대 갑의 경우를 살펴보자. 321~24일 무선전화면접, 100% 가상번호로 진행한 한국리서치 조사에 따르면 홍순헌 후보가 주진우 후보에 4% 앞선 조사가 나왔다. 이 조사에서 진보는 139, 보수는 180, 중도는 162가 표집됐는데 엄소장의 주장에 따르면 도저히 나올 수 없는 결과다. 이는 부산의 이념지형에서 진보가 과표집되었다고 하더라도, 그 결과로 인한 것이라기보다는 저변에 깔린 정권심판론에 황상무 회칼, 이종섭 도주, 대파 논란 등이 터지면서 숨죽이던 진보가 목소리를 내기 시작했다고 봄이 합리적이고, 중도 표심이 전체 여론향배를 결정한다는 것을 알 수 있다. 여론조사라는 것이 때때로 이해할 수 없이 튀는 조사가 나오기도 하는데 이를 근거로 여론조사나 여론지형 전반을 일반화하는 오류를 범해서는 안 되고, 몇몇 사례를 근거로 한 진보 과표집 논란은 이제 사라져야 할 것이다. 2월 여론조사에서 국민의 힘이 압도하던 당시 보수과표집 논란이 있었지만 이를 지적하던 언론은 없었다는 점을 상기할 필요가 있다.

다음으로 언론이 대대적으로 보도한 3월 첫 주 한국갤럽 조사를 읽는 방법에 대해서다. 언론이 주목한 것은 서울 지역 민주당 지지율 대폭락이다. 직전 주 조사결과 민주당 26%대 국민의힘 43%에서 민주당 24%45%로 격차가 좀 더 벌어진 것을 두고, 그렇게 보도한 것이다. 이 조사결과의 의미를 모르진 않았을 것인데, 그렇게 대대적으로 보도한 것은 정치적 목적이 있을 것이라 추측된다.

전국단위 1000 샘플 조사는 위에서 살펴본 바와 같이 표본오차가 ±3.1P이고, 서울지역 187 샘플의 표본오차는 95% 신뢰수준에 ±7%P에 달해 대폭락이 아니라 오차범위를 살짝 벗어난 것에 지나지 않는다. 940만 명의 서울 여론을 187 샘플로 규정하는 것은 일정한 추세를 인정한다 하더라도 어불성설이다. 21% 차이는 비슷한 시기에 500 샘플로 조사된 서울의 각 지역별 조사의 흐름과 너무나 간극이 큰 조사결과여서 신뢰도를 거론할 수준도 안 된다. 전국단위 조사의 경우는 전국적 흐름과 추세를 보는 것으로 제한적으로 사용되어야 한다. 정론을 추구하는 언론이라면 이점을 직시하여 향후에는 의도적으로 또는 정치적으로 민심을 왜곡하는 보도 태도를 지양하여야 할 것이다.

다음으로 여론조사를 읽을 때 중요하게 봐야 하는 몇 가지 키포인트에 대해 알아보자.

첫 번째는 여론조사는 위에서 언급했던 바와 같이 추세로 읽어야 한다는 것이다. 한 번의 조사에서 나타난 숫자에 큰 의미를 부여해선 안 된다. 최소한 2회 이상의 조사를 종합하고, 역대 선거 결과와 비교한다면 상당히 실체적 진실에 근접한 결과를 도출할 수 있을 것이다. 일례로 최근 여론조사에서 기존 흐름과 확연히 다른 결과를 보여주고 있는 부산 여론의 경우 16개 구청장 선거 중 13곳에서 승리한 2018년 지방선거와 비슷한 추세와 체감온도를 보여준다는 것을 근거로 판단해 본다면 18개 지역구 중 민주당 3, 진보당 1곳은 확실한 우세, 9곳에서는 치열한 경합이 벌어지고 있다고 해석할 수 있다.

두 번째는 적극 투표층의 표심이 어떤지를 봐야 한다. 여론조사는 투표에 관계없이 성별, 연령별, 지역별 가중치를 두어야 하지만 투표율은 그렇게 일률적으로 나타나지 않는다. 따라서 여론조사에서는 적극 투표층의 표심이 실체 투표율에 더 가깝다고 보는 것이 합리적이다. 소극 투표층이나 무관심층은 투표에 참여할 가능성이 조금은 떨어진다고 봐야 한다.

세 번째는 이념성향별 투표 경향이 어떤지가 중요하다. 이념성향별 표집규모와 각 성향별 지지성향을 보면 현재 판세와 투표 결과를 어느 정도는 예측할 수 있다. 충남 홍성·예산에서 각축을 벌이고 있는 민주당 양승조 후보와 국민의힘 강승규 후보의 경우 역대 선거 결과와 초기 여론 추이를 보면 최소 오차범위를 넘어서는 10% 이상의 격차를 보일 것이라고 예상되었다.

그런데 정권심판론 바람이 불고 국민의힘에 여러 악재가 터지면서 318일 윈지코리아 조사에서 700 샘플 중 보수가 337, 중도가 207, 진보가 136 샘플이 표집되었지만 전체적으로는 양승조 후보 44.5%, 강승규 후보 47.7%3.2% 차 오차범위 내의 접전을 벌이고 있으며, 적극 투표층에서는 2.2% 차의 초접전 양상을 보이고 있다.

이것이 가능한 것은 보수임에도 정권심판론에 동참하는 흐름이 나타나고 있고, 결정적으로는 양승조 후보가 중도에서 24.8% 차이의 압도적 지지를 얻었기 때문이다.

이처럼 이념성향별 과표집의 문제를 지지율로 연결하여 분석하기는 어렵다. 같은 지역의 323~24일 조원씨앤아이 조사에서는 양승조 후보 46.5%, 강승규 후보 46.3%0.2% 차이, 적극 투표층에서는 1.2% 차이로 오차범위 내에서 양승조 후보가 앞선 것으로 나타나고 있다. 한 치 앞을 보기 어려운 선거가 된 것이다. 추세로 보면 양승조 후보의 상승세가 예상된다.

넷째로는 정당 지지도, 정권심판론과 대통령 국정수행 지지도에 대한 상관관계를 어떻게 볼 것이냐다.

일부 전문가들이 정권심판론과 거대야당심판론이 대동소이하기 때문에 정당 지지도, 대통령 국정수행 지지도를 중심으로 봐야 한다고 주장하고 있지만 이는 윤석열 정권심판론의 강도에 대한 몰이해에서 비롯된 것으로 볼 수 있다.

부산·경남에서 정당 지지도에서는 국민의힘이 10% 이상 앞서고 있는 반면 정권심판론와 대통령 국정수행 부정평가가 50%를 상회하면서 각종 여론조사 결과 양당 간 접전을 펼치고 있다는 사실을 설명할 수 없다. 이번 총선의 판세는 정당 지지율만으로 해석하기 어렵다.

다섯째 투표결과에 가장 크게 영향을 미치는 것은 투표율이다. 이번 총선의 마지막 관전포인트는 현재의 정권심판론의 열기를 어떻게 높은 투표율로 연결시킬 수 있느냐다. 만약 21대 총선 투표율 66.2%를 넘어선다면 역대 선거 득표율 추이와 세대별 투표율 양극화 문제는 크지 않을 것이다. 이번 총선 투표율은 돌풍을 넘어 태풍의 눈으로 등장한 조국혁신당의 질주 정도에 따라 큰 영향을 받게 될 것이라는 점에 이론의 여지는 없는 듯하다.

마지막으로 한국경제신문이 의뢰하여 여론조사기관 피엠아이가 조사한 성남분당을, 중성동갑, 용산, 송파갑에 대한 문제다. 이 조사결과가 포털사이트 메인화면을 장식하고 있는 것은 어찌 보면 당연할지 모른다. 기존의 가상번호기반 전화면접조사나 ARS조사와는 너무나 다른 결과 때문이다. 2~3% 정도는 늘 앞서던 용산의 민주당 강태웅 후보가 권영세 후보에 12.1% 뒤지는 것으로, 중성동갑에서는 10% 정도 앞서던 민주당 전현희 후보가 5.8% 뒤집혀 지는 것으로 나타났다. 무엇이 문제일까?

먼저 처음으로 공표된 생소한 웹조사라는 점에서 특이하지만 방식 상의 문제는 필자의 경험으로 미뤄 큰 문제가 있다고 보기 어렵다. 문제는 표집틀인데 자체 구축한 리서치 패널이라고 여심위 홈페이지에 표기돼 있다. 조사대상은 피엠아이가 무작위 추출한 전국 패널은 400만 명이고, 그 중 중앙여심위 기준에 맞춰 표집한 279만 명이라고 한다. 최대의 미스터리는 400만 명이 어떤 기준으로 추출된 패널인지 알 수 없다는 점이다. 가상번호 기반의 조사 경우에도 알뜰폰 점유율 15.7%가 여론조사에 포함되지 않아 이를 개선하기 위한 노력이 진행되고 있음을 감안하면 이 패널의 표집 대표성을 어떻게 인정해야 할지 의문이다.

진정 279만명이 대한민국의 성별, 지역별, 연령별, 이념성향의 지형을 대표할 수 있는 표집단인가? 더 큰 문제는 용산조사를 보면 모집단 전체가 1,178명이고 그중에 500명이 응답하여 응답률이 무려 42.4%에 달한다는 점이다. 모집단 1,178명은 무슨 근거로 만들어진 것인지 해명해야 한다. 응답률이 높은 것은 쿠폰효과로 이해할 수 있지만 1,178명의 성격이 무엇인지 명확히 하지 않는다면 이 조사는 대단히 큰 문제가 아닐 수 없다. 적어도 회원수 3,000만을 넘는 쿠팡회원 데이터를 기반으로 하지 않는다면 그 신뢰도는 기대할 수 없을 것이다. 선관위는 피엠아이가 조사하고 한경이 발표한 웹조사 방식에 대해 과학적으로 검증된 조사인지 신속히 확인하고 즉각 후속조치를 해야 할 것이다.

43일 이후에는 여론조사 결과를 발표할 수 없는 깜깜이 선거를 해야 한다. 최근의 여론조사 결과 추이가 뒤집어질 가능성이 있을까? 단정할 순 없지만 가능성은 거의 없다고 본다. 현재로선 국민의 힘의 반전카드는 딱히 없다.

회심의 기획이었던 의대 정원 확대까지 악재로 끝나버린 상황에서 추락하는 것에는 날개가 없다는 말이 새삼스럽다.

여론조사 결과와 관련한 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다.

 

2024. 3. 28

 

정치컨설턴트 김동규 탑위드 대표

 

 

 

 
저작권자 © 미디어협동조합 시그널 무단전재 및 재배포 금지

개의 댓글

0 / 400
댓글 정렬
BEST댓글
BEST 댓글 답글과 추천수를 합산하여 자동으로 노출됩니다.
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
댓글수정
댓글 수정은 작성 후 1분내에만 가능합니다.
/ 400

내 댓글 모음