본문 바로가기
생각정리

여론조사 통계에 관한 궁금증: 신뢰수준과 표본오차

by 달빛 정원 2022. 3. 9.
반응형

여론조사 결과를 보다보면 항상 등장하는 것이 신뢰수준과 표본오차이다. 신뢰수준이 95%라고 하면 95% 확률이라는 것인지, 그렇다면 왜 확률이라고 표현하지 않고 신뢰수준이라고 하는지...혹은 표본오차는 무슨뜻인지 도통 헷갈린다. 본고에서는 이러한 개념을 정리하면서 여론조사 결과에 대한 이해도를 높여보고자 한다.

 

목차

    여론조사 통계 개념과 의미

    신뢰수준과 표본오차의 의미

    표본크기와 표본오차의 관계

    마무리


    여론조사 통계 개념과 의미

    여론조사란 대통령 혹은 국회의원, 지방자치 단체장 선거 등을 할때 민심(여론)을 확인하기 위해 조사하는 것이다. 어느 후보의 지지도가 높은지가 주요관심사이지만 모든 사람을 대상으로 여론조사를 하기는 시간과 비용이 너무나 많이 소요된다. 이때 통계적인 기법을 통해 여론조사를 하게되고, 이에 따라 신뢰도, 신뢰수준, 오차 등의 개념이 등장하게 되는것이다. 이 밖에도 다양한 주제들에 대한 여론조사들이 존재하고 다양한 기관에서 수행하는 만큼 다양한 결과들이 도출된다. 하지만 우리는 여론조사 결과자체에만 주목하고 이 조사가 어떻게 이루어 졌는지, 틀리거나 신뢰가 낮지는 않는지에 대해선 크게 신경써오지 않은것이 사실이다. 

    통계적 방법론에 대해 샘플링 숫자, ARS, 유선/무선전화비율 등 다양한 기준들이 존재하지만 결과자체로 보면 여론조사 결과를 발표할 때 이야기 나오는 것이 신뢰수준과 표준오차이다. 해당 개념을 잘 이해해야 결과에 대한 제대로된 해석이 가능하다.

     


    신뢰수준과 표본오차의 의미

    여론조사 결과가 나올때,

    "A후보의 지지율이 33%이고, B후보의 지지율이 25%다. 95% 신뢰수준에서 표본오차는 3%이다."

    와 같은 식으로 발표가 된다. 이때 신뢰수준이 95%라는 것은 95% 확률로 이 결과를 믿을 수 있다는 것이 아니라 같은 조사를 100번 한다면, 즉 동일한 조건에서 100번의 resampling을 했을 경우, 95번의 결과가 지금 나온 결과와 같다는 의미이다. 이때 표본오차는 샘플의 크기가 커질수록 작아지고, 샘플의 크기가 작어지면 표본오차는 늘어난다(출처: 주요동정 | 통계청. 2022년 3월 9일 접속. http://kostat.go.kr/portal/korea/kor_ko/3/4/index.board?bmode=readaSeq=378769pageNo=17rowNum=10amSeq=sTarget=sTxt=)

     

    이를 토대로 앞서나온 조사결과를 해석해보면, 100번 샘플링 해서 여론조사를 했을경우, 95번은 A후보의 지지율이 30~36%사이에 형성된다는 것이고, B후보의 지지율은 22~28% 사이에 형성된다는 것이다.

    물론 이때 모집단은 정규분포를 따라야 한다는 가정이 있지만 대부분의 여론조사는 표본수가 크기 때문에 중심극한정리에 의해 정규분포라고 가정한다.

     


     

    표본크기와 오차의 관계

    앞서 표본 크기와 오차는 반비례 한다고 했다. 이에 여론조사에서 표본의 크기도 매우 중요하다는 것이다. 보통 여론조사 1건에는 다양한 문항들이 포함되므로 문항별 측정값에 대한 각각의 표본오차를 모두 제시하지는 않고 전체 표본크기에 대한 최대허용 표본오차만 제시한다. 이때 최대허용 포본오차는 해당 표본크기에서 표본오차가 가장 커질 수 있는 조건하의 오차를 말한다. 예측확률이 50%일때 불확실성이 가장 크므로 응답비율이 50%인 경우의 표본오차가 가장크다.

    응답비율이 50%일 때 표본크기가 100인 경우 표본오차는 9.8%, 250인 경우 6.2%, 500인 경우 4.4% 등으로 표본이 커질수록 표본오차는 줄어든다(출처: 한국갤럽조사연구소. 2022년 3월 9일 접속. https://www.gallup.co.kr/gallupdb/faqContents.asp?seqNo=107.)

    표본크기와 표본오차 관계(95% 신뢰수준 기준, 출처: “한국갤럽조사연구소”. 2022년 3월 9일 접속. https://www.gallup.co.kr/gallupdb/faqContents.asp?seqNo=107.)

     


     

    마무리

    우리가 여론조사를 대할때 그 결과 수치에만 관심을 가져왔지 이러한 신뢰수준, 표본오차에 대해서는 큰 의미를 두지 않은 것이 사실이다. 신뢰수준과 오차범위에 대한 이해를 통해 여론조사를 조금 더 합리적으로 이해하고 활용할 수 있을 것으로 판단된다. 

    반응형

    댓글