지지율 45%와 45.0%는 다르다 섞일雜 끓일湯 (Others)

언론사나 여론 조사 회사들이 발표하는 대통령 선거 후보들의 지지율(%)을 보면, 한국갤럽의 수치가 다른 회사 발표와 좀 다르다는 것을 알 수 있다. 다른 회사는 모두 소수점 아래 한 자리까지인데, 한국갤럽만 소수 이하가 없는 자연수 단위의 %로 보여준다.



왜 이런 수치를 사용하는지 궁금해서 한국갤럽에 물어 보았다. 여론 조사의 방법과 오차 등을 고려할 때 소수 이하 자리는 큰 의미가 없고, 수치를 활용하는 데 편의를 도모하기 위해 논의를 거쳐 소수점 이상으로 하기로 결정했다고 한다. 이 경우 0.5% 미만의 지지를 얻는 군소 후보자는 조사 결과에서 저절로 배제된다는 문제가 있다. 반올림하면 0으로 처리되기 때문이다.

어쨌든 지지율의 수치 단위를 어디서 끊을 것인가는 조사 회사의 원칙과 방침에 달린 일일 것이다. 분명한 것은 이렇게 나온 한국갤럽의 지지율을 소수 이하 자리로 표현하는 것은 잘못되었다는 점이다. 한국갤럽의 결과를 보도하는 기사나 포털에서는 이런 잘못을 범한 경우가 있다.

예컨대 한국갤럽의 12월1일 조사 발표에는 박근혜 45%, 문재인 43%로 되어 있다.



그러나 이런 결과를 보여주는 네이버의 대선 후보자 지지율 사이트는 다음과 같이 45.0%, 43.0%로 표시했다



계산값 45와 45.0은 다른 숫자다. 그 이유는,

1) 45는 소수 첫째자리(0.x)에서 반올림을 한 것으로, 유효숫자가 두 자리(4와 5)이다. 계산값 45의 실제값 범위는 44.5~45.4x다.
2) 45.0은 소수 둘째자리(0.0x)에서 반올림한 것으로, 유효숫자가 세 자리(4, 5, 0)이다. 계산값 45.0의 실제값 범위는 44.95~45.04x다.

실제값이 44.83이라면 1)에서는 45지만 2)에서는 44.8이 된다. 이러한 차이, 즉 유효숫자가 다른 두 숫자가 대표하는 실제값의 차이는 다음과 같은 그래프에서 쉽게 알 수 있다.



이것은 유효숫자와 근사값의 문제인데, 어쨌든 다른 회사가 보고한 지지율 데이터와는 모양이 달라서 보기가 깔끔하지 않더라도, 원 소스에서 제공한 수치를 그대로 쓰는 것이 옳다.

※ 둘째 이미지: 한국갤럽(본문에 링크), 셋째 이미지: 네이버(본문에 링크)

 

덧글

  • 사바욘의_단_울휀스 2012/12/02 17:10 # 답글

    어느 쪽에서는 일단 이용할수 있는건 최대한 이용해야하니까요.^^
  • deulpul 2012/12/03 15:05 #

    무슨 말씀이신지 이해가 잘 안 됩니다.
  • joonghyuncho 2012/12/04 10:18 # 답글

    울휀스 님의 말씀은 한쪽에선, 정치적인 이유로 가려버릴수 있다는 의미인거 같네요.
  • deulpul 2012/12/04 18:57 #

    그래도 여전히 이해가 안 되는군요... 이건 정치적인 이유에서 나온 공작이라기보다, 수치를 다룰 때 흔히 벌어지는 실수에 가깝다고 생각합니다. 소수점 밑 자리 하나 더 쓴다고 해서 누가 표나게 유리한 것도 없죠. 두 사람 지지율 다 같은 방식으로 했고요.
댓글 입력 영역



Adsense

Adsense2

구글 애널리틱스