연휴 차량 통행량이 이주 상황을 말해 주는가 중매媒 몸體 (Media)

숫자로 본 ‘설 歸省-歸京 지도’… 수도권→호남 비율 크고 경남→호남 이동도 많아

데이터는 수집보다 분석이나 해석에 더 공을 들여야 한다는 점을 잘 보여주는 기사다. 뉴스 매체가 데이터를 다룰 때 얼마나 조심해야 하는지도 잘 보여준다.

우선 기사에 나타난 데이터의 성격을 보자.

"한국도로공사 도로교통연구원이 2년을 투자해 1998년부터 2008년까지 11년간 고속도로를 오간 차량의 통행 패턴을 전수 조사했다. 주목할 대목은 전국을 경기 강원 충청 호남 경북 경남 6개 권역으로 나눠 이뤄진 ‘권역별 통행량’ 조사다. 대한민국 귀성·귀경 지도를 최초로 그려볼 수 있기 때문이다."

그러니까 11년간 축적된 막대한 통행 데이터를 교통연구원이 2년 동안 분석하였는데, 그 중에 (기사에는 말이 없지만) 설 연휴 기간의 데이터에 특히 주목하여 만든 기사라는 말로 짐작된다. 이후 기사에서 등장하는 수치들은 "11년 동안 설 연휴 5일간" 각 지역 "고속도로 영업소를 통과해 나간 평균치"인 것으로 짐작된다.

기사에서 데이터에 대한 사실적 서술은 큰 문제가 없다. 그러나 분석과 해석은 매우 많은 문제를 안고 있다. 예를 들면,

"'수도권에 호남 사람 많다’는 믿음은 이번 조사에서도 확인됐다. 호남으로 이동한 차량은 경남 경북을 앞질렀다. 지난해 부산 대구 경남 경북 인구는 1180만명, 광주 전남 전북 인구는 510만명이었다. 인구차까지 감안해 보면 지역민이 수도권으로 옮겨가 살고 있는 비율은 호남이 영남보다 압도적으로 높다."

기사에 나타난 실제 데이터를 보자.

  • 수도권 <-> 내부 이동 : 142만 대
  • 수도권 <-> 강원 : 17만3천 대
  • 수도권 <-> 충청 : 45만 대(그림에서는 47만대로 나와, 기사 안에서도 일관성이 없다)
  • 수도권 <-> 호남(전남, 전북) : 13만4천 대
  • 수도권 <-> 영남(경북, 경남) : 17만2천 대(경북 11만9천, 경남 5만3천)

기사의 논리에 따르자면, '수도권에 많은 사람'은 호남 사람이 아니라 충청 사람이다. 가장 많은 이동을 보이고 있지 않은가.

게다가 '호남 사람 많다'는 '믿음'을 입증하기 위해, 호남 데이터는 전남북 구분 없이 '호남'으로 묶고, 영남 데이터는 경남과 경북을 따로 구분한 뒤, "호남으로 이동한 차량은 경남 경북을 앞질렀다"라고 썼다. 이런 왜곡은 사실을 호도하는 데이터 분석에서나 나오는 방식이다.

그보다 우선, "'수도권에 호남 사람 많다'는 믿음은 이번 조사에서도 확인됐다"라는 서술부터 문제 투성이이다. 누가 믿는다는 말인가? 기자가? 일반 사람이? 보통 사람의 믿음을 기사에 그대로 갖다 써도 되는 것인가? 설령 "'수도권에 호남 사람 많다'는 속설은..."이라고 썼다 해도 마찬가지다. 이런 말을 쓰고 싶었으면 먼저 수도권 거주자의 출신 지역별(?) 데이터를 먼저 명시해 놓고 '이런 상황이 설 연휴 차량 이동을 통해서도 입증되었다'라고 서술해야 할 것이다. 그런 데이터가 있는지도 모르겠지만 말이다.

이런 뚜렷한 근거도 없이, 그저 휴일의 차량 통행량만으로 "인구차까지 감안해 보면 지역민이 수도권으로 옮겨가 살고 있는 비율은 호남이 영남보다 압도적으로 높다"는 과감한 결론을 내린다. 그것이 설령 사실이라도, 문제의 데이터는 이런 결론을 전혀 뒷받침해 주지 않는다.

그것 말고도 많은 문제가 있다.

1. 데이터는 출발과 도착지를 구분하지 않고 이동량만 따졌다. 말하자면 서울에서 경남을 다녀온 차량과 경남에서 서울을 다녀온 차량이 구분되지 않았다. 따라서, 차량 이동 패턴으로는 볼 수 있어도, 어디 지역 출신이 어디에 옮겨 와 산다는 증거는 전혀 되지 못한다. 역의 가능성도 포함되어 있기 때문이다.

2. 데이터에서는 충청 지역 이동량이 가장 많은 것으로 나타났다. 이 차량들이 모두 충청 지역으로만 갔기 때문인가? 당연히 아닐 것이다. 문제의 데이터가 고속도로 통행량만을 집계한 것이라는 점을 고려해야 할 것이다. 해석에 주의가 필요한 부분이다.

3. 닷새나 되는 연휴에 고속도로를 달리는 차들은 모두 고향으로 가는 차들인가? 이것도 당연히 아닐 것이다. 그 중 많은 차량은 연휴를 이용해 놀러 나선 행렬일 것이다.

그런데도 기사는 끝까지 '어디에서 어디 지역으로 옮겨 가서 사는 지역민'을 거론하고 있다. 그런 사정을 보기에는 무리가 있는 데이터다.

기사 맨 마지막은 다음과 같다.

"영호남 지역갈등이란 말도 차량 통행 패턴 상으로는 도드라지지 않았다. 경남에서 호남으로 이동한 차량은 7만대로 경남에서 수도권으로 이동한 차량(4만6000대)보다 많았다."

기사의 논리에 따르면 경남에서 수도권으로 옮겨 가 사는 사람보다 경남에서 호남으로 옮겨 가 사는 사람이 더 많다는 뜻이 된다. 이게 말이 되는가?

데이터는 모아 놓기만 해서 아무런 의미가 없다. 해석을 해야 데이터로서 생명력이 생기는 것이며, 이 과정에서 편견과 오류가 개입한다면 데이터를 모아 분석하지 않느니만 못하다.

이 기사에는 단 하나 미덕이 있다. 제목이다. 기사 내용에 나타난 억지스러운 해석을 끌어 당겨 눈에 확 띄는 제목으로 올렸을 법도 한데, 이 기사의 제목은 "숫자로 본 ‘설 歸省-歸京 지도’… 수도권→호남 비율 크고 경남→호남 이동도 많아"라고 하여 아주 조심스러운 언어를 선택하여 제목으로 삼았다. 그 결과, 제목이 좀 길어졌다. 독자의 눈길만을 잡아 끌기 위해 제목 따로, 내용 따로인 낚시 제목도 마다하지 않는 세태에 귀감이 될 만한 제목이다. 제목 만든 사람의 고민이 읽힌다.

 

덧글

  • 푸른마음 2011/02/11 13:27 # 답글

    거기다 한가지 문제점을 더 추가해야죠.
    이동수단은 고속도로를 이용하는 것이 전부가 아니라는 사실을요.
    철도, 항공 등의 수단도 있는데다
    그 또한 각 지역별로 균형잡히게 분포된 것이 아니므로
    타 교통수단의 불균형성에 의해서도 고속도로 교통량에는 적잖은 변이를 가져올 수 있을테니까요.
  • deulpul 2011/02/11 15:27 #

    그 점도 분명 문제가 되는데, 기사 앞부분에 교통별 수송 분담율이나 명절 연휴에 선호하는 교통 수단 여론 조사 같은 걸로 근거를 달아 두긴 했습니다. 그래도 말씀하신 대로 지역별 교통편의 불균형 부분은 분명 영향을 미치겠네요.
  • dhunter 2011/02/11 13:33 # 삭제 답글

    거기에 문제점을 체리처럼 얹어보자면... "차량에 몇명이 탔는가" 는 고려가 안되었다는점 (극단적으로는 45인승 버스도 2인승 스포츠카도 1대), 경부선은 기차 수송량이 호남선에 비해 많다는 점등이 있겠네요.
  • deulpul 2011/02/11 15:27 #

    동의합니다. 예리하십니다.
댓글 입력 영역



Adsense

Adsense2

구글 애널리틱스