타깃은 여고생의 임신을 알아맞혔는가 2 섞일雜 끓일湯 (Others)

(앞에서 이어집니다.)

대형 소매점 타깃이 여고생 고객의 임신 사실을 가족보다 미리 알고 마케팅에 활용했다는 보도는 두 가지 반응을 불러 일으켰다.

1. 빅 데이터와 예측 분석법의 위력에 대한 놀라움
2. 프라이버시 침해에 대한 우려와 거부감

이 사례는 기업이 여러 소스에서 나온 고객 데이터를 통합하고 치밀하게 분석하면 어떤 효용이 생기는지를 잘 보여주었다는 점에서 이론의 여지가 없다. 타깃이 이러한 방식을 통해 상당한 매출과 수익 향상 효과를 보았다는 점도 분명하다. 그래서 이 사례는 이후 빅 데이터의 중요성을 강조할 때 단골로 인용된다.

그런데 이와 관련하여 좀더 생각해 보아야 할 부분이 있다.

이런 단일 사례만 놓고 보면, 빅 데이터만 열심히 파면 새로운 세상이 열릴 것 같다. 고객이 어떻게 행동하는지를 손바닥 보듯 알 수 있고, 그들이 무엇을 원하는지를 그들 자신이 알기 전에 먼저 알 수도 있다. 새로운 수요가 무한히 창출되고 기업 이익은 극적으로 상승될 것 같다.


한국의 가정에 배달되는 신문에는 아파트 분양 광고지가 흔하게 들어 있다. 그 대부분은 광고 역할을 제대로 하지 못하고 바로 재활용 통으로 들어간다. 그런데 어떤 아파트 건설업체가 다음과 같은 분석 자료를 갖게 되었다고 해 보자.

1) 사람들이 어떤 형태의 집에 얼마나 오래 살면 새 집으로 옮기고 싶어하는지에 대한 자료
2) 연령, 수입, 가족수 등이 어느 정도일 때 새 아파트를 많이 구입하는지에 대한 자료
3) 어떤 지역 주민들의 연령, 가족, 수입, 주거 정보가 담긴 기초 자료

이 업체는 1)과 2)에서 나온 공식을 근거로 하여 3)에서 아파트를 구매할 가능성이 높은 사람들을 추려낸 뒤, 이들에게만 여러 차례 광고물을 보낼 수 있다. 이 경우 아파트 계약 건수는 크게 상승할 것이다.


문제는 이런 일을 현실화하기가 생각만큼 만만하지는 않다는 것이다. 위 아파트 분양 사례에서 1)과 2)를 구축하기 위한 데이터를 찾기가 쉽지 않고 3)도 마찬가지다. 데이터를 입수하고 운용하는 데 프라이버시와 관련한 여러 법규의 제한도 가해진다. 쓸모 있는 빅 데이터를 수집하고 돌려서 어떤 패턴을 잡아내거나 예측 모델을 세우려고 시도해 본 사람이라면, 이게 말과는 달리 얼마나 어려운 일인지 잘 이해할 것이다. 빅 데이터 분석 방식만 도입하면 단기간에 이익이 손쉽게 늘어날 수 있다고 생각하는 것은 환상일 수 있다.


--- ** --- ** ---


타깃의 사례를 좀더 들여다 보자.

타깃에서 예측 분석법을 통한 마케팅을 총괄하는 앤드루 폴은 대학원에서 통계학과 경제학을 전공했다. 그가 타깃에 채용되어 이런 작업을 시작한 것은 2002년이다. <뉴욕 타임스> 보도에 따르면, 당시 그는 다음과 같은 질문을 받았다고 한다: "만일 어떤 고객이 임신중이라면, 그녀가 그런 사실을 공개하고 싶지 않더라도 우리가 알아낼 방법이 있을까? 당신, 그거 할 수 있겠어?"

고객이 임신중이라는 사실을 다른 업체보다 먼저 알아내는 것은 금광맥을 잡는 것과 같다. 임신과 출산, 육아는 사람의 생애에 있어 소비가 집중적으로 발생하는 시기다. 이런 시기에 있는 고객을 파악하고 마케팅을 집중할 수 있다면, 매출은 크게 오를 뿐더러 그 뒤 상당 기간 동안 안정적이고 충성도 높은 고객을 확보하는 셈이 된다.

타깃의 목표는 간단하다. 임신과 같은 고객 특성을 최대한 알아내서, 그 특성에 맞는 마케팅을 벌이는 것. 폴의 문제는 누가 임신한 고객인지를 알아내기가 쉽지 않다는 것이다. 다행히 타깃에는 활용할 자료가 있었다. 임신한 고객이 자발적으로 등록하고 할인 쿠폰 등을 받는 'baby-shower registry' 데이터가 그것이다. 몇 명이라면 의미가 없겠지만, 미국 49개 주에 1천800개 가까운 점포를 가진 타깃의 덩치를 고려해보면 그 숫자가 상당할 것임을 짐작할 수 있다.

폴은 이 자료를 분석하여 일정한 패턴을 찾아냈다. 임신의 어떤 시기에 관련 상품을 어떤 형태로 구입하는지 대략의 패턴을 파악한 것이다. 이렇게 하여 25가지 지표 상품이 설정되었다.

이 부분과 관련한 <뉴욕 타임스> 기사를 그대로 옮기면 다음과 같다.


내가 취재한 한 타깃 직원은 다음과 같은 가상의 사례를 들어 설명해 주었다. 제니 워드라는 고객이 있다고 해 보자. 그녀는 23세로 애틀랜타에 살며, 지난 3월에 코코아버터 로션, 기저귀 가방으로 쓸 수 있는 큰 핸드백, 아연과 마그네슘 보충제, 밝은 청색 카페트를 샀다. 이러한 사실은, 제니가 임신중이며 8월 말에 출산할 예정임을 87%의 가능성으로 알려준다.


이렇게 파악이 되었으니, 이제는 물건을 팔기만 하면 된다. 타깃에는 제니가 어떤 방식으로 물품을 구매해왔는지를 기록한 개인 자료가 있다. 여기에 따라 쿠폰과 홍보물을 보내는 방식을 결정하기만 하면 된다.

이러한 모델은 타깃의 최고 통계 분석 전문가들이 오랫동안 데이터에 매달린 끝에 만들어낸 것이며, 고객 구매 행동에 대한 타깃의 예측 분석법을 대표하는 모델이다. 이들이 데이터에 매달리는 양상은 앞 글에서 보인 폴의 PAW 컨퍼런스 발표에서 엿볼 수 있다.

2010년 당시 폴이 이끌고 있는 타깃의 빅 데이터 분석팀 인원은 50명이다(지금은 얼마로 늘었는지 알 수 없다). 그 중 절반은 미국에 있고 나머지 절반은 인도에 있다. 이게 무슨 말인가? 숫자를 다루는 데 있어 세계 최고 수준인 인간 50명이 매달려서 데이터에 곡괭이질을 하고 있다는 얘기다.

임신-예측 모델이 어떻게 나왔는지를 보여주는 폴의 슬라이드를 다시 한번 보자.




여기서 사용했다고 밝힌 데이터는 △ 매장이나 온라인에서 '지표 상품'을 구입한 데이터 △ 타깃에 자발적으로 등록한 임신-육아 여성 데이터 △ 임신과 육아 관련 상품을 인터넷에서 검색한 기록 데이터 △ 고객의 나이나 아동 수 같은 기초 자료 수 등이다. 이것만 해도 만만치 않은데, 여기서 밝히지 않은 다른 또다른 데이터가 사용되었을 수도 있다.

이것은 타깃이 특정한 여성(예컨대 제니)의 나이, 가족 상황, 주소 등 연락처, 인터넷 검색 기록, 타깃에서의 물품 구매 기록 같은 것을 모두 가지고 있다는 말이며, 이것을 모두 분석한다는 뜻이 된다. 타깃은 이렇게 자료를 수집하고 분석하기 위해 막대한 투자를 한다. 한 마디로, 쉬운 일이 아니다.

그런데, 제니의 임신 및 8월 출산 가능성이 87%라는 것은 무슨 의미인가? 이것은 타깃의 임신-예측 모델이 틀릴 가능성이 13%라는 것이다. 제니가 저런 물품을 샀더라도 8월 출산이 아니거나 심지어 임신을 하지 않았을 가능성이 그 정도라는 뜻이다. 만일 제니가 산 물품 중에 한두 가지가 빠지면 이 오류 확률은 더 커질 것이다.

예측 분석법 전문가이고 PAW 컨퍼런스 기획자인 에릭 시겔은 <뉴욕 타임스> 기사에서 이렇게 말한다: "(많은 기업이 예측 분석법을 마케팅에 도입하고 있지만) 타깃은 늘 이런 분야에서 가장 뛰어난 기업들 중 하나였다."

이렇게 최고 수준의 기업이 최고 수준의 인력을 수십 명 동원하고 다양한 데이터를 통합하여 오랜 시간에 걸쳐 만들어낸 마케팅 예측 모델 역시 오류 가능성이 상당하다는 것이다.


--- ** --- ** ---


이제 원래의 문제로 돌아가 보자. 타깃은 여고생의 임신을 알아맞혔는가?

이것은 확률적 언어로 설명해야 한다. 타깃이 임신-예측 모델을 통해 한 고객(여고생)의 임신 사실을 알아맞힐 가능성은 확률적으로 표현된다. 이 가능성이 80%라면, 여고생이 구매한 물품과 똑같은 구매를 하고 인구학적으로 비슷한 처지에 있는 여성 100명에게 유아용품 할인 쿠폰을 보냈을 때, 그 중 20명은 임신이 아닌데도 엉뚱하게 이런 쿠폰을 받게 된다. 만일 문제의 여고생이 이런 경우였다면, 그 아버지가 타깃 매장을 찾아와 항의를 하더라도 나중에 사과하는 일 같은 것은 일어나지 않았을 것이다.

<뉴욕 타임스> 기사에 따르면, 타깃은 이렇게 개인 특성(예컨대 임신)이 확정된 고객에 보내는 광고물이라도 관련 상품만 넣지 않고 다른 상품들을 섞어서 물타기를 한다고 한다. 남이 자신의 임신 사실을 은밀히 알아내서 그와 관련된 물품이 가득한 광고지를 보낸다면 사람들은 기분나빠 하거나 경계를 하기 때문이라고 한다.

그러나 어떤 분석가들은 타깃이 이렇게 물타기, 혹은 짬뽕 광고 전략을 쓰는 데에는 오류 가능성도 중요한 역할을 한다고 생각한다. 임신한 여성으로 예측하였으나 아닐 수도 있기 때문에, 임신 관련 상품만 보내지 않고 다른 상품을 뒤섞어 넣어서 안전 장치를 만든다는 것이다.

2014년 3월 <파이낸셜 타임스>에 실린 '빅 데이터: 우리는 큰 실수(big mistake)를 하고 있는 것인가?'에는 다음과 같은 부분이 있다:


세상의 기업들은 미국 할인 소매점 타깃이 거둔 이례적인 성공을 보며 군침을 흘렸을 것이다. 이 성공은 2012년에 뉴욕 타임스의 찰스 두히그가 보도하여 유명해졌다. 두히그는 타깃이 고객 관련 데이터를 엄청나게 수집하고 이를 치밀하게 분석한 결과, 고객들에 대한 판단이 마술의 경지에 이른 것처럼 보인다고 썼다.

이 기사에는 다음과 같은 충격적인 일화가 나온다. 한 남자가 미니애폴리스 인근의 타깃 매장으로 쳐들어가서, 이 회사가 10대 딸에게 아기 옷이나 임산부 옷 쿠폰을 보낸 사실을 관리자에게 항의했다. 관리자는 정중하게 사과했으며, 뒤에 다시 사과하기 위해 전화를 걸었다. 그리고 그 여고생이 실제로 임신했다는 이야기를 들었다. 아버지도 몰랐다. 그러나 여고생이 무취 티슈와 마그네슘 보충제를 산 내력을 분석한 타깃은 임신 사실을 알았다.

통계적인 마법사 같지 않은가? 그러나 여기에는 좀더 흔한 설명을 붙일 수 있다.

(데이터 분석가이며 <넘버센스: 빅 데이터를 유용하게 사용하는 법(Numbersense: How to Use Big Data to Your Advantage)>의 저자로서) 소매점과 광고주들을 위해 비슷한 분석을 몇 년 동안 해온 인 카이저 펑은 "이런 접근에는 거대한 '잘못된 긍정(false positive)' 문제가 있다"라고 말했다. 임신을 하지 않았는데도 아기 옷 쿠폰을 받은 수많은 여성들의 이야기는 우리가 듣지 못한다는 것이다.

여고생 사례만 들으면 타깃의 알고리듬이 완벽한 것으로 생각하기 쉽다. 즉, 아기 옷 쿠폰을 받은 모든 사람은 임신부라는 것이다. 그럴 가능성은 거의 없다. 문제의 임신 여고생이 그런 광고물을 받은 것은, 실제로는 타깃의 고객 리스트에 올라있는 모든 사람에게 해당 광고물을 뿌렸기 때문일 수도 있다. 우리는 타깃이 고객의 마음을 읽는 독심술가를 고용한다는 생각을 받아들이기 전에, 그들의 시도가 얼마나 많이 적중하지 않았는가에 대해 먼저 알아야 한다.

찰스 두히그의 기사에서 타깃은 (임산부 용품 관련) 쿠폰을 다른 일반 상품 쿠폰과 뒤섞는다고 한다. 타깃의 컴퓨터가 자신들을 얼마나 잘 파악하는지를 고객이 알면 두려워하게 될 것이기 때문이라고 한다.

펑은 또다른 설명을 내놓는다. 타깃이 광고 상품을 뒤섞는 것은, 임산부에게 아기 용품 쿠폰으로 가득찬 광고물을 보내는 것이 이상하게 보일 수 있기 때문이 아니라, 이 광고물을 받게 되는 사람 중 다수가 임산부가 아니라는 것을 회사가 알고 있기 때문이라는 것이다.


실제로는 임신을 하지 않은 여성에게 유아용품 쿠폰이 배달되었다고 해도 그 개인에게 큰 손해가 발생했다고 보기는 어렵다. 그게 설령 여고생이라도, 아빠가 업체를 찾아가서 한번 뒤집어놓고 오면 되는 정도다.

그러나 어떤 경우는 그렇게 간단하지 않다. 정부가 빅 데이터를 수집하고 분석하여 테러 용의자를 선별하는 작업을 한다고 해 보자(미국 정부는 왜 에드워드 스노든이 폭로한 것과 같이 엄청난 데이터를 수집하고 있겠는가). 이런 작업을 통해 테러 용의자로 잘못 낙인 찍힌 사람은 어떻게 되겠는가.


--- ** --- ** ---


나는 앞 글에서 빅 데이터 분석을 통한 마케팅에 관심 있는 사람은 찰스 두히그의 <뉴욕 타임스> 기사와 앤드루 폴의 발표를 한번 보는 것이 좋다고 했다. 빅 데이터 전반에 걸쳐 관심 있는 사람은 위에 인용한 <파이낸셜 타임스>의 팀 하포드 기사를 일독하기를 권한다. 빅 데이터와 관련하여 이해해야 할 통계적 문제들에 대해 잘 정리한 기사다.

그 중에는 이런 부분이 있다:


빅 데이터를 예찬하는 사람들은 다음의 네 가지 신나는 주장을 펼친다: 1) 데이터 분석 결과가 엄청나게 정확하다 2) 모든 사례가 집계되므로 구닥다리 표본 추출 방식이 필요없다 3) 상관 관계 분석이 모든 것을 말해주므로 인과 관계를 찾으려 애쓰는 것은 구식이다 4) 2008년에 <와이어드>의 기사 '이론의 종말'에서 "데이터의 양이 충분하면 숫자가 스스로 말한다"라고 한 것처럼, 과학적-통계학적 모델은 더 이상 필요하지 않다.

미안하지만 (사실이 아니라) 믿음에서 나온 이런 주장은 기껏해야 낙관적인 '지나친 단순화'에 불과하다. 캠브리지 대학에서 대중의 위기 인식을 전공하는 데이빗 슈피겔할터 교수에 따르면, 이런 주장은 심지어 "터무니없는 완전히 헛소리"이다.

(중략)

컨설턴트들은 데이터에 무지한 고객들에게 빅 데이터의 잠재력에 대해 눈을 뜨라고 몰아친다. 최근 맥킨지 글로벌 연구소가 내놓은 보고서는, 미국의 의료 관련 데이터(병원 진료 기록에서부터 의료보험 지급, 최신 운동화 구입 비용까지)를 모조리 통합한다면 의료 시스템 전체에서 한 해 3천억 달러를 절감할 수 있다고 썼다. 이것은 미국인 1인당 1천 달러에 해당하는 금액이다.

빅 데이터가 과학자, 기업, 정부에게 많은 가능성을 열어주는 것은 맞지만, 아주 흔한 통계적 교훈을 무시한다면 그 결과는 실망스러운 것이 될 수밖에 없다. 슈피겔할터는 "빅 데이터를 둘러싸고 수많은 통계적 문제들이 벌어진다. 덩치를 키운다고 해서 이런 문제가 없어지지는 않는다. 오히려 악화될 뿐이다."


나는 여기서 통계와 관련한 이야기를 길게 늘어놓을 생각은 없다. 다만, 표본 수가 커지면 표본 오차를 줄일 수 있는 반면에 또다른 문제가 발생할 수 있다는 것이 통계학의 오랜 상식이라는 점을 상기하고 싶다. 대표적인 것은, 표본 수가 커질수록 분석 결과가 유의미한 것으로 판단되게 되며 따라서 사실이 아닌데도 사실로 판단하는(영가설의 잘못된 기각) '제1종 오류'가 벌어질 가능성이 커진다는 것이다.

또다른 문제가 있다. 데이터가 크다고 하는 것이 능사가 아님은, 통계학에서 유명한 일화인 1936년 미국 대통령 선거 예측 사례에서 볼 수 있다. 전에 쓴 글 중에서 관련 부분을 그대로 긁어오면 다음과 같다:


잘 알려진 이야기지만, 선거에 과학적인 통계 방식을 도입하여 그 효율성을 극적으로 과시한 것은 1936년 미국 대통령 선거 때다. 선거를 앞두고 시사잡지 <리터러리 다이제스트>는 선거 결과 예측을 위해, 각종 문건에 등재된 유권자들의 주소를 활용하여 모의 투표 용지를 1천만 장 이상 보냈다. 이 결과를 바탕으로 하여, 도전자인 공화당의 알프레드 랜든이 57%의 지지를 얻어 프랭클린 루즈벨트 대통령을 물리칠 것이라고 예견하였다. 그러나 저널리즘 교수직을 집어치우고 자신의 여론 조사 회사를 세운 당시 35세의 조지 갤럽은 불과 5만 명의 표본을 조사한 뒤 <리터러리 다이제스트>와는 정반대의 예측을 내어 놓았다. 선거 결과는 갤럽이 예측한 대로 루즈벨트의 압도적인 승리였다.


당시 <리터러리 다이제스트>는 설문지 1천만 장 중 240만 장을 회수할 수 있었다. 여론 조사 치고는 엄청난 빅 데이터라고 할 수 있는 응답지 240만 장은, 그러나 결과를 제대로 예측하지 못했다. 갤럽의 획기적인 등장에 가려 많이 알려져 있지는 않지만 <리터러리 다이제스트>는 똑같은 방식으로 그 전의 대통령 선거 네 번을 모두 적중시켰다는 점도 기억할 만하다. 말하자면 일부가 맞다고 해서 언제나 맞지는 않는다.

이것은 표본 추출 방식, 혹은 편파적 표본 추출(sampling bias)의 문제를 보여주는 것이지만, 어쨌든 데이터가 크다고 해서 모든 의문을 분석하고 옳은 답을 내릴 수 있지는 않다는 것이다.


--- ** --- ** ---


물론 기업쪽에서 보면 이런 것들은 큰 문제가 아니며, 예측 분석에 대한 투자는 여전히 중요하다. 타깃이 수행하고 있는 것은 새로 개발한 의약품에 대한 효능 및 부작용 검증이 아니라, 고객에게 더 많은 물건을 팔아 더 높은 수익을 올리기 위한 마케팅 리서치다. 설령 모델이 부정확하더라도, 목표 고객을 단 10%만 더 확정할 수 있다면 매출을 그만큼 늘릴 수 있다.

위에서 예를 든 가상의 타깃 고객 제니의 경우, 그녀가 임신중이라는 예측이 맞을 확률은 87%였다. 이것은 마케팅 시각에서 보면 매우 유효한 모델이다. 설령 이 모델이 절반의 정확도밖에 갖지 못한다고 해도 타깃 입장에서는 여전히 막대한 수익을 올릴 수 있는 모델이 된다.


--- ** --- ** ---


지금까지의 이야기를 정리하면 다음과 같다:

1. 빅 데이터에 대한 열광이 있으나, 이를 실제로 수집하고 분석하는 일은 쉽지 않고 상당한 투자를 필요로 한다.
2. 그런 방식을 통해 나온 결과는 항상 맞는 것은 아니며, 많은 통계적 오류를 담고 있다.
3. 그러나 마케팅의 측면에서는 여전히 쓸모가 있다.

타깃은 문제의 여고생의 임신을 알아맞혔는가? 그렇다. 그러나 타깃은 적지 않은 비임신자들을 임신한 것으로 판단했을 수도 있다. 단지 그런 사례는 알려지지 않거나 타깃에서 홍보를 하지 않기 때문에 우리가 모를 뿐이다.

빅 데이터의 가능성을 강조하거나 홍보하는 사람들은 전자만 말할 뿐, 후자는 말하지 않는다. 이것은 결과적으로 빅 데이터에 대한 (사실과 다른) 환상을 조장한다. 빅 데이터가 전례없는 많은 가능성을 열어주는 것은 사실이지만, 그 수집과 적용에 매우 엄밀한 주의가 필요하듯, 그 해석과 이해에도 주의를 기울일 필요가 있다.

(맨 앞에 쓴 '여고생 임신 예측 사례가 가져온 두 가지 반응' 중 두 번째, 즉 프라이버시 침해에 대한 우려와 거부감도 아주 중요한 이슈다. 나중에 여력이 되면 살펴봅니다.)



Advertisement


 


덧글

  • 블루 2015/03/28 02:01 # 답글

    타겟에서 상시 5%할인과 같은 혜택을 내세우면서 스토어카드를 만들라고 하는 것이 이런 데이터를 수집하기 위한 목적도 크지 않나 생각하게 됩니다.
  • deulpul 2015/03/28 02:42 #

    물론입니다. 실제로 앤드루 폴이 발표한 내용을 보면 자사에서 운용하는 각종 신용카드와 고객 카드가 이러한 데이터 수집의 주요한 소스라고 강조하는 내용이 있습니다. 세상에 공짜는 없...
  • Ellery 2015/03/28 04:24 # 삭제 답글

    지금 제가 졸업 논문 주제로 No Fly List에 관련된 글을 쓰는 중인데 TSA에서 No fly list에 올라간 사람들 중에 위와 같은 방법으로 패턴분석을 통해 테러리스트 가능성이 있는 경우가 많더군요. 일부는 US Army, Marine 등의 군복부 경험이 있는 Veteran이었음에도 Blacklist에 올린다는 것이 놀랍더군요. 그런데 문제는 이 리스트에 올라간 사람들이 왜 자신이 리스트에 올랐는지 법적으로 다툴려고 해도 National Secutiry 때문에 이 정보에 대한 접근을 할수 없어 다툴 여지가 거의 없다는 문제가 있더군요.

    그런데 수업에서 교수님 설명으로 패턴 분석을 통한 미래예측이 틀릴 가능성 (false positive뿐만이 아니라 false negative)도 많아서 문제가 많은것 같습니다 앞으로 더욱 많은 분석과 기술(컴퓨터 등)이 발전하면 더 발전할지도 모르겠지만요.
  • deulpul 2015/03/28 10:48 #

    군대 경력이 있으면 테러리스트가 될 가능성이 높아집니다... 무기나 폭발물을 다룰 수 있는 능력을 맥락을 고려하지 않고 독립적으로 변수로 집어넣으면 그렇게 될 수밖에 없겠죠. 물론 이런 오류를 보정할 수 있는 장치들을 설정해두고 있겠습니다만, 통계의 원칙이나 현실에서 벌어지는 일은 모두 그게 그리 쉽지 않다는 점을 시사한다고 생각합니다. 단순한 마케팅 목적이 아니라 말씀하신 것처럼 개인에게 중대한 결과가 초래되는 분석을 할 때는, 그 결과를 고려하여 최대한 보수적으로 접근해야겠지요. 더구나 말씀하신 경우처럼 잘못된 결과가 벌어져도 이유를 따지고 구제할 수 있는 길이 없기 때문에 더욱 그렇겠습니다.

    잘못된 부정(false negative)이란, 말씀하신 경우에서는 '실제로 테러리스트인데도 잡아내지 못한다'라는 결과가 되는데, 이것도 현실적으로 문제이긴 합니다. 그러나 이 부분에서 1) '많은 도둑을 못 잡더라도 한 무고한 도둑을 잡으면 안 된다'라는 근대 사법 정신을 상기해볼 필요가 있고 2) 마케팅을 위한 빅 데이터 분석에서처럼, 이러한 접근이 효율이 그리 높지 않더라도 어쨌든 (그런 접근을 도입하지 않을 때보다) 상대적으로 더 많은 결과를 이끌어내는 점이 있기 때문에, 분석자들은 잘못된 긍정을 줄이는 데 더 주의를 기울여야 하지 않을까 싶습니다.
댓글 입력 영역



Adsense

Adsense2

구글 애널리틱스