빅데이터 분석, 데이터를 모르면 보이지 않는다.
(사진 @Pixabay)
데이터를 보면서 사업과의 다리를 놓은 게 십년이 넘은 것 같다.
인프라성 프로젝트도 꽤 했으니, 언제나 사업과 가까이 있었던 건 아니다.
다만 모든 데이터를 볼 수 있는 위치에서 개발운영했기 때문에
중요한 정보들을 먼저 보고, 시사점을 빨리 캐치할 수 있었다.
어떤 자료는 꾸준히 가공을 했고,
중요한 건 사업팀, 임원들에게 먼저 전달하곤 했다.
사업팀에서야 별거 아니겠지만, 시스템 관점에선 꽤 큰 성공경험이었다.
하지만 조직문제에 부딪혀서 그 경험들을 확장할 순 없었다.
최근에 빅데이터 열풍이 지나면서, 이제 각 기업들에 자리를 잡고 있다고 한다.
하지만, 개인적으로는 반대다.
여전히 갈 길이 멀다고 본다.
왜냐하면 아직도 빅데이터를 "기술인프라의 도입"으로 이해한다.
포르쉐를 샀다고 프로레이서가 될 수는 없다.
그냥 포르쉐를 산 돈 많은 아저씨일 뿐이다.
잘 다루지 못한다면, 포르쉐를 타는 폭주족이 될 수도 있다.
아래 글은 그동안 데이터를 사업현장에 활용하면서 겪었던 교훈들이다.
고급분석을 한다고, 더 보이는 게 아니다.
처음에는 회귀분석, 분산분석, 다변량분석 같은 걸로 보고를 했다.
폼나니까. 폼나잖아~
하지만, 임원이나 사업담당자는 이해하지 못했다.
그래서 어쩌라고. 이런 표정.
왜일까?
통계기법은 가설을 증명하는데 쓰는 도구들이다.
그래서, 결과가 수학 공식이다.
일반인에게 너무 어렵다.
내용을 현실 언어로 바꿔야 했다.
그리고 현실세계는 새로운 변수가 계속 생긴다.
그걸 모두 고려한 새로운 모델을 만들어야 하는데 불가능하다.
원래 실험은 닫힌 환경을 만드는 것부터 시작한다.
다양한 변수가 존재하는 현실세계에서 맞을리 없다.
그러니, 훌륭한 리포터를 보아도 그걸로 끝인 경우가 많다.
이해하지 못하는 건 당연한거다.
직원이 훌륭한 통계학자인 건 알 수 있다.
하지만, 사업에 도움이 되려면 멀었다.
이해할 수 있는 용어가 더 좋다.
그 다음엔 그냥 평균과 최대 최소값으로 보고를 했다.
일자별, 날짜별, 시간대별 변화 추이를 보여주었다.
작년의 오늘과 비교했고,
연도별로 같은 시기에 어떤 변화가 있었는지 보여주었다.
특별한 날은 디테일하게 펼쳤고, 아닌 날은 뭉떵거려서 보여주었다.
임원과 사업담당자는 매우 좋아했다.
쉽게 이해하고 다양한 추론을 하기 시작했다.
새로운 시각들이 기획과 전략에 반영하기 시작했다.
왜일까?
통계란 "현상"을 분석하는 연구도구들이다.
적용하기 전에 분석대상, 즉 현상이 있어야 한다.
그런데, 분석 대상을 알려면 무슨 데이터가 있는지 알아야 한다.
즉, 우리 데이터를 보는 것부터 시작해야 한다.
평균, 최대, 최소값은 짜여진 공식이 아니다.
그래서 다양한 상상력을 자극한다.
사업가들은 정보가 필요하지,
결론이 필요한 게 아니다.
결론을 내가 내려주면 안된다.
원인 없는 결과는 없다.
하지만, 하나의 원인만 그 결과를 만드는게 아니다.
"인문"은 "물리"에 비해 꽤 지맘대로다.
데이터를 들여다보는게 중요하지만, 그게 꼭 고급분석일 필요는 없다.
빅데이터는 데이터를 보기 위한 것이다.
빅데이터에서 중요한 건 딱 이거 하나다.
"미래를 계획하기 위해 데이터를 본다."
즉, 보고 만족하려고 데이터를 보는 게 아니다.
내가 앞으로 어떻게 해야 하지?
이거 알아보려고 분석하는 거다.
그런데, 미래계획이란 건 옛날에도 했다.
빅데이터가 없을 땐 어떻게 했을까?
그냥 감으로 행동했다.
"심리학적 접근법"이라고 한다.
여기서 감이란 마케터, 전략가들 사이에서 입으로 전해지는 정보들이다.
다른 이는 어떻게 했고, 우리와 닮은 다른 이는 어떻게 했고,
네이버는 어떻게 했고, 페이스북은 어떻게 했다.
이런 떠도는 이야기들이다.
나한테 정보가 없을 땐 이런 정보가 갈증을 해결해준다.
간접지표나 간접기준이 된다.
이런 걸 통해 미래일을 추론했다.
하지만, 알았으면 좋겠다.
내 옆에 있는 정보가 제일 좋은 것이다.
다양한 실험을 해 볼 수 있는 정보가 제일 좋은 것이다.
멀리서 "그렇다더라."를 듣기보다,
내 DB를 들여다보고 고민하는 게 백배는 더 낫다.
페이스북 백날 이야기해봤자, 우리 회사는 페이스북이 아니다.
왜냐하면, 정작 중요한 것은 말해주지 않기 때문이다.
페이스북을 따라한다고 해서,
우리 회사가 페이스북이 되는 게 아니다.
분석정보, 두가지 역할을 한다.
데이터분석이란 "내가 가진 정보"를 탐구하는 과정이다.
내가 무얼 가지고 있는가.
그건 분명히 내 사업에 중요하다.
필요한 정보를 제때 볼 수 있으면 좋다.
지속적으로 보는 것도 중요하다.
자세하게 볼 수 있으면 좋다.
그 문제에 대해 딱 그 대답이 있으면 더욱 좋다.
지속적인 정보는 새로운 아이디어에 좋다.
두뇌에 축적되면 다양한 연관성이 만들어진다.
새로운 게 자꾸 생각나면 뭔가를 해보게 된다.
지속적인 발전이 가능해진다.
"데이터분석"의 이상적인 모습은,
사내에 고급 리포트가 풍부하게 쌓여 있는 상태다.
새로운 데이터를 뽑지 않아도 이미 정보가 충분한 상태다.
데이터가 아니라, 정보로 가공되어 있어야 한다.
현장의 변화가 사업을 바꾼다.
경영진은 고급 정보를 보고받는다.
하지만, 경영 목적이지 서비스용이 아니다.
실무담당자는 정보에 목말라 있다.
자기들이 필요한 정보 말이다.
특히 우리 DB에 쌓인 거라면 더욱 그렇다.
그런데, 그건 임원용 보고서엔 없다.
그래서 임원들이 보고를 잘받는다고 해서 회사가 바뀌는 게 아니다.
데이터를 사업에 반영하려면,
데이터를 지식DB화 해야 한다.
지식DB란 고급 리포트, 반가공 정보들이 계속 쌓인다는 걸 의미한다.
물론 고급 정보란 다양한 해석과 견해들을 포함한다.
데이터 분석은 현장사례를 풍부하게 쌓는 과정이다.
그래야 보는 눈이 레벨업되고,
눈이 레벨업 되어야 고급기법도 필요한 법이다.
현장이 레벨업 되어야 서비스가 레벨업된다.
회사의 체질이 변해야 한다.
요약하자면, 데이터를 사업에 도입했다는 건,
팀을 짜서 분석사례를 쌓고,
그걸 회사내에 소통하게 되었다는 뜻이다.
팀을 짜서 분석사례를 쌓는 건, 기술과 시간투자가 필요하다.
하지만, 회사내 소통과정은 조직 및 업무관리의 영역이다.
어려운 말로 "조직문화"라고 한다.
조직문화를 바꾸려면 누군가 먼저 하고 있어야 한다.
그게 좋은 걸 보여줘야 사람들이 따라한다.
리더의 솔선수범이 필요하다.
그리고 따라해서 좋아지는 게 있어야 한다.
월급 올려주란 이야기가 아니다.
일이 편해지던, 기여도가 높아지던, 자존감이 높아지던.
즉, 동기유발이 중요하다.
따라서 CEO의 관심이 없다면,
데이터 분석은 너무 먼 이야기다.
"CEO 조찬모임"에서 이런저런 이야기를 듣고 오겠지만,
우리가 뭘 가지고 있는지는 한 번도 보지 못했을거다.
데이터 비용으로 많은 돈을 들이고 있음에도 불구하고 말이다.
끝.