본문으로 바로가기

통계 없이 사업하면 안된다.

category 스타트업/계획 2021. 5. 2. 00:47

통계학의 역사

고객을 읽어야 돈을 어떻게 쓸지 결정할 수 있다.

조승연의 탐구생활을 유튜브에서 봤다.

통계학에 대한 이야기였다.

몰랐던 이야기가 많다.

역시 사람은 배워야 해.

 

통계는 국가 통치학에서 비롯되었다고 한다.

State + ista = Statista = Statistics

국가 통계가 없으면, 궁궐을 점령해도 통치범위를 알 수 없고,

얼마나 많은 사람들이 사는지 알수도 없다.

통계야 말고 국가를 통치하는 기본이다.

국가를 점령하고나서 가장 먼저 하는 일이 국가통계를 보는 것이었다.

 

... 라고 한다.

맞는 이야기다.

 

통계라고 하니까, "평균", "추이" 이런 것만 떠올리기도 한다.

아니다. 통계는 숫자를 통해 전체를 보는 행위이고

보이지 않는 곳에서 일어나는 일들을 이해하는 방법이다.

 

www.youtube.com/watch?v=YlGMHmzeW3Y

사업도 마찬가지다.

내가 얼마를 벌고 있는지,

누구에게 팔고 있는지,

얼마를 팔고 있는지 알아야

비로소 사업을 하는 거다.

 

더불어 어떻게 변하는지 알아야

사업을 주도할 수 있다.

그 숫자와 변화가 모두 "통계"다.

 

...

회계적 숫자로 사업을 바라보기도 하는데

그건 "관리회계"라고 한다.

 

"통계"는 회계적 숫자까지 아울러서

모든 사업적 지표를 포함한다.

 

통계의 출발은 데이터다.

... 가 아니고, 데이터는 "분석의 출발"이다.

분석하려면 데이터가 있어야 하기 때문이다.

 

그런데 데이터가 어디에 있을까?

"내가 필요한 데이터를 어디선가 받아와서..."

라는 시나리오는 사실 거의 존재하지 않는다.

내가 필요한 걸 남이 가지고 있을리 만무하다.

 

데이터는 "기록"을 통해서만 쌓이며,

"기록"은 "측정"을 통해서만 할 수 있다.

 

"측정"의 기본은 "관찰"이다.

그래서 통계의 출발은 관찰이다.

 

"관찰"은 "인터뷰" 행위까지 포함하는데,

"인터뷰"는 "주관"을 포함한다.

 

"주관"은 "물리학"에선 피해야 할 요소다.

재현이 불가능해서 증명할 수 없기 때문이다.

 

"사회인문학"에선 그렇지 않다.

물리가 아닌 심리법칙이기 때문이다.

 

"사회적 데이터"는 "관찰"로 시작하며 "주관"을 포함한다.

해석할 때 "관찰자" 특성을 감안한다.

 

불완전한 통계

통계는 모집단을 추정하기 위한 거다.

모집단이란 전체 집단을 말한다.

 

모집단을 대변하도록 표본집단을 추리고

자세한 조사행위를 한다.

 

하지만, 표본집단이 충분하지 않거나

올바르지 못할 경우가 있다.

 

여기서 고민이 생긴다.

(1) 표본을 버리고 새로운 표본을 모은다.

(2) 이 표본이 이야기하는 모집단만 대상으로 한다.

 

모집단을 제대로 증명하려면 (1) 번이 맞다.

하지만, 시간이나 자원이 부족하다면?

(2)번을 선택한다.

(1)번을 선택할 수 없기 때문이다.

 

인터넷 서비스는?

(2)번으로 한다.

식별된 대상만 먼저 관리한다.

노하우가 손에 익으면, 새로운 대상으로 늘려간다.

그렇게 조금씩 전체를 채워간다.

 

인터넷 서비스는 이론물리학이 아니다.

사회 심리학이다.

 

사람은 다양한 가치관을 가지고 있고,

환경에 따라 복잡한 상황에 놓여있다.

이 상황을 모두 고려해서 모집단을 읽으려면

어마어마한 노동력과 시간이 들어간다.

 

불특정 다수를 읽는 것은 사실 불가능에 가깝다.

조금만 늘어나도 읽기 어렵다.

 

그런데 내 서비스는 범용적이지 않아도 된다.

그냥 내 서비스를 사주는 사람이면 충분하다.

 

그들이 좋아하는 행동패턴,

그들이 좋아하는 제품,

그런 것에 집중한다.

 

주어진 시간과 타이밍에,

가지고 있는 자원으로 

할 수 있는 일부터 하는 거다.

 

선택

서비스를 시작하면서 정답을 찾는 것은 바보짓이다.

서비스에서는,

사람이 살아가는 사회 속에서는,

정답을 찾지 않고,

"현재"에 필요한 "선택"을 한다.

원래 정답은 다양하고 많기 때문이다.

 

내가 인스타그램을 만든다고 치자.

새로운 필터를 개발할거다.

그런데 A 필터를 좋아하는 사람이 있고,

B 필터를 좋아하는 사람이 있다.

 

A 필터는 이런 장단점이 있고,

B 필터는 이런 장단점이 있다.

둘다 만들면 좋겠지만, 시간과 노동력이 부족하다.

 

그러면 선택을 해야 한다.

어떤 선택을 해도 좋아하는 사람과 싫어하는 사람이 있다.

어떤 것을 먼저 만들것인가... ?

 

"사회적 통계"는 이런 갈림길을 위한 거다.

"선택"을 위한 자료로 쓰인다.

관찰, 기록을 통해 데이터를 쌓고

필요한 때 그걸 기준으로 판단한다.

 

전체를 대변하지 않기 때문에 틀릴 수 있다.

하지만 식별된 범위에 대해선 그렇지 않다.

 

그래서 기록되고 측정된 것만 타게팅한다.

측정되지 않고 기록되지 않는 건 포기한다.

 

기록되지 않은 건 어차피 알 수 없다.

공유할 수 없으니, 회사로 일할 수 없다.

 

회사가 아니라 혼자 일하는 상황이고,

내 생각과 느낌으로 2~3억씩

써도되는 상황이라면 그래도 된다.

 

그게 아니라면 측정된 것만으로 선택한다.

보이지 않는 길을 갈 때는,

시야에 들어온 것만으로 판단한다.

적어도 발걸음을 헛디디진 않는다.

 

요약

- 통계는 "선택"행위를 위한 것이다.

- 선택은 식별된 것만 기준으로 한다.

- 통계의 출발은 관찰, 기록이다.

- 시간이 흐르면 통계가 누적되고 넓어지도록 설계한다.

- 빅데이터는 그 다음 !!! 우선 통계부터 잘하자.

 

끝.

 

 

 

 

반응형

댓글을 달아 주세요