서버개발 기본기, "데이터 다루기" :: 알고 넘어가자.
데이터분석 이야기를 하기전에, 데이터엔지니어링 이야기를 좀 하고 넘어가자. 데이터분석이 숨은 뜻을 찾아내는 거라면, 데이터엔지니어링이란, 데이터를 보관, 이동, 정리, 변형하는 기술을 말한다. Hadoop, Oracle 등은 데이터소프트웨어들이지, 엔지니어링 그 자체는 아니다. SI를 하면 대형데이터 다룰 일이 별로 없다. 새로 만드는 시스템은 데이터가 없고, 추가시스템이라면 접근권한이 없기 때문이다. "초기데이터 구축"도 중요하지만, "상용데이터"를 다루는 건 완전히 다르다. 그래서, 3년이나 지나도 "데이터 다루기의 기본"을 모르는 경우가 많다. 정리해보자. 지울까 말까 데이터 생성의 주체는 두 개 밖에 없다. "사람"이거나 "기계"이거나. 여기서 "사람"이란 사용자를 지칭한다. "사용자 데이터" 내..
2019. 9. 11.