
안녕하세요?
오늘은 지난 시간에 이어 데이터를 분석하기 위한 5가지 프로세스에 대해 좀 더 알아보는 시간을 가지도록 하겠습니다. 먼저, 데이터를 분석해야 하는 이유를 알았고, 필요한 데이터를 얻었다면 반드시 해야 하는 작업이 있습니다.
3. 데이터 정리하기 (Clean and Tranform data)
많은 사람들이 데이터를 연결하고 난 뒤에 바로 분석을 시작합니다. 물론 시간이 부족해서도 있지만, 눈에 보이는 테이블을 가지고 최대한 빠른 결과치를 내려고 하기 때문이라고 생각하는데요.
하지만! 반드시 거쳐야 할 과정은 바로: "내가 필요한 데이터"를 남기고 정리하는 것입니다.
이러한 과정을 data wrangling 이라고 하기도 합니다. 이는 데이터를 raw data를 이해하기 쉽고, 분석하기 좋도록 준비하는 것입니다. 이때 주요 정리해야 하는 내용은
1. 나의 분석과 보고서에 필요한 데이터는 무엇인가?
2. 다른 데이터와 연결을 해야 한다면, primary key는 무엇인가?
3. null value와 같이 비어있는 value를 어떻게 처리할 것인가?
4. outliner와 데이터에 필요하지 않은 내용은 어떻게 처리할 것인가?
4. 데이터 분석하고 인사이트 만들기 (Data Analysis & Insights)
데이터를 정리하고 비즈니스에 대한 이해를 가졌다면, 드디어 우리는 데이터를 분석하는 단계에 이를 수 있습니다. 이 단계는 앞서 준비한 데이터를 이용해 전반적인 패턴을 파악하고, 비즈니스 질문을 해결할 수 있는 결과치를 만들어내는 것이 중요합니다.
먼저, 해야 하는 것은 Exploratory Data Analysis (탐색적 데이터 분석) 입니다. 이때는 주요한 데이터의 특징에 대해 알아보는 과정입니다. 이때 표나 차트 등을 이용해 데이터를 보여줄 수 있습니다. 또한, 이 때 잠재적인 문제가 있는지에 대해 다시 한번 체크하고 데이터를 완벽하게 만들 수 있습니다.
그 이후에는 비즈니스의 니즈에 따라 다양한 방법으로 분석을 이행 할 수 있습니다. 필요한 질문을 해결하기 위한 적절한 방법을 선택하는 것이 중요합니다. 저는 파이썬 프로그램을 이용해 데이터 간의 관계를 파악하거나, 예측하는 등의 분석을 더 이행하기도 합니다.
데이터 분석은 스토리 텔링이다.
저에게 데이터 분석은 각각의 포인트가 가진 요소를 모아서 체계적으로 분석/정리하여 모두가 이해 할 수 있는 스토리를 만드는 과정이라고 생각합니다. 결국적으로 우리가 하는 분석의 목표는 데이터를 통한 비즈니스 결정에 도움을 주는 것이니까요.
데이터를 분석할 때 이 3단계와 4단계는 저에게 데이터를 숫자를 넘어서 이해하고, 스토리를 찾아내는 과정이라고 할 수 있습니다. 이 단계에는 내가 할 수 있는 부분에서 좀 더 자유롭고, 필요에 따라 같은 데이터를 다양한 시각으로 바라볼 수 있는 매력이 있는 부분이지요.
이렇게 데이터를 이해하고, 분석까지 한 이후에는 이를 사람들이 이해하기 쉬운 포맷으로 보여주는 단계를 거치는데요. 다음 시간에는 좀 더 자세히 이 내용에 대해 다뤄볼게요!
https://www.tistory.com/event/write-challenge-2024
작심삼주 오블완 챌린지
오늘 블로그 완료! 21일 동안 매일 블로그에 글 쓰고 글력을 키워보세요.
www.tistory.com
'자기 계발' 카테고리의 다른 글
갤럭시 노트 유저를 위한 주간 플래너 템플릿 무료 공유! (0) | 2025.01.23 |
---|---|
[자기 계발/데이터 분석] 데이터 분석의 5단계 프로세스 - 5단계 그리고.. (1) | 2024.11.15 |
[자기 계발/데이터 분석] 데이터 분석의 5단계 프로세스 - 1&2단계 (4) | 2024.11.08 |
[자기 계발] Coursera 수강 후기: Problem Solving with Creative and Critical Thinking (0) | 2024.09.24 |
[PowerPoint] 무료 이미지로 피피티를 돋보이게 만들어 보자! (0) | 2024.09.15 |