3. 비즈니스 분석/① 데이터 분석기술

1. 시각화 분석 : 정보디자인

모딜리아니 연구실 (Lab, Modigliani) 2024. 8. 7. 08:23

데이터 분석가(DA), 데이터 사이언티스트(DS), 비즈니스 애널리스트(BA) 등 데이터와 관련된 직무를 수행하는 사람들조차도 '정보디자인'이라는 개념에 익숙하지 않거나 데이터 탐색의 중요성을 느끼지 못하는 경우가 많다. 데이터를 활용해서 가치를 만들어내는 과정에서 이러한 인식 차이가 결과에서 큰 차이를 가져올 수 있다. 이번 글에서는 데이터 탐색의 이론적 측면, 특히 정보디자인에 대해 자세히 이야기해보려고 한다.

정보디자인이란

정보디자인은 원석과 같은 데이터 안에 숨겨져. 있는 정보를 시각화를 통해 뽑아내는 과정이다. 복잡한 데이터에서 정보를 추출하는 과정은 분류, 배열, 재배열 이렇게 세 가지 주요 단계로 이뤄진다.


정보디자인 부분 추천도서 (예시와 함께 상세하게 잘 설명되어 있다)



| 데이터 분류

분류는 데이터를 어떤 카테고리로 구분할지 정의하는 단계로, 실무에서는 대게 데이터베이스에 기존부터 사용하던 기본적인 카테고리(디멘션)가 존재한다. 예를 들면, 회사의 매출 데이터의 경우 지역이나 구매고객의 성별, 나이 등 기본적인 데모그래픽 정보가 카테고리로 칼럼으로 구성되어 있는 경우가 많다. 이런 경우도 매출을 어떤 디멘션으로 보느냐 (지역적으로 매출차이가 있는지 보느냐 성별에 따라 보느냐)에 따라서 정보의 양과 질이 달라질 수 있다. 분류를 마케팅 분야에서 보면 고객 세그멘테이션도 데이터 분류에 포함된다.

이처럼 분류의 중요성은 분류 기준에 따라 데이터의 의미가 크게 달라질 수 있다는 점에서 두드러진다. 예를 들어, 한 회사에서 일 잘하는 사람과 못하는 직원을 판단한다고 가정해 보자. 실적으로 분류할 수도 있지만,  안경을 쓴 사람들은 책을 많이 보고, 일도 열심히 해서 눈이 나빠졌을 거다라는 합리적(?) 의심에 따라서 안경을 쓴 사람과 안 쓴 사람으로 나눌 수도 있다. 그런데 실제로 안경착용 여부로 직원들을 평가하고 상벌을 준다면 인사체계가 엉망이 될 가능성이 크다. 극단적인 예지만 데이터를 어떻게 분류하느냐에 따라 결과가 크게 달라질 수 있다.

| 데이터 배열

배열 작업은 분류된 데이터를 특정 순서나 기준에 따라 정렬하는 단계이다. 이 단계에서는 데이터를 다양한 그래프를 이용해서 시간, 순서, 중요도, 크기 등 다양한 기준으로 배열하여 데이터의 흐름을 한눈에 파악하고, 시간에 따른 변화나 트렌드를 쉽게 이해하는 과정이다.

배열 작업의 예
- 매출 데이터를 월별로 배열하여 계절적인 변화를 분석
- 고객 만족도 데이터를 점수 순서대로 배열하여 만족도가 높은 순으로 정렬
- 웹사이트 방문 데이터를 일자별로 배열하여 트래픽 패턴 분석


대게 분석한다고 하면 분석가가 생각했던 차트를 몇 개 그려보고 끝내는 경우가 많다. (데이터 탐색에 대해서 설명해 준 사람이 없어서 원래 이렇게 하는 것으로 알고 있기도 하고, 시각화툴을 사용하지 않아서 코드로 여러 개의 다양한 차트를 그릴 엄두가 안 나서 이기도 하다)  즉 배열작업을 진행해 보고 끝내는 경우가 많지만, 차트 몇 번 그려보고 쓸만한 정보가 나오는 경우는 많지 않다.

| 데이터 재배열

데이터를 그래프에 넣자마자 와우 포인트가 나온다면 금상첨화겠지만 열이면 열 그렇지 않다. 그래서 배열을 요리조리 바꿔보는 재배열 작업이 필요하다. 재배열 작업은 배열된 데이터를 다양한 방식으로 다시 정렬하여 새로운 패턴을 발견하는 단계로, 데이터를 여러 번 재배열하여 다양한 관점에서 확인하고, 숨겨진 인사이트를 찾아가는 과정이다. 재배열 작업을 통해 데이터를 더 깊이 이해하고, 기존에 보지 못했던 관계나 맥락을 발견할 수 있다.

재배열 작업의 예
- 고객 설문조사 데이터를 연령대별, 성별별, 지역별로 각각 재배열하여 다각도로 분석
- 제품 리뷰 데이터를 긍정적, 부정적 리뷰로 재배열하여 제품의 장단점 파악
- 매출 데이터를 시간 순서, 제품 유형별, 지역별로 재배열하여 다양한 패턴 발견


정보디자인의 중요성
정보디자인은 계속 강조했듯이 단순히 데이터를 정리하는 것을 넘어 데이터에서 더 깊은 인사이트를 추출하는 중요한 작업이다. 분석가의 정보디자인 수준에 따라 나오는 인사이트가 달라지고 데이터의 가치, 나아가 데이터 조직의 가치가 달라지게 된다.

인내심과 시간과의 싸움
정보디자인 작업은  데이터를 분류하고, 배열하고, 재배열하는 과정에서 많은 시간이 소요되는 인내심이 필요한 과정이다.  그러나 이러한 작업을 통해 데이터에서 전혀 기대하지 못했던 정보와 인사이트를 찾고, 기존에는 보지 못했던 중요한 맥락과 원인을 이해할 수 있다.

반응형