정보디자인 3

데이터 분석방법 : 시각화 기반 & 머신러닝 기반

데이터 분석은 데이터의 특성과 구조를 이해하고, 데이터가 포함하고 있는 정보와 관계를 파악하는 과정이다. 이를 위해 두 가지 주요 접근법이 있다. 시각화 기반 데이터 분석과 머신러닝 기반 데이터 분석이다. 1. 시각화 기반 데이터 분석 시각화 기반 데이터 분석은 데이터의 패턴과 관계를 시각적으로 이해하는 가장 직관적인 방법으로 주로 BI(Business Intelligence) 툴을 사용한다. 차트로 그리고 육안으로 판단해야 하기 때문에 1차원에서 3차원 정도의 뎁스(Depth)를 가진, 즉 성과지표를 설명하는 변수 1~3개 정도 바탕으로, 데이터를 분석할 수 있다. 차원별로 다양한 차트를 그려보며 분석할 수 있다. 1차원 데이터 (1개 변수) : 히스토그램, 막대그래프, 파이 차트 등을 사용하여 데이터..

데이터 분석 : 빅데이터와 스몰데이터 I

데이터 탐색이나 데이터 분석에 대해 이야기할 때, 우리는 종종 빅데이터만 떠올리곤 한다. 데이터 관련 프로세스가 빅데이터의 등장과 함께 발전해오고 있지만 잊지 말아야 할 점은, 설문조사 결과와 같은 스몰데이터도 여전히 정량적인 데이터이고 두 데이터 모두 중요하며 정보를 추출해야하는 분석대상이라는 점이다. (본 글에선 리서치를 통해 나온 정량적 결과를 스몰데이터라고 하겠다. 빅데이터와 스몰데이터의 구분기준에 대한 의견은 다양할 수 있다.) 빅데이터와 스몰데이터의 특징 빅데이터는 주로 소비자의 구매 패턴, 웹사이트 방문 기록, 거래기록 등과 같이 주로 행동, 행태, 상태에 대한 데이터로 이뤄진다. 대규모 데이터를 분석하여 거기에서 나타난 행동, 행태, 상태의 현황 및 패턴을 파악하는 데 중점을 둔다. 이처럼..

데이터 분석 : 정보디자인

데이터 분석가(DA), 데이터 사이언티스트(DS), 비즈니스 애널리스트(BA) 등 데이터와 관련된 직무를 수행하는 사람들조차도 '정보디자인'이라는 개념에 익숙하지 않거나 데이터 탐색의 중요성을 느끼지 못하는 경우가 많다. 데이터를 활용해서 가치를 만들어내는 과정에서 이러한 인식 차이가 결과에서 큰 차이를 가져올 수 있다. 이번 글에서는 데이터 탐색의 이론적 측면, 특히 정보디자인에 대해 자세히 이야기해보려고 한다.정보디자인이란정보디자인은 원석과 같은 데이터 안에 숨겨져. 있는 정보를 시각화를 통해 뽑아내는 과정이다. 복잡한 데이터에서 정보를 추출하는 과정은 분류, 배열, 재배열 이렇게 세 가지 주요 단계로 이뤄진다.| 데이터 분류분류는 데이터를 어떤 카테고리로 구분할지 정의하는 단계로, 실무에서는 대게 ..

반응형