데이터시각화 6

데이터 분석방법 : 시각화 기반 & 머신러닝 기반

데이터 분석은 데이터의 특성과 구조를 이해하고, 데이터가 포함하고 있는 정보와 관계를 파악하는 과정이다. 이를 위해 두 가지 주요 접근법이 있다. 시각화 기반 데이터 분석과 머신러닝 기반 데이터 분석이다. 1. 시각화 기반 데이터 분석 시각화 기반 데이터 분석은 데이터의 패턴과 관계를 시각적으로 이해하는 가장 직관적인 방법으로 주로 BI(Business Intelligence) 툴을 사용한다. 차트로 그리고 육안으로 판단해야 하기 때문에 1차원에서 3차원 정도의 뎁스(Depth)를 가진, 즉 성과지표를 설명하는 변수 1~3개 정도 바탕으로, 데이터를 분석할 수 있다. 차원별로 다양한 차트를 그려보며 분석할 수 있다. 1차원 데이터 (1개 변수) : 히스토그램, 막대그래프, 파이 차트 등을 사용하여 데이터..

데이터 분석 : 빅데이터와 스몰데이터 I

데이터 탐색이나 데이터 분석에 대해 이야기할 때, 우리는 종종 빅데이터만 떠올리곤 한다. 데이터 관련 프로세스가 빅데이터의 등장과 함께 발전해오고 있지만 잊지 말아야 할 점은, 설문조사 결과와 같은 스몰데이터도 여전히 정량적인 데이터이고 두 데이터 모두 중요하며 정보를 추출해야하는 분석대상이라는 점이다. (본 글에선 리서치를 통해 나온 정량적 결과를 스몰데이터라고 하겠다. 빅데이터와 스몰데이터의 구분기준에 대한 의견은 다양할 수 있다.) 빅데이터와 스몰데이터의 특징 빅데이터는 주로 소비자의 구매 패턴, 웹사이트 방문 기록, 거래기록 등과 같이 주로 행동, 행태, 상태에 대한 데이터로 이뤄진다. 대규모 데이터를 분석하여 거기에서 나타난 행동, 행태, 상태의 현황 및 패턴을 파악하는 데 중점을 둔다. 이처럼..

3-1. 디지털 전환의 핵심 : 데이터 전문가 I

데이터 엔지니어, 데이터 분석가, 데이터 사이언티스트, 비즈니스 애널리스트 등은  데이터를 다루는 전문지식과 경험을 가진 전문가로 디지털 전환의 핵심이다. 2016년 알파고가 이세돌을 이기면서 빅데이터가 대중적 이슈가 된 후로 기대와 함께 여전히 인기 있는 전문직 중 하나다. 그래서인지 실무에서 데이터 전문가들과 일해보면 (주체적이고 호기심 가득한 전문가들도 있지만) 데이터를 다루는 기술과 지식 자체만으로 인정받고자 하는 경향들이 있다. 즉 요청에 따라 자신이 데이터를 다루는 활동(데이터 처리, 분석, 모델링, 자동화 등) 그 자체로 만족할 뿐, 그 활동으로 변화가 있으면 좋고 없어도 어쩔 수 없다는 마인드다.당신이 가지고 있는 기술과 지식은 재주인가 능력인가각자 할 일만 하면 되는 정서라고 하기에는 고..

데이터 분석 : 정보디자인

데이터 분석가(DA), 데이터 사이언티스트(DS), 비즈니스 애널리스트(BA) 등 데이터와 관련된 직무를 수행하는 사람들조차도 '정보디자인'이라는 개념에 익숙하지 않거나 데이터 탐색의 중요성을 느끼지 못하는 경우가 많다. 데이터를 활용해서 가치를 만들어내는 과정에서 이러한 인식 차이가 결과에서 큰 차이를 가져올 수 있다. 이번 글에서는 데이터 탐색의 이론적 측면, 특히 정보디자인에 대해 자세히 이야기해보려고 한다.정보디자인이란정보디자인은 원석과 같은 데이터 안에 숨겨져. 있는 정보를 시각화를 통해 뽑아내는 과정이다. 복잡한 데이터에서 정보를 추출하는 과정은 분류, 배열, 재배열 이렇게 세 가지 주요 단계로 이뤄진다.| 데이터 분류분류는 데이터를 어떤 카테고리로 구분할지 정의하는 단계로, 실무에서는 대게 ..

데이터 분석 : 시각화 탐색 도구

데이터 분석에서 시각화 탐색은 매우 중요한 역할을 한다. 시각화 탐색은 데이터를 분류, 배열, 재배열하는 반복적인 과정을 통해 숨겨진 패턴과 인사이트를 발견하는 작업이다. 하지만 많은 데이터 분석가와 리서처들은 탐색 자체를 소홀히 하거나, 탐색을 하더라도 파이썬이나 엑셀을 이용해 몇 개의 차트를 그려보는 것에 그치는 경우가 많다. 데이터에서 진정한 인사이트를 뽑아내려면, 다양한 조건별로 차트를 수백 개 그려보는 것이 필요하다. 그러나 파이썬이나 엑셀로 이러한 작업을 수행하는 것은 공수가 많이 들어 비효율적이며, 직관적으로 데이터를 바로바로 확인하기 어렵다. 따라서 시각화 탐색을 할 때는 전문 시각화 도구를 사용하는 것이 좋다.시각화 탐색 도구의 필요성시각화 탐색을 효율적으로 수행하기 위해서는 여러 차트를..

1-2. 우리는 왜 데이터 효과가 없을까

빅데이터를 소재로 한 많은 성공신화들이 만연하다. 아마존이나 쿠팡처럼 디지털화를 통해서 흑자전환에 성공한 사례들이나 챗 GPT를 시장에 내놓은 Open AI의 급성장 스토리들은 데이터 산업에 종사하지 않는 사람들도 데이터에 대해 관심을 가지게 하기 충분하다. 그런 광고효과 덕분에 실제 거의 모든 분야에 데이터, AI, 머신러닝이라는 단어가 붙기 시작했다. 심지어 YG 엔터테인먼트 같은 데이터와 상관이 없을 것 같은 분야까지 데이터를 활용하고자 하고 있다. 그러한 시도는 흔히 데이터 관련 학과를 나온 인력을 고용해서 데이터를 수집/처리해서 분석을 하거나 모델을 만드는 팀이나 인력을 별도로 구성하는 방식으로 진행된다. 그럼에도 큰 변화나 혁신이 이뤄지지 않는 경우가 여전히 많다. 오히려 오랜 시간이 흐른 뒤..

반응형