데이터수집 6

3-3. 시장데이터 수집 : 인구데이터 수집

데모그래픽 데이터: 가장 기본적이지만 쉽게 놓치는 데이터데이터 분석을 할 때 **인구 데이터(데모그래픽 데이터)**는 가장 기본적인 정보로 여겨진다. 연령, 성별, 지역, 소득 수준, 교육 수준 등과 같은 데이터는 소비자 행동을 이해하고, 시장을 세분화하며, 맞춤형 전략을 수립하는 데 필수적인 요소다.하지만 현실에서는 이 데이터를 수집하고 정리하는 과정이 생각보다 번거롭기 때문에, 쉽게 등한시되는 경우가 많다. 많은 분석가들이 데모그래픽 데이터의 중요성을 알고 있음에도 불구하고, 복잡한 수집 과정이나 데이터의 업데이트 주기 문제 때문에 이를 적극적으로 활용하지 않는 경우가 흔하다.하지만 이러한 데이터를 제대로 활용하지 않으면, 분석의 기본적인 틀이 흔들릴 수 있다. 예를 들어, 특정 브랜드의 제품을 구매..

3-2. 시장데이터 수집 : 네이버 카페 크롤링 (selenium)

특정 주제에 대해서 시장트렌드나 사람들의 니즈를 확인하기 위해서 다양한 데이터가 활용된다. 그중에 가장 흔히 사용되는 온라인 커뮤니티, 그중에서도 네이버 카페 크롤링 방법을 알아보자.파이썬 라이브러리 버전 등 환경설정 문제를 피하기 위해서 Colab 같은 클라우드 환경을 주로 사용하지만, 네이버 카페의 경우 보안로그인(CAPTCHA) 과정이 필요해서 온프레미스 환경에서 구현되도록 했다.1) 네이버 로그인from selenium import webdriverfrom selenium.webdriver.chrome.service import Servicefrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.by i..

3-1. 시장데이터 수집

시장데이터는 시장을 이해하고 나아가서 최종적으로 시장이 어떻게 돌아가는지 정의하는데 매우 중요한 데이터다. 판매량, 고객수 등 성과지표에 문제가 생기면 급한 마음에 비즈니스 내부적인 문제만 바라보고 있을 수 있지만, 성과지표 감소의 이유를 고민하며 따라가다 보면 결국 시장에서 사람들의 바뀐 행동과 관심사를 따라가지 못하고 있다는 결론에 이르게 된다. 즉 사람들의 라이프스타일, 정보 습득방식, 구매하는 채널, 가치를 느끼는 부분들이 바뀌었는데 회사가 인식하지 못하고, 과거에 시장에서 먹히던(?) 방식을 유지하고 있는 경우가 많다. 안타깝게도 사람들이 원하는 방식과 니즈가 바뀐 것인데, 내부적으로 자사의 제품과 서비스만 바라보고 시장과 맞지 않은 개선방향으로 움직이고 또 실패하는 악순환이 발생하는 경우도 꽤..

2-2. 고객 데이터 수집 : 오프라인 고객 데이터 수집

1) GPS고객의 오프라인 위치 데이터를 수집하는 가장 널리 알려진 방법이다. 고객 휴대기기의 GPS 신호를 바탕으로 실시간 위치 데이터를 수집할 수 있다. 실시간으로 사용자가 움직이는 대로 위치 데이터를 수집할 수 있는 장점이 있는 반면, 실제 위치와의 오차가 다른 기술에 비해서 크다는 단점이 있다. 참고로 구글 지도에서 제공하는 GPS를 통한 위치 오차는 20m 내외로 제공하고 있다. 오차가 큰 단점을 보완하여 서비스화 시키기 위해서 지오펜싱(Geofencing)을 설정하여 활용하는 경우가 많다. 지오펜스는 원하는 영역 (보통 km 단위의 넓은 영역)의 좌표로 영역을 정해놓고, 사용자의 GPS 신호가 그 영역 안에 들어왔을 때 마케팅 메시지를 보낸다든가 하는 식으로 서비스를 제공하는 방식이다. 2) ..

2-1. 고객 데이터 수집 : 온라인 고객 데이터 수집

대기업의 경우, 자사 온라인 서비스에 들어온 고객의 세세한 행동 (이미지 선택, 리뷰 클릭 후 드래그 한 여부, 리뷰에 머문 시간 등) 모든 행동이 다 수집된다. 앞선 글에서 얘기했듯이 온라인 고객데이터와 오프라인 고객데이터 두 가지로 나눌 수 있고, 온라인 고객 데이터와 오프라인 고객 데이터는 각각의 특성과 수집 방식이 다르다. 온라인 고객 데이터는 웹사이트, 모바일 애플리케이션, SNS 등의 디지털 환경에서 사용자가 남기는 행동 데이터를 의미하며, 오프라인 고객 데이터는 물리적 공간에서 고객이 생성하는 데이터를 의미한다.온라인 고객 데이터를 수집하는 대표적인 방법으로는 **Google Analytics(GA)**와 같은 웹/앱 분석 도구를 활용하는 방법이 있다. 이 도구들은 방문자의 유입 경로, 페..

1. 데이터 종류

데이터 인프라 구축의 첫 단계는 데이터 수집이다. 데이터를 제대로 수집하려면, 먼저 어떤 유형의 데이터가 존재하는지를 이해하는 것이 중요하다. 일반적으로 데이터는 자사 데이터와 외부 데이터로 구분되지만, 실제 비즈니스 활용 관점에서 보면 고객 데이터, 성과 데이터, 운영 데이터, 환경(시장) 데이터 등으로 세분화할 수 있다. 각 데이터 유형은 수집 방식과 활용 목적이 다르며, 데이터의 특성에 따라 저장 방식과 분석 방법도 달라진다. 데이터 종류데이터 소스데이터 활용고객 데이터 • 데모그래픽(연령, 성별 등)• 행동 (퍼널, 고객여정 등)• 사이코그래픽 (리뷰 등) • CRM, 앱서비스 고객정보• 외부 데이터 (카드사 등) • 고객특성 이해• 고객세분화, 타겟팅, 개인화 등성과 데이터 • 매출, 고객수,..

반응형