데이터 리터러시란?
데이터를 읽고 이해하는 능력, 비판적으로 분석하며, 결과를 의사소통에 활용할 수 있는 능력.
이를 수행하려면 데이터 수집과 데이터 원천을 이해하고 데이터활용법과 핵심지표를 이해해야한다.
-> 올바른 질문을 던질 수 있도록 만들어 줌
데이터 리터러시가 필요한 이유 : 데이터 분석의 과정에서 데이터 리터러시가 필요한 '생각' 부분에서 문제가 되는 경우가 많다.
문제 및 가설 정의(생각) -> 데이터 분석(작업) -> 결과 해석 및 액션 도출(생각)
따라서 데이터 분석이 목적이 되지 않도록 '왜?'를 항상 생각해야한다.
'생각'부분에서 오류를 줄이려면 풀고자 하는 문제를 명확히 할 것 : 문제 정의
[문제 정의 예제]
- 상황: 3개월 전부터 자사 제품의 사용자 수가 감소. 사용자 수를 늘리기 위한 포인트 이벤트 시행중이지만 효과가 없어보인다.
또한 자사 제품 내 서비스 중 A보다 B가 더 안 좋은 상황. 사용자가 줄었기 때문에, 수입도 감소 중
- 문제 정의 :
(내가 발견한 포인트)
1. 효과가 없어 보인다는 말이 애매하다. 포인트 이벤트에 참가하는 사람이 적은것인지, 어떤 과정에서 효과가 없어 보이는지 명확히 할 필요가 있어보인다. 또한 근본적으로 이벤트가 문제인 것인지 검토해볼 필요가 있다.
2. A보다 B가 더 안좋은 상황이란 어떤 부분에서 안좋은 상황인지 구체적으로 파악할 필요가 있어보인다.
3. 사용자가 줄었기 때문에 수입이 감소하고 있다는 인과관계는 타당한가?
-> 수입이 감소하고 있다는 것이 문제이지만 그에 대한 원인이나 정의를 확실히 하는 것이 필요하다.
(예시 답안)
1. 사용자 수가 감소하고 있다 : 생각해볼만한 문제이나, 결과적으로 풀고자 하는 것이 수입 감소라면, 사용자 수는 원인이 된다.
2. 이벤트 효과가 없다 : 이벤트가 효과적이지 않기 때문에 발생하는 문제가 근본적으로 해결되어야 하는 것인가?
3. A보다 B가 더 안좋은 상황 : 분석 과정 중 확인해 봐야 할 내용이지만, 근본적인 문제라고 하기엔 어려워 보인다.
4. 수입이 감소한 것이 문제이다 : 궁극적인 문제. 단, 단어의 정의를 명확하게 할 필요가 있다. 수입이 매출액인지, 순이익인지 등...
문제 정의를 위한 방법론: MECE
MECE(Mutually Exclusive, Collectively Exhaustive)
- 문제 해결과 분석에서 널리 사용되는 접근 방식
- 문제를 상호 배타적(Mutually Exclusive)이면서, 전체적으로 포괄적 (Collectively Exhaustive)인 구성요소로 나누는 것
- MECE를 통해 복잡한 문제를 체계적으로 분해하고, 구조화된 방식으로 분석할 수 있다.
문제 정의를 위한 방법론: Logic Tree
예시)
매출액 하락 원인
- 사옹자 수 감소
- A서비스
- B서비스
- 신규 고객 감소
- 기존 고객 이탈
- 평균 구매액 감소
포인트 이벤트(해결방안 중 하나이지만 근본적인 원인이라고는 할 수 없음)
문제 정의 팁
- 결과를 공유하고자 하는 사람이 누구인지 정의하기(회사 소속이라면, 경영자의 입장에서 보려고 노력)
- 결과를 통해 원하는 변화가 무엇인지 생각하기
- 많은 사람들과 의견을 나눠보는 것도 방법
- 반드시 혼자서 오래 고민해보기
지표 정의 : 어떤 결과를 기대하는가? 정의한 문제를 확인한느데 적합한가?
[주요 지표]
- 전체 Active User : 앱 접속 이력이 있는 유저
- 서비스별 Active User : 서비스별 서브메인 이하 추가 액션이 있는 유저
- DAU : Daily Active User
- WAU : Weekly Active User
- MAU : Monthly Active User
- 이탈유저(이탈율) : 전체 DAU로 잡혔지만, 각 서비스의 DAU로 잡히지 않은 유저(비율)
- CVR(Conversion Rate) : 특정 행동을 한 후, 전환된 비율
- CTR(Click Through Rate) : 어떤 페이지에 접근한 후, 특정 요소를 클릭한 비율
Retention Ratio : 재방문율; 서비스를 이용한 사람이 다시 서비스를 사용하는 비율
-> 리텐션이 높은 서비스는 획득비용에 투자한 비용을 빠르게 회수할 수 있음
일반적으로 리텐션은 시간이 지남에 따라 자연스럽게 감소
기울기가 점점 완만해지며 안정화 되는 그래프를 가지고 있다면 시장에 적합한 서비스라고 할 수 있다.
1) N-Day 리텐션: 최초 사용일로부터 N일 후에 재방문한 Active User의 비율 -> 매일 사용하는 서비스에서 사용하기 적합 (예시: 카카오톡, 페이스북)
2) Unbounded 리텐션: 특정 날짜를 포함하여 그 이후에 재방문한 유저의 비율 (이탈률의 반대 개념) : 사용빈도가 낮은 서비스에 활용하기 적합한 지표 (예시: 채용사이트, 쇼핑몰)
3) Bracket 리텐션: 설정한 특정 기간을 기반으로 재방문율을 측정. N-Day 리텐션을 확장한 개념. 활성유저가 특정한 활동을 위해 각 Bracket내 서비스에 재방문시 잔존 유저로 해석한다. 예시) 1(0일차) / 2(1-3일차) / 3(4-6일차) / 4(7-11일차)
-> 서비스 사용주기가 길거나 주기적인 경우 적합 (예시 : 식료품 배달 서비스, 세차 서비스)
Funnel (퍼널) : 유저들이 어디서 이탈하는가?
- 잠재고객을 유입시키며 최종적인 목표 액션을 달성할 때까지의 과정
- 각 단계의 전환율(또는 첫 유입 대비 전환율)을 측정
-> AARRR : 디지털 마케팅시 활용하는 프레임워크
단계별 전환율을 지표화하여 서비스 보완 지점을 찾음
- Acquisition : 유입
- Activation: 활성화
- Retention: 재방문(재구매)
- Revenue: 수익
- Referrel: 추천
LTV(Life Time Value, 고객 평생 가치) : 해당 유저가 우리에게 평생 주는 이익은 얼마나 될까?
한명의 유저가 생애 주기(한명의 유저가 서비스를 사용-이탈까지의 시간) 동안 얼마만큼의 이익을 주는지를 정량적으로 지표화 한 것
LTV 추측이 가능하면, 신규유저를 데려오는 비용의 산출 및 효율적인 예산 운용이 가능해진다.
산출 방법은 어떠한 기준으로 보느냐에 따라 다름.
예시)
- 이익 * Life Time * 할인율(미래 비용에 대한 현재 가치)
- 연간 거래액 * 수익률 * 고객 지속 연수
- 고객 평균 구매 단가 * 평균 구매 횟수
등...
북극성 지표 : 제품 / 서비스의 성공을 정의
- 제품/서비스가 유저에게 주는 core value를 가장 잘 나타낸 것
- 장기 성장을 위해 필수적으로 모니터링 해야 함
좋은 북극성 지표의 특징
- 제품/서비스 전략의 핵심
- 유저/고객이 제품/서비스에서 느끼는 가치
- 회사의 사업 목표를 나타내는 지표 중 선행지표 (후행X)
결론 도출
1) 결과와 결론의 차이
- 결과
- 데이터 처리, 분석, 모델링 후에 얻어진 구체적인 데이터의 출력
- 숫자, 통계, 그래프, 차트 등의 형태로 나타낼 수 있음
- ex) “고객 설문 조사 데이터를 분석한 결과, 고객 만족도와 구매 빈도 사이에 강한 상관관계가 있음을 보여줄 수 있습니다.”
- 계산과 분석을 해서 나온 결과물
- 결론
- 분석된 데이터 결과를 바탕으로 이끌어낸 의미나 통찰
- 데이터에 기반한 해석, 추론 또는 권고 사항을 포함
- ex) “고객 만족도와 구매 빈도 사이의 강한 상관관계를 보여주는 결과를 토대로, 고객 만족도 향상이 전반적인 매출 증가로 이어질 수 있다는 결론을 내릴 수 있습니다.”
- 목적에 대해 어떤 의미가 있는지 설명하는 것
-> 결과 뿐만 아니라 '결론'을 내는 것이 중요하다.
결과 - 결론 도출 시에는 스토리텔링이 필요하지만, 필요 이상으로 자신의 해석을 융합하면 안됨