본문 바로가기
책임감 있는 데이터 분석가로 성장하기 위한 지침서, 『새빨간 거짓말, 통계』를 읽고 (3) 지난주 '통계로 눈을 속이는 방법'으로 오차, 그래프, 억지 숫자를 활용하는 방법에 대해 알아보았다. 이번주는 평균값, 백분율을 활용하여 통계를 조작하는 사례에 대해 살펴보고 지금까지의 내용을 정리할 겸 통계 조작으로부터 피할 수 있는 방법과 소감으로 마무리하고자 한다. 『새빨간 거짓말, 통계』 독후감의 다른 내용이 궁금하다면? 1주차 계속해서 의심해라! 『새빨간 거짓말 통계』를 읽고 (1) 우리는 복잡한 통계 숫자로 가득찬 세상에서 살고 있다. "코로나19 백신 효과율은 95% 육박" "1인 가구 빚 규모 1년 새 37% 감소" 전문가가 아닌 이상 일반 사람들은 이런 뉴스 기사에서 나온 수치를 data-analytics-nayoonee.tistory.com 2주차 통계로 눈을 속이는 법 『새빨간 거짓말.. 2024. 4. 21.
통계로 눈을 속이는 법 『새빨간 거짓말, 통계』를 읽고 (2) 이번 글에서는 『새빨간 거짓말, 통계』에서 '통계로 눈을 속이는 구체적인 방법'을 소개하겠다. 이 책의 원제 'How To Lie With Statistics'(통계로 거짓말 치는 법)인 게 잘 드러나는 부분이다. 방법은 크게 오차, 그래프, 억지 숫자를 활용하는 것이다. 각 방법과 책 속에서 필자에게 인상 깊었던 부분을 추가로 설명하면서 어떻게 통계로 눈을 속이는지에 대해 자세히 알아보도록 하겠다. 『새빨간 거짓말, 통계』 독후감의 다른 내용이 궁금하다면? 계속해서 의심해라! 『새빨간 거짓말 통계』를 읽고 (1) 우리는 복잡한 통계 숫자로 가득찬 세상에서 살고 있다. "코로나19 백신 효과율은 95% 육박" "1인 가구 빚 규모 1년 새 37% 감소" 전문가가 아닌 이상 일반 사람들은 이런 뉴스 기사에.. 2024. 4. 14.
계속해서 의심해라! 『새빨간 거짓말 통계』를 읽고 (1) 우리는 복잡한 통계 숫자로 가득찬 세상에서 살고 있다. "코로나19 백신 효과율은 95% 육박" "1인 가구 빚 규모 1년 새 37% 감소" 전문가가 아닌 이상 일반 사람들은 이런 뉴스 기사에서 나온 수치를 믿을 수밖에 없다. 특히 정부에서 발표하는 통계발표라면 더욱 신뢰하는 것 같다. 하지만 통계가 사실은 교묘하게 사기 치기 딱 좋은 도구라는 걸 알게 된다면?! 이 책의 저자 대럴 허프는 통계로 사기 치는 방법을 알려주기 위해 일종의 입문서, 『새빨간 거짓말 통계』을 집필하였다. 그리고 이 책은 1954년에 출간되었지만 현재까지도 회자되는 베스트셀러 중 하나이다. (빌 게이츠가 '두 번이나' 추천했다는 게 상당히 구미가 당겼다.) 필자 역시 통계의 오류가 있다고는 생각하지만 그 수치가 제시된 값에서 크.. 2024. 4. 7.
넷플릭스는 사용자 행동 분석을 어떻게 할까? 본 글은 Neilpatel과 데이터리안의 블로그 글을 참고해 작성한 후기 글입니다. 목차 사용자 행동 분석이란? 사례 1: 어떤 콘텐츠를 제작해야 사용자의 반응이 좋을까? 사례 2: 어떤 기능을 만들어야 사용자의 구독 취소를 막을 수 있을까? 사례 3: 어떤 영화 라이선스를 결정해야 효용가치가 높을까? 후기 참고자료 사용자 행동 분석이란? 사용자 행동 분석은 서비스를 사용자들이 잘 쓰고 있는지 확인하는 방법 중 하나로, 사용자의 경험을 추정하고 니즈를 파악해 서비스 개선에 필요한 인사이트를 제공하는 데에 목적이 있다. 그리고 이 분석의 근간이 되는 사용자 행동 데이터는 사용자들의 행동 패턴을 확인하기 위해 저장하는 데이터이다. 웹/앱 로그 데이터, 행동 로그 데이터, 이벤트 데이터 등 다양한 이름으로 불.. 2024. 3. 26.
RFM 고객 세분화 분석이란? + The look ecommerce 데이터로 SQL 구현, Tableau 시각화까지 목차 RFM 분석이란? The look ecommerce 데이터로 RFM 분석 실습 a. Recency 구하기 b. Frequency, Monetary 구하기 c. Recency, Frequency, Monetary 한번에 구하기 RFM 스코어링 a. Recency 스코어링 b. Frequency, Monetary 스코어링 c. 최종 RFM 스코어링 d. 최종 RFM 점수를 평균으로 구할 때 주의할 점 태블로로 RFM Tree Map 구현하기 더 생각해보기 참고자료 서비스를 이용하는 고객의 특성을 분류할 수 있다면, 서비스 사용자에 대한 이해를 넓힐 수 있다. 특히 마케팅 담당자라면 그룹별로 개인화된 혜택을 제공하여 더 뾰족한 타겟 마케팅을 활용할 수 있을 것이다. 이번 시간에는 고객 행동을 분석할 수 .. 2024. 3. 22.
[데이터리안] 3월 세미나 - 퍼널 분석을 이용해 제품을 성장시키는 단서 찾기 다음 글은 데이터리안 3월 세미나를 듣고 남기는 후기입니다. 목차 0. 세미나 소개 1. 퍼널의 구성 a. 진입률과 진입 이후 전환율 2. 진입률 높이기 a. 홈 엔트리 : 뭉툭하지만 노출량을 극대화하는 엔트리 b. 넛지 엔트리 : 뾰족하게 퀄리티 높은 유입을 늘려주는 엔트리 3. 진입 이후 전환율 높이기 a. 퍼널 순서 바꾸기 b. 퍼널 개수 늘리기 c. 퍼널 구조 변경 d. 퍼널 구멍 없애기 4. 정리 5. 참고 0. 세미나 소개 데이터리안 3월 세미나의 테마는 바로 퍼널 분석이다! 퍼널 분석은 간단하지만 실무에서 유용하게 활용할 수 있는 분석 프레임워크이다. 필자는 지난 SQL 실전반 캠프를 통해 퍼널분석 쿼리를 작성하면서 로직을 이해한 바 있다. 이제는 실무로 배운 내용을 적용할 때! 이번 세미나.. 2024. 3. 13.