데이터 분석 프로젝트 9

[Kaggle/MySQL] E-Commerce 데이터분석2️⃣ Actual transactions from UK retailer

[이전 글] [Kaggle/MySQL] E-Commerce 데이터분석1️⃣ Actual transactions from UK retailer E-Commerce Data Actual transactions from UK retailer www.kaggle.com 데이터 생성 국가별 상품별 구매 지표 추출 특정 상품 구매자가 구매한 다른 상품은? 국가별 재구매율 계산 코호트 분석 고객 Segment 우리가 분 supercomputer.tistory.com 이번 시간에는 고객 세그먼트를 직접 나눠보고 첫 구매 고객 수 관련해서 데이터를 추출해 보자❕ 고객 세그먼트 서비스를 이용하는 고객의 특성을 분류할 수 있다면, 서비스 사용자에 대한 이해를 넓힐 수 있고, 타깃 마케팅 같은 개인화된 혜택을 제공할 수 있다..

[Kaggle/MySQL] E-Commerce 데이터분석1️⃣ Actual transactions from UK retailer

E-Commerce Data Actual transactions from UK retailer www.kaggle.com 데이터 생성 국가별 상품별 구매 지표 추출 특정 상품 구매자가 구매한 다른 상품은? 국가별 재구매율 계산 코호트 분석 고객 Segment 우리가 분석할 UK Commerce 데이터 세트는 다음과 같이 구성되어 있다. IncoiceNo: 주문 번호 StockCode: 상품 번호 Description: 상품명 Quantity: 구매 상품 수 UnitPrice: 개당 판매 가격 CustomerID: 고객 번호 Country: 판매 국가 InvoiceDate:판매 일자 국가별, 상품별 구매자 수 및 매출액 먼저 국가별, 상품별로 구매자수, 매출액을 계산해 본다. 국가별, 상품별로 지표를 계산..

[Kaggle/MYSQL]식품 배송 데이터분석 3️⃣Instacart Market Basket Analysis

[이전 글] 구매자 분석 [Kaggle/MYSQL]식품 배송 데이터분석 2️⃣Instacart Market Basket Analysis [이전 글] MYSQL을 사용하여 데이터를 살펴보기 [Kaggle/MySQL] 식품 배송 데이터분석1️⃣ Instacart Market Basket Analysis Instacart Market Basket Analysis | Kaggle www.kaggle.com 데이터 생성 이번에는 Instacart라는 e-comme supercomputer.tistory.com 이제 재구매를 많이 하는 상품을 알아보고, 각 상품의 판매 특성에 대해 살펴보자. 상품 분석 먼저 재구매 비중이 높은 상품을 찾아보자. 상품별 재구매 비중(%)과 주문 건수를 계산한다. SELECT PROD..

[Kaggle/MYSQL]식품 배송 데이터분석 2️⃣Instacart Market Basket Analysis

[이전 글] MYSQL을 사용하여 데이터를 살펴보기 [Kaggle/MySQL] 식품 배송 데이터분석1️⃣ Instacart Market Basket Analysis Instacart Market Basket Analysis | Kaggle www.kaggle.com 데이터 생성 이번에는 Instacart라는 e-commerce 회사의 데이터를 분석해 보는 시간을 가져보자. 먼저 해당 데이터 세트는 kaggle(Machine Learning Competition)에 존 supercomputer.tistory.com 이전까지 매출과 관련된 지표들을 주로 살펴보았다면, 이제는 구매자에 집중해 데이터를 살펴보자. 먼저 10분위 분석을 통해 서비스의 주문 수가 VIP 고객에게 얼마나 집중되어 있는지 살펴보자. 구..

[Kaggle/MySQL] 식품 배송 데이터분석1️⃣ Instacart Market Basket Analysis

Instacart Market Basket Analysis | Kaggle www.kaggle.com 데이터 생성 이번에는 Instacart라는 e-commerce 회사의 데이터를 분석해 보는 시간을 가져보자. 먼저 해당 데이터 세트는 kaggle(Machine Learning Competition)에 존재하는 데이터 세트이다. 데이터 세트에는 aisles, departments, order_product_prior, orders, products 테이블이 존재한다.(order_products_train은 사용하지 않는다.) aisles, departments는 상품의 카테고리를 의미 order_products_prior는 각 주문 번호의 상세 구매 내역 orders는 주문 대표 정보 products는 ..

[DACON]학습 플랫폼 이용자 구독 갱신 예측 해커톤 후기(~12.11)

학습 플랫폼 이용자 구독 갱신 예측 해커톤 - DACON 분석시각화 대회 코드 공유 게시물은 내용 확인 후 좋아요(투표) 가능합니다. dacon.io 데이터 가설 설정 구독 유형과 구독 유지 여부 구독유형은 Basic과 Premium으로 구분되어있다. Basic이 Premium보다 가격이 저렴하기 때문에 유지율이 높을것 같다. Premium이 선호하는 난이도가 Basic보다 높을것이다. 완료한 총 코스 수가 많을 수록 커뮤니티 참여도도 높고 구독 유지를 할 것이다. 데이터 살펴보기 더보기 user_id: 사용자의 고유 식별자 subscription_duration: 사용자가 서비스에 가입한 기간 (월) recent_login_time: 사용자가 마지막으로 로그인한 시간 (일) average_login_t..

[MySQL] VSCode와 MySQL 연결하면서 생긴 문제들☹︎(feat.sqlite3)

1. 다운로드 MySQL 인지 SQLTools MySQL/MariaDB/TiDB 인지 후기를 찾아보니 정말 다양하다. 2. MySQL 파일 connect 하기 ERROR 1045 (28000): Access denied for user 'root'@'localhost' (using password: YES) 해결 → 비밀번호 오류 → 계정을 새로 만들어도 계속 연결이 안된다. 3. sqlite3 다른 방법을 수소문해서 Python sqllite3라는 라이브러리를 알게되었다 ❕프로젝트에 연결하기 보다는 sql 경험에 포커스해보자 💬 sqlite3 — SQLite 데이터베이스용 DB-API 2.0 인터페이스 — Python 3.9.17 문서 컨텍스트 관리자로 연결 사용하기 연결 객체는 트랜잭션을 자동으로 커..

데이터 분석 프로젝트 : 해외방송시장조사(주 이용 OTT 서비스)

[데이터 출처] 방송통신위원회_해외방송시장조사_방송서비스와 OTT 중 주이용 서비스_20220711 해외방송시장조사 보고서 중 OTT관련 이용행태 및 만족도 등에 대한 데이터 중 국가별(인도, 싱가포르 등 10개국), 연령, 소득, 성별,고객가치, 직업 등에 따른 방송서비스와 OTT 서비스 이용현황 www.data.go.kr [이전 글] 데이터 활용 프로세스 단계 ⬇️ 데이터 분석 프로젝트 시작 : 데이터 문해력 Are you solving the right problem? Are you using the right data? 나는 문제를 명확하게 정의해 풀고 있는가? 나는 올바른 데이터를 사용하고 있는가? [소개] 이 책은 어떻게 데이터 분석을 하면 되는지 자세하게 supercomputer.tistor..

[책]데이터 분석 프로젝트 시작 : 데이터 문해력

Are you solving the right problem? Are you using the right data? 나는 문제를 명확하게 정의해 풀고 있는가? 나는 올바른 데이터를 사용하고 있는가? [소개] 이 책은 어떻게 데이터 분석을 하면 되는지 자세하게 가이드를 알려준다. 데이터에서 찾아낸 인사이트를 자신의 결론으로 이끄는 이야기로 만드는 능력이 바로 데이터 문해력이라고 한다. 목적과 문제를 올바른 데이터와 연결해서 가치 있는 결론을 낼 수 있도록 하는 사고방식과 기술을 안내해 준다. [계기] 처음으로 데이터 분석 프로젝트를 진행해보려고 하니 어디서부터 어떻게 시작해야 할지 어려웠다. 무조건 데이터 먼저 고르고 가설을 세우려고 했지만, 그조차도 데이터를 먼저 보고 가설을 끼워 맞추려고 했었다. 이 ..