전체 글 116

[TIL]250319_최종 프로젝트_군집을 위한 파생변수, 튜터링 노트 요약

요즘 가장 공감되는 짤... 파면 팔수록 또 나오는 전처리 대상 데이터들...ㅎㅎ일단 큼지막한 전처리는 끝냈으니 전처리는 필요에 따라 계속 진행하기로 하고, 군집을 위한 파생변수를 생각해보기로 했다. 군집을 시행하기 전에 우리의 목적과 문제 정의를 다시 떠올려보면목적:명품 중고 거래 시장의 글로벌 점유율 확대를 목표로 한다. 중고 플랫폼의 특성상 신뢰는 플랫폼 성공의 핵심 요소이며, 우리는 판매자를 위한 차별화된 서비스를 제공하여 신뢰할 수 있는 우수 판매자들을 확보하고, 구매자 유입 및 플랫폼의 지속적인 성장을 촉진하고자 한다.  문제:현재 판매자를 분류해 놓은 'seller_badge'를 살펴보면 기준이 모호하고, 배지별로 큰 매리트가 없다. 커뮤니티의 반응을 살펴보면 판매자 입장에서는 상품 등록까지..

[프로젝트 회고] 실전 프로젝트(Tableau)_게임 유저 및 이탈 요인 분석 대시보드

[완성 대시보드]https://public.tableau.com/views/_08_17405369977070/sheet0?:language=ko-KR&:sid=&:redirect=auth&:display_count=n&:origin=viz_share_link 게임 유저 및 이탈 요인 분석 대시보드유저의 마지막 접속시점을 기준으로 저장된 약 2만 7천 명의 게임 유저 데이터를 활용해 게임사의 유저관리와 신규업데이트 전략 수립을 지원하는 대시보드를 제작했습니다.public.tableau.com 느낀 점: 이번 프로젝트는 특히 도메인 지식의 중요성을 느꼈다. 평소 게임을 즐겨하지 않아서 게임 업계에서는 어떤 지표들을 주요 지표로 보는지도 모르겠었고, 던전 입장 수가 왜 중요한지, EDA를 하면서 데이터 분포를..

[PostgreSQL] ::, CASE_ type 변환

기본 구조CASE (SQL 표준)# 예시 1: 정수를 텍스트로 변환SELECT CAST(1234 AS TEXT) AS converted_value;# 예시 2: 소수를 정수로 변환SELECT CAST(12.34 AS INTEGER) AS converted_value;# 예시 3: 텍스트를 날짜로 변환SELECT CAST('2025-03-12' AS DATE) AS converted_date;# 예시 4: 텍스트를 정수로 변환SELECT CAST('5678' AS INTEGER) AS converted_value;# 예시 5: JSON 문자열을 JSON 객체로 변환SELECT CAST('{"key": "value"}' AS JSON) AS json_object;# 예시 6: 숫자를 소수로 변환SELECT ..

[PostgreSQL] FILTER_SELECT문 속의 조건

FILTER 기본 구조SELECT COUNT(1) FILTER (WHERE 조건) AS alias_nameFROM 테이블명;# 지정된 조건을 만족하는 행의 수를 세어 alias_name이라는 별칭으로 결과를 반환참고 : https://www.postgresql.org/docs/current/sql-expressions.html[활용 문제] https://datalemur.com/questions/odd-even-measurements  Google Interview Question | DataLemurGoogle SQL Interview Question: Calculate the sum of odd-numbered and even-numbered measurements.datalemur.com [문제] ..

[TIL]250311_데이터 전처리product_type : Men Accessories

문제 상황 : product_type 컬럼 항목 중에 제대로 분류되지 않은 컬럼들이 있음 914개의 product_type을 공식 홈페이지에 나와있는 12가지의 카테고리로 분류✅ Bags → 0개✅ Small bags, wallets & cases → 0개✅ Belt bags → 0개✅ Belts → 7947개✅ Sunglasses → 18477개✅ Scarves & pocket squares → 8203개✅ Ties → 27948✅ Hats & pull on hats → 10139✅ Gloves → 880개✅ Cufflinks → 1631개✅ Watches → 18957개✅ Jewellery → 4596개합계 : 98778개men_accesories 총 개수 : 98779차 : 1개 구글에 검색해보니 ..

[TIL]250310_최종프로젝트 기획서, 데이터 전처리

최종프로젝트 기획서 제출더보기프로젝트 제목럭셔리 중고 플랫폼 Vestiaire Collective의 시장 점유율 확대 방안 및 신뢰도 강화 전략프로젝트 주제[개요]중고 명품 플랫폼 Vestiaire Collective는 2022년 7월 27일 한국 시장에 진출했으며, 현재 2025년 IPO(기업공개)를 목표로 시장 점유율 확장에 주력하는 중. 이를 위해 브랜드 인지도 강화와 더불어, 소비자 신뢰 확보를 위한 전략을 세우고자 함.[배경]최근 물가 인상의 영향으로 중고 시장이 활성화되면서, 플랫폼의 매출 성장과 시장 점유율 확대가 중요한 과제가 되고 있습니다. 이에 따라, 소비자들이 중고 거래에서 가장 중요하게 여기는 ‘신뢰도’와 ‘안정성’을 높일 수 있는 전략을 세우고자 함[주제]판매자들이 최적의 가격을 ..

[TIL]250307_간단EDA(2), 시장조사, KPI 지표 고민..

간단 EDA(2)product_type: 신발, 악세사리 분류가 전혀 안되어 있음 -> 4531 행-> 공식 홈페이지에 나와있는 카테고리 별로 분류하기 (Woman, Men 등 product_category확인 필요)결측치 : 주말 중으로 더 깊게 뜯어보고 처리 방법 결정product_description: 7product_keywords: 1183product_category: 1183product_season: 2product_material: 4product_color: 1has_cross_border_fees: 13736buyers_fees: 13736seller_username: 39usually_ships_within: 15479 미정의된 컬럼    컬럼컬럼 값비고정의11.SoldTrue / ..

[TIL]250306_최종 프로젝트 간단 EDA, 배경설정

[지난번 후속 액션]- 3/6 4시까지 각자 데이터 eda(결측치, 이상치, 각 컬럼 내 분포, 기타등등) + 분석 주제 구상해서 모이기!- 마치고 튜터님 찾아가서 피드백 받기! [간단 EDA]데이터 Dtype컬럼명 컬럼 의미 Dtype 결측치product_idId of the productint640product_typeThe type of productobject0product_nameName of the productobject0product_descriptionDescription of the productobject7product_keywordsKeywords in product listingobject1183product_gender_targetGender target of the produc..

[TIL]250304_최종프로젝트 도메인 결정

프로젝트 주제📝 안건 주제공유가 잘 되었으면 좋겠다. → 못한 것도 공유하기!! 매일 조금씩이라도 공유기획이 초반에 잘 이루어졌으면 좋겠다. → 시간을 깊게 하고 넘어갔으면 좋겠다. ✅ 데이터 셋 모음https://www.kaggle.com/mkechinov/ecommerce-behavior-data-from-multi-category-storehttps://www.kaggle.com/mkechinov/ecommerce-purchase-history-from-electronics-storehttps://www.kaggle.com/mkechinov/ecommerce-events-history-in-cosmetics-shophttps://www.kaggle.com/mkechinov/ecommerce-pu..