전체 글 119

[최종프로젝트] 최종발표 피드백 / 회고

최종발표 자료 : https://drive.google.com/file/d/1WQNZi8gDaim-gr6SwWxOgTRbyf182-0k/view?usp=sharing [중간발표 피드백 반영] 1. 첫 번째 문제를 어떻게 해결할지 추가적으로 분석해 보시면 좋겠다:마지막 페이지에 각 두 문제를 어떻게 해결했는지 정리하기 2. 뱃지시스템에 대한 설명이 들어가고 관련해서 EDA 하는 흐름으로 들어가면 이해가 더 잘될 것 같아요:뱃지 시스템에 대한 설명 자시하게 넣기. ppt에서 Expert랑 Trusted 만 넣고, 어떤 배지가 더 상위 레벨인지 설명하기. 3. 정품 인증 통과율을 개선해야 한다고 했는데 이 부분이 개선 가능한 영역인지, 불가능하다면 어떤 식으로 해결할 수 있을지를 추가적으로 탐색:정품 인증 과..

[최종프로젝트]중간발표 피드백

[프로젝트 기획]문제 정의를 2개 해주셨는데, 현재는 2번째 문제에 집중되어 있는 것 같아요. 첫 번째 문제를 어떻게 해결할지 추가적으로 분석해보시면 좋겠습니다! 문제를 다양한 관점에서 살펴보고 실제로 적용가능할 것 같은 방법을 탐구해보면 좋겠습니다. 모델링으로 풀어도 되고, 데이터EDA에서 나온 결과를 바탕으로 새로운 전략을 취해보시는 것도 괜찮습니다.[데이터 EDA 및 전처리]뱃지시스템에 대한 설명이 들어가고 관련해서 EDA 하는 흐름으로 들어가면 이해가 더 잘될 것 같아요. 정품 인증 통과율을 개선해야 한다고 했는데 이 부분이 개선 가능한 영역인지, 불가능하다면 어떤 식으로 해결할 수 있을지를 추가적으로 탐색해보시면 좋겠습니다.[결과 해석 및 보고]정품 신뢰도가 0인 클러스터를 따로 만들어주면서 비..

[최종프로젝트정리] 군집결과, 가설검정

군집 시행 결과-> 평균 좋아요 수, 총 판매 상품 수가 너무 한쪽으로 치우쳐 있거나 극단적으로 떨어져 있어 명확하게 구분이 되지 않음.각 컬럼에서 0값을 제거한 후 상위 1%를 제외한 데이터 분포를 확인평균 좋아요 수와 총 판매 상품 수는 오른쪽으로 긴 꼬리를 가지며 이상치의 영향을 크게 받는 것으로 보임. 따라서 로그 변환을 적용하여 군집 분석을 진행(NumPy의 log1p 함수, StandardScaler를 사용)→ K-means는 거리기반으로 군집을 수행하기 때문에 반드시 해석 과정에서 변환 전 원본 값을 함께 확인하기!!(튜터님 피드백)  정품 인증 통과율이 0인 판매자들은 신뢰의 정도를 측정할 수 없고, 기업의 추구 방향성과 맞지 않기 때문에 별도의 클러스터로 분류하기로 결정.  가설설정검정 ..

[TIL]250319_최종 프로젝트_군집을 위한 파생변수, 튜터링 노트 요약

요즘 가장 공감되는 짤... 파면 팔수록 또 나오는 전처리 대상 데이터들...ㅎㅎ일단 큼지막한 전처리는 끝냈으니 전처리는 필요에 따라 계속 진행하기로 하고, 군집을 위한 파생변수를 생각해보기로 했다. 군집을 시행하기 전에 우리의 목적과 문제 정의를 다시 떠올려보면목적:명품 중고 거래 시장의 글로벌 점유율 확대를 목표로 한다. 중고 플랫폼의 특성상 신뢰는 플랫폼 성공의 핵심 요소이며, 우리는 판매자를 위한 차별화된 서비스를 제공하여 신뢰할 수 있는 우수 판매자들을 확보하고, 구매자 유입 및 플랫폼의 지속적인 성장을 촉진하고자 한다.  문제:현재 판매자를 분류해 놓은 'seller_badge'를 살펴보면 기준이 모호하고, 배지별로 큰 매리트가 없다. 커뮤니티의 반응을 살펴보면 판매자 입장에서는 상품 등록까지..

[프로젝트 회고] 실전 프로젝트(Tableau)_게임 유저 및 이탈 요인 분석 대시보드

[완성 대시보드]https://public.tableau.com/views/_08_17405369977070/sheet0?:language=ko-KR&:sid=&:redirect=auth&:display_count=n&:origin=viz_share_link 게임 유저 및 이탈 요인 분석 대시보드유저의 마지막 접속시점을 기준으로 저장된 약 2만 7천 명의 게임 유저 데이터를 활용해 게임사의 유저관리와 신규업데이트 전략 수립을 지원하는 대시보드를 제작했습니다.public.tableau.com 느낀 점: 이번 프로젝트는 특히 도메인 지식의 중요성을 느꼈다. 평소 게임을 즐겨하지 않아서 게임 업계에서는 어떤 지표들을 주요 지표로 보는지도 모르겠었고, 던전 입장 수가 왜 중요한지, EDA를 하면서 데이터 분포를..

[PostgreSQL] ::, CASE_ type 변환

기본 구조CASE (SQL 표준)# 예시 1: 정수를 텍스트로 변환SELECT CAST(1234 AS TEXT) AS converted_value;# 예시 2: 소수를 정수로 변환SELECT CAST(12.34 AS INTEGER) AS converted_value;# 예시 3: 텍스트를 날짜로 변환SELECT CAST('2025-03-12' AS DATE) AS converted_date;# 예시 4: 텍스트를 정수로 변환SELECT CAST('5678' AS INTEGER) AS converted_value;# 예시 5: JSON 문자열을 JSON 객체로 변환SELECT CAST('{"key": "value"}' AS JSON) AS json_object;# 예시 6: 숫자를 소수로 변환SELECT ..

[PostgreSQL] FILTER_SELECT문 속의 조건

FILTER 기본 구조SELECT COUNT(1) FILTER (WHERE 조건) AS alias_nameFROM 테이블명;# 지정된 조건을 만족하는 행의 수를 세어 alias_name이라는 별칭으로 결과를 반환참고 : https://www.postgresql.org/docs/current/sql-expressions.html[활용 문제] https://datalemur.com/questions/odd-even-measurements  Google Interview Question | DataLemurGoogle SQL Interview Question: Calculate the sum of odd-numbered and even-numbered measurements.datalemur.com [문제] ..

[TIL]250311_데이터 전처리product_type : Men Accessories

문제 상황 : product_type 컬럼 항목 중에 제대로 분류되지 않은 컬럼들이 있음 914개의 product_type을 공식 홈페이지에 나와있는 12가지의 카테고리로 분류✅ Bags → 0개✅ Small bags, wallets & cases → 0개✅ Belt bags → 0개✅ Belts → 7947개✅ Sunglasses → 18477개✅ Scarves & pocket squares → 8203개✅ Ties → 27948✅ Hats & pull on hats → 10139✅ Gloves → 880개✅ Cufflinks → 1631개✅ Watches → 18957개✅ Jewellery → 4596개합계 : 98778개men_accesories 총 개수 : 98779차 : 1개 구글에 검색해보니 ..

[TIL]250310_최종프로젝트 기획서, 데이터 전처리

최종프로젝트 기획서 제출더보기프로젝트 제목럭셔리 중고 플랫폼 Vestiaire Collective의 시장 점유율 확대 방안 및 신뢰도 강화 전략프로젝트 주제[개요]중고 명품 플랫폼 Vestiaire Collective는 2022년 7월 27일 한국 시장에 진출했으며, 현재 2025년 IPO(기업공개)를 목표로 시장 점유율 확장에 주력하는 중. 이를 위해 브랜드 인지도 강화와 더불어, 소비자 신뢰 확보를 위한 전략을 세우고자 함.[배경]최근 물가 인상의 영향으로 중고 시장이 활성화되면서, 플랫폼의 매출 성장과 시장 점유율 확대가 중요한 과제가 되고 있습니다. 이에 따라, 소비자들이 중고 거래에서 가장 중요하게 여기는 ‘신뢰도’와 ‘안정성’을 높일 수 있는 전략을 세우고자 함[주제]판매자들이 최적의 가격을 ..

[TIL]250307_간단EDA(2), 시장조사, KPI 지표 고민..

간단 EDA(2)product_type: 신발, 악세사리 분류가 전혀 안되어 있음 -> 4531 행-> 공식 홈페이지에 나와있는 카테고리 별로 분류하기 (Woman, Men 등 product_category확인 필요)결측치 : 주말 중으로 더 깊게 뜯어보고 처리 방법 결정product_description: 7product_keywords: 1183product_category: 1183product_season: 2product_material: 4product_color: 1has_cross_border_fees: 13736buyers_fees: 13736seller_username: 39usually_ships_within: 15479 미정의된 컬럼    컬럼컬럼 값비고정의11.SoldTrue / ..