728x90
오늘의 목표
- 파이썬 파일에 Low 고객 중 50대의 비율과 숫자, Potential 고객 중 20대 비율과 숫자 추가
- python 코드 파일 정리해서 팀원들과 합치기
- ppt완성하기
- 발표문 작성 및 발표 준비
- 파이썬 파일에 Low 고객 중 50대의 비율과 숫자, Potential 고객 중 20대 비율과 숫자 추가
- .transform('sum')
.transform()은 그룹화된 데이터의 통계 값을 원래 DataFrame의 각 행에 맞춰 유지하고 싶을 때 사용
- groupby(level=0)
DataFrame에서 그룹화하는 첫 번째 레벨(가장 첫번째 언급한 레벨)으로 그룹화할 때 사용.
value
A one 1
two 2
B one 3
two 4
- level=0은 A와 B로 그룹화하겠다는 의미이다.
- df.groupby(level=0)['value'].sum()은 각 그룹의 value 값을 합산합니다.
#비율 계산을 위한 세그먼트별 합계
total_age = user_seg_age_df.groupby(level=0)['age'].sum()
# 각 segment_group에서 차지하는 비율 계산
user_seg_age_df['percentage'] = user_seg_age_df['age'] / user_seg_age_df.groupby(level=0)['age'].transform('sum') * 100
user_seg_age_df['percentage'] = user_seg_age_df['percentage'].round(2)
user_seg_age_df
- python 코드 파일 정리해서 팀원들과 합치기
- ppt완성하기
- 발표문 작성 및 발표 준비
느낀 점
분석 결과를 글로 풀어내는 것도 생각보다 시간이 많이 걸렸다.
분석을 할때는 꼬리에 꼬리를 물어서 연관성이 깊어보였던 분석결과들도 ppt로 정리하며 초반에 세운 목적을 되새기면서 정리하니
굳이 필요하지 않은 것들이나 목적과는 동떨어진 것들도 있었다.
자료를 만들 때는 내가 한 것들을 최대한 많이 보여주려고 이것저것 다 넣고 싶은 욕심이 생겼지만..ㅎㅎ
발표할 때는 목적 설정과 근거를 논리적으로 설명하는게 중요하다는걸 잊지 말아야겠다.
728x90
'내일배움캠프 > TIL' 카테고리의 다른 글
[TIL]250107_QCC 2회차 문제풀이, 코드카타 (0) | 2025.01.07 |
---|---|
[TIL]250103기초프로젝트_발표 및 회고 (1) | 2025.01.03 |
[TIL]241231기초프로젝트_분석 결과 및 인사이트 도출 (0) | 2024.12.31 |
[TIL]241230기초 프로젝트_데이터분석 (1) | 2024.12.30 |
[TIL]241227기초프로젝트_데이터 전처리 (1) | 2024.12.27 |