내일배움캠프/TIL

[TIL]250102기초프로젝트_코드정리 및 발표자료 완성

dydatablog 2025. 1. 2. 23:02
728x90

오늘의 목표

- 파이썬 파일에 Low 고객 중 50대의 비율과 숫자, Potential 고객 중 20대 비율과 숫자 추가

- python 코드 파일 정리해서 팀원들과 합치기

- ppt완성하기

- 발표문 작성 및 발표 준비

 

- 파이썬 파일에 Low 고객 중 50대의 비율과 숫자, Potential 고객 중 20대 비율과 숫자 추가

이전 데이터

  • .transform('sum')

.transform()은 그룹화된 데이터의 통계 값을 원래 DataFrame의 각 행에 맞춰 유지하고 싶을 때 사용

 

  • groupby(level=0)

DataFrame에서 그룹화하는 첫 번째 레벨(가장 첫번째 언급한 레벨)으로 그룹화할 때 사용.

      value
A one      1
  two      2
B one      3
  two      4

 

  • level=0은 A와 B로 그룹화하겠다는 의미이다.
  • df.groupby(level=0)['value'].sum()은 각 그룹의 value 값을 합산합니다.

 

#비율 계산을 위한 세그먼트별 합계
total_age = user_seg_age_df.groupby(level=0)['age'].sum()

# 각 segment_group에서 차지하는 비율 계산
user_seg_age_df['percentage'] = user_seg_age_df['age'] / user_seg_age_df.groupby(level=0)['age'].transform('sum') * 100
user_seg_age_df['percentage'] = user_seg_age_df['percentage'].round(2)
user_seg_age_df

 

적용 후

 

- python 코드 파일 정리해서 팀원들과 합치기

- ppt완성하기

- 발표문 작성 및 발표 준비

 

느낀 점

분석 결과를 글로 풀어내는 것도 생각보다 시간이 많이 걸렸다.

분석을 할때는 꼬리에 꼬리를 물어서 연관성이 깊어보였던 분석결과들도 ppt로 정리하며 초반에 세운 목적을 되새기면서 정리하니

굳이 필요하지 않은 것들이나 목적과는 동떨어진 것들도 있었다.

자료를 만들 때는 내가 한 것들을 최대한 많이 보여주려고 이것저것 다 넣고 싶은 욕심이 생겼지만..ㅎㅎ

발표할 때는 목적 설정과 근거를 논리적으로 설명하는게 중요하다는걸 잊지 말아야겠다.

728x90