내일배움캠프/TIL

[TIL]250122_머신러닝 개인과제3-4번,아티클스터디

dydatablog 2025. 1. 22. 21:35

FACTS :

  • ✅ 오전 파이썬 300제 21~30
  • ✅ 오전 머신러닝 개인과제 3,4번
  • [ ] 오전 파이썬 베이직 복습 문제 다시 풀어보기
  • ✅ 오후 아티클스터디
  • ✅ 오후 머신러닝 심화 강의 2주차 -> 실습 다시 해보기

FEELINGS 

- FINDINGS 

[Python] 빈도표 작성법 : crosstab


머신러닝 개인과제 문제3

필수 3. 통계적 가설검정2

  • Color, Season 컬럼에 대한 카이제곱 검정을 진행해주세요.
    • 귀무가설과 대립가설을 작성해주세요.
    • 두 범주형 자료의 빈도표를 만들어주세요. 이를 코드로 작성하여 기재해주세요.
    • 카이제곱통계량, P-value 를 구해주세요.
  • 그리고 이에 대한 귀무가설 채택/기각 여부와 그렇게 생각한 이유를 간략하게 설명해주세요.
  • 결과 제출형태
    • 귀무가설, 대립가설
    • 코드와 결과값
    • 해석(채택여부 및 이유)
#문제3
from scipy.stats import chi2_contingency

#귀무가설(H0), 대립가설(H1) 설정
print('H0 : Season과 Color는 독립적이다.')
print('H1 : Season과 Color는 독립적이지 않다.')

#빈도표 작성
crosstab_stat = pd.crosstab(stat['Season'],stat['Color'])

# 카이제곱 통계량, P-value
chi2_stat, p_val, dof, expected = chi2_contingency(crosstab_stat)

print(f'카이제곱통계량 : {chi2_stat}')
print(f'P-value : {p_val}')

#유의수준 설정
alpha = 0.05
if p_val < alpha:
  print('귀무가설을 기각합니다. Season과 Color는 독립적이지 않다.')
else :
  print('귀무가설을 기각하지 않습니다. Season과 Color는 독립적이다.')

'''
해석: p-value가 유의수준인 0.05보다 크기 때문에 귀무가설을 기각하지 않는다. 
따라서 Season과 Color는 독립적이다고 해석할 수 있다.
'''

'''
출력:
H0 : Season과 Color는 독립적이다.
H1 : Season과 Color는 독립적이지 않다.

카이제곱통계량 : 64.6506366841786
P-value : 0.718551112120402

해석: p-value가 유의수준인 0.05보다 크기 때문에 귀무가설을 기각하지 않는다. 
따라서 성별에 따른 review rating에는 차이가 없다고 할 수 있다.

'''

✔️ 빈도표 작성법_crosstab

https://wikidocs.net/216695

 

crosstab

crosstab(분할표)은 두 개 이상의 범주형 변수 간의 관계를 요약하고 시각화하기 위해 사용됩니다. ``` import pandas as pd result = pd.cr…

wikidocs.net

 

문제4

필수 4. 머신러닝1

  • 아래와 같은 데이터가 있다고 가정하겠습니다.데이터를 바탕으로 선형 회귀 모델을 훈련시키고, 회귀식을 작성해주세요.
    • 독립 변수(X): 광고예산 (단위: 만원)
    • 종속 변수(Y): 일일 매출 (단위: 만원)
    • X=[10, 20, 30, 40, 60, 100]
    • Y=[50, 60, 70, 80, 90, 120]
  • 회귀식을통해, 새로운 광고예산이 1,000만원일 경우의 매출을 예측(계산)해주세요. 그리고 이에 대한 해석을 간략하게 설명해주세요.
  • 결과 제출형태
    • 회귀식
    • 코드와 결과값
    • 해석
# 문제4
import sklearn
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt

# 독립 변수(X): 광고예산 (단위: 만원)
X=[10, 20, 30, 40, 60, 100]
# 종속 변수(Y): 일일 매출 (단위: 만원)
Y=[50, 60, 70, 80, 90, 120]

df = pd.DataFrame({'광고예산' : X, '일일매출' : Y})

#학습
ml_df = LinearRegression()
ml_df.fit(df[['광고예산']],df[['일일매출']])

#회귀식구하기 : y = w(가중치)* x + b(편향)
#가중치 
w = round(ml_df.coef_[0][0],2)
#편향
b = round(ml_df.intercept_[0],2)
# 회귀식
print(f'y = {w} * x + {b}')

#예측
# 광고예산
budget = 1000
# 일일매출
daily_sales = w * budget + b
print(f'새로운 광고예산이 {budget}만원 일 경우, 일일 매출액은 {daily_sales}만원으로 예측된다.')

'''
해석 : 광고예산이 1만원씩 증가하면 일일 매출액도 0.76만원 증가한다.
출력 : 
y = 0.76 * x + 45.56
새로운 광고예산이 1000만원 일 경우, 일일 매출액은 805.56만원으로 예측된다.
\n해석 : 광고예산이 1만원씩 증가하면 일일 매출액도 0.76만원 증가한다.\n

'''

[아티클 스터디]

- 주제 : 의료 AI의 전망과 활용 사례 분석
- 아티클 원본 : AI를 활용한 헬스케어 혁신 사례 10가지 - 똑똑 알리미
- 팀노션 : https://www.notion.so/teamsparta/D-Data-Dept-Discovery-1732dc3ef51480b2a288e8d358f748cc
- 현황 :
AI를 활용한 수술은 의료 보험 적용 대상에서 제외되어 있습니다.
AI 기반 의료 시뮬레이션은 의료진이 진단과 치료 기술을 연습할 수 있는 환경을 제공합니다.
- 예상되는 장점 :
AI가 본격적으로 도입된다면 진단 및 수술의 속도와 정밀도가 향상될 것입니다.
병원 인프라가 부족한 지역에 도입 될 경우 국가적 의료 격차 해소에 기여할 것입니다.
- 우려사항 :
AI의 판단 신뢰성과 한계에 대한 의문이 지속되고 있습니다.
환자 데이터 보안 문제와 관련된 위험이 존재합니다.
의료 사고 발생 시 책임 소재를 명확히 규정하기 어렵습니다.
- 공통 인사이트 :
AI도 오류를 범할 수 있으며, 한 번의 실수가 환자의 생명에 직결될 수 있기 때문에 AI에 무조건 의존해서는 안 된다고 생각합니다. 따라서 AI와 의료진의 균형 잡힌 역할이 중요해질 것입니다.
방대한 의료 데이터를 정확히 해석하고 AI가 도출한 결과를 검증하며, 이를 바탕으로 의료진과 함께 최적의 치료 방안을 모색하는 의료 부문 데이터 분석가의 역할도 점점 더 중요해질 것입니다.

- 개인 인사이트 : 

  • 정신 건강 관리까지 해주는 AI를 보며 사람들이 과연 그 결과를 신뢰하는가에 대한 의구심이 들었다. 나는 AI를 어디까지 믿을 수 있을가..?
  • 특히나 인프라가 부족한 나라나 지역에 큰 도움이 되지 않을까 생각한다.
  • 구글 헬스가 왜 21년에 중단되었는지 궁금해서 찾아보니 분산식 전략으로 바꾼 것이었고, 헬스케어에 대한 투자와 프로젝트는 계속되고 있다고 한다. 다른 빅테크기업들도 의료 기술 회사로 넘어가는데 어려움을 겪는다고 하는데 그 이유는 다음과 같다고 한다.
    • 규제 및 법적 문제: 의료 분야는 엄격한 규제를 받고 있으며, HIPAA와 같은 개인 정보 보호법을 준수해야 해. 이러한 법적 요구 사항은 기술 회사들이 빠르게 움직이는 데 제약이 될 수 있어.
    • 데이터의 복잡성: 의료 데이터는 복잡하고 다양한 형태로 존재해. 이를 효과적으로 분석하고 활용하기 위해서는 전문적인 지식과 경험이 필요해.
    • 신뢰 구축: 의료는 사람의 생명과 직결된 분야이기 때문에, 신뢰성이 매우 중요해. 빅테크 기업들이 기존 의료 시스템과의 신뢰를 구축하는 데 시간이 걸릴 수 있어.
    • 기술의 적합성: 기존의 의료 시스템과 새로운 기술을 통합하는 것이 쉽지 않아. 새로운 기술이 실제 의료 현장에서 효과적으로 작동하려면 많은 테스트와 검증이 필요해.
    • 의료 전문가와의 협업: 의료 분야에서의 성공은 의사와 같은 전문가들과의 협력이 필수적이야. 그러나 이러한 협력 관계를 형성하는 것이 쉽지 않을 수 있어.