팀원분이 가설 5개를 정해주셨다
오늘은 가설검증 & EDA & 가능하면 모델링까지
- 기온(X:AvgTemp)은 커피 매출(y:amt)에 있어서 상관관계가 있지 않다. (회귀분석)
- 성별(X : sex)에 따라 매출(y:amt)에 영향이 있지 않다.(회귀분석)
- 커피 매장을 운영하면서 특정 외부 요인(X:모든 변수)에 의해 성별(y:sex)을 예측할 수 없다. (분류분석)
- 요일(X:day_of_week)에 따른 평균 커피 매출(y: amt) 은 영향이 없다.(회귀분석)
- 연령별 매출금액의 소비 수준(금액을 많이 쓰고 적게 쓰는 정도)패턴을 파악하기. (군집분석)
가설1,2 어찌저찌 검증하고 결과가 안좋아도 모델링 해보기로 했다...
개념자체가 이해를 잘 못하는것 같다.
우리 프로젝트에서는 예측을 잘 하는 모델이 좋은 모델일텐데...
예측을 잘하는걸 수학적으로 증명하고 패턴을 찾는 EDA 를 해보니?
결과가 다 안좋았다.
그럼 좋은모델이 될수가 없는거다
양질이고 최신의 데이터로 분석해야 좋은 결과가 나오는건가?
그럼 데이터 수집이 관건인데...
수원시 데이터에 쓸만한 의미있는 칼럼이 별로 없다고 한다....
아 너무 어려워....젠장머리야
내가 이걸 왜 한다고 한건지도 기억안나고
너무 힘드로...