본문 바로가기

전체 글

(23)
AI 프로젝트2 -4일차 어제는 너무 정신없어서 못씀 어제는 전처리된 데이터들을 팀원분들이 잘 모아주셔서 EDA 하고 모델링을 하기 위한 전작업들을 했다. 그리고 오늘은 pm맡으신 분이 데이터를 조금 더 추가해줘서 머신러닝을 해보앗다. CatBoost 장점 : 지역 변수 등 범주형 정교하게 반영 가능, 단점 : 러닝 커브 있음 LightGBM 장점 : XGBoost보다 더 빠른 학습 + 비슷하거나 더 나은 성능, 단점 : 과적합 위험 약간 존재해서 과적합 확인 필수 ..
AI 프로젝트2 -2일차 오늘은 MySQL DB 구축(테이블 생성 및 테스트), MySQL 주피터 연동 이렇게 하라고 pm님이 시켜서오전에 일찍 끝내고 노가리... 그리고 다른 분들은보조 데이터 전처리 마무리 (기온, 수출 등), 전처리 가이드 기반 처리 후 정리 (제가 전처리 데이터 최종 점검하고나서 수정할 부분 있을 경우!) 다음 일정은 1. 가설도출각자 정제된 데이터 살펴보면서 1~2개씩 가설 설정 진행 2. EDA 분담가설별로 각자 맡아서 EDA 수행 3. 공유 및 리뷰EDA 결과 팀원에게 설명 (노션 정리) 피드백하면서 인사이트 정리 4. 모델링 진행기본 모델 → 성능 비교 → 최종 모델 선정 도커!?@!?@?젠키스가 CICD 툴...??????????????????? 통합 - 배포 - 서비스 자동화
AI 프로젝트2 -1일차 두번째 프로젝트가 시작되었다. 이번엔 자연과학을 주제로 하는 프로젝트다이번 팀원중에 나한테 계속 말걸어주었던 분이랑 같은 팀을 하게 되었다. 팀원중에 한분이 전력사용량으로 에너지솔루션 아이디어를 내주셨는데 그 주제 다들 괜찮은것 같다고 했다.시계열 예측으로 주제를 조금 디벨롭해보기로 했는데얼마전에 뉴스에서 한국대학들이 AI 개발한다고 전기량이 부족하다는 뉴스가 생각이 났다. 대학의 전기 부족 vs AI 개발- 많은 대학이 AI 연구용 GPU 서버를 운영하면서 전기 사용량이 급증- 전기요금 인상, 전력 인프라 부족으로 인해 전산센터 증설이 어려움- 특히 전력 수요 예측이 어려운 실험적 GPU 작업이 많아 피크타임에 전력 과부하 발생 전력 데이터 기반 에너지 솔루션과 연결하면 좋은 방향이 될듯그래서 아이디어..
AI 프로젝트 8일차 오늘 할일은 모델 결과 호출하는 객체 또는 전역함수 생성생성한 모델 app에서 호출데이터 저장소 객체 생성 인데 너무어려워.....너무 어려워해서 pm님이 객체 간 호출이 중요....모델 간단하게 생성해서내가 한 코드를 사용해서 모델 이해하기 쉬운걸로 만들어서streamlit 호출 fast API 호출 이후 당고랑 flask 구현해야하고....nrogk 은 또 뭐야... 아...하기싫다....못하겠다....못해...포기
AI 프로젝트 7일차 pm님이 오늘 처음에 화면 간략하게 구성하는거 보여줬는데오우 너무 ㅇㅓ려워ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 오늘 pm님이 만들어주신 폴더 다운받아서객체 연습, UI 작업 이후에 모델링 넣는거 다시 연습해보기! model에 각자 이름 폴더 만들어서 생성해서 ㄱ 해보기 data_repository 객체화해서 모델링 넣어보는것! 1. 모델만들기2. 모델만든걸로 샘플앱 복붙해서 with col1 부터 바꿔보기3. 구현모르겠으면 복사해서 챗지피티, ai 한테 물어보기(이 모델 성능평가를 나타내도록 수정해줘) 모르겠으면 앱단에다 코드 다 작성해보기
AI 프로젝트 6일차 오늘은 가설 검정한것을 토대로 모델링을 하기로 했다. 우리 조는 ai가 다 처음이기 때문에 EDA, 데이터셋, 모델링 까지 각자 경험해보는것을 목표로 하였다.좋은 모델이든 아니든 만들어서 시각화 해보는것이 목표인것이다 부트캠프는 처음이지만 이런 경험위주의 프로젝트에서는 얻어가는게 많은것 같다난 일단 vscode를 잘 다루게 되었다(?)그리고 어느정도 eda를 해본것 같다(?) 물론 챗지피티가 해준거지만첫 프로젝트는 2주짜리라 이번주에 끝난다.모쪼록(?) 잘 마무리되었음 좋겠다 카페 운영 대시보드를 여러 ai 모델들로 만들어보는데 재밌다 오늘 우리 팀 pm님의 중간발표 이후피쳐 추가하여 r2을 높이는 모델링을 계속해서 해볼 예정...! 에러가 너무 많이나서 힘들지만...강사님이 에러를 해결하는 것이 개발자..
AI 프로젝트 5일차 팀원분이 가설 5개를 정해주셨다 오늘은 가설검증 & EDA & 가능하면 모델링까지 기온(X:AvgTemp)은 커피 매출(y:amt)에 있어서 상관관계가 있지 않다. (회귀분석)성별(X : sex)에 따라 매출(y:amt)에 영향이 있지 않다.(회귀분석)커피 매장을 운영하면서 특정 외부 요인(X:모든 변수)에 의해 성별(y:sex)을 예측할 수 없다. (분류분석)요일(X:day_of_week)에 따른 평균 커피 매출(y: amt) 은 영향이 없다.(회귀분석)연령별 매출금액의 소비 수준(금액을 많이 쓰고 적게 쓰는 정도)패턴을 파악하기. (군집분석)가설1,2 어찌저찌 검증하고 결과가 안좋아도 모델링 해보기로 했다... 개념자체가 이해를 잘 못하는것 같다.우리 프로젝트에서는 예측을 잘 하는 모델이 좋은 모델일..
AI 프로젝트 4일차 타겟팅을 조금 더 세부적으로 하기로 했다.경기도 수원시의 카페업의 카드 소비 사용 데이터를 활용해서카페업 이벤트 시기 최적화를 위한 AI 예측 모델이다 24-25년 1년치의 데이터 수집카드 소비 데이터와 날씨 데이터를 합쳐서 검증해봐도좋은 수치가 나오지않아서 살짝 좌절 그래도 괜찮다는 팀원분의 말이 듣기 좋았다 뭐 일단 해보는게 중요한 첫번째 프로젝트 분명 성장중인듯