회귀 모델 성능 평가 from sklearn.model_selection import cross_val_predict y_valid_pred = cross_val_predict(model, X_train, y_train, cv=5, n_jobs=-1, verbose=2) y_valid_pred y_valid_pred는 교차 검증을 통해 구한 모의고사 정답 값 MAE(Mean Absolute Error) 모델의 예측값과 실제 값 차이의 절대값 평균 절대값을 취하기 때문에 가장 직관적임 # mean_absolute_error mae = abs(y_train - y_valid_pred).mean() from sklearn.metrics import mean_absolute_error mean_absolute_..
29일차 멋사 AI스쿨 main lecture by 박조은 강사님 오늘의 회고 사실(Fact): 머신러닝 트리 모델의 분류와 회귀, 랜덤 포레스트 실습 느낌(Feeling): 수업때 새로 나오는 개념을 이해하는 데 시간이 좀 걸린다. 집중이 잘 되지 않아 아쉬웠다. 교훈(Finding): 어제 과제를 하면서 머신러닝 실습 과정이 좀 이해가 되었다. 예습 동영상을 많이 봐서 다음 수업엔 더 많은 배경지식을 가지고 수업에 참여해야겠다. 분류: 랜덤포레스트 알고리즘 실습 어제 실습과 같은 당뇨병 데이터셋(data-diabetes) 사용 랜덤포레스트란? https://ko.wikipedia.org/wiki/랜덤_포레스트 랜덤 포레스트의 가장 큰 특징은 랜덤성(randomness)에 의해 트리들이 서로 조금씩 다..
28일차 멋사 AI스쿨 main lecture by 박조은 강사님 오늘의 회고 사실(Fact): 머신러닝 결정트리학습법, 당뇨병 예측 실습 느낌(Feeling): 어제보다는 지도학습, 비지도학습에 대해 이해가 되는데, 지니불순도나 엔트로피 같은 용어가 단번에 이해하기 어려웠다 교훈(Finding): 오늘 과제를 해결하면서 복습하고, 유튜브 영상을 많이 참고해야겠다. +) 그리고 TIL 쓰는 스타일을 바꿔보려고 하는데 좀 어렵다 자세한 내용보단 뭘배웠는지 위주로 적고, 자세한 내용은 스스로 실습을 하면서 정리하면 좋을 거같다. 머신러닝을 통한 현실세계의 문제 해결 1. 지도학습 VS 비지도학습 (정답 == label == target) 있으면 지도학습, 없으면 비지도 학습 2. 지도 학습이라면, 그 중에서..
27일차 멋사 AI스쿨 main lecture by 박조은 강사님 오전/오후엔 미드프로젝트 발표 및 회고로 2시간 정도 수업 진행하였다. 머신러닝 입문 머신러닝 프레임워크 캐글 설문조사 결과(2020) - Scikit-learn (가장 많이쓰임 / 주로 정형데이터에 많이 쓰임) - Tensor Flow - Keras - xgboost - Pytorch - Caret 등등 캐글 설문조사 리포트는 트렌드를 파악하기 좋으므로 최신 것도 한번 읽어보기 프레임워크, 도구, 에디터, 알고리즘, Automated ML 등 2022 결과보기: https://www.kaggle.com/competitions/kaggle-survey-2022 프레임워크, 라이브러리 등 용어 참고: https://www.castingn.c..