멋사에서는 매주 설문 조사로 칭찬해주고 싶은 동기를 뽑는다. 라는 제도가 있다는 걸 알고부터 수업 기간 중 한 번은 선정되보자고 목표를 세웠고 최대한 적극적으로 참여하려고 노력했는데 예상도 못한 때에 진짜로 선정되서 넘넘 기뻤다 저번주따라 발표도 있고 새로운 팀 팀장을 하면서 좋게 봐주었던 팀원들 덕분인 것 같다. 셀프 칭찬 고고!! 머신러닝을 배우는 단계로 넘어가고, 관련 Job description을 보면서 점점 통계와 수학의 중요성과, AI 관련 석사의 필요성이 보이고 있다. 지금이야 경험해보는 게 목표니까 괜찮지만 진지하게 이쪽 길로 나가려면 어느정도 추가적인 공부는 필수인 듯하다. 그러면서 나의 진로도 데이터 엔지니어보단 SQL, 태블로를 주로 활용하는 데이터 분석가 쪽으로 준비해보려고 하는데 ..
멋쟁이사자처럼 AI스쿨 7기 Special Lecture by 강승일 강사님 오늘 한 내용 - 오전 테킷 인강 - 오후 실습 1. NIKE Revenue 2. 코로나 데이터 관계 설정 및 테이블 시각화 3. 매개 변수 활용하기 4. 스타벅스 매장데이터 맵 시각화 (이후 일정이 있어 조퇴로 못들었당) 배운 내용 간단 기록하기 누르면 각 지역을 더 자세히 볼 수 있는 지도 대시보드 만들기 맵차트를 3개 만들어서 필터 동작을 통해 선택된 곳만 나오게 만들었다 맵 차트는 맵-> 백그라운드 레이어를 통해 배경을 제거해 주었다. 영역차트 영역 차트 구분을 위한 그룹 만들기 색상에 고객 추가, 레이블 추가, 정렬 계층 만들기 계층을 바탕으로 상세 정보까지 접근하는 예시 이 항목만 유지 선택 시각화를 통해 어떤 데이터..
멋쟁이사자처럼 AI스쿨 7기 Special Lecture by 강승일 강사님 강의 저작권은 강사님께 있으며, 포스팅에는 일부 내용만 담고 있습니다. 태블로 설치: Tableau Public [데이터 타입] 아이콘 눌러서 다른 타입으로 변경 가능 #: 숫자 Abc: 문자 달력그림: 날짜 [필드명 변경] 더블클릭 또는 세모 옵션 세모 옵션: 사용하지 않을 필드 숨기기 가능 [필터 추가] 오른쪽 상단 닐짜 - Null이 아닌 날짜 [피벗 테이블] [데이터 해석기 사용] 널 값이 왜 나타나는지 보기 1. 원본 데이터에서 셀 병합이 되어있는 경우: 상단행에 null값이 나타날 수 있다 2. 필드명이 4번째 행에 위치한다 → 이럴때 데이터 해석기를 사용 [차원 VS 측정값] 차원: 그 숫자들로 만들어진 차트를 어떻..
오늘의 회고 사실(Fact) : bike 실습 마무리, 주택가격 예측실습 (피처엔지니어링 연습) 느낌(Feeling) : 지수 로그도 반복하다보니 익숙해진다. 당뇨병이나 타이타닉보다 배경지식이 덜 필요한 bike데이터로 여러번 실습하다보니 피처 선택 이해가 좀 더 잘 되었다. 교훈(Finding) : 지금은 수업 복습만이라도 제대로 하는 것이 제일 좋은 공부인 것 같다. dt.accessor 요일 변환 실습 : 의약품 처방 내역, 코로나 분석 참고 train["year"] = train["datetime"].dt.year train["month"] = train["datetime"].dt.month train["day"] = train["datetime"].dt.day train["hour"] = tra..
회귀 모델 성능 평가 from sklearn.model_selection import cross_val_predict y_valid_pred = cross_val_predict(model, X_train, y_train, cv=5, n_jobs=-1, verbose=2) y_valid_pred y_valid_pred는 교차 검증을 통해 구한 모의고사 정답 값 MAE(Mean Absolute Error) 모델의 예측값과 실제 값 차이의 절대값 평균 절대값을 취하기 때문에 가장 직관적임 # mean_absolute_error mae = abs(y_train - y_valid_pred).mean() from sklearn.metrics import mean_absolute_error mean_absolute_..