STUDY

STUDY/태블로

221111 TIL 태블로 실습 (오후) 대시보드 만들기

멋사 AI스쿨 special lecture by 강승일 강사님 실습 결과물 기록 위주의 정리. 태블로 재밌다! 헬스 데이터 걷기 대시보드 결과물: 걸음수를 요일별, 날짜별로 많고 적음을 시각화하여 보여주는 대시보드 사용하지 않는 필드는 숨기기하는 것이 좋다 요일 가져오기: option키 누르고 드래그해서 날짜(요일별) 선택하기 월요일로 시작날짜 변경하기: 데이터 → 마우스 우클릭 → 날짜속성 → 주 시작 월요일 달력 만들기 열: 년월, 요일 행: 주 레이블: 일 달력 편집 - 마크를 사각형으로 바꾸고 색상 넣기 - 테두리 흰색 - 머리글 표시 해제 대시보드에서 필터와 색상범례 워크시트에서 꺼내기 스타벅스 구매목록(계산식 위주) 데이터 사용자 지정 분할 구분 기호 ")", 분할범위 "지난" 2열 선택 Ic..

STUDY/태블로

221111 AI스쿨 TIL 태블로 실습 (오전)

멋사 AI스쿨 7기 강승일 강사님 강의 저작권은 강사님께 있으며, 어떤 실습을 했는지 결과물 위주로 정리 작성하였습니다. 대시보드를 만드는 이유는 정보가 필요한 상대방을 위한 것이다. 보는 사람을 기준으로 만들어야 하고, 시야의 흐름을 고려해서 읽기 쉽게 만들어야 한다. 보는 사람의 환경(PC인지, 대형화면인지, 모바일인지 등)도 고려해야한다. 결과물1. 매출 대시보드 매개변수 매개변수와 계산된 필드는 항상 세트 매개변수 표시 필터 → 계산된 필드 (필터) → 참 체크 계산된 필드 만들기 IIF(조건, 참, 거짓) 예시) IIF([f.당월], [매출], NULL) 전월과 비교하는 계산된 필드 Datediff('month',[주문 일자],dateparse('yyyyMM',[p. year]+[p. month..

STUDY/머신러닝 | 딥러닝

선형대수학, 미적분 유튜브 영상 (3b1b)

선형대수학 [선형대수학 강의] Essence of linear algebra (3b1b) : 시각적으로 잘 이해되는 직관적 설명. 선형대수학 큰 그림 파악에 좋은 가이드 강의. 미적분 [미적분 강의] Essence of calculus (3b1b) 미적분의 핵심이 되는 개념들을 시각적으로 직관적으로 이해할 수 있다. 머신러닝 책&강의 추천 출처_ https://www.philgineer.com/2020/10/awesome-machine-learning.html [책&강의] 직접 보고 추천하는 머신러닝 & 딥러닝 & 수학 총정리 (2022) 머신러닝 딥러닝 입문, 밑바닥부터 시작하는 딥러닝, 모두를 위한 딥러닝, 코세라 머신러닝, 파이썬 라이브러리를 활용한 머신러닝, 선형대수학 머신러닝, 딥러닝 선형대수학..

STUDY/머신러닝 | 딥러닝

Gradient Boosting 모델 비교 (XGBoost, LightGBM, Catboost)

Gradient Boosting이란 1. Gradient 기울기(gradient) 경사하강법(Gradient Descent)의 목적은 손실함수(loss function)의 최적화(Optimization)이다. 최적화는 손실 함수를 최소화 하는 파라미터 조합을 구하는 과정을 말한다. 경사하강법이란 함수의 기울기를 이용해 x값을 어디로 옮겼을때 함수가 최소값을 찾는지 알아보는 방법으로, 반복적인 방법(iterative)으로 해를 구하면 효율적이기 때문에 사용한다 손실함수란? 머신러닝에서 모델이 나타내는 확률 분포와 데이터가 따르는 실제 확률 분포 사이의 차이를 나타내는 함수 대체로 이 값은 0에 가까울수록 모델의 정확도가 높고, 반대로 0에서 멀어질수록 모델의 정확도가 낮다. 손실함수의 결과값(오차)를 가장..

STUDY/태블로

221104 AI스쿨 TIL (35일차) 태블로 대시보드

멋쟁이사자처럼 AI스쿨 7기 Special Lecture by 강승일 강사님 오늘 한 내용 - 오전 테킷 인강 - 오후 실습 1. NIKE Revenue 2. 코로나 데이터 관계 설정 및 테이블 시각화 3. 매개 변수 활용하기 4. 스타벅스 매장데이터 맵 시각화 (이후 일정이 있어 조퇴로 못들었당) 배운 내용 간단 기록하기 누르면 각 지역을 더 자세히 볼 수 있는 지도 대시보드 만들기 맵차트를 3개 만들어서 필터 동작을 통해 선택된 곳만 나오게 만들었다 맵 차트는 맵-> 백그라운드 레이어를 통해 배경을 제거해 주었다. 영역차트 영역 차트 구분을 위한 그룹 만들기 색상에 고객 추가, 레이블 추가, 정렬 계층 만들기 계층을 바탕으로 상세 정보까지 접근하는 예시 이 항목만 유지 선택 시각화를 통해 어떤 데이터..

STUDY/태블로

태블로 기초

멋쟁이사자처럼 AI스쿨 7기 Special Lecture by 강승일 강사님 강의 저작권은 강사님께 있으며, 포스팅에는 일부 내용만 담고 있습니다. 태블로 설치: Tableau Public [데이터 타입] 아이콘 눌러서 다른 타입으로 변경 가능 #: 숫자 Abc: 문자 달력그림: 날짜 [필드명 변경] 더블클릭 또는 세모 옵션 세모 옵션: 사용하지 않을 필드 숨기기 가능 [필터 추가] 오른쪽 상단 닐짜 - Null이 아닌 날짜 [피벗 테이블] [데이터 해석기 사용] 널 값이 왜 나타나는지 보기 1. 원본 데이터에서 셀 병합이 되어있는 경우: 상단행에 null값이 나타날 수 있다 2. 필드명이 4번째 행에 위치한다 → 이럴때 데이터 해석기를 사용 [차원 VS 측정값] 차원: 그 숫자들로 만들어진 차트를 어떻..

STUDY/Pandas

[Pandas] 수치 변수 그룹 나누기

이산화 pd.cut() VS pd.qcut() bins == 그룹 개수 q == quantile # SalePrice - cut, qcut train["SalePrice_cut"] = pd.cut(train["SalePrice"], bins=4, labels=[1,2,3,4]) # q == quantile train["SalePrice_qcut"] = pd.qcut(train["SalePrice"], q=4, labels=[1,2,3,4]) 차이 알아보기 # "SalePrice_cut", "SalePrice_qcut" - value_counts display(train["SalePrice_cut"].value_counts()) display(train["SalePrice_qcut"].value_count..

STUDY/머신러닝 | 딥러닝

회귀 모델 성능 평가 지표 정리

회귀 모델 성능 평가 from sklearn.model_selection import cross_val_predict y_valid_pred = cross_val_predict(model, X_train, y_train, cv=5, n_jobs=-1, verbose=2) y_valid_pred y_valid_pred는 교차 검증을 통해 구한 모의고사 정답 값 MAE(Mean Absolute Error) 모델의 예측값과 실제 값 차이의 절대값 평균 절대값을 취하기 때문에 가장 직관적임 # mean_absolute_error mae = abs(y_train - y_valid_pred).mean() from sklearn.metrics import mean_absolute_error mean_absolute_..

STUDY/Pandas

[Pandas] pivot_table, crosstab, group by

피벗 테이블이란, 데이터를 요약한 통계표라고 볼 수 있으며, 기존 데이터를 활용해서 새로운 테이블을 만든 것을 말한다. 같은 목적의 기능이지만 쓰는 형태는 달라 쓰다보면 헷갈리는 판다스 문법 3가지를 한 번에 비교해보려고 한다. 1. 크로스탭 crosstab 주로 두 개의 변수의 빈도수 구할때 사용하기 쉽다. pd.crosstab(컬럼명1, 컬럼명2) # 두 개의 변수의데이터 빈도수 구하기 df_p = pd.crosstab(df["제주 중분류"], df["월"]) df_p.iloc[:5][:5] 2. 피벗테이블 pivot_table pd.pivot_table(data=df, index=컬럼1, , values=컬럼3) columns는 스킵 가능 df.pivot_table(index=["alive","cl..

둥둥런
'STUDY' 카테고리의 글 목록 (7 Page)