멋사 AI School 7기 Special Lecture by 이호준 강사님(제주코딩베이스캠프) 9월에 스터디를 통해서 코딩테스트란 무엇인지 살짝 맛을 봤었는데, 재밌지만 안풀리는 문제를 만나니 코딩이 너무 어려운건 아닐지 두렵기도 했었다. 그 후로 약 두 달간 코드를 쓰는 것에 대해 조금 내공이 쌓이면서도, 데이터 EDA와 머신러닝에 집중하느라 파이썬 자체는 오히려 감을 좀 잃었었는데, 이번에 이호준 강사님 강의를 들으니 코딩 테스트라는게 완전 새롭게 다가왔다. 똑같이 어렵긴 하지만, 코테도 다른 시험처럼 노하우와 공식이 있는 거구나!! 한줄기 희망을 본 느낌?! 그리고 파이썬을 후다닥 배워서 map을 배워도 어떻게 써야할지, list를 알아도 어떻게 쓰는건지 잘 모르는 그런 상태였다가, 이번 강의를 ..
혼동행렬 (confused matrix) 혼동행렬(confusion matrix)은 모델의 분류 성능을 평가할 때 사용되는 지표이다. 관련 자료마다 예측, 실제, T, F 위치가 다 다르기 때문에 주의해야 한다. 이번 포스팅의 기준 TN: 예측 X, 실제 X FP (1종 오류): 예측은 O, 실제론 X FN (2종 오류): 예측은 X, 실제 O TP 예측 O, 실제 O 한눈에 보기 가장 잘 정리된 이미지 이미지 후출처_https://velog.io/@hajeongjj/Eval-Metrics 정확한 원 출처를 찾지 못했습니다. 문제가 된다면 알려주세요 좀 더 쉽게 이해하기 1종 오류와 2종 오류 예시 1종 오류 실제는 임신이 아닌데(0), 임신(1)로 예측 스팸메일이 아닌데 스팸메일로 예측 무고한 피고인에..
최적화란? 최적화(Optimization)란 손실함수(Loss Function)값을 최소화하는 파라미터를 구하는 과정이다. 이때 손실함수는 예측값과 실제 정답값의 차이를 의미한다. Gradient Descent(경사하강법)의 정의 gradient는 기울기, 경사를 의미하며 경사하강법의 주된 목적은 함수의 최소값을 찾는 것이다. 이에 따라, 경사하강법은 기울기가 작아지는 방향을 찾고 해당 방향으로 한 걸음 씩 계속 내딛으면서 값이 제일 작은 곳을 찾아 나가는 방법이다. 💡 함수 최소값 탐색에 미분계수가 0이 되는 지점을 찾지 않고 GD 사용하는 이유는? 우리가 주로 실제 분석에서 맞닥뜨리게 되는 함수들은 닫힌 형태(closed form)가 아니거나 함수의 형태가 복잡해 (가령, 비선형함수) 미분계수와 그 ..
오늘은 K-MOOC 강의를 통해 그동안 배운 내용을 복습했다 Introduction to Machine Learning 머신러닝이란 input (data) → function → output 결국에 머신러닝이라고 하는 건 함수를 학습하는 것이다. 컴퓨터를 학습시킬 수 있는 알고리즘을 컴퓨터에게 입력시켜주면 컴퓨터가 스스로 데이터 안에 있는 유용한 패턴을 찾아서 함수를 찾아주는 것이다. 그렇게 도출된 유용한 함수를 사용하는 것이다. 딥러닝, 머신러닝, 이러한 개념의 차이는 데이터를 입력하고, 그 다음에 function의 기본적인 형태를 컴퓨터에게 알려주면 트레이닝 과정을 통해서 최종적인 optimal function, 굉장히 좋은 유용한 함수를 컴퓨터 스스로 학습을 한다는 것이다. CPU Computing..
멋사 AI스쿨 special lecture by 강승일 강사님 실습 결과물 기록 위주의 정리. 태블로 재밌다! 헬스 데이터 걷기 대시보드 결과물: 걸음수를 요일별, 날짜별로 많고 적음을 시각화하여 보여주는 대시보드 사용하지 않는 필드는 숨기기하는 것이 좋다 요일 가져오기: option키 누르고 드래그해서 날짜(요일별) 선택하기 월요일로 시작날짜 변경하기: 데이터 → 마우스 우클릭 → 날짜속성 → 주 시작 월요일 달력 만들기 열: 년월, 요일 행: 주 레이블: 일 달력 편집 - 마크를 사각형으로 바꾸고 색상 넣기 - 테두리 흰색 - 머리글 표시 해제 대시보드에서 필터와 색상범례 워크시트에서 꺼내기 스타벅스 구매목록(계산식 위주) 데이터 사용자 지정 분할 구분 기호 ")", 분할범위 "지난" 2열 선택 Ic..