전체 글

대학원생의 UX, 데이터분석, 개발 공부 기록장📁
TIL/멋사_AI스쿨_TIL

221011 AI스쿨 TIL Tidy data

18일차 멋사 AI스쿨 main lecture by 박조은 강사님 - 서울시 코로나 확진자 데이터 분석 실습 마무리 - 분석하기 좋은 데이터란 (Tidy Data) - 아파트 분양가 데이터 분석 실습 시작 describe(include = ‘object’) count 결측치를 제거한 빈도수 unique 중복값을 제거한 유일값 top 최빈값 freq 최빈값의 빈도수 replace 메서드 - 데이터 프레임, 시리즈에 모두 사용 - replace는 완전히 일치해야 적용 → regex=True를 통해 일부만 가능하게 바꿀 수 있다. str.replace - 시리즈에만 사용가능 - str.replace는 해당 텍스트만 포함되면 바뀌게 된다 - str.contains도 시리즈에만 사용가능 (str이 series a..

STUDY/Pandas

[Pandas] 판다스 치트 시트, 공식 문서

Pandas Cheat Sheet https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf Pandas Documentation https://pandas.pydata.org/pandas-docs/stable/index.html pandas documentation — pandas 1.5.0 documentation The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key ..

STUDY/통계

221007 AI스쿨 TIL (17일차) 데이터 분석을 위한 통계 기초

오늘은 스페셜 강의로 기초 통계 용어 이해와 판다스 실습을 할 수 있는 날이었다. 통계 기초에 대해 목말라 있어서 재미있게 학습할 수 있었다. TIL에서는 어떤 내용을 다루었는지 간단히 정리하고, 자세히 공부하며 글을 써봐야겠다. 데이터 분석을 위한 통계 기초 t. 유재명 강사님 통계학 데이터 분석의 목적은 의사결정권자의 결정에 도움을 주기 위함이다. 통계 분석의 깊이를 더하기 위해선 데이터의 양과 질이 중요하다. 기업에서 데이터 분석을 할때, 분야별, 서비스 형태별로 데이터의 절대적인 양과 질은 차이날 수 있다. 통계학 용어는 어려우니, 상식을 버리고, 뜻을 짐작하지 말고 그냥 외우기! 범주형 변수 VS 연속형 변수 범주형 변수는 종류, 이름 등으로 수치 데이터의 경우 연산이 의미가 없다. 연속형 변수..

TIL/멋사_AI스쿨_TIL

221006 AI스쿨 TIL 코로나 확진자 수 분석

오늘의 회고 사실(Fact) : Plotly 마무리, 판다스 문법 & 시각화 실습 (코로나 확진자 공공데이터) 느낌(Feeling) : 판다스 문법을 복습해서 좋았고, 배울 수록 유용해보여서 더 잘하고싶다. 교훈(Finding) : 이번주 수업 복습 꼼꼼히! 블로그 TIL 밀린 것 잘 정리해보자! 중복확인, 제거 duplicated() drop_duplicates() 유니크값의 개수(nuniqur) .nunique() 유니크(unique) df["퇴원현황"].unique() #unique값에는 nan(결측치)은 포함되지 않는다 unique()는 serise에만 사용 가능하고 nunique()는 dataframe, series에 모두 사용 가능 인덱스 설정, 정렬하기 - set_index → 인덱스로 지정..

STUDY/Pandas

주피터 노트북 단축키/ 익스텐션(Nbextensions) 설치 방법

주피터 노트북 유용한 단축키 Ctrl + enter 실행하기 (맥북은 cmd + Enter) Shift + Enter : 셀이 실행 후, 커서가 다음셀로 이동 Enter 입력창 활성화하기 a 위에 셀 추가 b 아래에 셀 추가 dd 셀 지우기 m 마크다운 모드로 변경 y 코드 모드로 변경 요것들만 알아도 마우스 클릭안하고 실습할 수 있다!! 아나콘다로 주피터 노트북 설치, Nbextensions 설치 참고 영상 오늘코드: https://youtu.be/TSGcBvZo-8g 맥북에 주피터 익스텐션 설치하는 걸 많이 헤맸는데 아나콘다 네비게이터 -> environment -> base(root) -> Open Terminal 여기다가 터미널에 붙여넣으라는 코드를 입력하면 된다. 자세한 내용은 영상 참고!! c..

TIL/멋사_AI스쿨_TIL

221005 AI스쿨 TIL Plotly

EDA map: 시리즈만 가능, df[”column1”].map(함수 or dictionary) apply: 시리즈와 df둘 다 가능, df.apply(함수) applymap df만 가능, df.applymap(함수) lamda함수: 이름 없는 함수 간단한 기능은 함수를 만들지 않고, lamda 활용 간단한 전처리에 유용 # map과 lamda 연습 def find_year(x): return x[:4] #df1["생산연도"] = df1["생산일"].map(lamda x : x[:4]) df1["생산연도"] = df1["생산일"].map(find_year) df1 tqdm 오래 걸리는 작업 진행 상황을 파악하기 위해 사용 from tqdm.notebook import tqdm tqdm.pandas() m..

둥둥런
Done is better than Perfect