전체 글

대학원생의 UX, 데이터분석, 개발 공부 기록장📁
STUDY/SQL

[SQL중급] SQL JOIN, UNION 정리

SQL JOIN 정리 실제 업무 환경에서는 데이터의 중복 저장을 방지하기 위해 DB를 분리해서 사용하고, JOIN을 사용할 일이 매우 많다. 그래서 관계형 데이터베이스를 관리하기위해 RDBMS (Relation Database management system) 사용하는 것이다. DB간의 관계를 ERD(Entity-Relation Diagram)으로 표현하는데, 알고 있으면 SQL을 작성하기 훨씬 용이해진다. (문헌정보학 전공에서 수도 없이 배웠던 ERD… 다시보니 반갑다. 이번 기회에 복습해서 정리해야겠다) INNER JOIN /* 지금은 잘 안쓰는 방식 SELECT * FROM users, orders where users.Id = orders.userId */ SELECT * FROM users IN..

TIL/멋사_AI스쿨_TIL

221014 AI스쿨 TIL SQL 특강 마지막날

21일차 멋사 AI스쿨 special lecture by 데이터리안 인프런 SQL 중급 강의 (JOIN, UNION) 중급 문제 풀이 (solveSQL, 해커링크, 리트코드) -> SQL 공부방 매출 분석 ARPU = 매출 / 전체 유저 수 (Average Revenue Per User) ARPPU = 매출 / 결제 유저 수 (Average Revenue Per Paying User) 매출 = 결제 유저 수 X ARPPU 매출 = 유저 수 X 결제자 비율 X ARPPU 전체유저수 / 결제 유저의 비율 / 인당 결제액 등 어떤 변수가 전체 매출 변화에 영향을 미치는 지 파악해야한다. AARRR 서비스 성장 분석 방법론 A(Acquisition, 획득): 광고 등의 방법으로 새로운 사용자를 얻어오는 단계 A..

TIL/멋사_AI스쿨_TIL

221013 AI스쿨 TIL 의약품처방정보 EDA

20일차 멋사 AI스쿨 main lecture by 박조은 강사님 Seaborn 복습 https://seaborn.pydata.org/tutorial.html relplot, displot, catplot 큰 범주는 외우기! 한글폰트 적용 설정 import koreanize_matplotlib # 그래프에 retina display 적용 %config InlineBackend.figure_format = 'retina' # 제대로 적용 되었는지 확인해보기 pd.Series([1,-1]).plot(title="한글") 의약품 처방데이터 분석 (100만명의 데이터 중 33만명 파일 활용) csv 파일 위치 찾아서 불러오기 (glob) from glob import glob # glob("data/HP_*.c..

TIL/멋사_AI스쿨_TIL

221012 AI스쿨 TIL 아파트 분양가 EDA

19일차 멋사 AI스쿨 main lecture by 박조은 강사님 EDA 실습 전국 신규 민간 아파트 분양가 데이터 분석 (전혀 다른 형태의 데이터 합치기) 통계청 KOSIS 데이터 분석 (깔끔한 데이터의 이해와 국가통계포털 이용법) 전국 신규 민간 아파트 분양가 데이터 분석 melt (열에 있는 데이터를 행으로 녹이기) id_vars = 에 지정하는 값은 녹이지 않고 남길 컬럼 지정 https://pandas.pydata.org/docs/user_guide/reshaping.html#reshaping-by-melt # 아래 두 개는 같은 결과 # df.melt(id_vars="지역") df_melt = pd.melt(df, id_vars="지역") 데이터를 녹인 다음엔 variable, value 컬럼..

TIL/멋사_AI스쿨_TIL

221011 AI스쿨 TIL Tidy data

18일차 멋사 AI스쿨 main lecture by 박조은 강사님 - 서울시 코로나 확진자 데이터 분석 실습 마무리 - 분석하기 좋은 데이터란 (Tidy Data) - 아파트 분양가 데이터 분석 실습 시작 describe(include = ‘object’) count 결측치를 제거한 빈도수 unique 중복값을 제거한 유일값 top 최빈값 freq 최빈값의 빈도수 replace 메서드 - 데이터 프레임, 시리즈에 모두 사용 - replace는 완전히 일치해야 적용 → regex=True를 통해 일부만 가능하게 바꿀 수 있다. str.replace - 시리즈에만 사용가능 - str.replace는 해당 텍스트만 포함되면 바뀌게 된다 - str.contains도 시리즈에만 사용가능 (str이 series a..

STUDY/Pandas

[Pandas] 판다스 치트 시트, 공식 문서

Pandas Cheat Sheet https://pandas.pydata.org/Pandas_Cheat_Sheet.pdf Pandas Documentation https://pandas.pydata.org/pandas-docs/stable/index.html pandas documentation — pandas 1.5.0 documentation The reference guide contains a detailed description of the pandas API. The reference describes how the methods work and which parameters can be used. It assumes that you have an understanding of the key ..

둥둥런
Done is better than Perfect