- 프로젝트 포트폴리오 레퍼런스 서칭 - SQL 인강 수강 PostgreSQL Join 학습 (TIL) to_date(’19990101’, ’yyyymmdd’)\ with절 ()까지가 temp_01이라는 임시 집합 형성 -> temp_01을 참조하여 새로운 쿼리 생성 가능 between to_date('19970101','yyyymmdd') and to_date('19971231','yyyymmdd') SQL concat 기능 (first name + last name) → ||는 오라클 기반. 관련 설명 블로그: https://araikuma.tistory.com/522
투명하게도 아르바이트를 했던 2월 중순부터 3월 말까지 기간 동안 블로그를 올리지 못했다. 이제 다시 성실하게 취준 + 공부를 해봐야지...! 1. 데이터 구축 아르바이트 종료 아르바이트는 ChatGPT와 유사한 초거대AI모델 학습을 위한 데이터 라벨링 업무였다. 자세한 내용은 말할 수 없지만, 단순한 단어, 문장이 아니라 꽤 긴 분량이라 쉽지 않은 작업이었다. 자연어 처리 인공 지능 모델을 만드는 것에서 개발이 끝나는 것이 아니라, 그 검증과 평가가 매우 중요한 부분이며 이때 문과적인 지식과 감각이 필요하다는 것을 느꼈다. 글쓰기와 어법, 정보 구성력, 전달력 등등 근데 이번 기회에 다양한 질문으로 ChatGPT를 써보면서 정말 놀랐다. 한국어는 미흡할거라고 생각했는데도 내용의 거짓을 검증하는 것이 좀..
부트캠프 종강 후 하고 있는 것들 정리!! 네이버 부스트코스 강의 듣기 -> 유용한 무료 강의가 많다! 책 쓰기 스터디 2월부터 수료생들 일부가 모여서 데이터 부트캠프를 통해 배운 내용 정리 겸 배우기 전 알았다면 좋았을 것들을 작성해서 전자책으로 출판해보는 스터디를 진행하고 있다. 전자책에 대한 의지와 남는 시간으로, 어쩌다보니 편집팀 총괄을 맡게 되어 열심히 참여하고 있다. 역시 책 한권을 만드는 건 주제, 제목, 목차, 본문 작성 말고도, 편집과 출간이라는 여러 산을 넘어야 해서 쉽지 않다. 그치만 혼자 하는 게 아니라 같이 하니까, 좋은 아이디어도 계속 나와서 과정 자체가 재미있다!! Udemy 태블로 강의 Learn Tableau 2022 for data science step by step. ..
교육이 끝나자마자 코로나 확진이 되어 뭘 할 수가 없었다 약먹고 자고 누워있다가 겨우겨우 인프런 인강 조금 듣고, 부스트코스 미션 문제 풀었다. 이번주에 이력서, 포폴을 완성하는게 원래 목표였는데 도무지 진도가 나가지 않는다 ㅠㅠ 한 일 - 인프런 SQL 고급 서브쿼리까지 수강 - 포트폴리오 프로젝트 외 정리 - 네이버 부스트코스 인공지능 기초 1주차 완료 - 프로그래머스 lv.0 3문제 풀이 다음주에 할 일 - 이력서, 포폴 완성하기 - 인프런 SQL 고급 완강 - 수업 복습 및 정리 - 블로그 이사하기
멋사 AI스쿨 special lecture by 강승일 강사님 실습 결과물 기록 위주의 정리. 1번 실습 My Average steps per day 대시보드 일간 걸음 수 추이 https://public.tableau.com/app/profile/younghyun.kim/viz/averagesteps_16687468181240/MyAnnualAverageSteps?publish=yes average steps average steps public.tableau.com 테이블계산함수 테이블 기준이다 방향이 다른 경우에는 편집 (예시 테이블 옆으로→ 테이블 아래로 등) 2번 실습 분산형 차트를 활용한 고객 분석 - 고객별 구매 정보 대시보드 분산형 차트의 점을 클릭하면 고객별 구매정보를 자세히 볼 수 있는..
회고 사실(Fact): 자연어처리 - 텍스트 전처리 실습 (정규표현식 등) 느낌(Feeling): 아직 텍스트 길이가 짧아서 그런지 CNN보다 재미있다 교훈(Finding): 아직 할만할 때 복습 철저히 해놓기 국어 좋아하고 문정과 출신인 나한테는 CNN보다는 단어간의 관계를 파악하거나 단어를 쪼개는 NLP가 훨씬 재미있다. 전반적인 내용은 한번에 공부방에 정리해봐야겠다 오늘의 키워드 TF/ DF 사이킷런 -> feature_extraction.text countVectorizer() + TfidTransformer() → TfdifVectorizer() ***정규표현식(regular expression(regex)) word cloud concat -> merge(how, on) 불용어 (stop wo..
오늘의 회고 사실(Fact): 꽃 이미지 분류 예제 학습, 이미지전처리(PIL, OpenCV), 말라리아 감염 이미지 데이터셋 실습 느낌(Feeling): 어제보다 복잡하게 느껴졌다. 미니프로젝트로 잘할 수 있을지 걱정되지만 파이팅! 교훈(Finding): 겁먹지 말고 계속 반복해보기 멋사 AI스쿨 7기 박조은 강사님 CNN 두번째 시간 TF 공식예제의 이미지 분류 튜토리얼 꽃 5가지 이미지를 학습하고 분류하는 예제 ['daisy', 'dandelion', 'roses', 'sunflowers', 'tulips'] -> 이미지 전처리 필요 이미지 전처리 도구 PIL OpenCV 참고하기 좋은 사이트 Python OpenCV 강좌 : 제 1강 - OpenCV 설치 OpenCV 076923.github.io..
사실(Fact): 딥러닝 CNN(합성곱 신경망) 예제(The CIFAR-10 dataset) 학습 느낌(Feeling): cnn explainer 홈페이지를 통해 시각적으로 확인할 수 있어서 이해도가 높아졌다. 개념이 확실하진 않지만 앞으로 실습해가면 조금 더 알 수 있을 거 같다. 교훈(Finding): 조금 더 성실하게 정리해보자 멋사 AI스쿨 7기 박조은 강사님 오늘 수업의 핵심: 합성곱 층을 만드는 것 CNN의 합성곱(Convolution)을 구성하는 핵심요소 필터(Filter) & 활성화함수(Activation Function) 레이어 미리보기 model = models.Sequential() model.add(layers.Conv2D(filters=32, kernel_size=(3, 3), a..
벌써 12월이라니... 요즘엔 날씨가 갑자기 추워져서 그런지 살짝 감기 기운인지 두통인지 오래 지속이 되기도 했고, 머신러닝까진 어느 정도 재미있게 배우다가 딥러닝을 배우게 되면서 벽을 만난 것 같은 느낌이기도 했다. 이론적인 내용이 단번에 이해하기 어렵기도 하고, 내가 원하는 방향성과 조금 다른건가하는 생각이 들어서 일주일 정도 수업에 집중도 잘 하지 못했다. 지치던 와중에 팀원들과 얘기하는 시간에 나만 어렵고 힘든게 아니고, 다들 어렵게 느끼고 있다는 걸 알게 되었다. 처음 배우는 개념이고, 수업에 참여하며 따라가려고 노력하는 것만으로 대단한 것이라고 이건 전공자 한 학기 수업 분량이나 마찬가지라고 서로 토닥이고 공감하다보니 왜 이해가 안되지 왜 이렇게 어렵지하고 스트레스 받던 마음이 가벼워졌다!! ..