워드클라우드

STUDY/태블로

[태블로] 기간별로 트랜드를 볼 수 있는 워드클라우드 만들기

지난 번에 만들었던 대시보드에 기간별 보기 + 빈도 수 상위 N개만 보여주는 2가지 기능을 업데이트 해보았다. [태블로] 뉴스 본문, 제목 워드 클라우드 크롤링해서 수집한 기업 뉴스 데이터를 바탕으로 워드 클라우드 제작하기 0. 원본데이터는 파이썬을 활용해서 단어 단위로 쪼개놓은 상태 본문 워드 클라우드 단어를 텍스트에, 단어 카운트를 dogplot42-6.tistory.com 완성 대시보드 미리보기 https://public.tableau.com/app/profile/younghyun.kim/viz/Komatsu_wordcloud2/KOMATSU 오른쪽 상단 날짜 슬라이드를 통해 시작일과 종료일을 설정하면, 해당 기간의 뉴스 본문 워드 클라우드로 자동으로 변경된다. 또한 날짜가 변경되어도, 가장 빈도 ..

STUDY/태블로

[태블로] 뉴스 본문, 제목 워드 클라우드

크롤링해서 수집한 기업 뉴스 데이터를 바탕으로 워드 클라우드 제작하기 0. 원본데이터는 파이썬을 활용해서 단어 단위로 쪼개놓은 상태 본문 워드 클라우드 단어를 텍스트에, 단어 카운트를 크기에 드래그한다. 그리고 마크를 텍스트로 변경, 단어가 너무 많이 나타나서 필터를 통해 최소 단어 빈도 설정하면 완료! 결과물 https://public.tableau.com/app/profile/younghyun.kim/viz/komatsu_word_cloud_1/1?publish=yes komatsu_word_cloud_1 komatsu_word_cloud_1 public.tableau.com

STUDY/머신러닝 | 딥러닝

자연어처리(NLP) 정리(2) - 문자 전처리(정규표현식 등)

해당 내용은 멋쟁이사자처럼 AI School 오늘코드 박조은 강사의 자료입니다. 사용 데이터셋 출처: 뉴스 토픽 분류 AI 경진대회 - DACON KLUE Benchmark(https://klue-benchmark.com/) 문자 길이 세기 len 문장 길이 word_count 단어 수 unique_word_count 중복 제거 단어수 # apply, lambda를 통해 문자, 단어 빈도수 파생변수 만들기 # df["len"] = df["title"].map(lambda x: len(x)) df["len"] = df["title"].str.len() df["word_count"] = df["title"].map(lambda x : len(x.split())) # 형태소 분석기를 사용하면 단어의 수를 셀때..

둥둥런
'워드클라우드' 태그의 글 목록