지난 번에 만들었던 대시보드에
기간별 보기 + 빈도 수 상위 N개만 보여주는 2가지 기능을 업데이트 해보았다.
완성 대시보드 미리보기
https://public.tableau.com/app/profile/younghyun.kim/viz/Komatsu_wordcloud2/KOMATSU
오른쪽 상단 날짜 슬라이드를 통해 시작일과 종료일을 설정하면, 해당 기간의 뉴스 본문 워드 클라우드로 자동으로 변경된다.
또한 날짜가 변경되어도, 가장 빈도 수가 높은 상위 30개만 노출된다.
오른편에는 기간별 개별 단어의 빈도수를 막대그래프를 통해 시각화했다.
태블로 워드클라우드 기간 필터링 넣기
기간을 설정하기 위한 시작날짜와 종료 날짜를 매개변수로 생성한다.
그리고 만든 매개변수에 우클릭을 하여 <매개변수 표시>를 체크해준다.
그러면 하단처럼 오른편에 날짜 선택 슬라이더가 만들어진다.
기존 데이터의 Date 부분에 계산된 필드 만들기를 선택한다.
그리고 하단과 같이 Date Range라는 이름으로 조건식을 작성한다.
Date Range를 끌어서 필터에 위치시키고, 참을 체크해주면, 날짜 슬라이더 범위의 해당되는 행만 노출되는 것을 확인할 수 있다.
2. 태블로 워드클라우드 상위 N개만 노출되게 하기
RANK 함수를 활용하여 구현한다.
RANK(COUNT([text]),'desc') <= 30
빈도수가 많은 것부터 나타나게 만들 것이기 때문에 'desc'를 추가해준다.
30을 원하는 크기의 N으로 설정하면 완료.
해당 상위 30개 계산식을 마찬가지로 필터에 드래그 하고 참을 체크한다.
이때 값이 제대로 적용되지 않는다면 <다음을 사용하여 계산>을 확인하여 테이블(옆으로)를 계산 기준이 되는 열로 변경해준다.
그럼 완성!!
참고링크: https://kb.tableau.com/articles/howto/showing-top-and-bottom-n-per-category?lang=ko-kr
역시 직접 프로젝트를 해보니, 다양한 기능을 시도해보게 된다.
이제는 다시 데이터 전처리 단계로 돌아가서
불용어 처리를 제대로 할 수 있도록 원본 데이터를 수정한 뒤,
프로젝트를 마무리하려고 한다.