본문 바로가기

타닥타닥12: Superset Chart 및 Dashboard 구성 본문

공부

타닥타닥12: Superset Chart 및 Dashboard 구성

Savedata 2023. 5. 23. 10:18

BI툴인 Superset을 이용한 기본적인 Chart와 이를 이용한 Dashboard 구성

 

데이터를 쉽고 빠르게 시각화 해보자 (feat. Superset)

 

목차

 

1. Dataset

2. Superset dataset 등록

3. Superset Chart 만들기

4. Superset DashBoard 만들기

추천글

위의 목차를 클릭하면 해당 글로 자동 이동 합니다.

 

1.Dataset

캐글의 bank account fraud 데이터셋 링크

데이터 시각화가 편할 것 같은 데이터셋을 골라보았다.

 

아래는 각 컬럼의 분포 등을 간단히 확인할 수 있는 화면이다.

BI 툴을 이용한다는 것은 데이터를 통해 나타내고자 하는 것이 무엇인지 구상을 하고 그것을 시각화 하는 과정이지만, 이 글에서는 구성만을 위한 데이터셋을 골랐기에 데이터에 대한 큰 고찰 없이 차트랑 대쉬보드를 그려볼 예정이다.

 

2. Superset dataset 등록

캐글에서 받은 bank account fraud dataset의 csv파일을 DB에 입력하여 superset에 dataset을 등록한다.

supserset에 csv를 이용하여 데이터를 등록
데이터셋은 차트와 대쉬보드를 만드는 이에게만 보이기에 이름을 구분할 수 있는 정도면 충분
생성된 bank account fraud dataset

3. Superset Chart 만들기

데이터셋 이름을 클릭하면 자동으로 다음과 같은 차트 구성 화면으로 넘어간다. (Charts탭으로 이동하여 +CHART 아이콘을 클릭하여 데이터셋을 지정하는 방식이 정석이긴 하다.)

맨 왼쪽에는 차트를 구성하고자 하는 데이터셋, 매트릭, 컬럼이 나와있다.

그에 바로 붙어 있는 탭이 차트 선택 및 차트 시각화 옵션 등이 있는 구역이다.

 

기본적인 몇 가지 차트를 그려보자

 

pivot chart

bar chart

line chart

pie chart

treemap chart

 

#pivot chart

View all charts를 클릭하면 다음과 같은 화면으로 전환되고, 여기서 원하는 차트를 선택할 수 있다.

pivot 차트를 그려볼 예정이기에 Pivot Table을 선택하고 SELECT클릭.

 

차트 형태가 PIVOT TABLE로 바뀐다.
시각화하고자 하는 컬럼을 drag and drop으로 손쉽게 추가할 수 있다.
시각화하고자 하는 데이터셋의 컬럼들을 drag&drop으로 추가

컬럼들을 넣는 것이 UI형태로 구현이 되어 있기 때문에 굉장히 쉽게 여러가지 컬럼들을 넣어보며 여러가지 시각화를 손쉽게 구현해 볼 수 있다. 시각화하는 차트를 그리려면 데이터프레임에서 변수를 하나하나 열심히 고르고 고민하던 python과는 너무나 대비되는 편리함이다.

 

CREATE CHART를 누르면!!!

우측 상단을 보면 00:00:00.04 초만에 만들어 졌다고 과시하는 듯 하다.

다음과 같이 훌륭한 pivot chart가 굉장히 손쉽게 만들어진다. 시각화하고자 하는 column들을 drag&drop으로 바꿔가면서 수십가지의 시각화 조합을 해볼 수 있다. 차트마다 수십가지씩 가능하고 차트종류가 수십가지쯤 있으니 과장 좀 보태서 무한에 가까운 시각화를 시도해 볼 수 있다.

네이밍은 대쉬보드를 구성할 때 어떤 차트인지 알아볼 수 있기 위함이다.

간단히 이름을 지정한 이후 저장한다. (대쉬보드가 이미 존재한다면 바로 추가할 수도 있다.)

 

매우, 매우, 매우 간단하게 pivot chart 하나가 뚝딱 완성 되었다.

 

#bar chart

중복되는 화면(chart 종류 선택, column선택)들은 skip하도록 하자.

 

CREATE CHART!!

bar chart가 뚝딱 만들어졌다.

column 몇개 drag&drop 하여 bar chart가 손쉽게 만들어졌다. 하지만 superset에는 여러가지 차트별 옵션들이 존재한다. 이 옵션들을 몇 가지 수정하면 훨씬 더 직관적이게 데이터를 시각화 할 수 있으니 한번 해보자.

몇 가지 차트 옵션들을 추가했더니 다음과 같은 bar chart가 뙇 하고 나왔다. 위 차트보다 훨씬 직관적으로 데이터를 이해할 수 있고, 상세한 값을 확인할 수도 있으며, data zoom을 통해 부분만 확대하여 확인할 수도 있다. 

 

이 차트도 저장해주고 넘어가자.

 

#line chart

여기에선 superset을 사용하며 얻게 된 꿀팁을 하나 소개하려 한다. 새로운 차트를 그릴 때 위에 만들었던 bar chart의 옵션들을 그대로 가져가는 방법인데, save as를 통해 bar chart를 그리기 위해 적용했던 column이나 여러 세팅을 그대로 옮겨갈 수 있다. 여러 차트로 다양한 시각화를 해보려 한다면 시간을 획기적으로 단축시킬 수 있는 꼼수팁이다.

bar만 line으로 바꿔서 저장

UPDATE CHART!!

bar에서 line으로 바뀐 chart

bar chart에서 구성해놓았던 내용이 그대로 line으로 변경되어 넘어왔다. column을 drag&drop할 필요도 없고 기존에 넣어놨던 label, title, data zoom, sort 등이 그대로 반영되어 차트가 만들어졌다. column이나 옵션들을 그대로 옮기지 않는다 하더라도 이와같이 최소한의 설정등을 옮겨간다면 작업시간을 단축하는데 굉장히 유용하다.

 

개인적인 생각을 덧붙이자면, 이 이 데이터셋의 이 컬럼들은 bar 보다는 line에서 잘 보이는 듯 하다. bar에서는 각 month 안에서의 차이는 잘보이지만 연속적인 데이터 흐름이 안보이는 반면, line에서는 각 연령별로 월의 흐름에 따른 수입 변화가 잘 보이고 연령별 갭차이도 확실히 달라 보인다.

 

저장하고 다음으로.

 

#pie chart

이번에는 pie chart이다. save as로 설정을 그대로 옮겨서 UPDATE CHART까지 했는데...

아무래도 pie char는 bar와 line과는 다른 형태이다보니 column도 많이 사라지고 적용했던 옵션들도 거의 없어진 것을 볼 수 있다. 하지만 또 pie chart로 보기에 편한 내용들이 있을 수 있으니 뚝딱거려 보자.

뚝 딱

불과 1~2분 사이에 pie차트가 donut이 되며 여러가지 내용들이 반영되었다. 보고자 하는 것은 사람마다 좀 다르겠으나 훨씬 정보가 직관적이고 보기 편해진 것은 확실하다. 연령별 수입만을 보기에는 이 pie(donut) chart가 앞의 chart들보다 더 나은듯 하다.

 

이것도 저 장.

 

#treemap chart

너무나 손쉽게 chart들을 그릴 수 있으니 마지막으로 하나만 더 그려보자.

기존에 많이 보던 pivot, bar, line, pie 등은 좀 식상하니 새로운 chart에 도전해보려 한다.

이게 뭘까

treemap chart를 통해 연령별 월별 수입을 나타내보았다. 데이터가 상세하게 잘 이해가 되지는 않으나 면적이 넓은 것들이 많은 비중을 차지한다는 것 정도는 직관적으로 이해가 된다. 30대의 3월 수입이 모든 연령별 월별 중 가장 큰 면적을 차지하는구나 정도가 눈에 들어온다.

 

이것도 저 장.

 

4. Superset Dashboard 만들기

superset화면 DashBoard탭 우측 상단의 +DASHBOARD를 클릭하여 대쉬보드를 편집하는 화면으로 진입한다.

들어가보면 위에서 만들어왔던 차트들이 모두 오른쪽에 정렬되어 있다. 적당한 느낌으로 drag&drop을 하면.

이렇게 만들어왔던 모든 차트들이 하나의 대쉬보드를 통해 모아서 볼 수 있게 된다.

그런데 이것이 끝이 아니다.

filter를 이용한 즉각적인 데이터 선택 및 반영

데이터의 컬럼과 형태가 같다면 필터를 만들어서 이미 구성한 차트들에서 보고자 하는 것만 따로 골라볼 수 있는 기능 또한 지원한다. 데이터를 다루는 직업으로써 결과를 설명하기가 어려울 때가 참 많은데, 데이터를 차트로 시각화해주고, 내가 원하는 부분을 얘기하다가 변경해서 집중하여 보여줄 곳을 설명하고, 다시 돌아와서 전체적인 그림을 얘기하고, 그런 일련의 과정이 이 superset dashboard 하나로 다 가능한 것이다. 조금 오바하면 결과 보고서를 만들 필요가 없지 않을까...?

 

또 마지막으로 위와 같은 필터 뿐만 아니라 차트에 있는 지표들을 직접 클릭해도 해당 지표와 연관된 데이터들만 표시되는 등 사용자의 편리성을 고려한 데이터 시각화 기능이 무궁무진하다. 아직 사용해본지 1달 밖에 안되서 더 많은 내용들은 알지 못하지만 내가 모르는 수많은 기능들도 어딘가 숨어있을 듯 하다.

 

Superset을 이용하여 chart 및 dashboard를 구성해 보았다. 이제 처음 사용해보는 단계라 모든 것이 신기하고 어색하기만 하지만 나날이 증가하는 BI툴의 중요성을 superset의 편리성을 통해 더욱 크게 이해해 가는 중이다.

 

추천글

superset 공식 사이트 튜토리얼 (역시 공식 사이트가 근본이다.)

superset 블로그1 (깔끔하다.)

superset 블로그2(스탭별로 잘 나눠서 작성되어 있다.)

 

Comments