본문 바로가기

타닥타닥17: Superset Chart 및 Dashboard구성2 본문

공부

타닥타닥17: Superset Chart 및 Dashboard구성2

Savedata 2023. 8. 15. 23:50

Superset을 사용하며 발견하는 소소한 팁들을 정리해보자. 이 글에서는 Radar, Graph, Sunburst 차트에 대한 간략한 소개와 공유 및 설명을 위한 자료로 쓰기 위해 Dashboard 구성을 작성한다.

 

Chart & Dashboard

 

목차

 

1. Radar, Graph, Sunburst Chart

2. 공유를 위한 Dashboard 구성

위의 목차를 클릭하면 해당 글로 자동 이동 합니다.

 

1. Radar, Graph, Sunburst Chart

Radar Chart

특정 카테고리를 기준으로 여러가지 metrics를 한번에 비교해 볼 수 있는 좋은 차트라 소개하게 되었다.

기본적으로 카테고리 Dimension에 대한 groupby 형식으로만 나타낼 수 있기에 수치형 데이터만을 표시할 수 있지만, 기본적으로 데이터에는 수치형이 많으니까 사소한 문제이다.(암튼 그렇다)

 

예시로 가져온 차트는 kaggle의 은행사기 데이터인데, 사기 유무에 대한 차원으로 여러가지 수치형 데이터들의 평균 값을 나타낸 것으로, 이 차트만 보더라도 사기 데이터(1)와 정상 데이터(0)가 어떤 차이와 분포를 보이는지를 직관적으로 프로파일링 할 수 있게 된다. (e.g: 사기 데이터는 정상 데이터보다 수입, 나이, 신용점수, 세션 등의 값이 평균적으로 높게 나타난다는 것을 볼 수 있다.)

 

Graph Chart

이건 사실 좀 재미로 그려본 차트긴 한데 어딘가 쓰임새를 발견하게 된다면 유용하지 않을까 하여 이리저리 다뤄보고 있다.

고객 및 금융 정보들을 이용하여 confusion matrix등으로 그려낸 다음 이런 Graph차트를 이용해서 무엇인가 그려본다면 사기 데이터에 대한 분석을 좀 더 해볼수 있지 않을까 정도 막연히 생각해보고 있다.

 

예시 차트는 고객들의 연령과 사용 장비들의 연관 관계를 나타낸 것인데, 당연하게도 젊은 세대에 편중된 것을 볼 수 있다.

 

Sunburst Chart

특정 수치에 대해서 카테고리형 데이터의 분포를 직관적으로 확인하기 좋은 sunburst 차트이다. 각각의 카테고리가 차지하는 정도가 바로 눈에 보이기에 데이터를 쉽게 파악하는데에 유리하다.

 

예시 차트는 지불 방식별/ 사용 장비별/ 사기에 대한 합산으로 차지한 파이가 클수록 사기가 많은 곳이라고 할 수 있겠다.

2. 공유를 위한 Dashboard 구성

공유 및 설명을 위한 Dashboard 구성 방식이다. 이미 업무에 쓰이는 데이터로 구성하여 공유한 것을 kaggle 데이터셋으로 다시 흉내내려니 좀 허접하고 별 인사이트가 없긴 하지만, 구성 방식 자체에 대한 정리글이니 내용 보다는 방식에 의미를 둔다.

  1. 대시보드에 넣는 차트의 네이밍 해주기
    사실 이건 별거 아니긴 한데, 그래도 슈퍼셋의 대시보드를 이용하다 보면 각자 바라보게 되는 차트가 달라서 혼동이 오기가 참 쉽다. 비슷한 차트를 많이 그리게 되기도 하고, 필터를 걸고 하다보면 같은 차트를 보는게 맞나 싶은 물음표가 뜨기도 하더란 말이다.
    그렇기에 대시보드에 넣는 차트에 고유한 값(e.g: A1, A2, B1, B2)을 가지도록 넣어준다면 차트에 대한 부가적인 설명 없이도 어떤 차트인지를 모두가 바로 식별하여 볼 수 있게 된다.
    추가로, 당연하지만 연관 있는 차트끼리는 비슷한 네이밍을 해 준다면 좀 더 빠르게 이해를 할 수 있다.
  2. 데이터에 맞는 차트를 발굴하기
    이건 사실 센스에 가까운 얘기긴 한데, 슈퍼셋에는 꽤나 다양한 차트들이 존재한다.(태블로는 훨씬 많겠지만)
    시각화를 한다는 것은 데이터가 가진 여러 의미를 직관적으로 이해할 수 있도록 만드는 행위이다. 기본적인 차트를 통해서도 좋은 설명이 가능하겠지만 데이터가 가지는 특성을 이해하고 이를 잘 반영할 수 있는 차트를 사용한다면 굉장히 빠르고 효율적인 공유와 브레인 스토밍이 가능하더라.
    또한, 똑같은 데이터를 가지고 다른 차트를 통하여 여러가지 차원으로 설명할 수 있다면 훨씬 많은 인사이트를 끌어낼 수 있다.
  3. Text를 이용하여 차트에 대한 주석을 정리하기
    각 차트는 모르는 사람이 본다면 예쁜 그림에 지나지 않는다. 각 차트의 네이밍과 연계하여 차트에 대한 설명과 그 차트에서 얻을 수 있는 인사이트를 정리하기 전까지 대시보드는 Visual Art에 불과하다. 누군가 설명하지 않아도 주석만을 이용하여 대시보드를 읽는 사람이 정보를 얻을 수 있도록 정리한다면 대시보드는 굉장히 훌륭한 공유와 설명 수단이 될 것이다.

 

요즘 Superset을 사용하는 방식 중 일부를 정리해 보았다. 조금씩이라도 기록하는 습관을 스스로 정리도 되고 돌아볼 수도 있으니 꾸준히 작성하려 한다.

'공부' 카테고리의 다른 글

[LLM] 자습 중. 참고 목록 모음집  (0) 2024.05.13
[LLM] 시작  (0) 2024.04.22
타닥타닥16: Superset User&Role  (0) 2023.06.20
타닥타닥15: AWS EC2 Superset 설치  (0) 2023.06.12
타닥타닥14: 쇼핑몰 웹 로그 분석  (0) 2023.06.07
Comments