타닥타닥17: Superset Chart 및 Dashboard구성2 본문
Superset을 사용하며 발견하는 소소한 팁들을 정리해보자. 이 글에서는 Radar, Graph, Sunburst 차트에 대한 간략한 소개와 공유 및 설명을 위한 자료로 쓰기 위해 Dashboard 구성을 작성한다.
Chart & Dashboard
목차
위의 목차를 클릭하면 해당 글로 자동 이동 합니다.
1. Radar, Graph, Sunburst Chart
Radar Chart
특정 카테고리를 기준으로 여러가지 metrics를 한번에 비교해 볼 수 있는 좋은 차트라 소개하게 되었다.
기본적으로 카테고리 Dimension에 대한 groupby 형식으로만 나타낼 수 있기에 수치형 데이터만을 표시할 수 있지만, 기본적으로 데이터에는 수치형이 많으니까 사소한 문제이다.(암튼 그렇다)
예시로 가져온 차트는 kaggle의 은행사기 데이터인데, 사기 유무에 대한 차원으로 여러가지 수치형 데이터들의 평균 값을 나타낸 것으로, 이 차트만 보더라도 사기 데이터(1)와 정상 데이터(0)가 어떤 차이와 분포를 보이는지를 직관적으로 프로파일링 할 수 있게 된다. (e.g: 사기 데이터는 정상 데이터보다 수입, 나이, 신용점수, 세션 등의 값이 평균적으로 높게 나타난다는 것을 볼 수 있다.)
Graph Chart
이건 사실 좀 재미로 그려본 차트긴 한데 어딘가 쓰임새를 발견하게 된다면 유용하지 않을까 하여 이리저리 다뤄보고 있다.
고객 및 금융 정보들을 이용하여 confusion matrix등으로 그려낸 다음 이런 Graph차트를 이용해서 무엇인가 그려본다면 사기 데이터에 대한 분석을 좀 더 해볼수 있지 않을까 정도 막연히 생각해보고 있다.
예시 차트는 고객들의 연령과 사용 장비들의 연관 관계를 나타낸 것인데, 당연하게도 젊은 세대에 편중된 것을 볼 수 있다.
Sunburst Chart
특정 수치에 대해서 카테고리형 데이터의 분포를 직관적으로 확인하기 좋은 sunburst 차트이다. 각각의 카테고리가 차지하는 정도가 바로 눈에 보이기에 데이터를 쉽게 파악하는데에 유리하다.
예시 차트는 지불 방식별/ 사용 장비별/ 사기에 대한 합산으로 차지한 파이가 클수록 사기가 많은 곳이라고 할 수 있겠다.
2. 공유를 위한 Dashboard 구성
공유 및 설명을 위한 Dashboard 구성 방식이다. 이미 업무에 쓰이는 데이터로 구성하여 공유한 것을 kaggle 데이터셋으로 다시 흉내내려니 좀 허접하고 별 인사이트가 없긴 하지만, 구성 방식 자체에 대한 정리글이니 내용 보다는 방식에 의미를 둔다.
- 대시보드에 넣는 차트의 네이밍 해주기
사실 이건 별거 아니긴 한데, 그래도 슈퍼셋의 대시보드를 이용하다 보면 각자 바라보게 되는 차트가 달라서 혼동이 오기가 참 쉽다. 비슷한 차트를 많이 그리게 되기도 하고, 필터를 걸고 하다보면 같은 차트를 보는게 맞나 싶은 물음표가 뜨기도 하더란 말이다.
그렇기에 대시보드에 넣는 차트에 고유한 값(e.g: A1, A2, B1, B2)을 가지도록 넣어준다면 차트에 대한 부가적인 설명 없이도 어떤 차트인지를 모두가 바로 식별하여 볼 수 있게 된다.
추가로, 당연하지만 연관 있는 차트끼리는 비슷한 네이밍을 해 준다면 좀 더 빠르게 이해를 할 수 있다. - 데이터에 맞는 차트를 발굴하기
이건 사실 센스에 가까운 얘기긴 한데, 슈퍼셋에는 꽤나 다양한 차트들이 존재한다.(태블로는 훨씬 많겠지만)
시각화를 한다는 것은 데이터가 가진 여러 의미를 직관적으로 이해할 수 있도록 만드는 행위이다. 기본적인 차트를 통해서도 좋은 설명이 가능하겠지만 데이터가 가지는 특성을 이해하고 이를 잘 반영할 수 있는 차트를 사용한다면 굉장히 빠르고 효율적인 공유와 브레인 스토밍이 가능하더라.
또한, 똑같은 데이터를 가지고 다른 차트를 통하여 여러가지 차원으로 설명할 수 있다면 훨씬 많은 인사이트를 끌어낼 수 있다. - Text를 이용하여 차트에 대한 주석을 정리하기
각 차트는 모르는 사람이 본다면 예쁜 그림에 지나지 않는다. 각 차트의 네이밍과 연계하여 차트에 대한 설명과 그 차트에서 얻을 수 있는 인사이트를 정리하기 전까지 대시보드는 Visual Art에 불과하다. 누군가 설명하지 않아도 주석만을 이용하여 대시보드를 읽는 사람이 정보를 얻을 수 있도록 정리한다면 대시보드는 굉장히 훌륭한 공유와 설명 수단이 될 것이다.
요즘 Superset을 사용하는 방식 중 일부를 정리해 보았다. 조금씩이라도 기록하는 습관을 스스로 정리도 되고 돌아볼 수도 있으니 꾸준히 작성하려 한다.
'공부' 카테고리의 다른 글
[LLM] 자습 중. 참고 목록 모음집 (0) | 2024.05.13 |
---|---|
[LLM] 시작 (0) | 2024.04.22 |
타닥타닥16: Superset User&Role (0) | 2023.06.20 |
타닥타닥15: AWS EC2 Superset 설치 (0) | 2023.06.12 |
타닥타닥14: 쇼핑몰 웹 로그 분석 (0) | 2023.06.07 |