안녕하세요, BALL입니다!
이번 포스팅에서는 태블로를 활용해서 만들 수 있는 다양한 차트를 소개하겠습니다!
그 전에, "태블로(Tableau)"에 대해 알고 계신가요?
태블로는 드래그 앤 드롭만으로도 데이터를 시각화 할 수 있는 데이터 시각화 도구인데요,
엑셀, csv는 물론이고 텍스트, PDF, 엑세스 파일로 된 데이터까지 연결해 사용할 수 있어 활용도가 정말 좋은 도구입니다.
태블로는 정말 배우기 쉽고 강력한 도구이니 데이터 시각화에 관심이 있다면 꼭 배워보시는 것을 추천합니다!
태블로를 다운로드하는 방법과 요금제는 태블로 홈페이지를 참고해주세요.
( 태블로 홈페이지 : https://www.tableau.com/ko-kr )
그럼, 태블로로 차트를 한 번 만들어볼까요?
이번 포스팅에서 소개할 순서는 다음과 같습니다.
1. 파이 차트 & 도넛 차트
2. 누적 막대 차트 & 영역 차트
3. 분산형 차트
4. 캘린더 차트
5. 지도
데이터를 시각화하고자 하는 목적에 맞게 파악할 수 있도록 활용할 때,
어떤 차트를 선정할지는 매우 중요합니다!
저희의 글을 통해 많은 도움 되시길 바라면서 시작해보겠습니다 :-)
1. 파이차트 & 도넛 차트
첫 번째로, 파이 차트와 도넛 차트입니다.
프레젠테이션을 할 때 가장 많이 사용하는 차트가 바로 파이 차트인데요,
전체에서 차지하는 비중을 보여주기 좋아 설문조사 결과를 시각화할 때 자주 활용하고는 하죠.
하지만 파이 차트는,
'총합에 대한 값을 보여주기 어렵다'
'면적이 비슷할 경우 비교하기 어렵다'
는 단점이 있습니다.
첫 번째 단점을 해결할 수 있는 방법이 바로 ‘도넛 차트’입니다.
도넛 차트는 파이 차트 중앙에 구멍이 뚫린 형태로 도넛처럼 생긴 차트인데요,
중앙에 다양한 정보를 담을 수 있어 직관적으로 정보를 파악하는 데 도움을 줍니다!
위 사진처럼 파이 차트는 각 세그먼트의 매출 비율만 표현할 수 있고
총매출에 대한 정보는 별도의 계산식을 활용해 차트 상단에 표현해야 하는 반면,
도넛 차트는 이중축 기능을 활용해 총매출에 대한 정보를 차트 위에 표현할 수 있습니다.
2. 누적 막대 차트 & 영역 차트
두 번째로, 누적 막대 차트와 영역 차트입니다.
위 그림을 보면 왼쪽 차트가 영역차트, 오른쪽 차트가 누적 막대 차트인데요,
두 차트 모두 시간의 흐름에 따라 전체 추세를 확인하기에도 적합하고,
그 안에서 각 부문별로 얼마만큼의 양을 차지하고 있는지도 쉽게 확인할 수 있습니다.
먼저, 누적 막대 차트에 대해 더 알아보겠습니다.
누적 막대 차트는 막대 차트의 변형이라고 볼 수 있는데요,
막대 차트는 가장 기본이 되는 차트로,
시간의 경과에 따른 추세를 확인하기에 용이합니다.
그런데 항목들이 다양할 경우 막대 차트를 여러 개 사용해야 하는데,
누적 막대차트를 활용하면
각 범주 내의 데이터를 세분화하기 때문에 이를 한 눈에 파악할 수 있습니다.
그렇다면 이러한 누적 막대 차트에 불편함은 없을까요?
누적 막대 차트는 전체 추세와 부문별 추세를 한 번에 파악할 수 있다는 장점이 있지만,
각 부문(분절)의 크기를 "동시에" 비교하는 것은 쉽지 않습니다.
각 계열별로 기준선이 다르기 때문이죠.
따라서, 데이터를 시각화할 때에는
먼저, 어떤 것을 집중적으로 보여주고 싶은지 선택한 뒤에!
그 목적에 맞는 차트를 선정하는 것이 중요합니다.
만일 전체의 비율 중 어느 것이 많은 양을 차지하는지를 비교하여 파악하고 싶다면
왼쪽 그림의 누적 막대 차트가 용이하고, 강조하고 싶은 부문이 있다면
오른쪽 그림처럼 부문별로 막대 차트를 나누는 것이 더 적합할 수 있습니다.
누적 막대 차트는 위와 같이 양쪽 기준선에 차트가 꽉 차 있도록 표현하여
전체 중 부문별 비율의 추세를 더 용이하게 확인할 수 있도록 활용할 수도 있습니다.
또한, 이처럼 중앙 기준선을 중심으로 누적 막대 차트를 표현할 수도 있습니다.
주로 ‘그렇지 않다’와 ‘그렇다’를 기준선 양쪽에 배치하여
감정의 양상, 동의하는지 아닌지, 의견 등을 비교하는 데 활용합니다.
이번에는 영역 차트에 대해 더 알아보도록 하겠습니다.
영역차트를 통해서는
전체 측정값에서 각 항목들이 얼마만큼의 양을 차지하는지 확인할 수 있습니다.
영역 차트는 막대가 무한히 많은 막대 차트로 생각할 수도 있는데요,
따라서 앞서 설명했던 누적 막대 차트와 비슷하게
왼쪽 차트처럼 전체 추세의 흐름을 확인할 수 있는 방식으로 표현할 수도 있고,
오른쪽 차트처럼 전체 중 각 부분의 비율이 차지하는 정도를 강조하는 방식으로 표현할 수도 있습니다.
영역 차트의 경우에는 하나의 데이터 계열이 다른 계열을 가리지 않도록 하는 것과
차트가 두 데이터 계열의 합계로 오인하지 않도록 하는 점이 중요합니다.
데이터 계열이 겹치지 않도록 하기 위해서는
모든 계열의 색상에 투명도를 반영하면 오해하지 않을 수 있습니다.
3. 분산형 차트
세 번째로, 분산형 차트입니다!
분산형 차트는 해당 데이터가 어떻게 분포되어 있는지를 보여주는 차트입니다.
데이터의 분포 위치를 표현하거나
두 가지 변수의 데이터 사이의 상관관계를 보여주는 데 용이하므로
측정값 간의 관계를 파악하는데 적합합니다.
분산형 차트를 통해서는
다양한 변수 사이의 관계를 통해 전반적인 추세를 파악할 수도 있고,
눈에 띄는 마크에 대해 자세히 분석할 수도 있습니다.
또한, 추세선이나 매개변수를 추가하여 차트를 구체적으로 분석하는 것도 가능합니다.
왼쪽 차트의 경우 개별 마크를 같은 색으로 지정하여 데이터의 분포를 파악합니다.
동떨어져 있는 마크에 대해 세부적으로 분석하는 것도 가능하겠죠!
오른쪽 차트의 경우에는 추세선을 추가하여 기준에 따라 색상을 다르게 표현하였고,
이는 데이터의 상관관계를 분석하는 데 더욱 적합하다고 볼 수 있습니다.
매개변수를 적용하면 기준에 충족한 값들만 별도로 색상을 표시할 수 있습니다.
분산형 차트에서 마크는 꼭 원 모양만 사용해야 되는 것은 아닙니다.
데이터에 따라 사각형 등의 다른 마크 유형을 사용할 수 있고,
사용자 지정을 통해 원하는 이미지를 삽입하여 표현할 수도 있습니다.
그러나 중요한 것은,
데이터가 잘 파악될 수 있도록 서로 다른 요소 그룹끼리 확실히 구분되도록 해야 한다는 점입니다.
4. 캘린더 차트
네 번째로, 캘린더 차트입니다.
캘린더 차트는 파이 / 도넛 차트처럼 태블로 표현 방식에 기본 내장되어 있는 차트는 아니지만,
날짜 데이터를 활용해 쉽게 만들 수 있는 차트입니다.
만드는 방법을 간단히 알아볼까요?
열에 연도와 월, 요일을, 행에는 주를 올리고
원하는 연도와 월을 필터링 하면
달력 형태의 차트가 표현됩니다.
이제 마크에 날짜를 넣으면
위와 같이 날짜가 표현된 캘린더 차트가 완성됩니다.
이제 완성된 캘린더에 값을 표현해볼까요?
차트의 형태를 ‘사각형’으로 변경하고
관심있는 값을 ‘색상’에 넣으면 됩니다.
저는 캘린더에 수익의 합계를 표현해보았는데요,
캘린더 차트를 활용하면 특정 주, 요일에서 값의 차이를 한눈에 볼 수 있답니다.
시간 경과별 추세를 파악할 때 라인 차트나 막대 차트가 기본적으로 활용되지만,
캘린더 차트를 활용하면 더욱 직관적으로 확인할 수 있겠죠?
5. 지도
마지막으로, 지도 차트입니다.
태블로에서는 위도와 경도 값만 있다면 지도 차트를 그릴 수 있습니다.
구글 스프레드시트 Geocode 부가기능을 활용하면 주소를 위도와 경도로 변환할 수 있기 때문에
사실상 주소 데이터만 있다면 원하는 지도 차트를 그릴 수 있답니다.
스프레드시트 Geocode 부가기능을 활용해 위도와 경도 데이터를 생성하고
태블로에서 데이터를 열면 자동으로 위도값과 경도값으로 인식합니다.
(태블로가 편한 시각화 도구라고 말씀드린 이유 중 하나랍니다!)
열에 경도를 행에 위도를 올리면
자동 생성된 지도에 해당 위치를 표시할 수 있고
색상과 크기에 원하는 데이터를 넣으면
이렇게 위치와 함께 수치를 표현할 수 있습니다.
위 지도는 '경부고속도로 상행 휴게소 이용률 데이터'를 시각화한 지도인데요,
이렇게 지도 차트를 활용하면 휴게소의 위치와 이용률을 한눈에 볼 수 있다는 장점이 있습니다.
오늘은 태블로에서 만들면 더 편한,
그리고 태블로에서만 만들 수 있는 차트들을 살펴보았습니다!
위 차트들 외에도 다양한 차트로 데이터를 표현할 수 있는데요.
각 차트의 특징과 방법을 파악하여 효과적인 시각화 도구로 활용해보면 좋겠습니다 :)
그럼 다음 포스팅에서 만나요!
'데이터 분석 공부' 카테고리의 다른 글
SQL 입문 , 데이터베이스에 대해 알아보자. (1) | 2023.10.01 |
---|---|
맵박스(Mapbox)를 활용해 나만의 태블로 커스텀 맵 만드는 법 (0) | 2023.08.20 |
머신러닝 알고리즘 회귀분석 , 예시로 쉽게 알아보기 (0) | 2023.07.20 |
태블로 프렙(Tableau Prep), 간단히 마스터하기 (0) | 2023.06.20 |
사이킷런에 대해 소개합니다! (0) | 2023.05.20 |