따블로

반응형

안녕하세요. D2C(Direct to Consumer) 시대가 코로나로 인해 몇 년은 훅 당겨진 것 같습니다. 하여 나만의 경쟁력을 키우기 위해 태블로를 공부하면서 데이터 분석하는 방법을 배우기 시작했고, 태블로를 통해 깨달은 내용들을 정리해 봅니다.  이렇게 정리를 꾸준히 하다 보면 어느 날 성장해 있는 나를 기대해 봅니다. 혹 저와 같은 고민을 하는 분이 있다면 그분들에게도 도움이 되면 좋겠습니다.


오늘은 지역별로 제품 매출 순위 차트를 만드는 방법에 대해서 정리하고자 합니다. 정리하는 과정에서 태블로의 개념 중 필드유형에 속하는 연속형, 불연속형에 대해서도 함께 정리가 될 것입니다. 또한 현재의 캔버스(View)시점에서 한번 더 추가적인 분석을 하기 위한 테이블 계산식도 소개가 될 것입니다.

 

 

[핵심 정리]

지역별 매출 순위를 표현하기 위해서 아래 두가지를 정리해 보겠습니다. 

1. 퀵 테이블 계산을 활용하여 순위 표현하기

2. 연속형(초록 알약), 불연속형(파란 알약)의 차이점 이해하기

 

먼저 매출과 지역을 위와 같이 캔버스에 드래그 앤 드롭 합니다.

 

위와 같이 차트의 행과 열을 바꾸고 내림차순으로 정렬해 주는 빨간색 '□' 을 클릭합니다. 그러면 수도권이 매출순위 1위이고, 강원이 매출순위 5위로 정렬됩니다.

 

이제 '제품 대분류'를 '지역'옆에 추가하면 위와 같이 차트가 세분화 되었습니다. 그러나 정렬 순위가 내가 원했던 지역별 매출 순위대로 정렬된 것 같지 않습니다.

 

이제 지역별 매출 크기대로 순위를 변경하기 위해 위와 같이 열에 있는 합계(매출) 초록 알약을 +Ctrl을 누른채 마크카드의 '세부정보'로 드래그 앤 드롭 합니다. (Ctrl+드래그 앤 드롭= 복사 붙이기) 일반적으로 세부 정보에 무엇인가를 추가해도 캔버스가 변화하는 일은 거의 없습니다. 기준만 넣어 놓는 거죠.  

 

이제 위와 같이 '세부정보'에 있는 합계(매출) 초록알약을 우클릭하여 '퀵 테이블 계산'을 선택하여 '순위'를 선택합니다. 이때 캔버스는 여전히 변화는 없습니다.

 

 이제 '합계(매출)'의 초록알약 오른쪽에 퀵 테이블 계산이 적용되었다는 삼각형이 보입니다. 이 초록알약을 위와 같이 우클릭하여 '연속형'에서 '불연속형'으로 변경해 줍니다.  그러면 '초록알약'이 '파란알약'으로 변경됩니다. 이렇게 해 주는 이유는 차트 완성 이후에 추가로 설명을 하겠습니다.

 

이제 위와 같이 '파란 알약'을 행에 있는 '지역'과 '제품 대분류' 사이에 드래그 앤 드롭 합니다.

 

그런데 위의 결과는 전체 지역의 순위가 정리된 것이지 내가 원하는 지역별로 구분된 제품 매출 순위가 아니라는 것을 알 수 있습니다. 이제 지역별 기준으로 매출액 순위를 정렬해 보겠습니다.

 

 

<그림 1>지역별 순위를 표현하기 위해  '패널(아래로)'를 선택
<그림 2>테이블 계산 편집에서 '특정 차원'에서 '제품 대분류' 기준으로 순위 표현

위의 <그림 1>과 <그림 2>는 같은 결과를 보여 주는데 이해를 편하게 하기 위해 <그림 2>를 자세히 보겠습니다.  1 테이블 계산 편집을 선택하면 테이블 계산이란 팝업창이 뜨고 매출의 순위를 '특정 차원'에서 '제품 대분류'별로 순위를 잡겠다는 의미입니다. 위와 같이 실행하고 나면 아래와 같은 결과값을 보여 줍니다.

 

 

이제 지역별 색상을 구분하고 제목을 입력해 줍니다.

 

 

위와 같이 지역을 복사 붙이기(+Ctrl 을 누른 채 드래그 앤 드롭)를 하면 지역별로 색상이 부여됩니다. 제목 변경은 시트1 이라는 제목을 더블클릭하여 "카테고리별 매출액에 대한 지역별 순위" 라고 입력해 줍니다.

 

이제 지역별 구분된 색상과 매출 순위가 제대로 보입니다. 마지막으로 매출값을 막대그래프의 왼쪽 정렬로 표현해 보겠습니다.

 

위와 같이 '마크 카드'에서 레이블을 선택 > 마크 레이블 표시에 체크 > 맟춤에서 왼쪽 정렬을 선택하면 아래와 같은 최종 결과차트가 생성됩니다.

 


이제 '연속형'과 '불연속형'에 대한 필드유형에 대한 개념을 정리하고 마무리를 하겠습니다.

 

연속형 및 불연속형

연속형과 불연속형은 수학적 용어입니다. 연속형은 "단절이 없고 끊어지지 않는 완전체 형성"을 의미하고, 불연속형은 "개별적으로 구분"된다는 의미입니다.

Tableau에서 필드는 연속형이거나 불연속형일 수 있습니다. 

<데이터 패널>의

1.측정값 영역에서 필드를  또는 에 끌어 놓으면 기본적으로 연속형 값이 되고 "축"이 생성됩니다.

2.차원 영역에서 필드를  또는 에 끌어 놓으면 기본적으로 불연속형 값이 되고 열 또는 행 "머리글"이 생성됩니다.

 

이제 이렇게 되는 이유를 살펴보겠습니다.

연속형 필드는 "축" 생성

집계할 수 있는 숫자 값이 있는 경우 데이터 원본에 처음 연결하면 필드가 데이터 패널의 "측정값" 영역에 할당됩니다. Tableau는 값이 연속형이라고 가정합니다.

 또는 에 연속형 필드를 끌어 놓으면 Tableau가 "축"을 표시합니다. 축은 최소값과 최대값 사이의 값을 표시하는 측정선입니다. 필드가 숫자를 포함한다고 해서 자동적으로 해당 값이 연속형이 되는 것은 아닙니다. 우편 번호가 고전적인 예입니다. 우편 번호는 일반적으로 숫자만으로 구성되지만 실제로는 더하거나 평균을 구하는 것이 의미가 없는 문자열 값입니다. Tableau에서 그와 같은 필드가 측정값 영역에 할당된 경우 차원 영역으로 끌어 놓아야 합니다.

불연속형 필드는 "머리글" 생성

필드가 이름, 날짜 또는 지리적 위치 같은 숫자가 아닌 값을 포함하는 경우 데이터 원본에 처음 연결하면 Tableau는 해당 필드를 데이터 패널의 차원 영역에 할당합니다. Tableau는 값을 불연속형으로 처리합니다.

불연속형 필드를  또는 에 끌어 놓으면 Tableau가 "머리글"을 생성합니다. 불연속형 필드의 개별 값은 행 또는 열 머리글이 됩니다. 그와 같은 값은 집계되지 않기 때문에 캔버스에서 작업하는 동안 새 필드 값이 생성되지 않으므로 축을 생성할 필요가 없습니다.

연속형, 불연속형 차트 차이점 

필드가 연속형이면 '초록 알약'이고, 불연속형이면 '파란 알약'입니다. 캔버스의 필드가 측정값인지, 아니면 차원인지를 알려 주는 것은 필드가 집계되는지 여부입니다.

왼쪽 위 캔버스는 데이터 패널의 측정값 영역에서 끌어 놓은 Quantity가 연속형이기 때문에 캔버스 아래쪽에 축이 있다는 것을 알 수 있습니다. 축이 있고 '초록 알약'이기 때문에 이 필드가 연속형이라는 것을 알 수 있고, 집계되지는 않았으므로 차원이라는 것을 알 수 있습니다.

오른쪽 위 캔버스에서는  선반에서 Quantity를 클릭하고 불연속형을 선택하여 캔버스를 수정했습니다. 이제 캔버스 아래쪽에 축 대신 머리글이 있습니다.

 

반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band