따블로

반응형

사람마다 직관력이라는 것이 있습니다. 뛰어난 경영자일수록 이 직관력이 좋은 편이라고들 하죠. 그러나 직관은 생각보다 오류가 많습니다.

예를 들면 제가 아내를 위해 1년에 10번 정도 요리를 해 주었다고 가정을 해 보겠습니다. 그중 8번은 음식에 대해 칭찬을 받았는데 언제인지 모르는 2번의 실수로 인해 음식 맛이 기억에 남을 정도로 맛이 없었다면 아내는 남편의 음식 솜씨를 10번 중 8번은 잘했다고 해 줄까요? 2번의 끔찍했던 기억으로 남편의 음식 솜씨를 의심하게 될까요?

이런 비유를 하는 의도는 우리 인간의 뇌는 생각보다 오류가 많다는것을 말하고자 함입니다. 인간의 뇌는 나쁜 기억을 좋은 기억보다 오래도록, 그리고 사실보다 확대해서 기억에 저장한다고 합니다. 나쁜 기억은 자신을 보호하기 위해 당시 상황을 더 디테일하게 기억을 저장하기 때문에 기억할수 있는 용량에 한계가 있는 인간은 나쁜 기억에 대해서 실제 팩트 보다는 더 크게 와 닿는 것이죠.

 

만일 자기 신념이 강하고, 과거 성공의 경험을 해 봤던 경영자인 경우 이런 직관을 더 선호하는 경향이 있습니다. 자신의 감을 더 믿는 거죠. 그러나 이런 경영자를 만나면 인생이 꼬이게 됩니다. 그들은 사실에 근거한 데이터를 보여줘도 본인이 보고싶은 것만 보고, 믿고 싶은 것만 믿는 성향이 강합니다.

 

오늘은 태블로를 사용하여 외모는 직관적으로 보이지만 실제로는 데이터를 근거로 하는 사실(팩트) 그대로를 표현해 주는 '워드 클라우드'라는 차트를 만들어 보려 합니다.

위와 같이 왼쪽 사이바에서 차원값, 제품 중분류를 마크 카드의 '텍스트'에, 매출은 '크기'에 드래그 앤 드롭합니다.

그러면 위와 같이 트리 맵 형태의 차트가 나오는 데 이것을 워드 클라우드 형태로 바꿔 주려면 마크 카드에서 차트유형을 '자동'에서 '텍스트'로 바꿔 줍니다. 

위와 같이 매출의 크기에 따라 제품 중분류 텍스트의 크기가 달라집니다. 이제 제품 중분류 중 어떤 제품이 수익이 좋고, 어떤 제품이 손실이 나는지 알아보기 위해 차원값, '수익'을 마크 카드의 색상으로 드래그 앤 드롭합니다.

그러면 위와 같이 글자의 크기는 매출의 크기로, 수익의 크기는 색상으로 표현되는 워드 클라우드가 생성됩니다. '탁자'가 붉은색인 것을 보니 수익성에 문제가 있어 보이네요.


이제 이것을 활용해서 제가 좋아하는 영화에 응용을 해 보려고 합니다. KOBIS 영화관 통합전산망 사이트에서 역대 박스오피스 영화자료를 다운로드하여서 제작국가별 흥행 순위를 워드 클라우드로 정리한 후 대한민국 최고 흥행작을 찾아내는 과정을 정리하겠습니다.

요즘은 웬만한 데이터는 공개되어 있어서 참 편하긴 합니다. 위와 같이 영화 통합 전산망을 이용해서 데이터를 받은 후 태블로를 이용하여 막대차트를 먼저 만든 후 워드 클라우드로 전환합니다.

저도 이제 위의 차트 정도는 쉽게 할 수 있답니다. 관객수를 열(X축)에 놓고, 영화명을 행(Y축)에 놓았습니다. 

조금전에 정리한대로 영화명을 마크 카드의 '텍스트'로, 관객수를 마크 카드의 '크기'와 '색상'으로 옮기고, 관객수 색상카드를 더블클릭하여 위와 같이 관객수가 많으면 빨간색, 적으면 파란색으로 표현할 수 있도록 색상표를 바꾸고, 반전에 체크를 해 두었습니다. 이제 매개변수를 만들어서 관객수 500만 명 이상 흥행한 영화를 100만 명 단위로 필터링을 해 주도록 하겠습니다.

위와 같이 왼쪽 사이드바에서 빈 공간을 우클릭하여 매개 변수 만들기를 선택하고, 위 중앙 이미지와 같이 매개변수 이름을 관객수 필터라고 하고 정수를 선택하고, 범위에서 최소값 500만 명, 최댓값 2,000만 명, 단계 크기는 100만 명으로 입력합니다. 그러면 위 오른쪽과 같이 매개변수라는 차원이 하나 생성됩니다. 이것을 우클릭해서 매개 변수 표시를 선택합니다. 

알아야 할 것은 매개변수는 '계산된 필드' 없이는 아무 기능을 하지 않습니다. 따라서 위와 같이 '계산된 필드'를 하나 만들어 줍니다. 관객수의 합계는 항상 관객수 필터보다 크거나 작다로 함수를 입력하고 확인해 줍니다. 

그러면 사이드 바에 관객수 기준이라는 차원 값이 하나 생기는데 이것을 선반 필터에 드래그 앤 드롭해 줍니다. 그러면 참, 거짓을 선택하라고 하는데 관객수는 항상 매개 변숫값보다 큰 것으로 하였으니 참을 선택합니다.

그리고 이번에는 영화의 대표 국적을 필터에 넣어서 해당국가별 영화명를 볼 수 있도록 하겠습니다. 위 그림 오른쪽처럼 모든 국가를 선택합니다. 

필터로 이동한 대표 국적을 클릭하여 위 왼쪽 그림과 같이 필터 표시를 선택하고, 화면 오른쪽에 필터를 다중 값에서 단일 값으로 변경해 주면 나중에 선택하기가 용이해집니다. 이제 끝이 났네요.  짤 동영상으로 마지막 결과물을 정리합니다. 과연 어떤 영화가 대한민국에서 최고의 관객수를 동원한 흥행작일까요?

 

바로바로 대한민국 영화 '명량'이었네요.

반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band