Tableau

[태블로 기초 STUDY] 상관 관계와 분포를 나타내는 차트

주스 JUICE 2022. 1. 20. 00:23
728x90

스캐터 플롯

측정값 필드 우클릭 -> 기본 속성 -> 집계 -> 평균

 

 

숫자가 의미하는 바는?

데이터셋 전체 범위에서 수익의 합계 / 할인율의 평균

 

 

데이터셋 전체 범위에서의 집계를 고객별 집계로 한 단계 내려가기

 

 

 

각각의 점은 고객 한 명 한 명을 의미

 

 

 

눈에 잘 들어오는 스캐터 플랏 만들기

 

색상 불투명도 줄이기

 

 

불투명도 조절

테두리 검정선

profit 색상란

(파란색 표시는 우리 회사에 이익 주는 고객

주황색 표시일수록 우리 회사에 손실 주는 고객)

 

 

 

화면의 디테일 수준 바꿔주기

: 고객 -> 제품

 

 

customer name을

product name으로 대체해주면

화면이 바뀜

 

 

 

회사에 이익 가져다주는

효자 제품

 

 

손실 가져다주는 제품

 

 

양극단 두 제품 제외하고

중간값 보기

 

 

 

profit과 discount의 상관관계 알아보기

 

분석 들어가서 추세선

 

 

차트 위에 놓으려고 하면

이렇게 뜸

선형 클릭

 

 

 

discount와 profit의 상관관계가 뜬다

 

 

 

discount가 1%씩 증가할 때

profit은 $7.16씩 감소한다

 

 

분색탭의 추세선을 사용하여

두 개의 측정값 간의 상관관계

파악할 수 있는 것이

스캐터 플랏!

 

 

 

 

데이터 분포를 알 수 있는

히스토그램 & 박스 플랏

 

 

 

히스토그램

 

가운데를 차지하고 있는 것이

9,994개 중 7,699개를 차지하고 있는 것

 

 

구간의 값이 커질 수록/작아질 수록

레코드 값이 작아진다

 

 

 

 

현재 200단위로 설정된 구간의 크기를 조절하는 방법?

 

Profit(bin) 필드 우클릭 -> 편집 -> 구간차원 크기

 

값 입력 -> 500

설정 시

 

 

더 크게크게 묶여있음을 알 수 있다

 

 

 

Sales로도 만들어보고 싶으면?

 

측정값 필드 우클릭 -> 만들기 -> 구간차원

 

 

만들면

 

Sales(구간차원)이라는 field가 생김

 

 

 

각 Sales별로 관측치 볼 수 있음

 

 

내가 원하는 곳에 대해 직접 구간차원 만들어 볼 수 있다

내가 원하는 수준으로 조정 가능

 

 

 

 

 

 

 

박스 플롯

 

 

17개로 쪼개짐

 

 

 

 

원으로 마크 바꾸면

더 잘 눈에 띔

 

profit 순으로 쭉 나열

 

 

 

표현방식에서 박스 플랏 선택

 

박스 플랏

: 각 서브카테고리를 수익 금액 기준으로 줄을 세운다

 

 

 

수익이 가장 낮으면 1번

가장 높으면 17번

그리고 아래에서부터 2번 ~ 16번

 

 

 

 

 

옅은 회색 박스와 짙은 회색 박스의 경계선의 점

: 1~17번 중 정중앙인 9번

 

 

짙은 회색 박스의 아래쪽 경계선의 점

: 1~27번 중 1/4 위치

 

 

옅은 회색 박스의 위쪽 경계선의 점

: 1~17번 중 3/4 위치

 

 

 

1/4 지점 = Q1

2/4 지점 = Q2

3/4 지점 = Q3

4/4 지점 = Q4

 

 

양극단쪽에 많이 가있는지,

가운데에 집중되어있는지

확인할 수 있음

 

 

 

 

예를 들어 지역별로 17개 지역별 sub category 보고싶으면

 

 

region field 열 선반 위에 올려

각 지역별로 박스플랏을 분기해서 볼 수 있음

 

 

East 지역은 특정 제품군에 따라

수익이 극명하게 나뉜다

 

South 같은 경우 비교적 수익 편차 크지 않음

 

 

 

 

왜 South 지역의 일부 서브카테고리가 박스 플랏 바깥에 찍혀있을까?

Interquartile Range (IQR) = Q3 - Q1 (1/4 지점과 3/4 지점의 거리 차이)

 

 

아웃라이어 판별

Q3 * 1.5 보다 크거나

Q1 - IQR * 1.5 보다 작거나

 

 

오른쪽 클릭 -> 편집

최대 데이터 범위로 하면 박스플랏 범위 넘어가지 않음

 

 

 

 

아웃라이어만 확인하고 싶을 땐

기초 마크 숨기기 체크!

 

 

 


실습하며 만든 자료

[태블로 기초 STUDY] 상관관계와 분포를 나타내는 차트.twbx
1.16MB


 

 

강의 출처

 

728x90