다변량 시각화
- 두 개 이상의 변수로 구성된 데이터 관계를 시각화 기반으로 파악하는 데이터 탐색 유형
- 주어진 변수 간의 패턴 및 관계를 다양한 그래프의 시각화를 통해 전체적으로 파악
다변량 시각화 종류
데이터 조합 | 시각화 방안 | 목적 |
범주형 - 범주형 | 모자이크플롯 | 두 개 범주형 변수 내 범주 별 조합의 빈도 크기를 개략적으로 파악 |
범주형 - 연속형 | 박스플롯 평행좌표 |
범주 별 기술통계량 및 경향성을 개략적으로 파악 |
연속형 - 연속형 | 산점도 | 연속형 변수 간 관계성을 개략적으로 파악(선형/비선형 및 음양 방향 등) |
모자이크플롯
- 범주형 - 범주형 변수 조합 내 그룹(Subgroup) 크기 비교
- 범주 그룹 간 비중의 차이를 전체적으로 파악 가능
- 범주 수가 많고, 각 조합별 비중 차이가 크지 않을 경우 전체적 파악이 어려울 수 있음
- 범주의 재범주화를 통해서 범주 조합의 빈도를 특정 조합이 전체 대비 얼마나 차지하는지를 확인하는 방향으로 활용 가능
- 각 범주별 조합의 크기를 한 눈에 비교하기 위한 그래프로, 범주형 다변량 데이터를 표현하는 데에 적합한 그래프
- 각 조합별 구성의 빈도 크기의 우위를 표현한 것이므로 교차표를 시각화한것이라고 볼 수도 있음
모자이크 플롯 예시
박스플롯
- 범주형 - 연속형 변수 조합 간 전반적 요약 통계량 파악
- 하나의 그래프 안에 다양한 정보를 쉽게 표현하기 때문에 연속형 데이터에 대한 명확한 요약을 보기에 매우 시각적으로 효과적인 방안
- 많은 데이터를 눈으로 직접 확인하기 어렵고, 대표적 통계 값만으로 파악하기 어려울 때 용이함
- 범주 그룹(범주형 변수) 간 수치(연속형 변수)의 집합 범위와 중앙값, 이상치 등을 빠르게 확인할 수 있음
- 비시각화 기반의 단순 수치값 비교보다 데이터가 설명하는 많은 정보 획득 가능
박스플롯 예시
평행좌표
- 범주형 - 연속형 변수 조합 간 경향성 파악
- 연속형 데이터 기반으로 범주 별 경향성 파악에 용이함
- 데이터의 트렌드 판단 가능
- 연속형 변수 간 단위 표준화가 이루어지기 전의 데이터로 시각화할 경우 파악이 어려울 수 있음
평행좌표 예시 - 원데이터를 그대로 시각화하는 것 보다 스케일링을 한 뒤에 시각화하는 방안이 인사이트를 찾기 유용할 수 있음
- 주어진 데이터 내 해당 범주 간 경향성을 파악하기 위해 활용되는 평행좌표는 여러 개의 연속형 변수의 흐름을 하나의 그래프 안에서 파악하기 위한 좋은 시각화 방안
산점도
- 연속형 - 연속형 변수 조합 간 상관도 파악
- 연속형 데이터 간의 관계를 그래프상으로 어떠한 관계가 있는지 파악하기 위함
- 변수 간 분포를 통해 선형 혹은 비선형 관계 및 음양의 방향 등을 빠르게 파악할 수 있음
- 범주 Label 간 비교가 필요할 경우, 해당 부분의 그룹 정보를 표시하면 변수 간 관계 및 범주 그룹 간 관계를 함께 파악 가능
- 연속형 변수간의 관측치들을 좌표 공간에 나타내어 데이터의 분포가 어떻게 되어있는지를 확인하고 그에 따른 해석을 통해서 변수 간의 패턴등과 같은 정보를 한 눈에 파악할수 있는 방안으로 활용
'[KT] AIVLE School > 사전학습' 카테고리의 다른 글
데이터 분석 이해와 실무 (2) - 상관분석 (0) | 2025.03.18 |
---|---|
데이터 분석 이해와 실무 (1) - 가설의 의의와 검정 (0) | 2025.03.18 |
데이터 탐색 이해와 실무 (3) - 다변량 비시각화 탐색 (1) | 2025.03.17 |
데이터 탐색 이해와 실무 (2) - 일변량 시각화 탐색 (0) | 2025.03.17 |
데이터 탐색 이해와 실무 (1) - 일변량 비시각화 탐색 (1) | 2025.03.17 |