본문 바로가기
Talk about/Study

데이터 시각화 의미와 종류

by 개발을 꿈꾸는 디획자 2021. 12. 9.

현대 사회에서 정보는 곧 힘이라고 할 정도로 정보의 중요성은 날로 높아지고 있습니다. 정보의 양은 점점 많아지며 그 정보들 속에서 어떻게 빠르게 데이터를 찾아내 효율적으로 분석하는지가 매우 중요해졌죠. 즉 현대 사회에서 어떻게 수많은 데이터를 시각화하여 사용자들에게 정보를 전달해주는지가 매우 중요해지고 있습니다.

그렇다면 데이터 시각화가 무엇일까요?


수많은 데이터들을 이해하기 쉽게 시각적으로 표현하여 전달하는 것을 뜻합니다. 가장 대표적인 방법으론 막대그래프와 파이 차트가 있습니다.
과거 단순이 엑셀과 같은 테이블 구조에 정보를 뿌려주는 개념이었다면, 현재에는 한눈에 데이터가 들어오는 것이 중요해진 것이죠.
그에 따라 정보를 가공하고 디자인해야 하는 사람의 역할도 함께 중요해졌습니다. 단순이 테이블에 있던 정보를 막대 차트로 옮기면 데이터의 가시성이 올라갈까요? 그렇지 않습니다. 각 차트별로 장단점이 있습니다. 같은 정보라 하더라도 어떻게 그려주냐에 따라 정보의 가시성이 크게 차이가 납니다.

그렇기 때문에 어떤 데이터를 어떠한 목적으로 시각화할지 식별한 다음 적절한 차트 유형을 선택해주는 것이 매우 중요합니다

데이터 차트 유형

데이터 차트 유형에는 목적에 따라 크게 6가지 유형이 있습니다. (시간이 지남에 따라 점점 더 늘어나고 있지만 대표적인 것을 추려보았습니다.) 비교, 트렌드 파악, 전체 대비 부분 파악, 상관관계, 연결관계, 공간 정보 파악 등이 그것인데요. 각 목적 별로 각각 어떠한 차트들이 있는지 자세히 살펴보겠습니다.

해당 글은 Carbon Design System을 참고하여 작성하였습니다.
https://www.carbondesignsystem.com/

 

Carbon Design System

Carbon is IBM’s open source design system for products and digital experiences. With the IBM Design Language as its foundation, the system consists of working code, design tools and resources, human interface guidelines, and a vibrant community of contri

www.carbondesignsystem.com



1. 비교를 목적으로 한 데이터 시각화

비교에 유리한 차트 유형들

 

막대 차트

막대 차트 종류에는 가로 차트 그래프, 세로 막대 차트, 그룹형 막대 차트, 플로팅 막대 차트 등이 있습니다.
막대 차트는 각각의 카테고리 별 데이터를 비교하기 유리하며 시간 경과에 따른 추세를 표현하기 좋습니다.
그룹화된 막대 차트는 여러 범주의 값을 비교하기 좋습니다.

일반 막대 차트(좌) /  플로팅 막대 차트(가운데) / 그룹형 막대 차트(우)

 

롤리팝 차트

막대 차트와 유사한 역할을 하는 비교 목적의 데이터 시각화 방법입니다. 80% 이상의 높은 값의 데이터들을 비교할 때 사용하는 시각화 방법입니다. 막대 차트에서 나열되면 값의 차이를 알기 쉽지 않아 시각적으로 알아보기 어렵습니다. 하지만 롤리팝 차트로 표현하면 좀 더 비교가 용이합니다.

롤리팝 그래프

 

버블형 차트

버블 차트는 버블을 사용하여 각 축에 자유롭게 측정값을 표현합니다. 각 축을 따라 하나의 측정값이 표시됩니다. 거품의 크기는 통해서 측정값을 표현할 수 있습니다.

레이더 차트, 방사형 차트, 거미줄 차트

여러 항목의 크기를 한눈에 비교할 수 있는 그래프로 방사형 차트(혹은 거미줄 차트)라고도 합니다. 하나의 측정 목표에 대한 평가 항목이 여러 개일 때 사용되며 여러 측정 목표를 겹쳐 놓고 비교하기에 편리합니다. 측정 목표의 성향 및 균형을 직관적으로 알 수 있어 편리합니다.

워드 클라우드

글에서 언급된 핵심 키워드를 시각화하는 기법으로 문서에서 언급되는 단어가 많을수록 크게 표현을 합니다.
해당 문서의 주요 키워드와 개념을 직관적으로 파악하기가 용이합니다.

버블형 차트(좌) / 레이더차트(가운데) / 워드 클라우드(우)

 

 

 

반응형

2. 트렌드 및 추세를 표현하기 위한 데이터 시각화

트랜드 및 추세 표현

 

선 차트

선 차트는 선으로 연결된 일정한 간격으로 데이터를 표시합니다. 선으로 시각화하여 시간 경과에 따른 추세를 표현하고 여러 데이터를 비교할 수 있습니다.

영역 차트

영역 차트는 선 차트와 유사하지만 선 아래 영역은 색상이나 패턴으로 채워져 표현합니다. 시간에 따른 변화의 규모를 시각화해야 하는 경우 유용하며. 전체에 대한 부분의 관계를 표시하기 위해 누적 영역형 차트로도 사용됩니다.

선 차트(좌) / 면적 차트(우)

 

박스 플롯 차트

박스 플롯은 많은 데이터를 눈으로 확인하기 어려울 때 그림을 이용해 데이터 집합의 범위와 중앙값을 빠르게 확인할 수 있는 목적으로 사용합니다. 또한 통계적으로 비정상적인 이상점(outlier)이 있는지도 확인이 가능합니다.

이미지 출처 : 카본 디자인시스템(좌), https://newmkka.tistory.com/348(우)

 

히스토그램 차트

표로 되어 있는 도수 분포(도수분포표)를 그림으로 시각화시킨 것으로 이해하시면 됩니다. 전체 집단의 분포 현황을 파악하거나 비교할 때 용이합니다.
계급은 가로축에 도수는 세로축에 표시되어 표현하는 것이 일반적입니다. 막대 차트에서는 막대 간 간격을 둬도 상관없지만 히스토그램 차트는 막대 간 간격을 두면 안 되며 붙여 사용합니다.
막대그래프는 카테고리별 데이터 비교를 목적으로 한다면 히스토그램은 측정된 연속적인 값(성적, 몸무게 등)을 나열하여의 데이터를 비교하는 것을 목적으로 사용합니다.

카테고리 별로 구분된 막대그래프(좌), 측정된 연속적인 값으로 나열된 히스토그램(우) [출처 : https://www.edrawsoft.com/kr/for-beginners/what-is-histogram.html]

 


3. 부분 대 전체 비교를 목적으로 한 데이터 시각화

 

부분 대 전체 비교에 용이한 차트

파이 차트 / 도넛 차트

파이 차트는 전체에 대한 각 부분의 비율을 부채꼴 모양으로 백분율로 나타낸 차트입니다. 각 부채꼴의 중심각이 전체에서 차지하는 비율을 나타내며, 비율을 한눈에 볼 수 있다는 장점이 있습니다. 전체적인 비율을 쉽게 파악할 수 있어서 언론사에서 통계 수치를 공개할 때 자주 활용되지만 각 데이터별로 크기의 차이가 없을 경우 시각적으로 비교하기가 어렵다는 단점이 있습니다. 따라서 데이터별 크기 차이가 비슷할 시 비교를 목적으로 사용한다면 막대차트가 유리합니다.
도넛 차트는 파이 차트의 일종입니다. 가운데가 도넛처럼 비어 있기 때문에 가운데 영역을 활용할 수 있는 장점이 있습니다.

파이차트(좌) / 도넛차트(우)

 

누적 막대 차트

누적 막대 차트는 각 데이터 계열의 합계 및 각 범주 내 비례를 확인하기 좋으며 각 범주 별 데이터의 기여도를 확인하는데 유용합니다.

불릿 차트

불릿 차트(Bullet Chart, 총알 차트)는 실적 데이터를 표현하기 위한 최적의 시각화로 막대 차트와 유사하게 생겼으나, 타깃 대비 현재 얼마나 목표에 달성했는지 보여주기 위한 목적으로 사용합니다.

좌측 이미지 출처 : 카본 디자인 시스템 , 우측 이미지 및 자료 출처:  https://jaydata.tistory.com/60  [Data & Graph]

 

누적 영역 차트

영역 차트는 선 차트와 유사하지만 선 아래 영역은 색상이나 패턴으로 채워져 표현합니다. 시간에 따른 변화의 규모를 시각화해야 하는 경우 유용하며. 전체에 대한 부분의 관계를 표시하기 위해 누적 영역 차트로도 사용됩니다.

 

미터 차트

단일 변수의 값과 관련된 정보를 표시하는 방법입니다. 이 차트에서는 현재 값이 일반적인지 혹은 위험 범위에 있는지 여부를 색상으로 나타낼 수 있으며 디바이스의 용량 정보, 월별 총 근무 시간 등의 데이터를 표현하는데 많이 사용됩니다.

게이지 차트

자동차 계기판 형태로 시각화하여 현재 상태, 목표 달성 추이 등을 한눈에 파악하기 위한 목적으로 사용합니다.

트리 차트

각 카테고리별 간 정확한 데이터 비교보단 많은 카테고리에 소속된 데이터(부분 대 전체) 간의 관계를 파악할 때 사용합니다. 제한된 공간에서 많은 양의 데이터를 처리할 때 트리 구조의 노드 링크 다이어그램이나 네트워크 다이어그램은 복잡해 보일 수 있습니다. 트리 맵은 영역 크기를 통해 각 카테고리 및 하위 카테고리에 대한 직사각형 수량을 표시하면서 계층 구조를 유지하기 때문에 대안으로 떠오르고 있습니다.

 

 

서클 팩 차트

서클 팩은 데이터를 원으로 계층적인 시각화를 표현합니다. 트리 맵 동일한 개념으로 트리의 각 노드를 원으로 표시되고 하위 노드는 상위 내에서 원으로 표시됩니다. 각 원의 크기는 인구 또는 파일 크기 등의 값을 표현하는 데 사용됩니다. 색상은 카테고리(범주)를 지정하거나 추가 변수를 나타내는 데 사용할 수도 있습니다. 서클 팩은 트리 맵보다 공간을 효율적으로 활용하지는 못하지만 계층 구조를 더 잘 나타낼 수 있습니다.

두 개 이상의 계층 구조가 있는 서클 팩의 경우 확대/축소 기능을 통해 데이터를 탐색할 수 있습니다. 

트리맵(좌) / 서클팩(우)


4. 상관관계를 표현하기 위한 데이터 시각화

 

 

스캐터 차트

좌표상의 점들을 표시함으로써 두 개 변수 간의 관계를 나타내는 그래프 방법입니다. 대부분의 차트에서는 카테고리가 축 중 하나에 표시되지만, 스캐터 차트에서는 카테고리는 점으로 표시되고 측정값은 두 축에 각각 표시됩니다. 세 번째 선택적 측정값이 있을 경우, 해당 값은 점의 크기로 반영이 되어 표현됩니다. 큰 데이터 셋을 분석하고 압축 데이터를 보는 경우, 데이터 포인트의 밀도는 색으로 나타냅니다.

 

히트 맵 

단일 색상 및 혼합 색상을 통하여 데이터를 시각화 하는 방법입니다.  이 데이터 시각화 방법은 복잡한 데이터를 한눈에 쉽게 파악하기 용이합니다.

 

평행 좌표 차트

평행 좌표 차트는 변수가 다양하거나 다를 시 데이터를 표현하기 유리한 방법입니다. 각 변수는 세로 축에 표시하고 각 데이터 요소는 축을 따라 연결된 일련의 점으로 표시됩니다.

평행 좌표 차트는 축이 있는 방사형 차트와 동일하므로 많은 사용 사례에서 선호됩니다. 장점은 각 변수가 완전히 다를 수 있고 자체 척도를 가질 수도 있다는 것입니다(단위도 다를 수 있습니다).

 


5. 연결관계를 표현하기 위한 데이터 시각화

산키 다이어그램

Sankey 다이어그램은 데이터 세트의 두 가지 지표와 레코드가 이들 사이에 어떻게 분포되어 연결되는지 표시하도록 설계된 유형 흐름도입니다.

두 지표의 여러 블록을 서로 옆에 배치하여 더 넓은 충적도를 생성할 수 있지만 이러한 특정 종류의 차트는 직접 연결되지 않은 지표 간의 상관관계를 표시하지 않는다는 점을 고려하는 것이 중요합니다. 이것은 일반적으로 각 블록에 대해 다른 색상 세트를 사용하여 강조됩니다.

산키 다이어그램

네트워크 다이어그램

네트워크 다이어그램은 네트워크 아키텍처를 시각적으로 나타내는 방법입니다. 다양한 아이콘과 연결선으로 네트워크 구조를 매핑합니다. 시각적 표현을 통해 사용자가 복잡한 연결을 한 눈에 쉽게 이해할 수 있으므로 네트워크 레이아웃을 공유하는 데 이상적입니다. 이러한 다이어그램은 문제를 분리하거나 새 시스템을 설계할 때 특히 유용합니다.

트리 다이어그램

계층 구조 및 순차적으로 일어난 사건을 트리 구조로 표현한 방법입니다.

네트워크 다이어 그램(좌) / 트리 다이어그램(우)

 

 


6. 공간 정보 파악을 목적으로한 데이터 시각화

등치 지도

사전 정의된 영역 내에서 음영, 색상 또는 기호 배치의 차이를 사용하여 해당 영역의 속성 또는 수량의 평균값을 나타내는 맵입니다.

 

비례 기호 맵

맵 영역에 데이터를 오버레이되 표현됩니다. 데이터를 맵에서 버블로 표현하는 방법은 가장 일반적으로 사용되는 기호입니다. 버블의 면적은 데이터세트의 값에 비례합니다.

연결 맵

연결 지도는 지도에 배치된 점을 직선 또는 곡선으로 연결하여 그립니다.연결 맵은 지리적 연결 및 관계를 표시하는 데 유용하지만 맵 경로를 표시하는 데 사용할 수도 있습니다. 연결 맵은 연결 분포를 통해 또는 지도에서 연결이 집중된 방식을 통해 공간 패턴을 나타내는 데에도 유용할 수 있습니다.

 

 


 

이상 데이터 시각화의 종류를 살펴보았습니다.

종류가 많아 많이 길어졌네요. 데이터 시각화의 종류는 이렇듯 매우 많고 장단점이 분명합니다. 나의 데이터는 어떤 유형이며 어떤 시각화 방법으로 표현해야 더 가시성이 좋아질까를 고민하신다면 정보 전달을 더 효과적으로 할 수 있습니다.

이상 부족한 글 읽어주셔서 감사합니다.

 

반응형

댓글