[Statistics] 수치형 자료 표현 방법 vs 범주형 자료 표현 방법
Purpose of this Posting
- 수치형 자료 표현 방법과 범주형 자료 표현 방법을 알아봅니다.
What are Numercial Data and Categorical Data?
수치형 자료와 범주형 자료를 표현하는 여러 가지 방법들에 대해 알아보기 전에 수치형 자료와 범주형 자료란 무엇인지 알아야 합니다!
제가 이전에 수치형 자료와 범주형 자료에 대해 작성했던 글을 통해 알아보시면 좋을 것 같습니다!
바로 아래에 링크를 남겨두었으니 여러분들께 도움이 되었으면 좋겠습니다!
이제 본격적으로 수치형 자료와 범주형 자료 표현 방법들에 대해 알아보도록 하겠습니다~!
** - Dot Plot(점도표)**
Dot Chart 예시
점도표(Dot Plot)란 각 관측값의 위치에 점을 표시하여 나타내는 것입니다.
같은 관측값이 존재하는 경우에는 그 위로 누적되는 형태를 띱니다.
** - Histogram(히스토그램)**
Histogram 예시
히스토그램은 특히 수치형 자료 중에서 연속형 자료의 분포 형태를 나타내는데 활용됩니다.
해당하는 구간의 상대 도수를 직사각형의 면적으로 표시해 모든 면적의 합이 1이 되게 표현합니다.
(상대 도수란 무엇인지에 대해서는 도수분포표 파트에서 설명하도록 하겠습니다!)
그렇다면 히스토그램에서 높이는 무엇을 의미하는지 알아보도록 하겠습니다.
Histogram 예시
이때 밀도(Density)란 해당하는 구간에 자료들이 얼마나 모여 있는지 보여줍니다.
** - Stem and Leaf Plot(줄기 잎 그림)**
Stem and Leaf 예시
줄기와 잎의 의미
줄기 잎 그림의 장점은 관측값의 정보는 어떠한 변형 없이 그대로 보존하는 것뿐만 아니라 자료의 분포 또한 알려준다는 것입니다.
** - Bar Chart(막대 그래프)**
Bar Chart 예시
위 예시 그림을 통해 히스토그램은 막대그래프와 같은 것이 아닌가라는 궁금증을 가질 있습니다.
실제로 형태도 거의 똑같다 봐도 무방하기에 충분히 가질 수 있는 궁금증입니다.
하지만 통계에서는 히스토그램과 막대그래프를 엄격하게 구분한다는 점 유의해주세요!
막대 그래프는 각 범주의 빈도나 상대 도수를 막대 길이로 표시한 그래프입니다.
이때 상대 도수는 각 계급의 도수를 총 도수로 나눈 비율입니다.
단위는 % 입니다.
** - Pie Chart(파이 차트)**
Pie Chart 예시
(위 그림을 원으로 봐주시면 감사하겠습니다 ㅠㅠ)
파이 차트는 원에 각 범주에 해당하는 비율만큼 각도를 분할해서 표시합니다.
이때 제가 여러분께 한 가지 질문을 던져보도록 하겠습니다!
파이 차트는 왜 원을 사용해서 표현하는 것일까요?
바로 그 이유는 원에서 각 범주의 면적과 각도의 비가 항상 동일하기 때문입니다.
이러한 이유로 파이 차트를 표현하는데 원을 사용하는 것입니다!
<Numercial Data & Categorical Data> - Frequency Table(도수분포표)
도수분포표는 대게 범주형 자료를 정리할 때 가장 많이 사용합니다.
도수분포표를 이해하기 위해서는 도수와 상대 도수란 무엇인지 알아야 합니다!
도수와 상대 도수
도수분포표에서는 상대 도수에 100을 곱해 퍼센트(%)로 표시하는 경우도 있습니다.
이제 도수와 상대 도수란 무엇인지 알아보았으니 도수분포표에 대한 설명을 이어나가도록 하겠습니다!
Frequency Table 예시
위 그림은 도수분포표 예시 그림입니다!
제시된 도수분포표에서 판매량이 도수이고, 판매비율이 상대 도수가 되는 것입니다~!
그런데 도수분포표는 특이한 성질이 하나 있습니다…
바로 범주형 자료뿐만 아니라 수치형 자료를 도수분포표로 정리할 수 있다는 것입니다!
단, 조건을 충족하는 수치형 자료만 가능하다는 점 유의해주세요.
그 조건이란 무엇인지 알아보도록 하겠습니다~
자료의 수치형 값이 몇 개로 한정된 경우에 값을 몇 개의 구간으로 그룹화한 후에 해당 그룹에 속한 값들의 개수를 구합니다. (이때 그룹을 계급, class라고 합니다.)
그리고 구한 개수로 도수분포표를 만드는 것입니다!
즉, 수치형 자료 중 수치형 값이 몇 개로 한정되었다는 조건이 충족되었을 때는 수치형 자료임에도 불구하고 도수분포표로 표현 가능하다는 것입니다!
이번 포스팅에서는 수치형 자료와 범주형 자료의 다양한 표현 방법들에 대해 알아보았습니다!
여러분들께 많은 도움이 되었기를 바라며, 다음에도 좋은 포스팅으로 찾아뵙도록 하겠습니다.
긴 글 읽어주셔서 감사하다는 말씀드리며 글을 마치도록 하겠습니다!
감사합니다!
댓글남기기