1 분 소요

Purpose of this Posting

  • 가중치에 대해 알아봅니다.

Before Entering…


가중치(Weight)에 대한 설명에 앞서서 우선 설명을 이해하기 위해서는 표본 추출 방법에 대해 알고 계셔야 합니다!

CKtrace의 표본 추출 방법 포스팅

위에 링크를 걸어둔 글을 참고하시면 도움이 되실 것 같습니다!

What is Weight(가중치)?


가중치(Weight)란 표본 조사의 결과의 정확도를 높일 수 있게 해주는 중요한 요소입니다.

예를 들어, 여러 모집단에서 표본들을 추출하는데 특정한 모집단에서 추출한 표본의 크기가 크거나 작으면 왜곡된 결과가 도출될 수 있습니다.

이러한 경우에 가중치를 적용하여 왜곡된 결과가 도출되는 위험으로부터 벗어날 수 있는 것이죠!

Weight in Sampling Method


단순확률추출법, 체계추출법, 층화확률추출법, 집락추출법에서 가중치가 적용되는 방법에 대해 하나씩 필기 그림을 통해 설명드리도록 하겠습니다.

1. 단순확률추출법(Simple Random Sampling)



2. 체계추출법(Systematic Sampling)



3. 층화확률추출법(Stratified Random Sampling)



4. 집락추출법(Cluster Sampling)



확률 추출법에 따른 가중치 적용법에 대해 알아보았으니 최종적으로 가중치가 어떻게 계산되는지 자세히 알아보도록 하겠습니다.

How to calculate the final weight


설명하기에 앞서 한 가지 가정을 해보도록 하겠습니다.

구하려고 하는 값이 왜곡될 수 있는 영향을 주는 것은 추출 확률, 무응답, 사후 추가, 이 세 가지라고 가정하고 설명을 시작하도록 하겠습니다.

최종 가중치를 구하기 위해 처음으로 고려해야 할 부분은 추출 확률에 대해 고려해보아야 합니다.

그렇다면 추출 확률에 대한 가중치를 우선 구해야겠죠?



추출 확률에 대한 가중치를 구할 때는 등확률, 즉 표본의 추출 확률이 모두 동일할 때와 등확률이 아닌 두 경우로 나누어서 계산해야 합니다.

다음으로 고려해야 할 부분은 바로 응답하지 않은, 무응답인 경우를 고려해보아야 합니다.

즉, 대체할 표본이 없거나 일부 항목에 답을 하지 않았을 경우에 사용하는 무응답에 대한 가중치를 구해야 합니다!



이제 마지막으로 알아볼, 고려해야 할 부분은 사후에 추가됨에 의해 발생하는 왜곡입니다.

이때 우리는 사후에 추가됨에 따른 가중치 값을 이용해야 합니다.



이제 구해야 할 가중치들을 다 긁어모았습니다.

드디어 긁어모은 가중치들을 적용할 때가 왔습니다! 

바로 적용해보도록 하겠습니다~





이렇게 각각의 가중치들을 모두 곱해주면 최종 가중치가 됩니다!

이렇게 해서 가중치란 무엇인지부터 최종 가중치까지 구해보았습니다.

긴 글 읽어주셔서 감사하다는 말씀드리며 마치도록 하겠습니다!

감사합니다!

댓글남기기