Study/Computer

가설과 검정 [R언어를 쓰기 위한 초석닦기]

MuviSsum 2019. 11. 13. 17:32

귀무가설, 대립가설 설정 -> 가설 검정(관찰, 실험) -> 검정 통계 측정 -> 유의수준에 따른 가설 유지 or 폐지

 

 

위의 순서는 귀무 가설을 기각하는 단계를 뜻한다.

 

이는 R언어에서 중요한 개념으로 한 단계씩 살펴보도록 한다.

 

1. 귀무가설과 대립가설이 무엇인가?

 

귀무가설은 기존의 가설을 말한다. "대한민국 평균 키는 180보다 크다" 라는 가설이 있다고 하자.

 

이 가설을 기각하기 위해선 대립가설이 필요하다. "대한민국 평균 키는 180보다 작다"라는 가설을 세우자.

 

이렇게 검정하고 싶은 기존의 가설을 귀무가설이라고 하고, 기존의 가설과 대립되는 것을 대립가설이라고 한다.

 

2. 가설 검정

 

가설 검정 방법을 들어가기 전에, 단측 검정과 양측검정을 먼저 알아보자.

 

"대한민국 평균 키는 180보다 크다" vs "대한민국 평균 키는 180보다 작다"

 

이렇게 한 쪽을 고려하여 검정하는 것이 단측 검정이다.

 

"A약과 B약은 타박상에 대해 치료효과에 차이가 없다" vs " ~ 차이가 있다"

 

이렇게 양 측을 모두 고려하는 것이 양측 검정이라고 한다. 확실히 단측검정이 좀 더 검정력이 높다.

 

자, 이제 방법으로 들어가 보자.

 

쉽게 말해서 실험과 관찰을 수행하여 그에 대한 검정 통계량을 생성하는 것이다.

 

하지만 모집단에 대한 표본을 잘 설정해야 하고 검정 방법에 대한 디자인을 확실하고 정확하게 해야 신뢰도가 높아진다.

 

3. 검정 통계 측정, 유의 수준에 따른 가설 유지/ 폐지

 

앞에서 만든 검정 통계량을 가지고 측정을 한다. 측정 전, 유의수준의 기준을 정해놓고 측정한다.

 

유의수준이란 어느 정도 드문 현상을 유의하다고 결정하느냐의 기준이다.

 

"대한민국 평균 키는 180보다 크다" vs "대한민국 평균 키는 180보다 작다" 에

 

모집단에서 표본을 100번 추출해서 100번 조사하여 "~ 크다" 쪽은 1번, "~ 작다" 쪽은 99번이 나왔다.

 

그러면 유의확률(p-value)는 0.01 (1%)가 된다.

 

여기서!! 유의수준 = 5% 라고 한다면, 이 기무가설의 유의확률은 유의수준을 넘지 못하므로 기무가설이 기각된다.

 

그리고 100번 추출해서 100번 조사하는 이런 방법을 검정 통계 측정이라고 한다.

 

하나 더 말하자면, 유의수준은 대부분 5%를 쓰고, 1%도 드물게 쓴다. (고등학교 수학 분산에서 나옴)

 

p.s. 무식하게 한 방법들이고 사실 세상엔 좋게 디자인된 통계방법이 많다.

 

※ 참조 : R을 이용한 누구나하는 통계분석(안재형, 한나래 아카데미)

 

반응형