Study/Computer

통계 언어에 대한 간단한 정리

MuviSsum 2019. 12. 17. 01:27

모집단 : 연구대상이 되는 집단 전체

표본 : 연구대상인 모집단의 특성을 조사하기 위한 모집단의 일부분

모수 : 모집단의 특성을 나타내는 변수 - 평균, 모분산 등

분산 : 변량이 퍼져있는 정도

평균 : 주어진 데이터 변수들의 합을 데이터 변수의 개수로 나눈 값

표준편차 : 분산은 너무 크니까 작게 만듬

표준오차 : 추정치의 표준편차 (쓰는 곳 : 표본평균의 표준편차)  => √(분산/대상의 수)

변동계수 : 비교할 때, 각 변수들을 보정해주기 위한 계수 => 표준편차/평균

사분위수 : 자료를 순서대로 나열하였을 때, 1/4마다 위치한 데이터를 말함.

IQR(변수) : 1/4~3/4의 퍼진정도

중위수 : 1/2에 위치한 데이터

귀무가설 : 검정하고 싶은 기존의 가설

대립가설 : 기존의 가설과 대립되는 가설

단측검정 : 한 종류의 데이터만 고려하여 검정

양측검정 : 두 종류의 데이터가 연관되어 고려해야 하는 검정

유의수준 : 어느정도로 드문현상을 유의하다고 결정하는 기준 - 알파(a) = 0.01 or 0.05 (디폴트 값)

유의확률 : 실험이나 관찰에서 나온 검정통계량이 귀무가설을 지지하는 정도 - p-value

검정력 : 표본수(많을 수록 좋다)에 따른 결과에 귀무가설을 기각할 수 있는 확률 - power

정규분포곡선 : 좌우대칭이며, 하나의 꼭지를 가지는 곡선

비모수: 정규분포를 따르지않는 집단을 말함. 모집단에서 충분치 못한 데이터를 가져온 경우

공분산 : 두 변수가 같은 방향으로 움직이는지 다른 방향으로 움직이는지를 보여준다.

           0보다 크면 같은 방향, 0보다 작으면 다른 방향, 0이면 서로 독립적인 변수 or 안 움직임

단순 회귀 분석 : 하나의 종속변수와 하나의 설명변수 간의 관계를 직선으로 표현하는 방법

다중 회귀 분석 : 하나의 종속변수와 두 개 이상의 독립 변수 간의 관계를 직선을 표현하는 방법

일원 분산 분석(One-way ANOVA) : 세 그룹 이상의 평균이 모두 같은지 검정 후,

                                              분석을 마치거나 다시 어느 그룹에서 차이가 있는지 다중비교함.

이원 분산 분석 : 두 개의 그룹변수 가짐-두 그룹변수가 서로 어떤 영향을 미치는지(교호작용)

공분산분석(ANCOVA) : 분산분석에 연속형 변수를 추가한 것 - 비율

                              통제가 안되는 연속형변수를 추가하여 오차를 줄이고 검정력을 높이는 것

이항분포 : 연속된 n번의 독립적 실행에서 각 시행의 확률이 p를 가질 때의 이산확률분포

논리적 회귀 분석(Logistic Regression) : 종속변수가 (0,1) / (살다, 죽다) 같은 바이너리

비선형 회귀분석(Nonlinear Regression) : 약물을 연구에 주로 쓰인다. 직선이 아닌 곡선(점점 증가)

생존분석 : 절단된자료들을 최대한 이용하여 분석에 활용하여 생존기간을 분석하는 것

절단된 자료 : 어느 기간까지는 데이터가 모이고 있었지만, 그 이후부터 모이지 않은 자료.

예시) 항암제 투여 후 5년동안 연락하고 그 이후 생사가 불분명 한 경우, 5년 이상이라는 생존기간을 의미하는 자료들

반응형