Study/Computer

R 언어 설치하기 및 기본 명령어

MuviSsum 2019. 11. 13. 16:08

내용 및 순서 정리

  • 설치 하기
  • 패키지 설치 방법
  • 기본 명령어 조작 (함수)

1. 설치하기

 

www.r-project.org 로 들어간다. - 여기서 R studio는 쓰지 않습니다.

 

왼쪽 아래 CRAN을 선택한다.

 

 


CRAN Mirrors 중 Korea를 찾아 자기 지역에서 제일 가까운 지역을 선택한다.

 


선택 후 OS에 맞는 것을 선택한다.

 


이걸 보시는 분은 처음하거나 초심자이기 때문에 그냥 Base를 선택한다.

 


마지막으로 다운로드를 눌러 설치를 끝내면 된다.

 


자, 이제 설치가 끝났다면, R x64 0.0.0 을 시작해보자.

 

 

그럼 이런 창이 뜬다. 그럼 성공이다.

 

2. 패키지 설치

 

install.packages()를 사용하여 설치하면 된다.

 

예) > install.packages("NRAIA")

 

예처럼하면 패키지가 설치되고 사용할 때에

 

Library(NRAIA) 입력하고 다 쓰면, detach(package:NRAIA) 해주면 된다. 

 

3. 기본 명령어 조작

 

 내장되어 있는 함수를 통해 조작을 해볼 것이다.

 

 내장되어 있는 데이터 trees, chickwts, cars를 사용한다.

 

 summary(), boxplot(), pairs() 는 trees 데이터를 사용한다.


 summary()는 각각의 변수에 대하여 6개의 기술 통계량을 보여준다.

 

summary() 사용 결과


boxplot()은 기술통계량들을 보다 효율적으로 제시한다.

 

boxplot() 사용 결과

이 그래프는 주식 동향 그래프에서 자주 사용되는데,

 

한눈에 보기 편하다.

 


 

pairs()는 산포도를 통해 변수들의 연관성을 한눈에 살펴볼 수 있다.

 

pairs() 사용 결과

 이제 회귀분석을 하는 lm()과 분산분석표를 보여주는 anova()에 대하여 알아보자.

 

 lm(), anova() 는 cars를 사용한다.

 

 잠깐 알고 가실 것은 회귀분석이란? 

 

 관찰된 연속형 변수들에 대해 두 변수 사이의 모형을 구한뒤 적합도를 측정해 내는 분석 방법

 

 즉, 독립변수를 지정하고 종속변수를 지정하여 그에 대한 상관 관계를 나타내는 것이다.

 

 선형 회귀 방법을 예로 들자면, 하나 이상의 독립변수를 지정하고,

 

 하나의 종속 변수를 지정하여, 그래프 선으로 둘의 관계를 나타낸다.

 


 

 자, 이제 lm() 사용 방법과 사용 결과를 보자면,

 

lm() 사용 결과

 


 

이렇게 나온다. 이제 이걸 anova()로 분석표를 만들어 보자.

 

anova() 사용 결과


 이것들을 이용하여 통계분석을 해보면 된다.

 

 참고로 boxplot(girth ~ height, data=trees) 처럼

 

 앞의 말은 데이터 변수들의 범위를 지정하고, 뒤는

 

 데이터의 소속을 지정한다고 생각하시면 편하다.

 

 쓸만한 함수들은 아래에 있다.

 

  • mean() : 평균 ex) mean(trees$Volume)
  • attach() : 소속 지정 ex) attach(trees)
  • detach() : 소속 해제 ex) detach(trees)
  • with() : 소속 데이터 사용한 명령 ex) with(trees, mean(Volume))
  • read.csv() : csv 파일 불러오기 ex)  a = read.csv("C:/data/a.csv")
  • setwd() : csv read할 때 디렉토리 지정해 놓기. ex) setwd("C:/data")

 

참조 : R을 이용한 누구나 하는 통계분석(안재형, 한나래 아카데미)
반응형