본문 바로가기
2. 데이터/3) 데이터 전처리

R 데이터 전처리(누락데이터 처리)

by makhimh 2019. 12. 30.
반응형

R 데이터 전처리(누락데이터 처리)


R에서는 누락데이터(NA)를 다루는 네가지 함수를 제공합니다. 


na.fail(object, ...)

na.omit(object, ...)

na.exclude(object, ...)

na.pass(object, ...)


설명을 위해 누락데이터를 가진 데이터프레임을 하나 정의합시다. 


> a=c(1,2,3)

> b=c(10,20,NA)

> md=data.frame(a,b)

> md

  a  b

1 1 10

2 2 20

3 3 NA




#1. na.fail


na.fail 은 결측값이 있는 경우 Error를 반환합니다. 


> na.fail(md)

Error in na.fail.default(md) : 객체안에 결측값들이 있습니다



#2. na.omit


na.omit 은 결측값이 생략된 결과를 반환합니다. 보통 이 값을 다른 변수에 저장해서 사용합니다. 


 > na.omit(md)

  a  b

1 1 10

2 2 20



#3. na.exclude


na.omit과 동일한데, naresid, napredict를 사용하는 함수에서 NA로 제외한 행을 결과에 다시 추가한다는 차이가 있습니다. 


> na.exclude(md)

  a  b

1 1 10

2 2 20



#4. na.pass


na.omit과 동일한데, naresid, napredict를 사용하는 함수에서 NA로 제외한 행을 결과에 다시 추가한다는 차이가 있습니다. 


na를 그냥 통과시킨다. 언제쓰지??

반응형

댓글