반응형
R 데이터 전처리(누락데이터 처리)
R에서는 누락데이터(NA)를 다루는 네가지 함수를 제공합니다.
na.fail(object, ...)
na.omit(object, ...)
na.exclude(object, ...)
na.pass(object, ...)
설명을 위해 누락데이터를 가진 데이터프레임을 하나 정의합시다.
> a=c(1,2,3)
> b=c(10,20,NA)
> md=data.frame(a,b)
> md
a b
1 1 10
2 2 20
3 3 NA
#1. na.fail
na.fail 은 결측값이 있는 경우 Error를 반환합니다.
> na.fail(md)
Error in na.fail.default(md) : 객체안에 결측값들이 있습니다
#2. na.omit
na.omit 은 결측값이 생략된 결과를 반환합니다. 보통 이 값을 다른 변수에 저장해서 사용합니다.
> na.omit(md)
a b
1 1 10
2 2 20
#3. na.exclude
na.omit과 동일한데, naresid, napredict를 사용하는 함수에서 NA로 제외한 행을 결과에 다시 추가한다는 차이가 있습니다.
> na.exclude(md)
a b
1 1 10
2 2 20
#4. na.pass
na.omit과 동일한데, naresid, napredict를 사용하는 함수에서 NA로 제외한 행을 결과에 다시 추가한다는 차이가 있습니다.
na를 그냥 통과시킨다. 언제쓰지??
반응형
댓글