R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형)
R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형) R에서 제공하는 자료형은 큰 범주로 나눠보면 아래와 같습니다. 1) 숫자형 (정수,실수,NaN,Inf)2) 복소수형3) 문자형4) 논리형 (TRUE,FALSE,NA)5) NULL 형 1) 숫자형 (정수,실수,NA,Inf) 숫자형은 다시 정수형과 실수형으로 나눠집니다. 디폴트는 실수형입니다. 정수형을 정의하고 싶을 경우 정수 뒤에 L을 붙여주면 됩니다. > a=3> a[1] 3> b=3L> b[1] 3> c=3.1> c[1] 3.1 typeof를 이용하면 변수의 자료형을 확인할 수 있습니다. > typeof(a) [1] "double" > typeof(b) [1] "integer" > typeof(c) [1] "double" 숫자형에..
2020. 1. 20.
R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수
R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수 다섯 사람이 있다고 해봅시다. 다섯 사람의 성별과 혈액형은 아래와 같습니다. gender=factor(c('M','M','F','M','F'),levels=c('M','F'))b_type=factor(c('A','O','AB','B','A'),levels=c('A','O','AB','B')) interaction 함수를 적용해보겠습니다. > interaction(gender,b_type)[1] M.A M.O F.AB M.B F.A Levels: F.A M.A F.AB M.AB F.B M.B F.O M.O 위와 같이 두 요인이 결합된 요인을 반환해줍니다. level을 보면 두 요인의 level 조합으로 나올 수 있는 모..
2020. 1. 18.
R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl()
R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl() gl함수를 이용하면 요인을 간편하게 정의할 수 있습니다. 아래와 같이 사용합니다. gl(요인 수, 요인 별 반복 수, 전체 수, 요인 이름) 예를들어서 남자(M)와 여자(F)로 구성된 요인을 만들고 싶다고 해봅시다. M,M,M,F,F,F 를 만들고 싶다면, gl함수를 아래와 같이 사용하면 됩니다. > gl(2,3,labels=c("M","F"))[1] M M M F F FLevels: M F 이번에는 전체 수도 입력해봅시다. 10을 입력하면, MMMFFF 가 3개씩 입력되다가 10개가 되면 입력을 멈춥니다. > gl(2,3,10,labels=c("M","F")) [1] M M M F F F M M M FLevels: M F ordered ..
2020. 1. 18.
[R 유용한 함수] 데이터의 그룹을 나눠주는 split 함수
데이터의 그룹을 나눠주는 split 함수 R에서 제공하는 split 함수는 데이터를 그룹으로 나눠줍니다. 말로 설명이 어려워서 예제를 통해 이해해봅시다. 먼저 아래와 같이 사람 열명의 이름으로 되어 있는 데이터를 만들어봅시다. name=c("KKH","LIK","JJI","AHK","BBK","SYJ","BJW","JDK","KII","SSI") 이제 이 사람들을 A,B,C 세개의 그룹으로 나눌 것입니다. 그룹 배정이 아래와 같이 되었다고 합시다. (factor가 아니라 vector 형태로 입력해도 됩니다. vector로 입력할 경우 drop 옵션 사용이 불가합니다. 이후 설명하겠습니다.) group=factor(c("A","B","A","C","C","A","B","B","A","C")) spilit ..
2020. 1. 18.
R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique()
R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique() 예를들어 아래와 같이 과일 이름데이터가 있다고 해봅시다. fruits=c("apple","apple","banana","orange","orange","melon","apple","orange","banana") 어떤 과일이 들어 있는지 종류만 알고 싶을 때는 unique 함수를 사용하면 됩니다. > unique(fruits)[1] "apple" "banana" "orange" "melon" fromLast 옵션을 TRUE로 하면, 결과를 역순으로 출력할 수도 있습니다. > unique(fruits,fromLast=TRUE)[1] "melon" "apple" "orange" "banana"
2020. 1. 1.
R에서 데이터를 txt, csv 로 저장하는 방법
R에서 데이터를 txt, csv 로 저장하는 방법 먼저 데이터를 하나 만들어봅시다. num=c(1,2,3)char=c("a","b","c")log=c(TRUE,TRUE,FALSE) mydf=data.frame(num,char,log) > mydf num char log1 1 a TRUE2 2 b TRUE3 3 c FALSE txt 형태로 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제..
2019. 12. 21.
R 데이터프레임 열별 누락 데이터 개수 확인
R 데이터프레임 열별 누락 데이터 개수 확인 #데이터 정의 data1=c(1,2,3,NA,5) data2=c(NA,2,3,NA,5) data3=c(NA,NA,NA,4,5) #데이터 프레임 정의 my_df=data.frame(data1,data2,data3) > my_df data1 data2 data3 1 1 NA NA 2 2 2 NA 3 3 3 NA 4 NA NA 4 5 5 5 5 #apply 함수를 이용하여 누락데이터 수 계산 #sum 함수 안에 다시 is.na 함수를 적용한 것이라, 아래와 같은 형식 사용 apply(my_df,2,function(x) sum(is.na(x))) > apply(my_df,2,function(x) sum(is.na(x))) data1 data2 data3 1 2 3
2019. 12. 12.
자료형의 특수형태 (NULL, NA, NaN, Inf, -Inf)
자료형의 특수형태 (NULL, NA, NaN, Inf, -Inf) R에는 자료형의 특수형태를 제공합니다. 수 계산결과로 나왔지만 정의가 되지 않거나, 무한대를 나타내거나, 결측치를 나타내는 등의 특수한 상황에서 사용됩니다. NULL이라는 자료형을 제외하면, 나머지 특수형태들은 숫자형이나 논리형에 속합니다. 1. NULL2. NA3. NaN4. Inf, -Inf 1. NULL 설명 : 값이 없다자료형 : NULL형 a=NULL > class(a)[1] "NULL" > mode(a)[1] "NULL" > str(a) NULL > typeof(a)[1] "NULL" > is.null(a)[1] TRUE 2. NA 설명 : 결측값자료형 : 논리형 a=NA > class(a)[1] "logical" > mode(..
2019. 11. 29.
R 에서 벡터 정의, 원소 이름 지정
R 에서 벡터 정의, 원소 이름 지정 1. 스칼라 정의 R에서 스칼라는 원소의 개수가 1인 벡터입니다. 따라서 벡터가 스칼라를 포함하는 개념입니다. 스칼라는 아래와 같이 정의합니다. > a=c(3) > a [1] 3 원소가 1개인 경우에는 c를 생략해줄 수 있습니다. > a=3 > a [1] 3 2. 벡터 정의 벡터는 아래와 같이 정의합니다. > a=c(1,2,3) > a [1] 1 2 3 괄호 앞에 쓰여진 c는 concatenate(연결된,연쇄된)의 줄임말입니다. 벡터는 숫자형 뿐 아니라 문자형,논리형으로도 정의가 가능합니다. > v1=c("a","b","c")> v1[1] "a" "b" "c" > v2=c(TRUE,TRUE,FALSE)> v2[1] TRUE TRUE FALSE 만약 숫자와 문자가 둘다..
2019. 11. 29.
R 자동으로 색 설정해주는 함수모음 (rainbow, heat, terrain, topo, cm)
R 자동으로 색 설정해주는 함수모음 #1. rainbow 함수 rainbow(n, s = 1, v = 1, start = 0, end = max(1, n - 1)/n, alpha = 1) HSV라고 색을 표현하는 방식이 있습니다. 변수가 3개라 색 공간이라고도 하는데, H는 색상 S는 채도 V는 명도입니다. rainbow에서는 H인 색상이 n개 지정되고, 채도와 명도를 s와 v라는 옵션으로 입력할 수 있습니다. s가 1에 가까울수록 색이 선명해지고 0에 가까울 수록 엷어집니다. v는 1에 가까울 수록 밝아지고 0에 가까울수록 색이 어두워집니다. alpha는 투명도입니다. s : 채도v : 명도alpha : 투명도 >예시 my_col=rainbow(10,s=0.2)pie(rep(1,10), col = my..
2019. 11. 28.