본문 바로가기
반응형

r159

R에서 그래프 그림파일로 저장하는 방법 R에서 그래프 그림파일로 저장하는 방법 그래프를 하나 만들어봅시다. > plot(c(1,2,3),c(4,5,6),main="My plot",xlab="x",ylab="y") 그림파일을 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제 png 형태로 저장해봅시다. png() 함수를 사용합니다. 배경은 투명으로 설정하겠습니다. 아래와 같이 입력합니다. png 함수를 입력하고, 이후에 plo.. 2020. 1. 28.
R에서 데이터(txt) 불러오는 방법, read.table() 옵션의 자세한 설명 R에서 메모장 데이터(txt) 불러오는 방법, read.table() 먼저 불러올 메모장파일을 만들겠습니다. 메모장의 내용은 아래와 같습니다. 파일 이름은 mytxt.txt 입니다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.table("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a V1 V2 V3 V41 1 2 3 42 1 2 3 43 5 6 7 .. 2020. 1. 20.
R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형) R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형) R에서 제공하는 자료형은 큰 범주로 나눠보면 아래와 같습니다. 1) 숫자형 (정수,실수,NaN,Inf)2) 복소수형3) 문자형4) 논리형 (TRUE,FALSE,NA)5) NULL 형 1) 숫자형 (정수,실수,NA,Inf) 숫자형은 다시 정수형과 실수형으로 나눠집니다. 디폴트는 실수형입니다. 정수형을 정의하고 싶을 경우 정수 뒤에 L을 붙여주면 됩니다. > a=3> a[1] 3> b=3L> b[1] 3> c=3.1> c[1] 3.1 typeof를 이용하면 변수의 자료형을 확인할 수 있습니다. > typeof(a) [1] "double" > typeof(b) [1] "integer" > typeof(c) [1] "double" 숫자형에.. 2020. 1. 20.
R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수 R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수 다섯 사람이 있다고 해봅시다. 다섯 사람의 성별과 혈액형은 아래와 같습니다. gender=factor(c('M','M','F','M','F'),levels=c('M','F'))b_type=factor(c('A','O','AB','B','A'),levels=c('A','O','AB','B')) interaction 함수를 적용해보겠습니다. > interaction(gender,b_type)[1] M.A M.O F.AB M.B F.A Levels: F.A M.A F.AB M.AB F.B M.B F.O M.O 위와 같이 두 요인이 결합된 요인을 반환해줍니다. level을 보면 두 요인의 level 조합으로 나올 수 있는 모.. 2020. 1. 18.
R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl() R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl() gl함수를 이용하면 요인을 간편하게 정의할 수 있습니다. 아래와 같이 사용합니다. gl(요인 수, 요인 별 반복 수, 전체 수, 요인 이름) 예를들어서 남자(M)와 여자(F)로 구성된 요인을 만들고 싶다고 해봅시다. M,M,M,F,F,F 를 만들고 싶다면, gl함수를 아래와 같이 사용하면 됩니다. > gl(2,3,labels=c("M","F"))[1] M M M F F FLevels: M F 이번에는 전체 수도 입력해봅시다. 10을 입력하면, MMMFFF 가 3개씩 입력되다가 10개가 되면 입력을 멈춥니다. > gl(2,3,10,labels=c("M","F")) [1] M M M F F F M M M FLevels: M F ordered .. 2020. 1. 18.
[R 유용한 함수] 데이터의 그룹을 나눠주는 split 함수 데이터의 그룹을 나눠주는 split 함수 R에서 제공하는 split 함수는 데이터를 그룹으로 나눠줍니다. 말로 설명이 어려워서 예제를 통해 이해해봅시다. 먼저 아래와 같이 사람 열명의 이름으로 되어 있는 데이터를 만들어봅시다. name=c("KKH","LIK","JJI","AHK","BBK","SYJ","BJW","JDK","KII","SSI") 이제 이 사람들을 A,B,C 세개의 그룹으로 나눌 것입니다. 그룹 배정이 아래와 같이 되었다고 합시다. (factor가 아니라 vector 형태로 입력해도 됩니다. vector로 입력할 경우 drop 옵션 사용이 불가합니다. 이후 설명하겠습니다.) group=factor(c("A","B","A","C","C","A","B","B","A","C")) spilit .. 2020. 1. 18.
R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 아래 명령어를 입력하면, 파일을 선택할 수 있는 탐색창이 뜹니다. read.table(file.choose(),header=TRUE) 2020. 1. 4.
R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique() R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique() 예를들어 아래와 같이 과일 이름데이터가 있다고 해봅시다. fruits=c("apple","apple","banana","orange","orange","melon","apple","orange","banana") 어떤 과일이 들어 있는지 종류만 알고 싶을 때는 unique 함수를 사용하면 됩니다. > unique(fruits)[1] "apple" "banana" "orange" "melon" fromLast 옵션을 TRUE로 하면, 결과를 역순으로 출력할 수도 있습니다. > unique(fruits,fromLast=TRUE)[1] "melon" "apple" "orange" "banana" 2020. 1. 1.
R에서 column 접근 시 $없이 사용하는 방법 attach 함수 R에서 column 접근 시 $없이 사용하는 방법 attach 함수 데이터프레임이나 리스트를 사용할 때, 원하는 column에 접근하기 위해서는 데이터프레임이름$열이름 의 형식으로 접근해야하는데 번거로운 경우가 있습니다. 이럴 때 사용하는 함수가 attach함수입니다. 데이터프레임을 하나 정의합시다. > md=data.frame(c(1,2,3),c("a","b","c"))> names(md)=c("mynum","mychar")> md mynum mychar1 1 a2 2 b3 3 c 이 데이터프레임의 두번째 열이 char에 접근해보겠습니다. > md$mychar[1] a b cLevels: a b c mychar이라고 입력하면 아래와 같은 오류메시지가 뜹니다. > mycharError: object 'm.. 2019. 12. 30.
R 데이터 전처리(누락데이터 처리) R 데이터 전처리(누락데이터 처리) R에서는 누락데이터(NA)를 다루는 네가지 함수를 제공합니다. na.fail(object, ...)na.omit(object, ...)na.exclude(object, ...)na.pass(object, ...) 설명을 위해 누락데이터를 가진 데이터프레임을 하나 정의합시다. > a=c(1,2,3)> b=c(10,20,NA)> md=data.frame(a,b)> md a b1 1 102 2 203 3 NA #1. na.fail na.fail 은 결측값이 있는 경우 Error를 반환합니다. > na.fail(md)Error in na.fail.default(md) : 객체안에 결측값들이 있습니다 #2. na.omit na.omit 은 결측값이 생략된 결과를 반환합니다. 보.. 2019. 12. 30.
R에서 함수 만드는 방법 R에서 함수 정의하고 바로 사용하는 방법 아래와 같은 형식으로 정의합니다. 함수이름 2019. 12. 21.
R 패키지 데이터 불러오는 방법 R에서 제공하는 내장 데이터셋 말고, 설치한 패키지에서 데이터를 제공하는 경우가 있습니다. 예를들어 MASS라는 패키지에서 제공하는 데이터들을 불러오는 방법은 아래와 같습니다. > data(package="MASS")$results[,3] [1] "Aids2" "Animals" "Boston" "Cars93" "Cushings" "DDT" "GAGurine" "Insurance" "Melanoma" "OME" [11] "Pima.te" "Pima.tr" "Pima.tr2" "Rabbit" "Rubber" "SP500" "Sitka" "Sitka89" "Skye" "Traffic" [21] "UScereal" "UScrime" "VA" "abbey" "accdeaths" "anorexia" "bacteri.. 2019. 12. 21.
[R] 패키지에서 제공하는 데이터 확인하는 방법 (+데이터목록 변수저장) [R] 패키지에 있는 데이터 확인하는 방법 (+데이터목록 변수저장) 우리가 설치하는 패키지마다 내장 데이터가 있습니다. 패키지가 제공하는 내장데이터 목록을 출력하고 싶을 때 사용하는 명령어를 알아봅시다. MASS라는 패키지에 있는 데이터셋이 궁금했습니다. R 콘솔 창에 아래와 같이 입력합니다. > data(package="MASS") 새 창에 데이터 목록과 설명이 출력됩니다. 데이터 리스트가 어떤 변수에 저장되는 것이 아니라 새 창에 설명이 뜨는 형태입니다. 만약 MASS라는 패키지에 있는 데이터의 이름들만 변수에 저장하고 싶다면 어떻게 해야 할까요? 먼저 MASS 데이터의 구조를 파악해야 합니다. 아래와 같이 변수에 저장하고, 변수에 str함수를 적용해봅시다. > md=data(package="MASS.. 2019. 12. 21.
R에서 데이터를 txt, csv 로 저장하는 방법 R에서 데이터를 txt, csv 로 저장하는 방법 먼저 데이터를 하나 만들어봅시다. num=c(1,2,3)char=c("a","b","c")log=c(TRUE,TRUE,FALSE) mydf=data.frame(num,char,log) > mydf num char log1 1 a TRUE2 2 b TRUE3 3 c FALSE txt 형태로 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제.. 2019. 12. 21.
[R] 패키지 안에 있는 함수 목록 보는 방법 [R] 패키지 안에 있는 함수 목록 보는 방법 R에서 패키지를 로드하여 몇개의 함수들을 사용하다 보면 이런 궁금증이 생깁니다. 패키지에서 제공하는 모든 함수 목록을 볼 수는 없을까? 방법이 있습니다. 예를들어 base 패키지에서 제공하는 모든 함수를 보고 싶다면 아래와 같은 명령어를 입력해주면 됩니다. ls("package:base") 먼저 함수의 개수 먼저 확인해봅시다. > length(ls("package:base"))[1] 1225 함수가 무려 1225개나 있네요. 한번 실행...해봅시다. ls("package:base") 라고 입력하시면 예쁘지 않게 뜰거에요. 아래와 같은 명령어로 대신합시다. 엑셀과 같은 표를 출력해줍니다. > View(ls("package:base")) 1 -2 -.Date3 .. 2019. 12. 21.
R 비교연산자 < <= > >= == != R 비교연산자 == 같음 != 같지 않음 = 크거나 같음 사용예 : 인덱싱 X의 원소 중 2보다 큰 원소만 반환 X=c(1,2,3,4,5) Y=X[X>2] > Y [1] 3 4 5 사용예 : if문 if문의 조건으로 같다(==) 혹은 다르다(!==) 라는 비교연산자 사용 a=0 for (i in 1:3) { if(i==1){a=a+1} if(i!=1){a=a*2} } > a [1] 4 2019. 12. 13.
R 데이터프레임 열별 누락 데이터 개수 확인 R 데이터프레임 열별 누락 데이터 개수 확인 #데이터 정의 data1=c(1,2,3,NA,5) data2=c(NA,2,3,NA,5) data3=c(NA,NA,NA,4,5) #데이터 프레임 정의 my_df=data.frame(data1,data2,data3) > my_df data1 data2 data3 1 1 NA NA 2 2 2 NA 3 3 3 NA 4 NA NA 4 5 5 5 5 #apply 함수를 이용하여 누락데이터 수 계산 #sum 함수 안에 다시 is.na 함수를 적용한 것이라, 아래와 같은 형식 사용 apply(my_df,2,function(x) sum(is.na(x))) > apply(my_df,2,function(x) sum(is.na(x))) data1 data2 data3 1 2 3 2019. 12. 12.
R 데이터를 스프레드시트 창에서 열어주는 함수, View() R 데이터를 스프레드시트 창에서 열어주는 함수 #1. 형식 View(x, title) #2. 예제 > View(mtcars) 2019. 12. 2.
R 함수의 인수와 초기값을 알려주는 함수, args() R 함수의 인수와 초기값을 알려주는 함수 #1. 형식 args(name) #2. 예제 > args(matrix)function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL) NULL 2019. 11. 30.
R에 미리 정의되어 있는 상수들 (LETTERS, letters, month.abb, month.name, pi) R에 미리 정의되어 있는 상수들 (LETTERS, letters, month.abb, month.name, pi) built-in constant라고 부릅니다. LETTERSlettersmonth.abbmonth.namepi > LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z" > letters [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s" "t" "u" "v" "w" "x" "y" "z" > month.abb [1] "Jan" "Feb" "Mar" "A.. 2019. 11. 30.
자료형의 특수형태 (NULL, NA, NaN, Inf, -Inf) 자료형의 특수형태 (NULL, NA, NaN, Inf, -Inf) R에는 자료형의 특수형태를 제공합니다. 수 계산결과로 나왔지만 정의가 되지 않거나, 무한대를 나타내거나, 결측치를 나타내는 등의 특수한 상황에서 사용됩니다. NULL이라는 자료형을 제외하면, 나머지 특수형태들은 숫자형이나 논리형에 속합니다. 1. NULL2. NA3. NaN4. Inf, -Inf 1. NULL 설명 : 값이 없다자료형 : NULL형 a=NULL > class(a)[1] "NULL" > mode(a)[1] "NULL" > str(a) NULL > typeof(a)[1] "NULL" > is.null(a)[1] TRUE 2. NA 설명 : 결측값자료형 : 논리형 a=NA > class(a)[1] "logical" > mode(.. 2019. 11. 29.
R 논리형(logical) 정의하기, 확인하기 R 논리형(logical) 정의하기, 확인하기 #1. 복소수형 정의하기 a=c(TRUE,FALSE) TRUE, FALSE 대신 T,F를 사용해도 됩니다. #2. 복소수형 확인하기 class(a)mode(a)str(a)typeof(a)is.logical(a) > 실행 결과 > class(a)[1] "logical" > mode(a)[1] "logical" > str(a) logi [1:2] TRUE FALSE > typeof(a)[1] "logical" > is.logical(a)[1] TRUE 2019. 11. 29.
R 복소수형(complex)정의하기, 확인하기 R 복소수형(complex) 정의하기, 확인하기 #1. 복소수형 정의하기 a=c(1+3i,2+5i) #2. 복소수형 확인하기 class(a)mode(a)str(a)typeof(a)is.numeric(a)is.complex(a) > 실행 결과 > class(a)[1] "complex" > mode(a)[1] "complex" > str(a) cplx [1:2] 1+3i 2+5i > typeof(a)[1] "complex" > is.numeric(a)[1] FALSE > is.complex(a)[1] TRUE 2019. 11. 29.
R 숫자형(numeric) 중 정수형(integer)정의하기, 확인하기 R 숫자형(numeric) 중 정수형(integer)정의하기, 확인하기 #1. 정수형 정의하기 a=c(1L,2L,3L) #2. 정수형 확인하기 class(a)mode(a)str(a)typeof(a)is.character(a) >실행결과 > class(a)[1] "integer" > mode(a)[1] "numeric" > str(a) int [1:3] 1 2 3 > typeof(a)[1] "integer" > is.numeric(a)[1] TRUE > is.double(a)[1] FALSE > is.integer(a)[1] TRUE 2019. 11. 29.
R 숫자형(numeric) 중 실수형(double)정의하기, 확인하기 R 숫자형(numeric) 중 실수형(double)정의하기, 확인하기 #1. 실수형 정의하기 a=c(1,2,3) #2. 실수형 확인하기 class(a)mode(a)str(a)typeof(a)is.character(a) >실행결과 > class(a)[1] "numeric" > mode(a)[1] "numeric" > str(a) num [1:3] 1 2 3 > typeof(a)[1] "double" > is.numeric(a)[1] TRUE > is.double(a)[1] TRUE > is.integer(a)[1] FALSE 2019. 11. 29.
R 문자형(character)정의하기, 확인하기 R 문자형(character)정의하기, 확인하기 1. 문자형 정의하기 a=c("hi","123","good") #2. 문자형 확인하기 class(a)mode(a)str(a)typeof(a)is.character(a) > 실행결과 > class(a)[1] "character" > mode(a)[1] "character" > str(a) chr [1:3] "hi" "123" "good" > typeof(a)[1] "character" > is.character(a)[1] TRUE 2019. 11. 29.
R 설치버전 확인하는 방법 R 설치버전 확인하는 방법 R에서 설치버전을 확인하는 방법은 세가지 방법이 있습니다. 1. package_version(R.version) package_version 함수를 이용하면 간단하게 버전이름만 볼 수 있습니다. 아래와 같이 사용합니다. > package_version(R.version) [1] ‘3.5.0’ 2. R.version 또는 version R.version 또는 version 이라는 명령어를 입력하면, 운영체제 설치년도 등 다양한 정보를 볼 수 있습니다. 아래에서 두번째 줄에 버전이 쓰여있습니다. 아래와 같이 사용합니다. > R.version _ platform x86_64-w64-mingw32 arch x86_64 os mingw32 system x86_64, mingw32 sta.. 2019. 11. 29.
R 에서 벡터 정의, 원소 이름 지정 R 에서 벡터 정의, 원소 이름 지정 1. 스칼라 정의 R에서 스칼라는 원소의 개수가 1인 벡터입니다. 따라서 벡터가 스칼라를 포함하는 개념입니다. 스칼라는 아래와 같이 정의합니다. > a=c(3) > a [1] 3 원소가 1개인 경우에는 c를 생략해줄 수 있습니다. > a=3 > a [1] 3 2. 벡터 정의 벡터는 아래와 같이 정의합니다. > a=c(1,2,3) > a [1] 1 2 3 괄호 앞에 쓰여진 c는 concatenate(연결된,연쇄된)의 줄임말입니다. 벡터는 숫자형 뿐 아니라 문자형,논리형으로도 정의가 가능합니다. > v1=c("a","b","c")> v1[1] "a" "b" "c" > v2=c(TRUE,TRUE,FALSE)> v2[1] TRUE TRUE FALSE 만약 숫자와 문자가 둘다.. 2019. 11. 29.
R 자동으로 색 설정해주는 함수모음 (rainbow, heat, terrain, topo, cm) R 자동으로 색 설정해주는 함수모음 #1. rainbow 함수 rainbow(n, s = 1, v = 1, start = 0, end = max(1, n - 1)/n, alpha = 1) HSV라고 색을 표현하는 방식이 있습니다. 변수가 3개라 색 공간이라고도 하는데, H는 색상 S는 채도 V는 명도입니다. rainbow에서는 H인 색상이 n개 지정되고, 채도와 명도를 s와 v라는 옵션으로 입력할 수 있습니다. s가 1에 가까울수록 색이 선명해지고 0에 가까울 수록 엷어집니다. v는 1에 가까울 수록 밝아지고 0에 가까울수록 색이 어두워집니다. alpha는 투명도입니다. s : 채도v : 명도alpha : 투명도 >예시 my_col=rainbow(10,s=0.2)pie(rep(1,10), col = my.. 2019. 11. 28.
[R] 반올림, 버림, 올림 [R] 반올림, 버림, 올림 #1. 반올림 round(숫자, 소수점 자리수) #2. 올림 ceiling(숫자) 정수로 올림 #3. 버림 floor(숫자) 정수로 버림 2019. 11. 28.
반응형