본문 바로가기
반응형

분류 전체보기232

R 자료형 사이의 변환방법 (문자형,숫자형,논리형,NULL형) R 자료형 사이의 변환방법 R에서 어떤 자료형을 다른 자료형으로 바꾸는데 사용되는 함수는 as. 함수입니다. 함수의 종류는 자료형의 종류만큼 있습니다. as. 뒤에 자료형을 붙인 형태입니다. 종류는 아래와 같습니다. as.numeric() : 숫자형 벡터로 변환as.integer() : 정수형 벡터로 변환as.complex() : 복소수형 벡터로 변환as.character() : 문자형 벡터로 변환as.logical() : 논리형 벡터로 변환as.null : null형 벡터로 변환 변환이 항상 가능한 것은 아닙니다. 자료형 사이에는 우선순위가 있습니다. 문자형이 가장 우선이고 숫자형, 논리형, NULL형 순으로 이어집니다. 문자형 > 숫자형 > 논리형 > NULL 낮은 우선순위를 높은 우선순위로 바꾸는 .. 2020. 1. 28.
R에서 그래프 그림파일로 저장하는 방법 R에서 그래프 그림파일로 저장하는 방법 그래프를 하나 만들어봅시다. > plot(c(1,2,3),c(4,5,6),main="My plot",xlab="x",ylab="y") 그림파일을 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제 png 형태로 저장해봅시다. png() 함수를 사용합니다. 배경은 투명으로 설정하겠습니다. 아래와 같이 입력합니다. png 함수를 입력하고, 이후에 plo.. 2020. 1. 28.
R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() 엑셀파일(xls, xlsx)을 R에서 불러오려면 readxl 패키지를 설치해야합니다. 먼저 패키지를 설치합시다. > install.packages("readxl") 엑셀파일을 하나 만들어봅시다. 저장한 엑셀파일의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 먼저 패키지를 불러옵니다. > library(readxl) 이제 엑셀파일을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > mydata=read_excel(".. 2020. 1. 22.
R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() csv파일은 comma-separated values 의 약자입니다. 콤마 즉 , 기호로 구분된 값이라는 뜻입니다. 메모장파일을 하나 만들어봅시다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.csv("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a=read.csv("mytxt.t.. 2020. 1. 21.
R에서 데이터(txt) 불러오는 방법, read.table() 옵션의 자세한 설명 R에서 메모장 데이터(txt) 불러오는 방법, read.table() 먼저 불러올 메모장파일을 만들겠습니다. 메모장의 내용은 아래와 같습니다. 파일 이름은 mytxt.txt 입니다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.table("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a V1 V2 V3 V41 1 2 3 42 1 2 3 43 5 6 7 .. 2020. 1. 20.
R과 R Studio 다운로드 및 설치 방법 R과 R Studio 다운로드 및 설치 방법 1. R 다운로드 및 설치 방법 구글에 R download 라고 검색하면, 가장 위에 R 최신버전 다운로드 링크가 뜹니다. 가장 윗줄을 클릭하면 설치파일이 다운로드됩니다. 설치파일을 실행하고 설치를 진행합니다. mac 사용자의 경우 구글 검색어에 "download r for mac"라고 입력합니다. 2. R Studio 다운로드 및 설치 방법 파이썬의 PyCharm이나 Spyder 처럼 R에서도 R Studio 라는 IDE를 제공합니다. IDE는 Integrated Development Environment의 약어로 통합개발환경을 의미합니다. IDE는 코딩을 편하게 하도록 돕기 위해 다양한 기능과 GUI를 제공합니다. 구글에 R Studio를 검색합니다. 가장.. 2020. 1. 20.
R에서 제공하는 산술연산자 (더하기,곱하기,행렬곱 등) R에서 제공하는 산술연산자 (더하기,곱하기,행렬곱 등) R에서 제공하는 산술연산자입니다. + 더하기 - 빼기 * 곱하기 / 나누기 ^ (또는 **) 지수 승 %% 나머지 %/% 나누기의 몫을 반환 %*% 행렬의 곱셈 사칙연산은 잘 알고 있으니, 나머지 연산자들만 예시로 알아봅시다. 나머지 연산자는 연산자 앞에 있는 수를 뒤에 있는 수로 나눈 나머지를 반환해줍니다 . > 12%%5[1] 2 %/% 연산자는 나누기 결과에서 몫만 반환합니다. > 17/4[1] 4.25> 17%/%4[1] 4 행렬의 곱셈을 해봅시다. 먼저 곱셈연산자 *를 사용해봅시다. > mat1=matrix(c(1,2,3,4),nrow=2)> mat1 [,1] [,2][1,] 1 3[2,] 2 4> mat2=matrix(c(1,2,3,4),.. 2020. 1. 20.
R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형) R에서 제공하는 모든 자료형 (숫자형,복소수형,문자형,논리형,NULL형) R에서 제공하는 자료형은 큰 범주로 나눠보면 아래와 같습니다. 1) 숫자형 (정수,실수,NaN,Inf)2) 복소수형3) 문자형4) 논리형 (TRUE,FALSE,NA)5) NULL 형 1) 숫자형 (정수,실수,NA,Inf) 숫자형은 다시 정수형과 실수형으로 나눠집니다. 디폴트는 실수형입니다. 정수형을 정의하고 싶을 경우 정수 뒤에 L을 붙여주면 됩니다. > a=3> a[1] 3> b=3L> b[1] 3> c=3.1> c[1] 3.1 typeof를 이용하면 변수의 자료형을 확인할 수 있습니다. > typeof(a) [1] "double" > typeof(b) [1] "integer" > typeof(c) [1] "double" 숫자형에.. 2020. 1. 20.
R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수 R에서 여러 요인(factor)들이 결합된 요인을 만들어주는 interaction 함수 다섯 사람이 있다고 해봅시다. 다섯 사람의 성별과 혈액형은 아래와 같습니다. gender=factor(c('M','M','F','M','F'),levels=c('M','F'))b_type=factor(c('A','O','AB','B','A'),levels=c('A','O','AB','B')) interaction 함수를 적용해보겠습니다. > interaction(gender,b_type)[1] M.A M.O F.AB M.B F.A Levels: F.A M.A F.AB M.AB F.B M.B F.O M.O 위와 같이 두 요인이 결합된 요인을 반환해줍니다. level을 보면 두 요인의 level 조합으로 나올 수 있는 모.. 2020. 1. 18.
R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl() R에서 요인(factor)을 쉽게 정의할 수 있는 꿀함수 gl() gl함수를 이용하면 요인을 간편하게 정의할 수 있습니다. 아래와 같이 사용합니다. gl(요인 수, 요인 별 반복 수, 전체 수, 요인 이름) 예를들어서 남자(M)와 여자(F)로 구성된 요인을 만들고 싶다고 해봅시다. M,M,M,F,F,F 를 만들고 싶다면, gl함수를 아래와 같이 사용하면 됩니다. > gl(2,3,labels=c("M","F"))[1] M M M F F FLevels: M F 이번에는 전체 수도 입력해봅시다. 10을 입력하면, MMMFFF 가 3개씩 입력되다가 10개가 되면 입력을 멈춥니다. > gl(2,3,10,labels=c("M","F")) [1] M M M F F F M M M FLevels: M F ordered .. 2020. 1. 18.
[R 유용한 함수] 데이터의 그룹을 나눠주는 split 함수 데이터의 그룹을 나눠주는 split 함수 R에서 제공하는 split 함수는 데이터를 그룹으로 나눠줍니다. 말로 설명이 어려워서 예제를 통해 이해해봅시다. 먼저 아래와 같이 사람 열명의 이름으로 되어 있는 데이터를 만들어봅시다. name=c("KKH","LIK","JJI","AHK","BBK","SYJ","BJW","JDK","KII","SSI") 이제 이 사람들을 A,B,C 세개의 그룹으로 나눌 것입니다. 그룹 배정이 아래와 같이 되었다고 합시다. (factor가 아니라 vector 형태로 입력해도 됩니다. vector로 입력할 경우 drop 옵션 사용이 불가합니다. 이후 설명하겠습니다.) group=factor(c("A","B","A","C","C","A","B","B","A","C")) spilit .. 2020. 1. 18.
R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 아래 명령어를 입력하면, 파일을 선택할 수 있는 탐색창이 뜹니다. read.table(file.choose(),header=TRUE) 2020. 1. 4.
R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique() R에서 중복 제거하고 원소 종류만 알고 싶을 때, unique() 예를들어 아래와 같이 과일 이름데이터가 있다고 해봅시다. fruits=c("apple","apple","banana","orange","orange","melon","apple","orange","banana") 어떤 과일이 들어 있는지 종류만 알고 싶을 때는 unique 함수를 사용하면 됩니다. > unique(fruits)[1] "apple" "banana" "orange" "melon" fromLast 옵션을 TRUE로 하면, 결과를 역순으로 출력할 수도 있습니다. > unique(fruits,fromLast=TRUE)[1] "melon" "apple" "orange" "banana" 2020. 1. 1.
R에서 column 접근 시 $없이 사용하는 방법 attach 함수 R에서 column 접근 시 $없이 사용하는 방법 attach 함수 데이터프레임이나 리스트를 사용할 때, 원하는 column에 접근하기 위해서는 데이터프레임이름$열이름 의 형식으로 접근해야하는데 번거로운 경우가 있습니다. 이럴 때 사용하는 함수가 attach함수입니다. 데이터프레임을 하나 정의합시다. > md=data.frame(c(1,2,3),c("a","b","c"))> names(md)=c("mynum","mychar")> md mynum mychar1 1 a2 2 b3 3 c 이 데이터프레임의 두번째 열이 char에 접근해보겠습니다. > md$mychar[1] a b cLevels: a b c mychar이라고 입력하면 아래와 같은 오류메시지가 뜹니다. > mycharError: object 'm.. 2019. 12. 30.
R 데이터 전처리(누락데이터 처리) R 데이터 전처리(누락데이터 처리) R에서는 누락데이터(NA)를 다루는 네가지 함수를 제공합니다. na.fail(object, ...)na.omit(object, ...)na.exclude(object, ...)na.pass(object, ...) 설명을 위해 누락데이터를 가진 데이터프레임을 하나 정의합시다. > a=c(1,2,3)> b=c(10,20,NA)> md=data.frame(a,b)> md a b1 1 102 2 203 3 NA #1. na.fail na.fail 은 결측값이 있는 경우 Error를 반환합니다. > na.fail(md)Error in na.fail.default(md) : 객체안에 결측값들이 있습니다 #2. na.omit na.omit 은 결측값이 생략된 결과를 반환합니다. 보.. 2019. 12. 30.
R에서 함수 만드는 방법 R에서 함수 정의하고 바로 사용하는 방법 아래와 같은 형식으로 정의합니다. 함수이름 2019. 12. 21.
R 패키지 데이터 불러오는 방법 R에서 제공하는 내장 데이터셋 말고, 설치한 패키지에서 데이터를 제공하는 경우가 있습니다. 예를들어 MASS라는 패키지에서 제공하는 데이터들을 불러오는 방법은 아래와 같습니다. > data(package="MASS")$results[,3] [1] "Aids2" "Animals" "Boston" "Cars93" "Cushings" "DDT" "GAGurine" "Insurance" "Melanoma" "OME" [11] "Pima.te" "Pima.tr" "Pima.tr2" "Rabbit" "Rubber" "SP500" "Sitka" "Sitka89" "Skye" "Traffic" [21] "UScereal" "UScrime" "VA" "abbey" "accdeaths" "anorexia" "bacteri.. 2019. 12. 21.
[R] 패키지에서 제공하는 데이터 확인하는 방법 (+데이터목록 변수저장) [R] 패키지에 있는 데이터 확인하는 방법 (+데이터목록 변수저장) 우리가 설치하는 패키지마다 내장 데이터가 있습니다. 패키지가 제공하는 내장데이터 목록을 출력하고 싶을 때 사용하는 명령어를 알아봅시다. MASS라는 패키지에 있는 데이터셋이 궁금했습니다. R 콘솔 창에 아래와 같이 입력합니다. > data(package="MASS") 새 창에 데이터 목록과 설명이 출력됩니다. 데이터 리스트가 어떤 변수에 저장되는 것이 아니라 새 창에 설명이 뜨는 형태입니다. 만약 MASS라는 패키지에 있는 데이터의 이름들만 변수에 저장하고 싶다면 어떻게 해야 할까요? 먼저 MASS 데이터의 구조를 파악해야 합니다. 아래와 같이 변수에 저장하고, 변수에 str함수를 적용해봅시다. > md=data(package="MASS.. 2019. 12. 21.
R에서 데이터를 txt, csv 로 저장하는 방법 R에서 데이터를 txt, csv 로 저장하는 방법 먼저 데이터를 하나 만들어봅시다. num=c(1,2,3)char=c("a","b","c")log=c(TRUE,TRUE,FALSE) mydf=data.frame(num,char,log) > mydf num char log1 1 a TRUE2 2 b TRUE3 3 c FALSE txt 형태로 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제.. 2019. 12. 21.
[R] 패키지 안에 있는 함수 목록 보는 방법 [R] 패키지 안에 있는 함수 목록 보는 방법 R에서 패키지를 로드하여 몇개의 함수들을 사용하다 보면 이런 궁금증이 생깁니다. 패키지에서 제공하는 모든 함수 목록을 볼 수는 없을까? 방법이 있습니다. 예를들어 base 패키지에서 제공하는 모든 함수를 보고 싶다면 아래와 같은 명령어를 입력해주면 됩니다. ls("package:base") 먼저 함수의 개수 먼저 확인해봅시다. > length(ls("package:base"))[1] 1225 함수가 무려 1225개나 있네요. 한번 실행...해봅시다. ls("package:base") 라고 입력하시면 예쁘지 않게 뜰거에요. 아래와 같은 명령어로 대신합시다. 엑셀과 같은 표를 출력해줍니다. > View(ls("package:base")) 1 -2 -.Date3 .. 2019. 12. 21.
R 비교연산자 < <= > >= == != R 비교연산자 == 같음 != 같지 않음 = 크거나 같음 사용예 : 인덱싱 X의 원소 중 2보다 큰 원소만 반환 X=c(1,2,3,4,5) Y=X[X>2] > Y [1] 3 4 5 사용예 : if문 if문의 조건으로 같다(==) 혹은 다르다(!==) 라는 비교연산자 사용 a=0 for (i in 1:3) { if(i==1){a=a+1} if(i!=1){a=a*2} } > a [1] 4 2019. 12. 13.
R 데이터프레임 열별 누락 데이터 개수 확인 R 데이터프레임 열별 누락 데이터 개수 확인 #데이터 정의 data1=c(1,2,3,NA,5) data2=c(NA,2,3,NA,5) data3=c(NA,NA,NA,4,5) #데이터 프레임 정의 my_df=data.frame(data1,data2,data3) > my_df data1 data2 data3 1 1 NA NA 2 2 2 NA 3 3 3 NA 4 NA NA 4 5 5 5 5 #apply 함수를 이용하여 누락데이터 수 계산 #sum 함수 안에 다시 is.na 함수를 적용한 것이라, 아래와 같은 형식 사용 apply(my_df,2,function(x) sum(is.na(x))) > apply(my_df,2,function(x) sum(is.na(x))) data1 data2 data3 1 2 3 2019. 12. 12.
R에서 리스트를 벡터로 바꾸는 방법, unlist() R에서 리스트를 벡터로 바꾸는 방법, unlist() 먼저 리스트를 하나 만들겠습니다. my_list=list(c(1,2,3),c('a','b','c')) unlist함수를 적용하면, 리스트에 입력된 순서대로 벡터의 원소가 됩니다. 문자형만 있는 경우 factor로 반환됩니다. > unlist(my_list)[1] "1" "2" "3" "a" "b" "c" 저는 주로 이런 상황에 사용합니다. 데이터프레임에서 [ ] 인덱스로 열에 접근할 경우 결과가 리스트로 반환됩니다. 데이터프레임을 하나 만들어봅시다. > myd=data.frame(c1=c(1,2,3),c2=c("a","b","c")) > myd c1 c2 1 1 a 2 2 b 3 3 c 2열에 접근하여 myd_2에 저장합시다. 리스트 형태로 저장됩니다.. 2019. 12. 11.
R 문자열을 각각 원소로 만들기1 ("abcd" → "a" "b" "c" "d") R 문자열을 각각 원소로 만들기1 ("abcd" → "a" "b" "c" "d") 문자열 벡터를 만들 때, 따옴표를 매번 입력해야해서 불편합니다. a=c("a","b","c","d","e") 이런 경우 사용할 수 있는 팁을 알려드리겠습니다. 문자열 벡터를 만드는 다양한 경우에 응용이 가능합니다. 먼저 문자열을 전부 붙여서 벡터를 만들어줍니다. a=c("abcde") 이 벡터에 substring 함수를 적용합니다. > a2=substring(a,1:5,1:5) > a2 [1] "a" "b" "c" "d" "e" substring 함수의 형식은 아래와 같습니다. substring(벡터, 시작, 끝) 우리가 위에서 적용한 substring 함수는 c(1,2,3,4,5)에서 각각 시작하고, c(1,2,3,4,5.. 2019. 12. 2.
R 데이터를 스프레드시트 창에서 열어주는 함수, View() R 데이터를 스프레드시트 창에서 열어주는 함수 #1. 형식 View(x, title) #2. 예제 > View(mtcars) 2019. 12. 2.
R 함수의 인수와 초기값을 알려주는 함수, args() R 함수의 인수와 초기값을 알려주는 함수 #1. 형식 args(name) #2. 예제 > args(matrix)function (data = NA, nrow = 1, ncol = 1, byrow = FALSE, dimnames = NULL) NULL 2019. 11. 30.
R에 미리 정의되어 있는 상수들 (LETTERS, letters, month.abb, month.name, pi) R에 미리 정의되어 있는 상수들 (LETTERS, letters, month.abb, month.name, pi) built-in constant라고 부릅니다. LETTERSlettersmonth.abbmonth.namepi > LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q" "R" "S" "T" "U" "V" "W" "X" "Y" "Z" > letters [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" "r" "s" "t" "u" "v" "w" "x" "y" "z" > month.abb [1] "Jan" "Feb" "Mar" "A.. 2019. 11. 30.
[R 함수] 문자열의 일부 추출2 (substring) [R 함수] 문자열의 일부 추출2 (substring) #1. 형식 substring(text, first, last = 1000000L) text : 문자열 벡터first : 시작번호last : 끝번호 #2. 예제 substr 함수보다 복잡한 추출이 가능합니다. last에 디폴트갑이 들어가 있기 때문에 first값만 입력하면 first값 부터 데이터 끝까지를 추출합니다. > x="hello"> substring(x,2)[1] "ello" last값을 입력해줄 수도 있습니다. > x="hello"> substring(x,2,4)[1] "ell" substr 함수와의 차이점은 first와 last 값을 벡터형태로 입력할 수 있다는 것입니다. 예를들어 first 자리에 c(2,3) 을 입력해보겠습니다. > .. 2019. 11. 30.
[R 함수] 문자열의 일부 추출 (substr) [R 함수] 문자열의 일부 추출 (substr) #1. 형식 substr(x, start, stop) x : 문자형 벡터start : 시작 번호stop : 끝번호 #2. 예제 hello 에서 ell만 추출해보겠습니다. > x="hello"> substr(x,2,4)[1] "ell" 입력한 문자형 벡터의 원소가 여러개여도 가능합니다. > x=c("hello","world")> substr(x,2,4)[1] "ell" "orl" 2019. 11. 30.
[R기초] 요인(factor) 정의하는 방법 [R기초] 요인(factor) 정의하는 방법 factor는 범주형자료를 입력할 때 사용합니다. 범주형은 영어로 categorical 인데요. 카테고리형태의 데이터라는 말입니다. 예를들면 혈액형, 성별 등이 있습니다. #1. 형식 factor(x = character(), levels, labels = levels, exclude = NA, ordered = is.ordered(x), nmax = NA) x 어떤 형식의 데이터도 넣을 수 있고, 개수 제한 없음. #2. 예제 2-1) 기본예제 아래와 같이 성별데이터를 factor에 입력합니다. gender=factor(c("Male","Male","Female","Female","Female")) 아래와 같이 Level이 설정됩니다. Level은 카테고리라.. 2019. 11. 30.
반응형