본문 바로가기
반응형

2. 데이터36

R에서 엑셀 시트 이름 불러오는 방법 라이브러리는 readxl 을 사용합니다. library(readxl) 엑셀의 시트 이름을 불러올 때는 excel_sheets 함수를 사용합니다. excel_sheets(파일경로) 2022. 10. 27.
[R 내장데이터 설명] quakes 데이터 1. 설명 몸파크기 MB>4.0 인 1000개의 지진의 위치데이터이다. 1964년 이래로 피지(Fiji) 큐브 근처에서 발생한 지진입니다. 2. 변수 5개의 변수, 1000개의 관측 Latitude(위도) of event Longitude(경도) Depth (km) Richter Magnitude(리히터 규모) Number of stations reporting(관측소 수) 3. 데이터 데이터 형식 : data.frame > str(quakes) 'data.frame':1000 obs. of 5 variables: $ lat : num -20.4 -20.6 -26 -18 -20.4 ... $ long : num 182 181 184 182 182 ... $ depth : int 562 650 42 626.. 2020. 12. 31.
[R 내장데이터 설명] warpbreaks 데이터 1. 설명 실의 종류와 실의 장력에 따른 warp breaks 입니다. warp breaks 는 실의 끊김 횟수라고 합니다. 2. 변수 독립변수 : 실의 종류(범주형), 실의 장력(범주형) 종속변수 : warpbreaks (연속형) 3. 데이터 데이터 형식 : data.frame > str(warpbreaks) 'data.frame':54 obs. of 3 variables: $ breaks : num 26 30 54 25 70 52 51 26 67 18 ... $ wool : Factor w/ 2 levels "A","B": 1 1 1 1 1 1 1 1 1 1 ... $ tension: Factor w/ 3 levels "L","M","H": 1 1 1 1 1 1 1 1 1 2 ... > warpbre.. 2020. 12. 25.
[R 내장데이터 설명] airquality 데이터 1. 설명 153일 동안의 공기 질(air quaility) 측정데이터. 2. 변수 서로 짝지어진 6개의 변수 Ozone : 평균 오존량 Solar.R : 태양 복사 wind : 평균 풍속 Temp : 최대 온도 Month : 월 Day : 일 3. 데이터 데이터 형식 : data.frame > str(airquality) 'data.frame':153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8 NA ... $ Solar.R: int 190 118 149 313 NA NA 299 99 19 194 ... $ Wind : num 7.4 8 12.6 11.5 14.3 14.9 8.6 13.8 20.1 8.6 ... $ Temp : int 67.. 2020. 12. 15.
[R 내장데이터 설명] PlantGrowth 데이터 1. 설명 대조군, 처리1, 처리2 의 결과를 비교함. 결과는 나무의 무게임. 2. 변수 weight 와 group 이라는 두가지 변수. weight : 연속형 group : 범주형 (ctrl,trt1,trt2) 3. 데이터 데이터 형식 : data.frame > str(PlantGrowth) 'data.frame':30 obs. of 2 variables: $ weight: num 4.17 5.58 5.18 6.11 4.5 4.61 5.17 4.53 5.33 5.14 ... $ group : Factor w/ 3 levels "ctrl","trt1",..: 1 1 1 1 1 1 1 1 1 1 ... > PlantGrowth weight group 1 4.17 ctrl 2 5.58 ctrl 3 5.18 .. 2020. 12. 15.
R에서 MYSQL 데이터 읽는 방법 R에서 MYSQL 데이터를 읽을 때는 RMySQL 패키지를 사용합니다. 먼저 패키지를 설치하고 불러옵시다. install.packages("RMySQL") library("RMySQL") MYSQL 데이터를 읽어올 때는 dbConnect 함수를 사용합니다. 아래와 같은 형식으로 사용합니다. data 2020. 12. 15.
[R 내장데이터 설명] mtcars 데이터 한줄요약 : 32행 11열의 데이터프레임 R 내장데이터를 잘 알아두면 유용하게 사용됩니다. 여러 책이나 예제들에서도 내장데이터를 사용하고 있어 공부하는데도 도움이 됩니다. 오늘은 내장데이터 중 mtcars 데이터를 알아봅시다. 먼저 help(mtcars) 를 입력하면, mtcars 데이터의 설명을 볼 수 있습니다. 이 중 description(설명)을 번역하면 아래와 같습니다. 1974년 모터트랜드 US 메거진에서 가져온 데이터입니다. 32 종 자동차의 10가지 디자인과 성능특성과 연료소모량입니다. str 함수를 적용해봅시다. > str(mtcars) 'data.frame':32 obs. of 11 variables: $ mpg : num 21 21 22.8 21.4 18.7 18.1 14.3 24.4 .. 2020. 12. 12.
[R 내장데이터 설명] 타이타닉 데이터 요약 : 4개 요인을 가진 4차원 테이블 R 내장데이터를 잘 알아두면 유용하게 사용됩니다. 여러 책이나 예제들에서도 내장데이터를 사용하고 있어 공부하는데도 도움이 됩니다. 오늘은 내장데이터 중 타이타닉 데이터를 알아봅시다. 먼저 help(Titanic) 를 입력하면, 타이타닉 데이터의 설명을 볼 수 있습니다. 이 중 description(설명)을 번역하면 아래와 같습니다. 타이타닉 승객들의 운명에 대한 데이터이다. 승객 등급, 성별, 나이, 생존여부로 나뉜다. str함수를 적용해봅시다. > str(Titanic) 'table' num [1:4, 1:2, 1:2, 1:2] 0 0 35 0 0 0 17 0 118 154 ... - attr(*, "dimnames")=List of 4 ..$ Class : c.. 2020. 12. 12.
[R 내장데이터 설명] CO2 데이터 한줄요약 : 5열 84행의 데이터프레임 R 내장데이터를 잘 알아두면 유용하게 사용됩니다. 여러 책이나 예제들에서도 내장데이터를 사용하고 있어 공부하는데도 도움이 됩니다. 오늘은 내장데이터 중 CO2 데이터를 알아봅시다. 먼저 help(CO2) 를 입력하면, CO2 데이터의 설명을 볼 수 있습니다. 이 중 description(설명)을 번역하면 아래와 같습니다. CO2 데이터프레임은 80행 5열로 되어 있습니다. 돌피(Echinochloa crus-galli)라는 식물종을 이용하여 냉기에 대한 저항을 실험한 결과입니다. str함수를 적용해봅시다. > str(CO2) Classes ‘nfnGroupedData’, ‘nfGroupedData’, ‘groupedData’ and 'data.frame':84 ob.. 2020. 12. 12.
[R 내장데이터 설명] iris 데이터 한줄요약 : 5열, 150행의 데이터프레임 R 내장데이터를 잘 알아두면 유용하게 사용됩니다. 여러 책이나 예제들에서도 내장데이터를 사용하고 있어 공부하는데도 도움이 됩니다. 오늘은 내장데이터 중 iris 데이터를 알아봅시다. 먼저 help(iris) 를 입력하면, iris 데이터의 설명을 볼 수 있습니다. 이 중 description(설명)을 번역하면 아래와 같습니다. 그 유명한 iris 데이터는 cm 단위로 측정된 값들을 제공한다. 데이터는 sepal length, width 와 petal length, width 이다. iris 3종에서 각각 50개의 꽃에 대한 정보입니다. iris 3종은 setosa, versicolor, virginica 입니다. sepal 은 꽃 받침이고, petal은 꽃잎 입.. 2020. 12. 12.
[R코딩] 미국 주(state)이름 데이터 R에서는 미국 주(state)이름 데이터를 제공합니다. 먼저 주 전체이름 데이터입니다. > state.name [1] "Alabama" "Alaska" "Arizona" "Arkansas" [5] "California" "Colorado" "Connecticut" "Delaware" [9] "Florida" "Georgia" "Hawaii" "Idaho" [13] "Illinois" "Indiana" "Iowa" "Kansas" [17] "Kentucky" "Louisiana" "Maine" "Maryland" [21] "Massachusetts" "Michigan" "Minnesota" "Mississippi" [25] "Missouri" "Montana" "Nebraska" "Nevada" [29] .. 2020. 12. 12.
R 월(month) 영어이름 데이터 (Jan,Feb,...) R에서는 월(month)의 영어이름 데이터를 제공합니다. 두가지가 있습니다. 전체이름 데이터는 month.name 입니다. > month.name [1] "January" "February" "March" "April" "May" [6] "June" "July" "August" "September" "October" [11] "November" "December" 약어 데이터는 month.abb 입니다. > month.abb [1] "Jan" "Feb" "Mar" "Apr" "May" "Jun" "Jul" "Aug" "Sep" "Oct" "Nov" [12] "Dec" 2020. 12. 12.
R에서 알파벳 불러오기 R에서는 알파벳 대소문자를 내장데이터로 갖고 있습니다. 먼저 대분자데이터입니다. LETTERS 를 입력하면 됩니다. > LETTERS [1] "A" "B" "C" "D" "E" "F" "G" "H" "I" "J" "K" "L" "M" "N" "O" "P" "Q" [18] "R" "S" "T" "U" "V" "W" "X" "Y" "Z" 소문자는 소문자로 letters 를 입력합니다. > letters [1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j" "k" "l" "m" "n" "o" "p" "q" [18] "r" "s" "t" "u" "v" "w" "x" "y" "z" 2020. 12. 12.
R에서 워드 doc, docx 파일 읽기 R에서 워드 doc, docx 파일 읽기 doc 파일 읽기 워드에서 doc 파일을 읽을 때는 textreadr 패키지의 read_doc 함수를 이용합니다. 먼저 패키지를 설치하고 불러옵시다. > install.packages("textreadr")> library(textreadr) read_doc 함수를 이용하여 준비한 워드파일을 불러옵니다. 예제를 위해 exdoc.doc라는 워드파일을 생성하였습니다. 내용은 아래와 같습니다. 1234567891011hihihi 함수의 입력값으로 경로와 파일 이름을 문자열 형태로 넣으면 됩니다. > data_raw=read_doc('C:/Users/Public/exdoc.doc') 아래와 같이 각 줄을 하나의 원소로 하는 문자열백터로 불러와집니다. > data_raw[.. 2020. 12. 8.
R 텍스트 파일을 리스트로 불러오기 (scan) R 텍스트 파일을 리스트로 불러오기 (scan) 아래와 같은 텍스트파일을 만들어봅시다. 제목 : ex1내용 : kim 183 75 ALee 173 65 BPark 166 56 AB scan 함수로 불러옵시다. 각자 텍스트파일을 저장한 경로로 불러오면 됩니다. 성, 키, 몸무게, 혈액형을 각각 리스트형태로 불러오겠습니다. data1=scan("C:/Users/Public/ex1.txt",what=list(name=character(0), height=numeric(0), weight=numeric(0), btype=character(0))) > data2$name[1] "kim" "Lee" "Park" $height[1] 183 173 166 $weight[1] 75 65 56 $btype[1] "A" ".. 2020. 12. 2.
R 텍스트 파일을 벡터로 불러오기 (scan) R 텍스트 파일을 벡터로 불러오기 (scan) 아래와 같은 텍스트파일을 만들어봅시다. 제목 : ex1내용 : 12 34 5 6 7 8 scan 함수로 불러옵시다. 각자 텍스트파일을 저장한 경로로 불러오면 됩니다. 떨어진 글자들을 각각 벡터의 원소로 불러옵니다. > data=scan("C:/Users/Public/ex1.txt")Read 7 items> data[1] 12 3 4 5 6 7 8 이번에는 내용에 문자를 포함해봅시다. 제목 : ex2내용 : 12 34 5 6 7 8a b c scan 함수로 불러와봅시다. > data=scan("C:/Users/Public/ex2.txt")Error in scan("C:/Users/Public/ex2.txt") : scan() expected 'a real', .. 2020. 12. 2.
R 텍스트 파일 원하는 줄 수 만큼 읽어오기 (readLines) R 텍스트 파일 원하는 줄 수 만큼 읽어오기 (readLines) 아래와 같은 내용의 파일을 메모장으로 만들어 저장합시다. 파일 이름: my.txt내용 : 1 2 34 5 6 7 8a b c d e g 불러와봅시다. 각자 저장한 경로에서 불러오면 됩니다. readLines 함수를 사용합니다. > data=readLines("C:/Users/Public/ex1.txt") 두줄만 불러오려면 아래와 같이 입력하면 됩니다. > data=readLines("C:/Users/Public/ex1.txt",n=2)> data[1] "1 2 3" "4 5 6 7 8" 2020. 12. 2.
R에서 html 테이블 읽기 R에서 html 테이블 읽기 예시를 통해 이해합시다. R의 위키피디아 페이지에서 표를 가져와봅시다. library(rvest)library(magrittr) #html 코드 받아오기html_raw = read_html("https://en.wikipedia.org/wiki/R_(programming_language)") html_table = html_table(html_raw,fill = TRUE, header = TRUE) #2번째 테이블만 추출result = extract2(html_table,2) #새 텝에서 보기View(result) rvest 패키지에 read_html과 html_table 함수가 들어있고, magrittr 패키지에 extract2 함수가 들어있습니다. 결과는 아래와 같습니다. 2020. 12. 2.
R에서 SAS 데이터를 불러오는/저장하는 방법 R에서 SAS 데이터를 불러오는/저장하는 방법 R에서 SAS 데이터를 불러올 때는 haven 패키지의 read_sas 함수를 사용합니다. 저장할 때는 write_sas 함수를 사용합니다. 먼저 haven 패키지를 설치하고 불러옵니다. > install.packages("haven")> library(haven) SAS 데이터 불러오기 read_sas 함수의 사용 방법은 아래와 같습니다. sas 파일 이름이 mysas 라고 합시다. 이 파일을 불러와 data라는 변수에 저장하겠습니다. > data=read_sas("mysas.sas6dat") SAS 데이터 저장하기 write_sas 함수의 사용 방법은 아래와 같습니다. write_sas(데이터,경로) 2020. 12. 2.
R 데이터프레임을 엑셀 파일로 저장하기 R 데이터프레임을 엑셀 파일로 저장하기 먼저 데이터프레임을 하나 정의합시다. > mydf=data.frame(A=c(1,2,3),B=c("a","b","C"))> mydf A B1 1 a2 2 b3 3 C 데이터프레임을 엑셀로 저장할 때는 openxlsx 패키지의 write.xlsx 함수를 사용합니다. openxlsx 패키지를 설치하고 불러옵니다. > install.packages("openxlsx")> library("openxlsx") write.xlsx는 아래와 같은 형식으로 사용합니다. 다양한 옵션이 있지만 주요 옵션만 사용하였습니다. write.xlsx(저장할 데이터, sheetName="시트 이름", file="파일이름.xlsx") 실제로 사용해봅시다. > write.xlsx(mydf, she.. 2020. 12. 2.
R 데이터프레임을 CSV 파일로 저장하기 R 데이터프레임을 CSV 파일로 저장하기 먼저 데이터프레임을 하나 정의합시다. > mydf=data.frame(A=c(1,2,3),B=c("a","b","C"))> mydf A B1 1 a2 2 b3 3 C 저장하는 방법은 두가지가 있습니다. 내장함수인 write.csv 함수를 이용하는 방법과 tidyverse 세계관의 readr 패키지를 사용하는 것입니다. tidyverse 를 이용하는 것이 속도가 더 빠릅니다. 대신 또한 행이름을 출력하지 않습니다. write.csv 이용 아래와 같이 사용합니다. mydf 라는 데이터프레임을 ex1.csv 라는 파일로 저장한다는 의미입니다. > write.csv(mydf,file="ex1.csv") 이름만 입력할 경우 작업폴더에 저장됩니다. 아래와 같이 파일 경로를 .. 2020. 12. 2.
R 스튜디오에서 CSV 파일 불러오는 방법 R 스튜디오에서 CSV파일 불러오는 방법 1) File → Import Dataset → From Text (readr)... 클릭 2) Browse 에서 엑셀 파일 선택 경로에 한글 있으면 안됨. 3) 첫줄에 이름이 있는지 여부 체크, NA를 무엇으로 인식할지 선택 4) code preview 부분을 복사해서 R script 창에 붙여넣기 한 뒤 실행하면 됩니다. Import 를 눌러서 불러와도 되지만, 코드를 가져와야 수정 등이 용이하므로 복붙이 낫습니다. 2020. 12. 2.
R 스튜디오에서 엑셀파일 불러오는 방법 R 스튜디오에서 엑셀파일 불러오는 방법 1) File → Import Dataset → From Excel 클릭 2) Browse 에서 엑셀 파일 선택 경로에 한글 있으면 안됨. 3) Sheet 이름 선택, NA가 있는 경우 입력 NA를 인식하는 방식입니다. NA를 na로 입력했다면, na라고 입력하면 됩니다. 4) code preview 부분을 복사해서 R script 창에 붙여넣기 한 뒤 실행하면 됩니다. Import 를 눌러서 불러와도 되지만, 코드를 가져와야 수정 등이 용이하므로 복붙이 낫습니다. 2020. 12. 1.
[R] 특정 패키지가 제공하는 데이터를 불러오는 방법 [R] 특정 패키지가 제공하는 데이터를 불러오는 방법 특정 패키지가 제공하는 데이터를 불러올 때는 data 함수를 사용합니다. 아래와 같은 형식으로 사용합니다. data(데이터 이름 , package="패키지 이름") 예를들어 MASS라는 패키지가 제공하는 데이터 중 DDT 를 가져오기 원한다고 합시다. 그냥 DDT라고 입력하면 에러가 뜹니다. > DDTError: object 'DDT' not found 데이터를 불러와 봅시다. > data(DDT,package="MASS") 다시 DDT를 입력하면 데이터가 출력됩니다. > DDT [1] 2.79 2.93 3.22 3.78 3.22 3.38 3.18 3.33 3.34 3.06 3.07 3.56 3.08 4.64 3.34 2020. 11. 30.
[R] 작업 디렉토리 확인 및 변경 [R] 작업 디렉토리 확인 및 변경 작업 디렉토리 확인 get working directorty 의 약어 > getwd()[1] "C:/Users//Documents" 작업디렉토리 변경 set working directory 의 약어 > setwd("경로") 2020. 11. 30.
[R기초] 데이터 생성하기 (rep, seq 함수) [R기초] 데이터 생성하기 (rep, seq 함수) 1. rep 함수 rep는 반복한다는 의미인 repeat의 약어입니다. 두가지 사용법이 있습니다. rep(반복할 변수, times=전체 반복 횟수) times는 생략이 가능합니다. > rep(3,10) [1] 3 3 3 3 3 3 3 3 3 3 다른 방법은 each 옵션을 사용하는 것입니다. rep(반복할 변수, each=각 원소 반복 횟수) > rep(c(1,3),each=3)[1] 1 1 1 3 3 3 2. seq 함수 seq는 수열을 의미하는 sequence의 약어입니다. seq(시작값, 종료값, 간격) > seq(1,10,3)[1] 1 4 7 10 2020. 10. 5.
R에서 그래프 그림파일로 저장하는 방법 R에서 그래프 그림파일로 저장하는 방법 그래프를 하나 만들어봅시다. > plot(c(1,2,3),c(4,5,6),main="My plot",xlab="x",ylab="y") 그림파일을 저장해봅시다. 저장은 working directory에 됩니다. working directory를 확인합시다. >getwd()"C:/Users/hi/Documents" 원하는 경로를 working directory로 지정합니다. > setwd("C:/Users/Public") 경로가 맞게 지정되었나 확인합니다. > getwd()[1] "C:/Users/Public" 이제 png 형태로 저장해봅시다. png() 함수를 사용합니다. 배경은 투명으로 설정하겠습니다. 아래와 같이 입력합니다. png 함수를 입력하고, 이후에 plo.. 2020. 1. 28.
R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() 엑셀파일(xls, xlsx)을 R에서 불러오려면 readxl 패키지를 설치해야합니다. 먼저 패키지를 설치합시다. > install.packages("readxl") 엑셀파일을 하나 만들어봅시다. 저장한 엑셀파일의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 먼저 패키지를 불러옵니다. > library(readxl) 이제 엑셀파일을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > mydata=read_excel(".. 2020. 1. 22.
R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() csv파일은 comma-separated values 의 약자입니다. 콤마 즉 , 기호로 구분된 값이라는 뜻입니다. 메모장파일을 하나 만들어봅시다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.csv("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a=read.csv("mytxt.t.. 2020. 1. 21.
R에서 데이터(txt) 불러오는 방법, read.table() 옵션의 자세한 설명 R에서 메모장 데이터(txt) 불러오는 방법, read.table() 먼저 불러올 메모장파일을 만들겠습니다. 메모장의 내용은 아래와 같습니다. 파일 이름은 mytxt.txt 입니다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.table("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a V1 V2 V3 V41 1 2 3 42 1 2 3 43 5 6 7 .. 2020. 1. 20.
반응형