본문 바로가기
반응형

2. 데이터/1) 데이터 불러오기19

R에서 엑셀 시트 이름 불러오는 방법 라이브러리는 readxl 을 사용합니다. library(readxl) 엑셀의 시트 이름을 불러올 때는 excel_sheets 함수를 사용합니다. excel_sheets(파일경로) 2022. 10. 27.
R에서 MYSQL 데이터 읽는 방법 R에서 MYSQL 데이터를 읽을 때는 RMySQL 패키지를 사용합니다. 먼저 패키지를 설치하고 불러옵시다. install.packages("RMySQL") library("RMySQL") MYSQL 데이터를 읽어올 때는 dbConnect 함수를 사용합니다. 아래와 같은 형식으로 사용합니다. data 2020. 12. 15.
R에서 워드 doc, docx 파일 읽기 R에서 워드 doc, docx 파일 읽기 doc 파일 읽기 워드에서 doc 파일을 읽을 때는 textreadr 패키지의 read_doc 함수를 이용합니다. 먼저 패키지를 설치하고 불러옵시다. > install.packages("textreadr")> library(textreadr) read_doc 함수를 이용하여 준비한 워드파일을 불러옵니다. 예제를 위해 exdoc.doc라는 워드파일을 생성하였습니다. 내용은 아래와 같습니다. 1234567891011hihihi 함수의 입력값으로 경로와 파일 이름을 문자열 형태로 넣으면 됩니다. > data_raw=read_doc('C:/Users/Public/exdoc.doc') 아래와 같이 각 줄을 하나의 원소로 하는 문자열백터로 불러와집니다. > data_raw[.. 2020. 12. 8.
R 텍스트 파일을 리스트로 불러오기 (scan) R 텍스트 파일을 리스트로 불러오기 (scan) 아래와 같은 텍스트파일을 만들어봅시다. 제목 : ex1내용 : kim 183 75 ALee 173 65 BPark 166 56 AB scan 함수로 불러옵시다. 각자 텍스트파일을 저장한 경로로 불러오면 됩니다. 성, 키, 몸무게, 혈액형을 각각 리스트형태로 불러오겠습니다. data1=scan("C:/Users/Public/ex1.txt",what=list(name=character(0), height=numeric(0), weight=numeric(0), btype=character(0))) > data2$name[1] "kim" "Lee" "Park" $height[1] 183 173 166 $weight[1] 75 65 56 $btype[1] "A" ".. 2020. 12. 2.
R 텍스트 파일을 벡터로 불러오기 (scan) R 텍스트 파일을 벡터로 불러오기 (scan) 아래와 같은 텍스트파일을 만들어봅시다. 제목 : ex1내용 : 12 34 5 6 7 8 scan 함수로 불러옵시다. 각자 텍스트파일을 저장한 경로로 불러오면 됩니다. 떨어진 글자들을 각각 벡터의 원소로 불러옵니다. > data=scan("C:/Users/Public/ex1.txt")Read 7 items> data[1] 12 3 4 5 6 7 8 이번에는 내용에 문자를 포함해봅시다. 제목 : ex2내용 : 12 34 5 6 7 8a b c scan 함수로 불러와봅시다. > data=scan("C:/Users/Public/ex2.txt")Error in scan("C:/Users/Public/ex2.txt") : scan() expected 'a real', .. 2020. 12. 2.
R 텍스트 파일 원하는 줄 수 만큼 읽어오기 (readLines) R 텍스트 파일 원하는 줄 수 만큼 읽어오기 (readLines) 아래와 같은 내용의 파일을 메모장으로 만들어 저장합시다. 파일 이름: my.txt내용 : 1 2 34 5 6 7 8a b c d e g 불러와봅시다. 각자 저장한 경로에서 불러오면 됩니다. readLines 함수를 사용합니다. > data=readLines("C:/Users/Public/ex1.txt") 두줄만 불러오려면 아래와 같이 입력하면 됩니다. > data=readLines("C:/Users/Public/ex1.txt",n=2)> data[1] "1 2 3" "4 5 6 7 8" 2020. 12. 2.
R에서 html 테이블 읽기 R에서 html 테이블 읽기 예시를 통해 이해합시다. R의 위키피디아 페이지에서 표를 가져와봅시다. library(rvest)library(magrittr) #html 코드 받아오기html_raw = read_html("https://en.wikipedia.org/wiki/R_(programming_language)") html_table = html_table(html_raw,fill = TRUE, header = TRUE) #2번째 테이블만 추출result = extract2(html_table,2) #새 텝에서 보기View(result) rvest 패키지에 read_html과 html_table 함수가 들어있고, magrittr 패키지에 extract2 함수가 들어있습니다. 결과는 아래와 같습니다. 2020. 12. 2.
R에서 SAS 데이터를 불러오는/저장하는 방법 R에서 SAS 데이터를 불러오는/저장하는 방법 R에서 SAS 데이터를 불러올 때는 haven 패키지의 read_sas 함수를 사용합니다. 저장할 때는 write_sas 함수를 사용합니다. 먼저 haven 패키지를 설치하고 불러옵니다. > install.packages("haven")> library(haven) SAS 데이터 불러오기 read_sas 함수의 사용 방법은 아래와 같습니다. sas 파일 이름이 mysas 라고 합시다. 이 파일을 불러와 data라는 변수에 저장하겠습니다. > data=read_sas("mysas.sas6dat") SAS 데이터 저장하기 write_sas 함수의 사용 방법은 아래와 같습니다. write_sas(데이터,경로) 2020. 12. 2.
R 스튜디오에서 CSV 파일 불러오는 방법 R 스튜디오에서 CSV파일 불러오는 방법 1) File → Import Dataset → From Text (readr)... 클릭 2) Browse 에서 엑셀 파일 선택 경로에 한글 있으면 안됨. 3) 첫줄에 이름이 있는지 여부 체크, NA를 무엇으로 인식할지 선택 4) code preview 부분을 복사해서 R script 창에 붙여넣기 한 뒤 실행하면 됩니다. Import 를 눌러서 불러와도 되지만, 코드를 가져와야 수정 등이 용이하므로 복붙이 낫습니다. 2020. 12. 2.
R 스튜디오에서 엑셀파일 불러오는 방법 R 스튜디오에서 엑셀파일 불러오는 방법 1) File → Import Dataset → From Excel 클릭 2) Browse 에서 엑셀 파일 선택 경로에 한글 있으면 안됨. 3) Sheet 이름 선택, NA가 있는 경우 입력 NA를 인식하는 방식입니다. NA를 na로 입력했다면, na라고 입력하면 됩니다. 4) code preview 부분을 복사해서 R script 창에 붙여넣기 한 뒤 실행하면 됩니다. Import 를 눌러서 불러와도 되지만, 코드를 가져와야 수정 등이 용이하므로 복붙이 낫습니다. 2020. 12. 1.
[R] 특정 패키지가 제공하는 데이터를 불러오는 방법 [R] 특정 패키지가 제공하는 데이터를 불러오는 방법 특정 패키지가 제공하는 데이터를 불러올 때는 data 함수를 사용합니다. 아래와 같은 형식으로 사용합니다. data(데이터 이름 , package="패키지 이름") 예를들어 MASS라는 패키지가 제공하는 데이터 중 DDT 를 가져오기 원한다고 합시다. 그냥 DDT라고 입력하면 에러가 뜹니다. > DDTError: object 'DDT' not found 데이터를 불러와 봅시다. > data(DDT,package="MASS") 다시 DDT를 입력하면 데이터가 출력됩니다. > DDT [1] 2.79 2.93 3.22 3.78 3.22 3.38 3.18 3.33 3.34 3.06 3.07 3.56 3.08 4.64 3.34 2020. 11. 30.
[R] 작업 디렉토리 확인 및 변경 [R] 작업 디렉토리 확인 및 변경 작업 디렉토리 확인 get working directorty 의 약어 > getwd()[1] "C:/Users//Documents" 작업디렉토리 변경 set working directory 의 약어 > setwd("경로") 2020. 11. 30.
R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() R에서 엑셀(xls,xlsx)파일 불러오는 방법, read_excel() 엑셀파일(xls, xlsx)을 R에서 불러오려면 readxl 패키지를 설치해야합니다. 먼저 패키지를 설치합시다. > install.packages("readxl") 엑셀파일을 하나 만들어봅시다. 저장한 엑셀파일의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 먼저 패키지를 불러옵니다. > library(readxl) 이제 엑셀파일을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > mydata=read_excel(".. 2020. 1. 22.
R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() R에서 csv(콤마 구분 데이터)파일 불러오는 방법, read.csv() csv파일은 comma-separated values 의 약자입니다. 콤마 즉 , 기호로 구분된 값이라는 뜻입니다. 메모장파일을 하나 만들어봅시다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.csv("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a=read.csv("mytxt.t.. 2020. 1. 21.
R에서 데이터(txt) 불러오는 방법, read.table() 옵션의 자세한 설명 R에서 메모장 데이터(txt) 불러오는 방법, read.table() 먼저 불러올 메모장파일을 만들겠습니다. 메모장의 내용은 아래와 같습니다. 파일 이름은 mytxt.txt 입니다. 메모장의 경로는 아래와 같습니다. "C:/Users/Public" 먼저 working directory를 위 경로로 바꿔야합니다. 아래와 같은 코드를 실행합니다. > setwd("C:/Users/Public") 이제 메모장을 불러옵시다. read.table함수를 사용합니다. 다양한 옵션이 있지만 일단은 옵션 지정 없이 불러오겠습니다. > a=read.table("mytxt.txt") 아래와 같이 잘 불러와졌습니다. 자료구조는 data.frame입니다. > a V1 V2 V3 V41 1 2 3 42 1 2 3 43 5 6 7 .. 2020. 1. 20.
R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 R에서 데이터 불러올 때, 파일을 직접 선택하는 창을 띄우는 방법 아래 명령어를 입력하면, 파일을 선택할 수 있는 탐색창이 뜹니다. read.table(file.choose(),header=TRUE) 2020. 1. 4.
[R] 패키지에서 제공하는 데이터 확인하는 방법 (+데이터목록 변수저장) [R] 패키지에 있는 데이터 확인하는 방법 (+데이터목록 변수저장) 우리가 설치하는 패키지마다 내장 데이터가 있습니다. 패키지가 제공하는 내장데이터 목록을 출력하고 싶을 때 사용하는 명령어를 알아봅시다. MASS라는 패키지에 있는 데이터셋이 궁금했습니다. R 콘솔 창에 아래와 같이 입력합니다. > data(package="MASS") 새 창에 데이터 목록과 설명이 출력됩니다. 데이터 리스트가 어떤 변수에 저장되는 것이 아니라 새 창에 설명이 뜨는 형태입니다. 만약 MASS라는 패키지에 있는 데이터의 이름들만 변수에 저장하고 싶다면 어떻게 해야 할까요? 먼저 MASS 데이터의 구조를 파악해야 합니다. 아래와 같이 변수에 저장하고, 변수에 str함수를 적용해봅시다. > md=data(package="MASS.. 2019. 12. 21.
R 내장데이터 3줄씩 한번에 모아보기 R 내장데이터 3줄씩 한번에 모아보기 R에서는 버전 3.6.2 기준 104개의 내장데이터를 제공합니다. 내장데이터의 개수를 확인하는 방법은 data()에 str함수를 적용하면 됩니다. > str(data())List of 4 $ title : chr "Data sets" $ header : NULL $ results: chr [1:104, 1:4] "datasets" "datasets" "datasets" "datasets" ... ..- attr(*, "dimnames")=List of 2 .. ..$ : NULL .. ..$ : chr [1:4] "Package" "LibPath" "Item" "Title" $ footer : chr "Use ‘data(package = .packages(all.av.. 2019. 11. 28.
R에서 기본 제공하는 내장 데이터 가져오는 방법, data() R에서 기본 제공하는 내장 데이터 가져오는 방법, data() R에서는 datasets이라는 패키지가 내장되어 있고, 쓸만한 데이터들을 상당 수 제공합니다. 아래 명령어를 콘솔창에 입력하면 새로운 창에 사용 가능한 데이터 목록과 각 데이터에 대한 간단한 설명이 출력됩니다. > data() Data sets in package ‘datasets’: AirPassengers Monthly Airline Passenger Numbers 1949-1960BJsales Sales Data with Leading IndicatorBJsales.lead (BJsales) Sales Data with Leading IndicatorBOD Biochemical Oxygen DemandCO2 Carbon Dioxide U.. 2019. 11. 28.
반응형