본문 바로가기
2. 데이터/1) 데이터 불러오기

R에서 워드 doc, docx 파일 읽기

by makhimh 2020. 12. 8.
반응형

R에서 워드 doc, docx 파일 읽기



doc 파일 읽기


워드에서 doc 파일을 읽을 때는 textreadr 패키지의 read_doc 함수를 이용합니다. 


먼저 패키지를 설치하고 불러옵시다. 


> install.packages("textreadr")

> library(textreadr)


read_doc 함수를 이용하여 준비한 워드파일을 불러옵니다. 예제를 위해 exdoc.doc라는 워드파일을 생성하였습니다. 내용은 아래와 같습니다. 


123

4567

891011

hihihi


함수의 입력값으로 경로와 파일 이름을 문자열 형태로 넣으면 됩니다. 


> data_raw=read_doc('C:/Users/Public/exdoc.doc')


아래와 같이 각 줄을 하나의 원소로 하는 문자열백터로 불러와집니다. 


> data_raw

[1] "123"    "4567"   "891011" "hihihi"



docx 파일 읽기


위에서와 같은 패키지 textreadr 의 read_docx 함수를 사용합니다. 나머지 과정은 같습니다. 

반응형

댓글