Exportarea datelor din R: Cum se exportă datele din R în CSV, Excel

Cuprins:

Anonim

Cum se exportă date din R

În acest tutorial, vom învăța cum să exportăm date din mediul R în diferite formate.

Pentru a exporta date pe hard disk, aveți nevoie de calea fișierului și de o extensie. În primul rând, calea este locația în care vor fi stocate datele. În acest tutorial, veți vedea cum să stocați date pe:

  • Hard disk-ul
  • Google Drive
  • Dropbox

În al doilea rând, R permite utilizatorilor să exporte datele în diferite tipuri de fișiere. Acoperim extensia fișierului esențial:

  • CSV
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

În general, nu este dificil să exportați date din R.

În acest tutorial, veți învăța-

  • Exportați pe hard disk
  • Cum se exportă un DataFrame într-un fișier CSV în R
  • Cum se exportă date din R în fișier Excel
  • Exportul de date de la R la diferite programe software
  • Exportarea datelor din R în fișierul SAS
  • Cum să exportați date de la R la fișierul STATA
  • Interacționați cu serviciile Cloud
  • Google Drive
  • Exportați în Dropbox

Exportați pe hard disk

Pentru început, puteți salva datele direct în directorul de lucru. Următorul cod imprimă calea directorului dvs. de lucru:

directory <-getwd()directory

Ieșire:

## [1] "/Users/15_Export_to_do" 

În mod implicit, fișierul va fi salvat în calea de mai jos.

Pentru Mac OS:

/Users/USERNAME/Downloads/ 

Pentru Windows:

C:\Users\USERNAME\Documents\

Puteți, desigur, stabili o cale diferită. De exemplu, puteți schimba calea către folderul de descărcare.

Creați cadru de date

În primul rând, să importăm setul de date mtcars și să obținem media mpg și disp grupate după unelte.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Ieșire ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

Tabelul conține trei rânduri și trei coloane. Puteți crea un fișier CSV cu funcția write.csv în R.

Cum se exportă un DataFrame într-un fișier CSV în R

Sintaxa de bază a write.csv în R pentru a exporta DataFrame în CSV în R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Exemplu:

write.csv(df, "table_car.csv")

Explicarea codului

  • write.csv (df, "table_car.csv"): Creați un fișier CSV pe hard disk:
    • df: numele cadrului de date din mediu
    • "table_car.csv": Denumiți fișierul table_car și stocați-l ca csv

Notă : Puteți utiliza funcția write.csv în R ca write.csv2 () pentru a separa rândurile cu un punct și virgulă pentru exportul R către datele CSV.

write.csv2(df, "table_car.csv")

Notă : Numai în scop pedagogic, am creat o funcție numită open_folder () pentru a deschide folderul director pentru dvs. Trebuie doar să rulați codul de mai jos și să vedeți unde este stocat fișierul CSV. Ar trebui să vedeți un nume de fișier table_car.csv pentru exportul de date R în csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Cum se exportă date din R în fișier Excel

Acum, vom învăța cum să exportăm date din R în Excel:

Exportul de date de la R la Excel este banal pentru utilizatorii de Windows și mai complicat pentru utilizatorii de Mac OS. Ambii utilizatori vor folosi biblioteca xlsx pentru a crea un fișier Excel. O mică diferență provine din instalarea bibliotecii. Într-adevăr, biblioteca xlsx folosește Java pentru a crea fișierul. Java trebuie instalat dacă nu este prezent în mașină pentru exportul de date R în Excel.

Utilizatori Windows

Dacă sunteți utilizator Windows, puteți instala biblioteca direct cu conda pentru a exporta dataframe în Excel R:

conda install -c r r-xlsx

Odată instalată biblioteca, puteți utiliza funcția write.xlsx (). Un nou registru de lucru Excel este creat în directorul de lucru pentru exportul R în datele Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Dacă sunteți utilizator Mac OS, trebuie să urmați acești pași:

  • Pasul 1: Instalați cea mai recentă versiune de Java
  • Pasul 2: Instalați biblioteca rJava
  • Pasul 3: Instalați biblioteca xlsx

Pasul 1) Puteți descărca Java de pe site-ul oficial Oracle și îl puteți instala.

Puteți reveni la Rstudio și puteți verifica ce versiune de Java este instalată.

system("java -version")

La momentul tutorialului, cea mai recentă versiune de Java este 9.0.4.

Pasul 2) Trebuie să instalați rjava în R. Vă recomandăm să instalați R și Rstudio cu Anaconda. Anaconda gestionează dependențele dintre biblioteci. În acest sens, Anaconda se va ocupa de complexitățile instalării rJava.

În primul rând, trebuie să actualizați conda și apoi să instalați biblioteca. Puteți copia și lipi următoarele două linii de cod în terminal.

conda - conda updateconda install -c r r-rjava

Apoi, deschideți rjava în Rstudio

library(rJava)

Pasul 3) În cele din urmă, este timpul să instalați xlsx. Din nou, puteți folosi conda pentru a face acest lucru:

conda install -c r r-xlsx

La fel ca utilizatorii de Windows, puteți salva date cu funcția write.xlsx ()

library(xlsx)

Ieșire:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Exportul de date de la R la diferite programe software

Exportul de date către diferite programe este la fel de simplu ca și importarea lor. Biblioteca „haven” oferă o modalitate convenabilă de a exporta date către

  • spss
  • sas
  • stata

În primul rând, importați biblioteca. Dacă nu aveți „refugiu”, puteți merge aici pentru al instala.

library(haven) 

Fișier SPSS

Mai jos este codul pentru exportul datelor către software-ul SPSS:

write_sav(df, "table_car.sav") 

Exportarea datelor din R în fișierul SAS

La fel de simplu ca spss, puteți exporta în sas

write_sas(df, "table_car.sas7bdat")

Cum să exportați date de la R la fișierul STATA

În sfârșit, biblioteca haven permite scrierea fișierului .dta.

write_dta(df, "table_car.dta")

R

Dacă doriți să salvați un cadru de date sau orice alt obiect R, puteți utiliza funcția save ().

save(df, file ='table_car.RData')

Puteți verifica fișierele create mai sus în actualul director de lucru

Interacționați cu serviciile Cloud

Nu în ultimul rând, R este echipat cu biblioteci fantastice pentru a interacționa cu serviciile de cloud computing. Ultima parte a acestui tutorial se referă la exportul / importarea fișierelor din:

  • Google Drive
  • Dropbox

Notă : Această parte a tutorialului presupune că aveți un cont la Google și Dropbox. Dacă nu, puteți crea rapid unul pentru - Google Drive: https://accounts.google.com/SignUp?hl=ro - Dropbox: https://www.dropbox.com/h

Google Drive

Trebuie să instalați biblioteca googledrive pentru a accesa funcția care permite interacțiunea cu Google Drive.

Biblioteca nu este încă disponibilă la Anaconda. Puteți să-l instalați cu codul de mai jos în consolă.

install.packages("googledrive") 

și deschizi biblioteca.

library(googledrive)

Pentru utilizatorii non-conda, instalarea unei biblioteci este ușoară, puteți utiliza funcția install.packages („NOMUL PACHETULUI) cu numele pachetului în paranteză. Nu uitați de ''. Rețineți că R ar trebui să instaleze automat pachetul în `libPaths (). Merită să-l vedem în acțiune.

Încărcați pe Google Drive

Pentru a încărca un fișier pe Google Drive, trebuie să utilizați funcția drive_upload ().

De fiecare dată când reporniți Rstudio, vi se va solicita să permiteți accesul ordonat la Google Drive.

Sintaxa de bază a drive_upload () este

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

După ce lansați codul, trebuie să confirmați mai multe întrebări

drive_upload%<("table_car.csv", name ="table_car")

Ieșire:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Tastați 1 în consolă pentru a confirma accesul

Apoi, sunteți redirecționat către Google API pentru a permite accesul. Faceți clic pe Permiteți.

Odată ce autentificarea este finalizată, puteți părăsi browserul.

În consola Rstudio, puteți vedea rezumatul pasului făcut. Google a încărcat cu succes fișierul localizat pe Drive. Google a atribuit un ID fiecărui fișier din unitate.

Puteți vedea acest fișier în foaia de calcul Google.

drive_browse("table_car")

Ieșire:

Veți fi redirecționat către foaia de calcul Google

Importați din Google Drive

Încărcarea unui fișier din Google Drive cu ID-ul este convenabilă. Dacă știți numele fișierului, puteți obține ID-ul său după cum urmează:

Notă : În funcție de conexiunea la internet și de dimensiunea unității dvs., durează câteva ori.

x <-drive_get("table_car")as_id(x)

Ați stocat ID-ul în variabila x. Funcția drive_download () permite descărcarea unui fișier din Google Drive.

Sintaxa de bază este:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Puteți descărca în cele din urmă fișierul:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Explicarea codului

  • drive_download (): Funcție de descărcare a unui fișier din Google Drive
  • as_id (x): utilizați ID-ul pentru a răsfoi fișierul din Google Drive
  • suprascrie = ADEVĂRAT: Dacă fișierul există, suprascrie-l, altfel executarea sa oprit Pentru a vedea numele fișierului local, poți folosi:

Ieșire:

Fișierul este stocat în directorul dvs. de lucru. Amintiți-vă, trebuie să adăugați extensia fișierului pentru a-l deschide în R. Puteți crea numele complet cu funcția paste () (adică table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Ieșire:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

În cele din urmă, puteți elimina fișierul de pe unitatea Google.

## remove filedrive_find("table_car") %>%drive_rm()

Ieșire:

Este un proces lent. Durează ștergerea

Exportați în Dropbox

R interacționează cu Dropbox prin intermediul bibliotecii rdrop2. Biblioteca nu este disponibilă și la Anaconda. Puteți să-l instalați prin consolă

install.packages('rdrop2')
library(rdrop2)

Trebuie să oferiți acces temporar la Dropbox cu acreditarea dvs. După identificare, R poate crea, elimina încărcarea și descărcarea în Dropbox.

În primul rând, trebuie să oferiți acces la contul dvs. Acreditările sunt stocate în cache pe parcursul întregii sesiuni.

drop_auth()

Veți fi redirecționat către Dropbox pentru a confirma autentificarea.

Veți primi o pagină de confirmare. O puteți închide și reveni la R

Puteți crea un folder cu funcția drop_create ().

  • drop_create ('my_first_drop'): Creați un folder în prima ramură a Dropbox
  • drop_create ('First_branch / my_first_drop'): Creați un folder în folderul First_branch existent.
drop_create('my_first_drop')

Ieșire:

În DropBox

Pentru a încărca fișierul .csv în Dropbox, utilizați funcția drop_upload ().

Sintaxa de bază:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Ieșire:

La DropBox

Puteți citi fișierul CSV din Dropbox cu funcția drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Ieșire:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Când ați terminat de utilizat fișierul și doriți să îl ștergeți. Trebuie să scrieți calea fișierului în funcția drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Ieșire:

De asemenea, este posibil să ștergeți un folder

drop_delete('my_first_drop')

Ieșire:

rezumat

Putem rezuma toate funcțiile din tabelul de mai jos

Bibliotecă

Obiectiv

Funcţie

baza

Exportați CSV

write.csv ()

xlsx

Exportați excel

write.xlsx ()

refugiu

Exportați spss

write_sav ()

refugiu

Exportați sas

write_sas ()

refugiu

Export stata

write_dta ()

baza

Export R

Salvați()

googledrive

Încărcați Google Drive

drive_upload ()

googledrive

Deschideți în Google Drive

drive_browse ()

googledrive

Preluare ID fișier

drive_get (as_id ())

googledrive

Descărcați din Google Drive

download_google ()

googledrive

Eliminați fișierul din Google Drive

drive_rm ()

rdrop2

Autentificare

drop_auth ()

rdrop2

Creați un folder

drop_create ()

rdrop2

Încărcați în Dropbox

drop_upload ()

rdrop2

Citiți CSV din Dropbox

drop_read_csv

rdrop2

Ștergeți fișierul din Dropbox

drop_delete ()