Cum se exportă date din R
În acest tutorial, vom învăța cum să exportăm date din mediul R în diferite formate.
Pentru a exporta date pe hard disk, aveți nevoie de calea fișierului și de o extensie. În primul rând, calea este locația în care vor fi stocate datele. În acest tutorial, veți vedea cum să stocați date pe:
- Hard disk-ul
- Google Drive
- Dropbox
În al doilea rând, R permite utilizatorilor să exporte datele în diferite tipuri de fișiere. Acoperim extensia fișierului esențial:
- CSV
- xlsx
- RDS
- SAS
- SPSS
- STATA
În general, nu este dificil să exportați date din R.
În acest tutorial, veți învăța-
- Exportați pe hard disk
- Cum se exportă un DataFrame într-un fișier CSV în R
- Cum se exportă date din R în fișier Excel
- Exportul de date de la R la diferite programe software
- Exportarea datelor din R în fișierul SAS
- Cum să exportați date de la R la fișierul STATA
- Interacționați cu serviciile Cloud
- Google Drive
- Exportați în Dropbox
Exportați pe hard disk
Pentru început, puteți salva datele direct în directorul de lucru. Următorul cod imprimă calea directorului dvs. de lucru:
directory <-getwd()directory
Ieșire:
## [1] "/Users/15_Export_to_do"
În mod implicit, fișierul va fi salvat în calea de mai jos.
Pentru Mac OS:
/Users/USERNAME/Downloads/
Pentru Windows:
C:\Users\USERNAME\Documents\
Puteți, desigur, stabili o cale diferită. De exemplu, puteți schimba calea către folderul de descărcare.
Creați cadru de date
În primul rând, să importăm setul de date mtcars și să obținem media mpg și disp grupate după unelte.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Ieșire ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
Tabelul conține trei rânduri și trei coloane. Puteți crea un fișier CSV cu funcția write.csv în R.
Cum se exportă un DataFrame într-un fișier CSV în R
Sintaxa de bază a write.csv în R pentru a exporta DataFrame în CSV în R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Exemplu:
write.csv(df, "table_car.csv")
Explicarea codului
- write.csv (df, "table_car.csv"): Creați un fișier CSV pe hard disk:
- df: numele cadrului de date din mediu
- "table_car.csv": Denumiți fișierul table_car și stocați-l ca csv
Notă : Puteți utiliza funcția write.csv în R ca write.csv2 () pentru a separa rândurile cu un punct și virgulă pentru exportul R către datele CSV.
write.csv2(df, "table_car.csv")
Notă : Numai în scop pedagogic, am creat o funcție numită open_folder () pentru a deschide folderul director pentru dvs. Trebuie doar să rulați codul de mai jos și să vedeți unde este stocat fișierul CSV. Ar trebui să vedeți un nume de fișier table_car.csv pentru exportul de date R în csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Cum se exportă date din R în fișier Excel
Acum, vom învăța cum să exportăm date din R în Excel:
Exportul de date de la R la Excel este banal pentru utilizatorii de Windows și mai complicat pentru utilizatorii de Mac OS. Ambii utilizatori vor folosi biblioteca xlsx pentru a crea un fișier Excel. O mică diferență provine din instalarea bibliotecii. Într-adevăr, biblioteca xlsx folosește Java pentru a crea fișierul. Java trebuie instalat dacă nu este prezent în mașină pentru exportul de date R în Excel.
Utilizatori Windows
Dacă sunteți utilizator Windows, puteți instala biblioteca direct cu conda pentru a exporta dataframe în Excel R:
conda install -c r r-xlsx
Odată instalată biblioteca, puteți utiliza funcția write.xlsx (). Un nou registru de lucru Excel este creat în directorul de lucru pentru exportul R în datele Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Dacă sunteți utilizator Mac OS, trebuie să urmați acești pași:
- Pasul 1: Instalați cea mai recentă versiune de Java
- Pasul 2: Instalați biblioteca rJava
- Pasul 3: Instalați biblioteca xlsx
Pasul 1) Puteți descărca Java de pe site-ul oficial Oracle și îl puteți instala.
Puteți reveni la Rstudio și puteți verifica ce versiune de Java este instalată.
system("java -version")
La momentul tutorialului, cea mai recentă versiune de Java este 9.0.4.
Pasul 2) Trebuie să instalați rjava în R. Vă recomandăm să instalați R și Rstudio cu Anaconda. Anaconda gestionează dependențele dintre biblioteci. În acest sens, Anaconda se va ocupa de complexitățile instalării rJava.
În primul rând, trebuie să actualizați conda și apoi să instalați biblioteca. Puteți copia și lipi următoarele două linii de cod în terminal.
conda - conda updateconda install -c r r-rjava
Apoi, deschideți rjava în Rstudio
library(rJava)
Pasul 3) În cele din urmă, este timpul să instalați xlsx. Din nou, puteți folosi conda pentru a face acest lucru:
conda install -c r r-xlsx
La fel ca utilizatorii de Windows, puteți salva date cu funcția write.xlsx ()
library(xlsx)
Ieșire:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Exportul de date de la R la diferite programe software
Exportul de date către diferite programe este la fel de simplu ca și importarea lor. Biblioteca „haven” oferă o modalitate convenabilă de a exporta date către
- spss
- sas
- stata
În primul rând, importați biblioteca. Dacă nu aveți „refugiu”, puteți merge aici pentru al instala.
library(haven)
Fișier SPSS
Mai jos este codul pentru exportul datelor către software-ul SPSS:
write_sav(df, "table_car.sav")
Exportarea datelor din R în fișierul SAS
La fel de simplu ca spss, puteți exporta în sas
write_sas(df, "table_car.sas7bdat")
Cum să exportați date de la R la fișierul STATA
În sfârșit, biblioteca haven permite scrierea fișierului .dta.
write_dta(df, "table_car.dta")
R
Dacă doriți să salvați un cadru de date sau orice alt obiect R, puteți utiliza funcția save ().
save(df, file ='table_car.RData')
Puteți verifica fișierele create mai sus în actualul director de lucru
Interacționați cu serviciile Cloud
Nu în ultimul rând, R este echipat cu biblioteci fantastice pentru a interacționa cu serviciile de cloud computing. Ultima parte a acestui tutorial se referă la exportul / importarea fișierelor din:
- Google Drive
- Dropbox
Notă : Această parte a tutorialului presupune că aveți un cont la Google și Dropbox. Dacă nu, puteți crea rapid unul pentru - Google Drive: https://accounts.google.com/SignUp?hl=ro - Dropbox: https://www.dropbox.com/h
Google Drive
Trebuie să instalați biblioteca googledrive pentru a accesa funcția care permite interacțiunea cu Google Drive.
Biblioteca nu este încă disponibilă la Anaconda. Puteți să-l instalați cu codul de mai jos în consolă.
install.packages("googledrive")
și deschizi biblioteca.
library(googledrive)
Pentru utilizatorii non-conda, instalarea unei biblioteci este ușoară, puteți utiliza funcția install.packages („NOMUL PACHETULUI) cu numele pachetului în paranteză. Nu uitați de ''. Rețineți că R ar trebui să instaleze automat pachetul în `libPaths (). Merită să-l vedem în acțiune.
Încărcați pe Google Drive
Pentru a încărca un fișier pe Google Drive, trebuie să utilizați funcția drive_upload ().
De fiecare dată când reporniți Rstudio, vi se va solicita să permiteți accesul ordonat la Google Drive.
Sintaxa de bază a drive_upload () este
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
După ce lansați codul, trebuie să confirmați mai multe întrebări
drive_upload%<("table_car.csv", name ="table_car")
Ieșire:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Tastați 1 în consolă pentru a confirma accesul
Apoi, sunteți redirecționat către Google API pentru a permite accesul. Faceți clic pe Permiteți.
Odată ce autentificarea este finalizată, puteți părăsi browserul.
În consola Rstudio, puteți vedea rezumatul pasului făcut. Google a încărcat cu succes fișierul localizat pe Drive. Google a atribuit un ID fiecărui fișier din unitate.
Puteți vedea acest fișier în foaia de calcul Google.
drive_browse("table_car")
Ieșire:
Veți fi redirecționat către foaia de calcul Google
Importați din Google Drive
Încărcarea unui fișier din Google Drive cu ID-ul este convenabilă. Dacă știți numele fișierului, puteți obține ID-ul său după cum urmează:
Notă : În funcție de conexiunea la internet și de dimensiunea unității dvs., durează câteva ori.
x <-drive_get("table_car")as_id(x)
Ați stocat ID-ul în variabila x. Funcția drive_download () permite descărcarea unui fișier din Google Drive.
Sintaxa de bază este:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Puteți descărca în cele din urmă fișierul:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Explicarea codului
- drive_download (): Funcție de descărcare a unui fișier din Google Drive
- as_id (x): utilizați ID-ul pentru a răsfoi fișierul din Google Drive
- suprascrie = ADEVĂRAT: Dacă fișierul există, suprascrie-l, altfel executarea sa oprit Pentru a vedea numele fișierului local, poți folosi:
Ieșire:
Fișierul este stocat în directorul dvs. de lucru. Amintiți-vă, trebuie să adăugați extensia fișierului pentru a-l deschide în R. Puteți crea numele complet cu funcția paste () (adică table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Ieșire:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
În cele din urmă, puteți elimina fișierul de pe unitatea Google.
## remove filedrive_find("table_car") %>%drive_rm()
Ieșire:
Este un proces lent. Durează ștergerea
Exportați în Dropbox
R interacționează cu Dropbox prin intermediul bibliotecii rdrop2. Biblioteca nu este disponibilă și la Anaconda. Puteți să-l instalați prin consolă
install.packages('rdrop2')
library(rdrop2)
Trebuie să oferiți acces temporar la Dropbox cu acreditarea dvs. După identificare, R poate crea, elimina încărcarea și descărcarea în Dropbox.
În primul rând, trebuie să oferiți acces la contul dvs. Acreditările sunt stocate în cache pe parcursul întregii sesiuni.
drop_auth()
Veți fi redirecționat către Dropbox pentru a confirma autentificarea.
Veți primi o pagină de confirmare. O puteți închide și reveni la R
Puteți crea un folder cu funcția drop_create ().
- drop_create ('my_first_drop'): Creați un folder în prima ramură a Dropbox
- drop_create ('First_branch / my_first_drop'): Creați un folder în folderul First_branch existent.
drop_create('my_first_drop')
Ieșire:
În DropBox
Pentru a încărca fișierul .csv în Dropbox, utilizați funcția drop_upload ().
Sintaxa de bază:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Ieșire:
La DropBox
Puteți citi fișierul CSV din Dropbox cu funcția drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Ieșire:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Când ați terminat de utilizat fișierul și doriți să îl ștergeți. Trebuie să scrieți calea fișierului în funcția drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Ieșire:
De asemenea, este posibil să ștergeți un folder
drop_delete('my_first_drop')
Ieșire:
rezumat
Putem rezuma toate funcțiile din tabelul de mai jos
Bibliotecă |
Obiectiv |
Funcţie |
---|---|---|
baza |
Exportați CSV |
write.csv () |
xlsx |
Exportați excel |
write.xlsx () |
refugiu |
Exportați spss |
write_sav () |
refugiu |
Exportați sas |
write_sas () |
refugiu |
Export stata |
write_dta () |
baza |
Export R |
Salvați() |
googledrive |
Încărcați Google Drive |
drive_upload () |
googledrive |
Deschideți în Google Drive |
drive_browse () |
googledrive |
Preluare ID fișier |
drive_get (as_id ()) |
googledrive |
Descărcați din Google Drive |
download_google () |
googledrive |
Eliminați fișierul din Google Drive |
drive_rm () |
rdrop2 |
Autentificare |
drop_auth () |
rdrop2 |
Creați un folder |
drop_create () |
rdrop2 |
Încărcați în Dropbox |
drop_upload () |
rdrop2 |
Citiți CSV din Dropbox |
drop_read_csv |
rdrop2 |
Ștergeți fișierul din Dropbox |
drop_delete () |