Introduksjon til R-pakker

Pakken er en samling av funksjoner og datasett. Pakker er med på å forbedre funksjonaliteten på et programmeringsspråk. Hvis vi ønsker å lagre og behandle databaser (dvs. SQL som funksjonaliteter ved bruk av datarammer), kan vi bruke dplyr-pakken i R. Pakker inneholder også dokumentasjon for hvordan du bruker funksjonene og datasettene i en gitt pakke.

Hvor finner vi pakker?

Pakker er tilgjengelige på internett gjennom forskjellige kilder. Imidlertid er det visse klarerte lagringssteder der vi kan laste ned pakkene.

Her er de to viktige depotene som er tilgjengelige online.

  • CRAN (Comprehensive R Archive Network): Dette er det offisielle R-samfunnet med et nettverk av FTP og webservere som inneholder den nyeste koden og dokumentasjonen til R. Før du legger ut pakkene dine på nettet går den gjennom en serie tester som overholder CRAN-policyen .
  • GitHub: GitHub er et annet kjent depot, men ikke spesifikt for R. Nettsamfunnet kan dele sine pakker med andre mennesker, og det brukes til versjonskontroll er bra. GitHub er en åpen kildekode og har ingen vurderingsprosesser.

Liste over nyttige R-pakker

Det er flere pakker i R og kan lastes ned fra CRAN eller GitHub. Nedenfor er pakkene som kan brukes til spesifikke formål.

1. Laster inn dataene fra eksterne kilder

  • Haven: R leser og skriver data fra SAS.
  • DBI: T o etablere kommunikasjon mellom relasjonsdatabasen og R.
  • RSQlite: Den brukes til å lese data fra relasjonsdatabaser.

2. Datamanipulering

  • Dplyr: Det brukes til datamanipulering som underinnstilling, gir snarveier for å få tilgang til data og genererer sql-spørsmål.
  • Tidyr - Den brukes til å konvertere data til bittesmå formater.
  • stringr - manipulere strenguttrykk og karakterstrenger.
  • lubridate- Å jobbe med data og tid.

3. Datavisualisering

  • Rgl: Å jobbe med 3D-visualiseringer.
  • ggvis: Å lage og bygge grammatikk av grafikk.
  • googlevis: For å bruke google visualiseringsverktøy i R.

4. Nettbaserte pakker

  1. XML: For å lese og skrive XML-dokumenter i R.
  2. Httpr: Arbeid med http-tilkoblinger.
  3. Jsonlite: For å lese json datatabeller.

Innhenting av R-pakker

Vi kan sjekke tilgjengelige pakker som er i R ved å bruke koden nedenfor.

  • available.packages (): Det er omtrent 5200 pakker tilgjengelig i CRAN-nettverket.

CRAN har oppgavevisninger som grupperer pakker under et bestemt emne.

Installere R-pakker

Vi kan installere pakker direkte gjennom IDE eller gjennom kommandoer. For å installere pakker bruker vi funksjonen nedenfor og spesifiserer pakkenavnet.

syntaks:

install.packages()

Kode:

install.packages(“ggplot2”)

Koden ovenfor installerer ggplot2-pakken og eventuelle avhengige pakker.

Vi kan installere flere pakker om gangen ved å spesifisere pakkenes navn under en tegnvektor.

syntaks:

install.packages(c(“package 1”, ”package 2”, ”package 3”))

Kode:

install.packages(c(“ggplot2”, ”slidify”, ”deplyr”))

Installere ved bruk av R Studio

Fordelen med å bruke et R-studio er at det er GUI (Grafisk brukergrensesnitt). Vi kan velge pakker som skal installeres og kilden til den.

Vi kan gå til verktøy -> Installer pakker.

Laster inn R-pakker

Etter å ha installert R-pakken må vi laste dem inn i R for å begynne å bruke de installerte pakkene.

Vi bruker funksjonen nedenfor for å laste inn pakkene.

syntaks:

library(package name)

Merk: Pakkenavnet trenger ikke oppgis i tilbud.

Kode:

library(ggplot2)

Det er visse pakker som viser meldinger når de er lastet inn. Noen av dem, ikke. Vi kan se detaljene i biblioteket installert ved hjelp av koden nedenfor.

Kode:

library(ggplot2)
search()

Produksjon:

“Pakke: gitter” “pakke: ggplot2” “pakke: merker”

“Pakke: knitr” “pakke: skyv” “verktøy: rstudio”

Lage din egen pakke

Før vi lager vår egen pakke. Vi bør huske sjekklisten nedenfor før vi fortsetter med å lage en pakke.

  • Organisering av koden er noe av det viktigste når du skriver kode i pakken. Vi mister halvparten av tiden på å søke etter kodeplassering i stedet for å forbedre koden. Legg alle filene i en mappe som er lett tilgjengelig.
  • Å dokumentere koden hjelper deg å forstå formålet med koden. Når vi ikke besøker koden ofte, glemmer vi hvorfor vi har skrevet koden på en bestemt måte. Det kan også hjelpe folk til å forstå koden din bedre når de blir delt med dem.
  • Deling av skriptene via e-post har blitt arkaisk. Den enkle måten er å laste opp koden og distribuere den på GitHub. Det er mulig du får tilbakemeldinger som kan hjelpe deg med å forbedre koden.

For å lage din egen pakke, må vi installere devtools-pakken.

Kode:

install.packages("devtools")

For å hjelpe med dokumentasjonen kan vi bruke pakken nedenfor.

Kode:

install.packages("roxygen2")

Etter å ha installert pakkeutstyret. Du kan lage din egen pakke.

Kode:

devtools::create ("packagename")

I stedet for “pakkenavn”, kan du oppgi navnet du ønsker. Du kan nå legge til funksjonene dine under denne pakken.

Du kan opprette samme filnavn som ditt funksjonsnavn.

syntaks:

Devtools:create(“firstpackage”)

Distribuere pakken

Du kan distribuere pakken din på github ved å bruke devtools-pakken.

Vi bruker koden nedenfor for å distribuere pakken vår på github.

Kode:

devtools::install_github("yourusername/firstpackage")

Du kan gi github-brukernavnet og pakkenavnet du har opprettet ovenfor.

Her er de nødvendige filene for en pakke

  • funksjoner
  • dokumentasjon
  • Data

Når vi har alle de ovennevnte filene, kan vi legge dem ut i depotet.

Anbefalte artikler

Dette er en guide til R-pakker. Her diskuterer vi listen over nyttige R-pakker, installerer pakker ved bruk av R studio og lager din egen pakke, etc. Du kan også se på følgende artikler for å lære mer -

  1. Hva er R-programmeringsspråk?
  2. Karrierer i R-programmering
  3. R-programmering vs Python
  4. MySQL vs SQLite
  5. Liste over R-pakker

Kategori: