Introduksjon til R-programmeringsspråk

I dagens verden er det viktig for en bedrift å forstå en stor datamengde. Å bruke regneark er ikke det beste alternativet for virksomheten i disse dager. her vil vi diskutere mer om R-programmeringsspråket.

R er et programmeringsspråk med åpen kildekode samt et programvaremiljø som brukes til statistisk analyse, grafisk representasjon og rapportering. Den ble opprettet av Ross Ihaka og Robert Gentleman. Det regnes som en dialekt av S-språket. Det brukes mye av forskere over hele verden. Det gjør det enkelt å analysere dataene mer effektivt og effektivt.

R-programmeringsspråk distribueres fritt under GNU General Public License. Det fungerer i flere operativsystemer som Unix, Linux, Windows og Mac. Filene som er nødvendige for å installere R fra de forhåndskompilerte binære versjonene distribueres fra nettstedet til Comprehensive R Archive Network (CRAN).

R-programmeringsspråk har mange funksjoner for statistisk analyse og grafiske fremstillinger.

Fordeler med å bruke R-programmeringsspråk

  • R er gratis og er den første store fordelen.
  • Du kan installere R på så mange datamaskiner du vil
  • R er lett å samarbeide og lære
  • Hvem som helst kan skrive en tilleggspakke for R
  • Gir den mest avanserte analysen
  • R har kapasitet for reproduserbar forskning. Som et resultat av dette prosjektet kan enkelt repeteres når nye data er tilgjengelige

Hvordan installere R-programmeringsspråk

Følg disse enkle trinnene for å installere R på datamaskinen.

  1. Last ned R fra nettet og åpne R-filen i nedlastingsmappen.

  1. Dobbeltklikk på filen for å åpne den. Dette tar deg til et sikkerhetsvarslingsvindu.

  1. Klikk på Kjør. Dette tar deg igjen til et vindu der du spør om du vil tillate følgende program fra en Ukjent utgiver å gjøre endringer i dette datamaskinvinduet. Klikk Ja.
  2. Det neste vinduet lar deg velge språk. Velg språket og klikk OK.
  3. Dette åpner vinduet Setup Wizard.

  1. Klikk Neste. Etter dette vil du få GNU General Public License. Les den og klikk Neste.

  1. I neste vindu velger du destinasjonsstedet. Standardplassering er Programfiler. Velg og klikk Neste.

  1. I neste vindu kan du velge komponentene du vil installere. Merk alltid av for avmerkingsboksen for kjernefiler, og velg mellom 32-bit filer eller 64-bit filer i henhold til systemet ditt. Klikk Neste

  1. I neste vindu blir du spurt om du vil tilpasse oppstartsalternativene. Velg Nei og klikk Neste.

  1. Det neste vinduet hjelper deg å velge en Start-menymappe.

  1. Klikk Neste. Det neste vinduet lar deg velge Flere oppgaver og lar deg lage et skrivebordsikon eller et hurtigstartikon. Merk av i begge avmerkingsboksene for Registrer oppføringer. Velg Neste.

  1. R vil bli installert. Velg Fullfør-knappen for å fullføre installasjonen.

Fra og med R

Etter at R er installert, kan du åpne R ved å bruke

Startmeny à Alle programmer à R

eller

Du kan også dobbeltklikke på R-snarveiikonet på skrivebordet

R-konsollen dukker opp som vist på bildet under. RGui er den korte formen for R Graphical User Interface. Det er den enkleste måten å samhandle med R-språket. Du kan konfigurere noen aspekter av RGui. Dialogboksen RGui-konfigurasjonsredigeringsprogram vises på bildet nedenfor

R-konsollen er stedet der du kan legge inn kommandoer. Noen ganger vil du bli pålagt å skrive kommandoen i et skript og deretter kjøre kommandoene. Et skript er et eget vindu der du kan skrive inn kommandoene. Bildet under viser deg hvordan du åpner et manus

For å kjøre kommandoene i skriptet kan du enten kopiere lime inn kommandoene i kommandovinduet eller velge kommandoene du vil kjøre og klikke på Kjør linje eller Valg-knappen.

Når du skriver kommandoer i konsollen, kan du også bruke tidligere brukte kommandoer ved å bruke pil opp eller pil ned.

Slik fungerer R

Bildet nedenfor vil forklare arbeidsflyten til R

Hver gang R kjører variablene, funksjonene og andre, lagres i datamaskinens minne i form av objekter med navn. Brukeren kan utføre forskjellige operasjoner på disse objektene ved å bruke operatører og funksjoner. En R-funksjon kan bli representert som vist på bildet nedenfor

Argumentene kan være objekter som er definert som standard eller spesifisert av brukeren. Funksjonene utføres gjennom kommandoer som er lagt inn av brukeren. Resultatene vises deretter på skjermen og lagres som et objekt i datamaskinens minne.

Grunnleggende om R-programmeringsspråk

her er det grunnleggende for R-programmeringsspråket som du trenger å vite for å jobbe med R.

  • Kommandoer, objekter og funksjoner

Når du vil samhandle med R, kan du skrive en kommando i konsolldialogboksen og trykke enter. Hvis du har tastet inn feil kommando, vil du få en feilmelding. Du kan enkelt gjøre en enkel beregning ved å bruke R. Du kan bruke alle aritmetiske operatører på samme måte som brukt i den andre dataprogrammet uten at du ikke trenger å skrive lik tegn. Bare trykk på enter for å få utdata.

Eksempel

7 + 3

(1) 10

3 3

(1) 27

10 * (10 + 2)

(1) 120

(2 * (17, 2 + 5)) / 56

(1) 0, 7929

I eksemplene ovenfor kan du finne (1) foran alle svarene. Dette betegnet at det bare er ett tall i svaret. Når det er mer enn ett tall i svaret, vil det hjelpe deg å finne svaret i gruppene. Og hvis du legger til en brakett, blir disse beregningene først utført. Hvis mer enn en brakett er lagt til, kan du gruppere parentesene dine ved hjelp av Ad Infinitum.

  • objekter

Hvis du vil utføre ytterligere beregninger ved å bruke utdataene fra en beregning, må du gi den et navn og bestille R for å lagre den som et objekt. Et eksempel er gitt nedenfor

svar <- 4 + 4

I dette eksemplet kalles <- tildelingssymbolet eller det tildelte symbolet. Dette symbolet ber R om å lage objektet til venstre til utgangen av kommandoen til høyre. Du kan også lagre resultatene fra en beregning gjort med objekter som et annet objekt. Du kan fjerne et objekt ved å bruke rm () -funksjonen og bekrefte det med funksjonen ls ().

  • funksjoner

R har et stort utvalg av koder som vil hjelpe deg å gjøre matematiske beregninger, tegne en graf og gjøre statistisk analyse. Disse kodene kalles funksjoner. Hvert funksjonsnavn ender i et par parenteser, og du kan også med en gang skrive inn navnet på funksjonen og navnet på objektet for å utføre operasjonen du trenger.

eksempler

kvm (100)

(1) 10

Du kan også legge til et objektnavn for å utføre beregningen

synd (15+ svar)

Verdien av objektet "svar" tas her for beregning

Vektorer, matriser og datarammer

R er den beste løsningen for å håndtere objekter som er gruppen av antall eller grupper av tegn. Grupper av et nummer som er organisert som sekvenser kalles Vectors. Grupper som er organisert som todimensjonale tabeller kalles matriser. Tabeller som inneholder et tall i noen kolonner og noen andre data i andre kolonner kalles datarammer.

  • vektorer

La oss se på et eksempel for å forstå hva vektor er og hvordan den brukes i R

Eksempel

A <- seq (10, 20)

I dette eksemplet har du opprettet et nytt objekt kalt A og det inneholder rekkefølgen av tall fra 10 til 20. Du kan sjekke dette ved ganske enkelt å skrive A og få utdataene. Det blir forklart nedenfor

EN

(1) 10 11 12 13 14 15 16 17 18 19 20

En av de viktigste funksjonene i Vector er c (). Det betyr "sammenlengtet". Et eksempel er gitt nedenfor

B <- c (2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22)

B (Trykk enter)

(1) 2 4 6 8 10 12 14 16 18 20 22

Du kan også utføre aritmetiske operasjoner i en vektor.

A + B

(1) 12 15 18 21 24 27 30 33 36 39 42

  • matriser

Når du har data som kan ordnes i to dimensjoner, kalles det Matrix. Matrise er betegnet med matrise () -funksjon.

Eksempel

mat2 <- matrise (data = seq (1, 12), nrows = 3, ncols = 4, dimnames = list (c ("Rad 1", "Rad 2", "Rad 3"), c ("Col 1", “Col 2”, “Col 3”, “Col 4”)

Eksemplet ovenfor blir forklart i detalj nedenfor

mat2 <- setter opp et objekt som heter mat2

matrise (data = seq (1, 12) her objektet er matrisen og data i matrisen er en sekvens med tall fra 1 til 12

nrows = 3, ncols = 4 betyr at antall rader er 3 og antall kolonner er 4

dimnames = list (c ("Rad 1", "Rad 2", "Rad 3"), c ("Col 1", "Col 2", "Col 3", "Col 4") inneholder navnene for radene og kolonner.

Utgangen er som følger

mat1kol1col2kol3Col4
Rad 114710
Rad 225811
Rad 336912

Datatyper og datarammer

Data blir alltid registrert som tall eller kvantitative data. Numeriske objekter kan videre deles inn i reelle tall, komplekse tall eller heltall og så videre. I tilfelle du ville finne ut om vektoren du bruker er i numerisk form, kan du bruke funksjonsmodus () og kjenne til hvilken type numerisk du kan bruke funksjonsklassen ().

Det er en spesiell type data i R som kalles en faktor. Denne typen data er der ting er delt inn i klasser.

  • indeksene

Du kan finne det individuelle nummeret eller gruppene i datastrukturen ved å bruke abonnement. Det vil være veldig nyttig.

Eksempel

X <- rnorm (10, 2, 0, 1)

I dette eksemplet lages en vektor i navnet X som består av 10 tilfeldige tall avledet fra en normalfordeling med middelverdien 2 og standardavvik 0, 1.

Abonnement trenger ikke nødvendigvis være enkelttall. Det kan være et objekt eller til og med en funksjon. Logiske uttrykk kan også inkluderes i abonnementet.

  • undergrupper

Et delsett er en funksjon som brukes til å utlede deler av en matrise eller dataramme. Den har tre hovedseksjoner - først navnet på undergruppen, deretter et logisk uttrykk, tredje som informerer R om hvilke kolonner du skal velge.

Eksempel

Teller <- read.csv ("Countts.csv", header = T)

Fra tabellen nedenfor kan du opprette et underett

KjønnTempVektVekt
MVarmt75292
FVarmt65180
MKald69.03161
FKald73.25323

Teller 2 = 70)

Dette vil gi deg resultatet hvis vekten er mindre enn 70.

R programmeringsspråk Pakker

R-installasjon leveres med alle grunnleggende pakker. Det er mange andre pakker som vil hjelpe deg med å laste inn nye funksjoner og objekter. Du kan også opprette en ny pakke i R. Noen av grunnpakkene som er inkludert i R under installasjonen, er listet opp nedenfor

  • gitter
  • MASSE
  • nlme
  • klynge
  • overlevelse

Du kan bruke det installerte. pakker () -funksjon for å vite mer om de installerte pakkene.

Statistiske metoder

R kommer med forskjellige statistiske metoder som er innebygd. De er

  • Mener
  • median
  • Modus
  • distribusjoner
  • kovarians
  • regresjon
  • Ikke-lineære blandede effekter
  • GLM
  • GAM og mange metoder

R har også forskjellige statistiske prosedyrer som følgende

  • Klassiske parametriske tester
  • Ikke-parametriske tester
  • Lineær modellering
  • Ikke-lineær regresjonsmodellering
  • Gruppering
  • Utjevning

Konklusjon

Hovedpoenget er at programmeringsspråk R hjelper både forskere og forretningsfolk til å utføre effektiv dataanalyse. R-pakker gjør det enkelt for bedrifter å gjøre analysen. De krever ikke dataprogrammerere eller omfattende programmering for å bruke R. R Programmeringsspråk hjelper til med å lage grafikk på en mer tiltalende måte.

Anbefalte artikler

Her er din guide til å forstå installasjonen, komme i gang, fordeler, grunnleggende kommandoer og funksjoner for R Programming Language.

  1. Er Python et skriptspråk?
  2. Hvordan installere Angular 2?
  3. Hvordan installere Swift?
  4. Er MySQL programmeringsspråk?