Introduksjon til liste over R-pakker

En pakke i R-programmeringsspråk er en enhet som gir nødvendige funksjoner som kan brukes ved å laste den inn i R-miljøet. En liste over R-pakker ligner et bibliotek i C, C ++ eller Java. Så i utgangspunktet kan en pakke ha mange funksjoner som funksjoner, konstanter, etc. som vi lar brukeren bruke dem i sammenheng med et bestemt problem. I R kan en nødvendig pakke lastes inn med funksjonen bibliotek (). I tilfelle en pakke ikke er til stede, kan den installeres ved hjelp av funksjonen install.packages (). Pakker gjør tilsynelatende vanskelige oppgaver enkle gjennom de ferdige funksjonalitetene.

Hva er R-pakker?

Det er mange pakker i R, og valget av en pakke avhenger av bruken. Selv om det er visse pakker som er mye brukt på grunn av funksjonalitetene de leverer, er det ikke slik at andre pakker er mindre viktige. Ulike pakker har forskjellige formål; noen er relatert til statistiske teknikker, noen gjelder visualiseringer, etc.

I det følgende avsnittet vil vi se på noen av de viktige pakkene i R:

1. Bil

Denne pakken er Companion to Applied Regression. Det er en stor pakke som gir forskjellige funksjoner for statistisk analyse. Import av denne pakken til R-miljøet importerer andre relaterte pakker som MASS, statistikk, grafikk, etc. Noen av funksjonene i pakken inkluderer Anova, avPlots, Boxplot, carPalette, densitetsplott, infIndexPlot, lineær hypotese, logit, outlier test, qqPlot, restplott, scatterplot, scatterplot matrix, etc. De omfattende egenskapene til pakken kan måles ut fra antall funksjoner den gir.

2. Corrplot

Pakken gir en grafisk visning av en korrelasjonsmatrise og et konfidensintervall. Pakken inneholder også algoritmer for å utføre matriseinnordning. Tallrike alternativer inkluderer valg av nødvendige farger, tekstetiketter, fargeetiketter, layout, etc. Ulike visualiseringsmetoder eller parametermetoder i corrplot-pakken er “sirkel”, “firkant”, “ellipse”, “antall”, “skygge”, “farge” og "kake". Korrolotfunksjonen som inkluderer forskjellige alternativer gir en visuelt tiltalende representasjon av korrelasjon mellom forskjellige variabler, som ellers under normale omstendigheter, som tall, er vanskelige å tolke. Positive korrelasjoner vises med blå og negative korrelasjoner i rødt. Fargeintensiteten og størrelsen på sirkelen er proporsjonal med korrelasjonskoeffisientene.

3. DataExplorer

Denne pakken omhandler automatisert utforskning og behandling av data. Det gir en automatisert datautforskingsprosess ment for analytiske oppgaver og prediktiv modellering. Dette er avgjørende fordi det gjør det mulig for brukeren å forstå data og hente ut innsikt. Hver variabel i analysen skannes og analyseres av pakken. Videre gir pakken funksjoner for visualisering av disse variablene ved bruk av typiske grafiske teknikker. Det gir også vanlige databehandlingsmetoder for å behandle og formatere data.

4. Gmodels

Gmodels-pakken inneholder forskjellige verktøy i R for å plotte data. Den inneholder forskjellige funksjoner som glh.test som brukes til å teste, skrive ut eller oppsummere en generell lineær hypotese for en regresjonsmodell. Funksjonen lager. kontraster konverterer menneskelige lesbare kontraster til den formen som R krever for beregning. Matrisen som returneres av make.contrasts kan brukes som argument for kontrastargumentet for modellfunksjoner. CoefFrame-funksjonen passer til en modell til hver undergruppe definert av , og returnerer deretter en dataramme med en rad for hver passning og en kolonne for hver parameter. Den estimable funksjonen beregner og tester kontraster og andre estimable lineære funksjoner av modellkoeffisienter for lm, glm, etc. Funksjonen fit.contrast beregner og tester vilkårlige kontraster for regresjonsobjekter.

5. Gplots

Denne pakken gir visualiseringsfunksjoner gjennom mangfoldige programmeringsverktøy. Funksjonene i pakken jobber med konseptet beregning og plotting. De grafiske egenskapene til pakken er demonstrert av forskjellige funksjoner som båndplott, boxplot2, col2hex, ci2d, hist2d, tekstdiagram, sink plot, balloon pilot, plotCI, plot middel, etc. Disse funksjonene muliggjør arbeid med innstillinger relatert til farge, tekst og andre intrikate grafiske sider ved visualiseringen. De tar også for seg komplekse elementer involvert i statistikkbasert visualisering, for eksempel lmplot2, residplotfunksjoner som gjør det mulig for brukeren å kjøre detaljert regresjonsdiagnose gjennom diagnostiske plott. Hvis flere data må plottes i samme region, men med separate akser, er dette mulig ved å bruke over-plot-funksjonen i pakken.

6. Ggplot2

Det er en av de veldig berømte pakkene i R som gir omfattende visuelle evner og presenterer resultatene til og med komplekse statistiske og matematiske teknikker. De mange funksjonalitetene som tilbys av pakken gjør det mulig for analytikeren å hente innsikt fra data på en mest interaktiv måte. R-beskrivelsen for funksjonen er "et system for deklarativt å lage grafikk som er basert på grammatikken til grafikk". Denne grammatikken med grafikk betyr at brukeren må fortelle 'ggplot2' om hvordan variabler må kartlegges til estetikk, så dette betyr egentlig at det å spesifisere hvilke grafiske aspekter å bruke, og ggplot2 vil fungere deretter basert på detaljene.

7. Lubridert

Denne R-pakken gjør det lettere å jobbe med datoer og klokkeslett. Den hybridiserte pakken muliggjør enkel manipulering av dato og klokkedata. Det analyserer et tall og gir passende dataopplegg, faktisk analyserer funksjonene i pakken et bredt utvalg av formater og separatorer som forenkler analyseringsprosessen. En av de bemerkelsesverdige funksjonene er at pakken gir funksjoner for å håndtere datoer med forskjellige tidssoner.

8. Hmisc

Hmisc-pakken som heter Harrell Diverse, inneholder mange funksjoner som kan utnyttes til dataanalyse, grafikk på høyt nivå og verktøy. Det inkluderer også funksjoner for beregning av prøvestørrelse og kraft, import og kommentering av datasett, påregning av manglende verdier, tilveiebringelse av avanserte tabellfunksjoner, gruppering av variabler, manipulering av karakterstrengen, konvertering av R-objekter til HTML-kode, etc.

9. Gitter

Pakken tilbyr et datavisualiseringssystem på høyt nivå som er inspirert av Trellis-grafikk. Det vektlegges på multivariate data. De kraftige visualiseringsfunksjonene til pakken gir den nødvendige grafiske løsningen. Noen av de bemerkelsesverdige funksjonene i pakken er B_07_cloud som hjelper til med å produsere 3d-scatter-plott og wireframe-overflateplott; D_level. farger, en funksjon for å beregne falske farger som representerer numerisk eller kategorisk variabel; B_06_levelplot, en funksjon som genererer nivåplott og konturplott; A_01_Lattice, en funksjon som gir grafiske funksjoner for gitter. B_09_tmd er en funksjon som genererer Tukey Mean - Difference Plot; B_11_oneway, en funksjon som passer til enveismodellen. Pakken gir dermed omfattende funksjoner for visualiseringer gjennom forskjellige funksjoner.

10. MatrixModels

Denne pakken tillater modellering med sparsomme og tette "Matrix" -matriser. For å oppnå dette bruker den modulær prediksjon og respons, modulklasser. Alle funksjonene som tilbys av pakken er like viktige, hvorav noen er lm.fit.sparse som er en montørfunksjon for sparsomme lineære modeller, opløsCoef som løser for koeffisientene og koeffisientøkning, modell. En matrise som konstruerer muligens sparsom design eller modellmatriser, glm4 som passer til generaliserte lineære modeller.

11. Multkomp

Pakken gir mulighet for flere sammenligninger av k-grupper i generaliserte lineære modeller. En liste over ni standardprosedyrer, dvs. Dunnet, Tukey, Sequen, AVE, Changepoint, Williams, Marcus, McDermott og Tetrade, blir gitt til brukeren, og brukeren velger sammenligninger basert på kravet. I tillegg til dette er det også gitt et gratis inngangsgrensesnitt for kontrastmatrisen som muliggjør spesielle sammenligninger. Det bemerkelsesverdige trekket er at sammenligningene i seg selv ikke er begrenset til noen spesiell design som balansert eller enkel, snarere er programmene designet på en slik måte at de passer til flere sammenligninger innenfor den generelle lineære modellen som gjør det mulig for kovariater, korrelerte midler, manglende verdier, etc.

12. OpenMx

Denne pakken omhandler i utgangspunktet utvidet strukturell ligningsmodellering. Det gir funksjoner for å lage strukturelle ligningsmodeller. Disse modellene kan manipuleres ved bruk av programmering. Modellene kan spesifiseres med matriser eller stier som LISREL eller RAM. Noen av typene modeller inkluderer flere grupper, bekreftende faktor, blandingsfordeling, kategorisk terskel, differensialpasningsfunksjoner, etc.

13. Plyr

Det er en veldig viktig pakke som gir funksjoner for datamanipulering. Den gir verktøy for å dele opp, bruke og kombinere data. Den leveres med et sett verktøy som hjelper til med å løse et vanlig sett med problemer. F.eks. Kan det hende at vi kanskje trenger å dele en stor oppgave i mindre oppgaver som er håndterbare, så opererer vi på hver av brikkene, og så til slutt legger vi alle brikkene sammen.

14. Qcc

Pakken får betydning på grunn av forskjellige kvalitetsanalysefunksjoner som den gir. Den gir Shewhart-kvalitetskontrolldiagrammer for kontinuerlig, attributter og teller data. Blant andre viktige diagrammer er Cusum- og EWMA-diagrammer og driftskarakteristikkskurver. Det tilbyr også funksjonalitet for prosessfunksjonsanalyse. Paretokart og årsak-og-virkningskart og multivariate kontrollkart er nyttige verktøy som leveres av pakken.

15. RandomForest

Som navnet antyder, brukes denne pakken til å bygge en tilfeldig skogalgoritme. Pakken implementerer Breimans tilfeldige skogalgoritme, som er basert på Beiman og Cutlers opprinnelige FORTRAN-kode. Algoritmen brukes til klassifisering og regresjon. Pakken kan også brukes i uovervåket modus for å vurdere nærhet mellom datapunkter.

16. Psyk

Det er en pakke ment for et spesielt formål. Pakken gir en prosedyre for psykologisk, psykometrisk og personlighetsforskning. Funksjoner er først og fremst for multivariat analyse ved bruk av forskjellige multivariate statistiske teknikker.

Konklusjonsliste over R-pakker

Det er mange pakker i R, og bruken av en pakke avhenger av krav. List of R Packages-samfunnet har vokst veldig raskt, og hver eneste dag blir en pakke lagt til. Flere pakker kan gi lignende funksjoner, men valg av pakke må være basert på nøye undersøkelser.

Anbefalte artikler

Dette er en guide til en liste over R-pakker. Her diskuterer vi introduksjonen til R-pakker og noen viktige pakker med R. Du kan også gå gjennom våre andre foreslåtte artikler for å lære mer -

  1. Java-pakker
  2. Hva er JNDI i Java?
  3. JColorChooser
  4. R-programmering vs Python

Kategori: