Oversikt over R Data Frame
Datarammer er en liste over vektorer med samme lengde. Forskjellen mellom matrise og datarammer er imidlertid at datarammene godtar forskjellige typer data. (Karakter, numerisk osv.). I dette emnet skal vi lære om R Data Frame.
Fordeler ved bruk av datarammer
- Distribuert innsamling av data og organisert.
- Det har bedre optimaliseringer sammenlignet med en relasjonsdatabase.
- Inneholder en rekke data som er heterogene.
Opprette en dataramme i R
Vi lager data_frame. Nedenfor er eksemplet for å erklære en dataramme.
Data_frame <- data.frame (variable 1, variable 2, variable n…)
I eksemplet over har vi ikke definert variablene. La oss nå se hvordan vi tildeler verdier til variabler og lagrer dem i datarammen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
Produksjon:
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
Struktur av dataramme
Når vi vil vite strukturen til en bestemt dataramme. Vi kan bruke funksjonen nedenfor.
Stjerne ()
str(Data_frame)
Produksjon:
Antall: num 2 3 4
alfa: Faktor m / 3 nivåer "x", "y", "z": 1 2 3
Booleans: logi TRUE TRUE FALSE
Pakk ut spesifikke data fra datarammen
1. Bruk kolonnenavnet
Vi kan trekke ut et bestemt sett med data fra datarammen.
Fra vårt eksempel ovenfor, la oss bare trekke ut den første kolonnen fra datarammen som er nummer.
Data_ frame <- data. Frame(Number)
Produksjon:
Nummer
1 2
2 3
3 4
2. Bruke radene
Vi kan trekke ut dataene fra radene akkurat som i eksemplet nedenfor.
La oss anta at vi bare vil skrive ut to rader i kolonnen Antall.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)
Produksjon:
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
------------
Antall albaboleere
1 2 x SANN
2 3 y SANN
Vi kan observere forskjellen i første og andre utganger.
3. Skrive ut spesifikke rader og kolonner
Vi kan også skrive ut spesifikke rader og kolonner.
I eksemplet nedenfor skriver vi ut første og andre rad, kolonner
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)
Produksjon:
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
-------------
Antall alfa
1 2 x
2 3 y
4. Legge til en annen kolonne i datarammen
Vi kan legge til en ny kolonne sammen med verdier i datarammen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)
Produksjon:
Antall alfa Booleans-klassen
1 2 x SANN A
2 3 y SANN B
3 4 z FALSE C
5. Legge til en rad i datarammen
Vi bruker rbind-funksjonen for å legge til en ny rad i den eksisterende datarammen.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)
Produksjon:
Antall alfa Booleans-klassen
1 2 x SANN A
2 3 y SANN B
3 4 z FALSE C
4 5 x FALSE D
6. Kombinere begge datarammene
Vi kan også kombinere to datarammer for å produsere en enkelt utgang.
For å kombinere to datarammer må vi ha den samme kolonnen for datarammene.
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)
Produksjon:
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
--------------
Antall albaboleere
1 4 x SANN
2 5 y SANN
3 6 z FALSE
--------------
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
4 4 x SANN
5 5 y SANN
6 6 z FALSE
Inspiserer datarammer
Nedenfor er de forskjellige måtene å inspisere en dataramme og gir informasjon om en dataramme akkurat som stjernefunksjonen ovenfor.
1. Navn - Oppgir navnene på variablene i dataframmen
Syntaks : names(data frame name)
Eksempel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)
output : (1) “Number” “alpha” “Booleans”
2. Sammendrag - Oppgir statistikken for datarammen.
Syntaks: summary(data frame name)
Eksempel
Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)
Produksjon:
Antall albaboleere
Min. : 2, 0 x: 1 Mode: logisk
1. kv .: 2, 5 y: 1 FALSE: 1
Median: 3, 0 z: 1 SANN: 2
Gjennomsnitt: 3, 0 NA: 0
3. kv .:3.5
Maks. : 4, 0
3. Hode- Oppgir data for de første radene.
Syntaks: Head( name of the data frame)
Eksempel
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)
Produksjon:
Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
4 5 a SANN
5 6 b FALSE
6 7 c FALSE
4. Hale- Skriver ut de siste radene i datarammen.
Syntaks: tail( name of the data frame)
Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)
Produksjon:
Antall albaboleere
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE
Konklusjon
Datarammer er et viktig konsept i R-programmering. Det er enkelt, men likevel kraftig i å lage datasett som kan endres og lett nås. Akkurat som matrise, kan du få tilgang til datasettene gjennom rader og kolonnenavn med å legge til og fjerne data enkelt.
Anbefalte artikler
Dette er en guide til R Data Frame. Her diskuterer vi Oppretting av dataramme i R med strukturen og trekke ut spesifikke data fra datarammen. Du kan også se på følgende artikler for å lære mer -
- Datatyper i C
- Data Science Karriere
- Big Data Technologies
- Data Science-plattformen
- Java Booleans