Oversikt over R Data Frame

Datarammer er en liste over vektorer med samme lengde. Forskjellen mellom matrise og datarammer er imidlertid at datarammene godtar forskjellige typer data. (Karakter, numerisk osv.). I dette emnet skal vi lære om R Data Frame.

Fordeler ved bruk av datarammer

  • Distribuert innsamling av data og organisert.
  • Det har bedre optimaliseringer sammenlignet med en relasjonsdatabase.
  • Inneholder en rekke data som er heterogene.

Opprette en dataramme i R

Vi lager data_frame. Nedenfor er eksemplet for å erklære en dataramme.

Data_frame <- data.frame (variable 1, variable 2, variable n…)

I eksemplet over har vi ikke definert variablene. La oss nå se hvordan vi tildeler verdier til variabler og lagrer dem i datarammen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)

Produksjon:

Antall albaboleere

1 2 x SANN

2 3 y SANN

3 4 z FALSE

Struktur av dataramme

Når vi vil vite strukturen til en bestemt dataramme. Vi kan bruke funksjonen nedenfor.

Stjerne ()

str(Data_frame)

Produksjon:

Antall: num 2 3 4

alfa: Faktor m / 3 nivåer "x", "y", "z": 1 2 3

Booleans: logi TRUE TRUE FALSE

Pakk ut spesifikke data fra datarammen

1. Bruk kolonnenavnet

Vi kan trekke ut et bestemt sett med data fra datarammen.

Fra vårt eksempel ovenfor, la oss bare trekke ut den første kolonnen fra datarammen som er nummer.

Data_ frame <- data. Frame(Number)

Produksjon:

Nummer

1 2

2 3

3 4

2. Bruke radene

Vi kan trekke ut dataene fra radene akkurat som i eksemplet nedenfor.

La oss anta at vi bare vil skrive ut to rader i kolonnen Antall.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(1:2, ) print(output)

Produksjon:

Antall albaboleere

1 2 x SANN

2 3 y SANN

3 4 z FALSE

------------

Antall albaboleere

1 2 x SANN

2 3 y SANN

Vi kan observere forskjellen i første og andre utganger.

3. Skrive ut spesifikke rader og kolonner

Vi kan også skrive ut spesifikke rader og kolonner.

I eksemplet nedenfor skriver vi ut første og andre rad, kolonner

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
print(Data_frame)
output <- Data_frame(c(1, 2), c(1, 2)) print(output)

Produksjon:

Antall albaboleere

1 2 x SANN

2 3 y SANN

3 4 z FALSE

-------------

Antall alfa

1 2 x

2 3 y

4. Legge til en annen kolonne i datarammen

Vi kan legge til en ny kolonne sammen med verdier i datarammen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- Data_frame
print(out)

Produksjon:

Antall alfa Booleans-klassen

1 2 x SANN A

2 3 y SANN B

3 4 z FALSE C

5. Legge til en rad i datarammen

Vi bruker rbind-funksjonen for å legge til en ny rad i den eksisterende datarammen.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
Data_frame$class <- c("A", "B", "C")
out <- rbind(Data_frame, c(5, "x", FALSE, "D"))
print(out)

Produksjon:

Antall alfa Booleans-klassen

1 2 x SANN A

2 3 y SANN B

3 4 z FALSE C

4 5 x FALSE D

6. Kombinere begge datarammene

Vi kan også kombinere to datarammer for å produsere en enkelt utgang.

For å kombinere to datarammer må vi ha den samme kolonnen for datarammene.

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame1 <- data.frame(Number, alpha, Booleans)
print(Data_frame1)
Number <- c(4, 5, 6)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame2 <- data.frame(Number, alpha, Booleans)
print(Data_frame2)
out <- rbind(Data_frame1, Data_frame2)
print(out)

Produksjon:

Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
--------------
Antall albaboleere
1 4 x SANN
2 5 y SANN
3 6 z FALSE

--------------

Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
4 4 x SANN
5 5 y SANN
6 6 z FALSE

Inspiserer datarammer

Nedenfor er de forskjellige måtene å inspisere en dataramme og gir informasjon om en dataramme akkurat som stjernefunksjonen ovenfor.

1. Navn - Oppgir navnene på variablene i dataframmen

Syntaks : names(data frame name)

Eksempel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
names(Data_frame)

output : (1) “Number” “alpha” “Booleans”

2. Sammendrag - Oppgir statistikken for datarammen.

Syntaks: summary(data frame name)

Eksempel

Number <- c(2, 3, 4)
alpha <- c("x", "y", "z")
Booleans <- c(TRUE, TRUE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
summary(Data_frame)

Produksjon:

Antall albaboleere
Min. : 2, 0 x: 1 Mode: logisk
1. kv .: 2, 5 y: 1 FALSE: 1
Median: 3, 0 z: 1 SANN: 2
Gjennomsnitt: 3, 0 NA: 0
3. kv .:3.5
Maks. : 4, 0

3. Hode- Oppgir data for de første radene.

Syntaks: Head( name of the data frame)

Eksempel

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
head(Data_frame)

Produksjon:

Antall albaboleere
1 2 x SANN
2 3 y SANN
3 4 z FALSE
4 5 a SANN
5 6 b FALSE
6 7 c FALSE

4. Hale- Skriver ut de siste radene i datarammen.

Syntaks: tail( name of the data frame)

Number <- c(2, 3, 4, 5, 6, 7, 8, 9, 10, 11)
alpha <- c("x", "y", "z", "a", "b", "c", "d", "f", "g", "j")
Booleans <- c(TRUE, TRUE, FALSE, TRUE, FALSE, FALSE, FALSE, FALSE, FALSE, FALSE)
Data_frame <- data.frame(Number, alpha, Booleans)
tail(Data_frame)

Produksjon:

Antall albaboleere
5 6 b FALSE
6 7 c FALSE
7 8 d FALSE
8 9 f FALSE
9 10 g FALSE
10 11 j FALSE

Konklusjon

Datarammer er et viktig konsept i R-programmering. Det er enkelt, men likevel kraftig i å lage datasett som kan endres og lett nås. Akkurat som matrise, kan du få tilgang til datasettene gjennom rader og kolonnenavn med å legge til og fjerne data enkelt.

Anbefalte artikler

Dette er en guide til R Data Frame. Her diskuterer vi Oppretting av dataramme i R med strukturen og trekke ut spesifikke data fra datarammen. Du kan også se på følgende artikler for å lære mer -

  1. Datatyper i C
  2. Data Science Karriere
  3. Big Data Technologies
  4. Data Science-plattformen
  5. Java Booleans

Kategori: