Comment obtenir une ligne à partir de R data.frame

103

J'ai un data.frame avec des en-têtes de colonnes.

Comment puis-je obtenir une ligne spécifique du data.frame sous forme de liste (avec les en-têtes de colonne comme clés de la liste)?

Plus précisément, mon data.frame est

      abc
    1 5 4,25 4,5
    2 3,5 4 2,5
    3 3,25 4 4
    4 4,25 4,5 2,25
    5 1,5 4,5 3

Et je veux obtenir une ligne équivalente à

> c(a=5, b=4.25, c=4.5)
  a   b   c 
5.0 4.25 4.5 
Will Glass
la source

Réponses:

129
x[r,]

où r est la ligne qui vous intéresse. Essayez ceci, par exemple:

#Add your data
x <- structure(list(A = c(5,    3.5, 3.25, 4.25,  1.5 ), 
                    B = c(4.25, 4,   4,    4.5,   4.5 ),
                    C = c(4.5,  2.5, 4,    2.25,  3   )
               ),
               .Names    = c("A", "B", "C"),
               class     = "data.frame",
               row.names = c(NA, -5L)
     )

#The vector your result should match
y<-c(A=5, B=4.25, C=4.5)

#Test that the items in the row match the vector you wanted
x[1,]==y

Cette page (de ce site utile ) contient de bonnes informations sur une telle indexation.

Matt Parker
la source
14

L'indexation logique est très R-ish. Essayer:

 x[ x$A ==5 & x$B==4.25 & x$C==4.5 , ] 

Ou:

subset( x, A ==5 & B==4.25 & C==4.5 )
IRTFM
la source
7

Essayer:

> d <- data.frame(a=1:3, b=4:6, c=7:9)

> d
  a b c
1 1 4 7
2 2 5 8
3 3 6 9

> d[1, ]
  a b c
1 1 4 7

> d[1, ]['a']
  a
1 1
ars
la source
5

Si vous ne connaissez pas le numéro de ligne, mais connaissez certaines valeurs, vous pouvez utiliser le sous-ensemble

x <- structure(list(A = c(5,    3.5, 3.25, 4.25,  1.5 ), 
                    B = c(4.25, 4,   4,    4.5,   4.5 ),
                    C = c(4.5,  2.5, 4,    2.25,  3   )
               ),
               .Names    = c("A", "B", "C"),
               class     = "data.frame",
               row.names = c(NA, -5L)
     )

subset(x, A ==5 & B==4.25 & C==4.5)
Thierry
la source
voulez-vous dire cela à la place? subset (x, A == 5 && B == 4.25 && C == 4.5)
momeara
Non, cela aurait dû être:subset(x, A ==5 & B==4.25 & C==4.5)
IRTFM
1

10 ans plus tard ---> En utilisant tidyverse, nous pourrions y parvenir simplement et en empruntant une feuille à Christopher Bottoms . Pour une meilleure compréhension, voir slice().

library(tidyverse)
x <- structure(list(A = c(5,    3.5, 3.25, 4.25,  1.5 ), 
                    B = c(4.25, 4,   4,    4.5,   4.5 ),
                    C = c(4.5,  2.5, 4,    2.25,  3   )
),
.Names    = c("A", "B", "C"),
class     = "data.frame",
row.names = c(NA, -5L)
)

x
#>      A    B    C
#> 1 5.00 4.25 4.50
#> 2 3.50 4.00 2.50
#> 3 3.25 4.00 4.00
#> 4 4.25 4.50 2.25
#> 5 1.50 4.50 3.00

y<-c(A=5, B=4.25, C=4.5)
y
#>    A    B    C 
#> 5.00 4.25 4.50

#The slice() verb allows one to subset data row-wise. 
x <- x %>% slice(1) #(n) for the nth row, or (i:n) for range i to n, (i:n()) for i to last row...

x
#>   A    B   C
#> 1 5 4.25 4.5

#Test that the items in the row match the vector you wanted
x[1,]==y
#>      A    B    C
#> 1 TRUE TRUE TRUE

Créé le 2020-08-06 par le package reprex (v0.3.0)

odunayo12
la source