Questions marquées «dplyr»

Utilisez cette balise pour les questions relatives aux fonctions du package dplyr, telles que group_by, summary, filter et select.

192
Afficher / imprimer toutes les lignes d'un tibble (tbl_df)

tibble (précédemment tbl_df ) est une version d'une trame de données créée par le dplyrpackage de manipulation de trame de données dans R. Il empêche les sorties de table longues lors d'un appel accidentel de la trame de données. Une fois qu'une trame de données a été enveloppée par tibble /...

188
Filtrer les lignes contenant une certaine chaîne

Je dois filtrer une trame de données en utilisant comme critère les lignes dans lesquelles est contenue la chaîne RTB. J'utilise dplyr. d.del <- df %>% group_by(TrackingPixel) %>% summarise(MonthDelivery = as.integer(sum(Revenue))) %>% arrange(desc(MonthDelivery)) Je sais que je peux...

175
Extraire une colonne tbl dplyr en tant que vecteur

Existe-t-il un moyen plus succinct d'obtenir une colonne d'un tbl dplyr en tant que vecteur, à partir d'un tbl avec une base de données principale (c'est-à-dire que la trame / table de données ne peut pas être directement sous-ensemble)? require(dplyr) db <- src_sqlite(tempfile(), create = TRUE)...

172
Correction d'un avertissement multiple "colonne inconnue"

J'ai un avertissement multiple persistant de "colonne inconnue" pour tous les types de commandes (par exemple, str (x) pour installer les mises à jour sur les paquets), et je ne sais pas comment déboguer ceci ou le réparer. L'avertissement "colonne inconnue" est clairement lié à une variable dans...

168
Utilisez des noms de variables dynamiques dans `dplyr`

Je souhaite utiliser dplyr::mutate()pour créer plusieurs nouvelles colonnes dans un bloc de données. Les noms de colonnes et leur contenu doivent être générés dynamiquement. Exemple de données d'iris: library(dplyr) iris <- tbl_df(iris) J'ai créé une fonction pour muter mes nouvelles colonnes à...

153
Fréquences / proportions relatives avec dplyr

Supposons que je veuille calculer la proportion de valeurs différentes dans chaque groupe. Par exemple, en utilisant les mtcarsdonnées, comment calculer la fréquence relative du nombre de vitesses par heure (automatique / manuel) en une seule fois dplyr? library(dplyr) data(mtcars) mtcars <-...

128
Supprimer les lignes dupliquées à l'aide de dplyr

J'ai un data.frame comme celui-ci - set.seed(123) df = data.frame(x=sample(0:1,10,replace=T),y=sample(0:1,10,replace=T),z=1:10) > df x y z 1 0 1 1 2 1 0 2 3 0 1 3 4 1 1 4 5 1 0 5 6 0 1 6 7 1 0 7 8 1 0 8 9 1 0 9 10 0 1 10 Je voudrais supprimer les lignes en double en fonction des deux premières...

118
Remplacement de «renommer» dans dplyr

J'aime la fonction de changement de nom de plyr rename. J'ai récemment commencé à utiliser dplyr et je me demandais s'il existe un moyen simple de renommer des variables en utilisant une fonction de dplyr, qui est aussi facile à utiliser que celle de plyr

111
Dplyr peut-il se joindre sur plusieurs colonnes ou clé composite?

Je me rends compte que la dplyrv3.0 vous permet de rejoindre sur différentes variables: left_join(x, y, by = c("a" = "b")correspondra x.aày.b Cependant, est-il possible de joindre sur une combinaison de variables ou dois-je ajouter une clé composite au préalable? Quelque chose comme ça:...

108
Rassemblez plusieurs ensembles de colonnes

J'ai des données provenant d'un sondage en ligne où les répondants parcourent une boucle de questions 1 à 3 fois. Le logiciel d'enquête (Qualtrics) enregistre ces données dans plusieurs colonnes qui est, Q3.2 dans l'enquête aura des colonnes Q3.2.1., Q3.2.2.et Q3.2.3.: df <- data.frame( id =...

98
Somme sur plusieurs colonnes avec dplyr

Ma question consiste à additionner les valeurs sur plusieurs colonnes d'un bloc de données et à créer une nouvelle colonne correspondant à cette somme à l'aide de dplyr. Les entrées de données dans les colonnes sont binaires (0,1). Je pense à un analogue en ligne de la fonction summarise_eachou...

96
R dplyr: supprimer plusieurs colonnes

J'ai un dataframe et une liste de colonnes dans ce dataframe que j'aimerais supprimer. Prenons le irisjeu de données comme exemple. Je voudrais laisser tomber Sepal.Lengthet Sepal.Widthet utiliser uniquement les colonnes restantes. Comment faire cela en utilisant selectou à select_partir du...