Questions marquées «r-faq»

152
Dois-je utiliser un data.frame ou une matrice?

Quand faut-il utiliser un data.frame, et quand est-il préférable d'utiliser un matrix? Les deux conservent les données dans un format rectangulaire, donc parfois ce n'est pas clair. Existe-t-il des règles générales pour savoir quand utiliser quel type de

152
Supprimer les lignes dupliquées

J'ai lu un CSVfichier dans un data.frame R. Certaines des lignes ont le même élément dans l'une des colonnes. Je souhaite supprimer les lignes dupliquées dans cette colonne. Par exemple: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus...

145
Remplacez toutes les valeurs 0 par NA

J'ai un dataframe avec quelques colonnes numériques. Certaines lignes ont une valeur 0 qui doit être considérée comme nulle dans l'analyse statistique. Quel est le moyen le plus rapide de remplacer toute la valeur 0 par NULL dans R?

143
Ajouter une légende au tracé linéaire ggplot2

J'ai une question sur les légendes dans ggplot2. J'ai réussi à tracer trois lignes dans le même graphique et je souhaite ajouter une légende avec les trois couleurs utilisées. C'est le code utilisé library(ggplot2) require(RCurl) link<-getURL("https://dl.dropbox.com/s/ds5zp9jonznpuwb/dat.txt")...

142
Remplacement des NA par la dernière valeur non NA

Dans un data.frame (ou data.table), je voudrais "remplir" les NA avec la valeur non NA précédente la plus proche. Un exemple simple, utilisant des vecteurs (au lieu de a data.frame) est le suivant: > y <- c(NA, 2, 2, NA, NA, 3, NA, 4, NA, NA) Je voudrais une fonction fill.NAs()qui me permette...

137
Commande de l'échelle X discrète par fréquence / valeur

Je crée un graphique à barres esquivé en utilisant ggplot avec une échelle x discrète, l'axe des x est maintenant organisé par ordre alphabétique, mais je dois le réorganiser de sorte qu'il soit ordonné par la valeur de l'axe y (c'est-à-dire que la barre la plus haute sera être positionné à...

134
Lire uniquement les colonnes sélectionnées

Quelqu'un peut-il me dire comment lire uniquement les 6 premiers mois (7 colonnes) pour chaque année des données ci-dessous, par exemple en utilisant read.table()? Year Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec 2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -25 2010 -41 -27 -25 -31 -31 -39...

134
Installation de l'ancienne version du package R

J'essaye d'utiliser Rpy2 et ggplot2 mais j'obtiens une erreur. Après quelques recherches sur l'erreur en ligne, j'ai constaté que l'erreur se produisait car il y avait des modifications dans le package ggplot2 qui ne sont pas encore reflétées dans Rpy2 (par exemple, voir cet article (Edit: Link is...

131
Comment rechercher des matériaux «R»? [fermé]

Fermé. Cette question est hors sujet . Il n'accepte pas les réponses actuellement. Vous souhaitez améliorer cette question? Mettez à jour la question pour qu'elle soit pertinente pour Stack Overflow. Fermé il y a 7 ans . Améliorez cette question "Google" est très utile ... à moins que votre...

125
Que signifie «méthodes S3» dans R?

Comme je suis assez nouveau dans R, je ne sais pas ce que sont les méthodes et les objets S3. J'ai trouvé qu'il existe des systèmes d'objets S3 et S4, et certains recommandent d'utiliser S3 sur S4 si possible (voir le guide de style R de Google à

121
Compter le nombre de lignes dans chaque groupe

J'ai un dataframe et je voudrais compter le nombre de lignes dans chaque groupe. J'utilise régulièrement la aggregatefonction pour additionner les données comme suit: df2 <- aggregate(x ~ Year + Month, data = df1, sum) Maintenant, j'aimerais compter les observations mais je n'arrive pas à...

120
Suggestions générales pour le débogage dans R

J'obtiens une erreur lors de l'utilisation d'une fonction R que j'ai écrite: Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: algorithm did not converge Ce que j'ai fait: Parcourez la fonction L'ajout d'impression pour savoir à quelle ligne l'erreur se produit suggère deux...

119
Passer un nom de colonne data.frame à une fonction

J'essaye d'écrire une fonction pour accepter un data.frame ( x) et un columnde celui-ci. La fonction effectue quelques calculs sur x et retourne plus tard un autre data.frame. Je suis bloqué sur la méthode des meilleures pratiques pour passer le nom de la colonne à la fonction. Les deux exemples...