Quels packages R trouvez-vous les plus utiles dans votre travail quotidien?

28

Fil en double: je viens d'installer la dernière version de R. Quels packages dois-je obtenir?

Quels sont les packages R que vous ne pouviez pas imaginer votre travail quotidien avec les données? Veuillez énumérer les outils généraux et spécifiques.

MISE À JOUR: Comme pour 24.10.10 ggplot2semble être le winer avec 7 voix.

Les autres packages mentionnés plus d'un sont:

  • plyr - 4
  • RODBC, RMySQL- 4
  • sqldf - 3
  • lattice - 2
  • zoo - 2
  • Hmisc/rms - 2
  • Rcurl - 2
  • XML - 2

Merci à tous pour vos réponses!

radek
la source
1
Question très subjective: cette question est sans réponse et ne convient pas à un site d'AQ.
Egon Willighagen
3
Devrait probablement être un wiki communautaire; question utile ici mais n'a pas de réponse définitive.
Shane
2
@Shane: bon point. déplacé. @ Egon: subjectif en effet. mais si les réponses viennent de personnes bien informées, cela ne me dérange pas de dose de subjectivité. J'ai commencé à apprendre le R assez récemment et j'en ai installé quelques dizaines à explorer, mais je remarque qu'il existe des outils que j'utilise beaucoup plus souvent indépendamment de la tâche à accomplir.
radek
Il serait intéressant que StackExchange puisse prendre en charge une méthode de liaison des publications de wiki communautaire à travers les sites. Parce que je parie que cette question a été posée sur Stackoverflow et je pense également que l'analyse statistique peut attirer des gens qui ne visiteraient pas habituellement SO.
Sharpie
@Sharpie: il y a eu plusieurs publications SO intéressantes comme stackoverflow.com/questions/1295955/… ou stackoverflow.com/questions/1535021/… mais elles ne sont pas axées sur les packages. et je suis d'accord, le lien du wiki communautaire pourrait être vraiment utile.
radek

Réponses:

23

J'utilise plyr et ggplot2 le plus quotidiennement.

Je compte également beaucoup sur les packages de séries chronologiques; plus particulièrement, le forfait zoo .

Shane
la source
8

J'utilise le package xtable . Le package xtable transforme les tables produites par R (en particulier, les tables affichant les résultats anova) en tables LaTeX, à inclure dans un article.

Mehper C. Palavuzlar
la source
8

multicœur est assez agréable pour l'outil permettant de rendre les scripts plus rapides plus rapidement.
cacheSweave fait gagner beaucoup de temps lors de l'utilisation Sweave.

user88
la source
8

ggplot2 - de loin la meilleure visualisation pour R.

RMySQL / RSQLite / RODBC - pour la connexion à une base de données

sqldf - manipule data.frames avec des requêtes SQL

Hmisc / rms - packages de Frank Harrell contenant des fonctions diverses pratiques et de belles fonctions pour les analyses de régression.

GenABEL - bel ensemble pour les études d'association à l'échelle du génome

Rcmdr - une interface graphique décente pour R si vous en avez besoin.

Consultez également CRANtastic - ce lien contient une liste des packages R les plus populaires. Beaucoup en tête de liste ont déjà été mentionnés

Stephen Turner
la source
8

data.table est mon préféré maintenant! Très impatient de la nouvelle version avec la liste de souhaits plus implémentée.

Branson
la source
6

Pour moi personnellement, j'utilise le plus les trois packages suivants, tous disponibles à partir du génial Omega Project for Statistical Computing (je ne prétends pas être un expert, mais à mes fins, ils sont très faciles à utiliser):

  • RCurl : Il a beaucoup d'options qui permettent d'accéder à des sites Web avec lesquels les fonctions par défaut de la base R auraient des difficultés, je pense que c'est juste de dire. C'est une interface R à la bibliothèque libcurl, qui a l' avantage supplémentaire de toute une communauté en dehors de R le développer. Également disponible sur CRAN .

  • XML : Il est très indulgent d'analyser XML / HTML mal formé. C'est une interface R à la bibliothèque libxml2 et a encore l' avantage supplémentaire de toute une communauté en dehors de R le développer. Aussi disponible sur CRAN .

  • RJSONIO : Il permet d'analyser le texte renvoyé d'un appel json et de l'organiser dans une structure de liste pour une analyse plus approfondie.Le concurrent de ce package est rjson mais celui-ci a l'avantage d'être vectorisé, facilement extensible via S3 / S4, rapide et évolutif à des données volumineuses.
Tony Breyal
la source
6

Sweave vous permet d'incorporer du code R dans un document LaTeX. Les résultats de l'exécution du code, et éventuellement du code source, font partie du document final.

Ainsi, au lieu, par exemple, de coller une image produite par R dans un fichier LaTeX, vous pouvez coller le code R dans le fichier et tout garder au même endroit.

John D. Cook
la source
4
Juste un indice pour tous ceux qui veulent commencer une recherche reproductible avec R. Je vous conseille de jeter un œil au nouveau package knitrau lieu de Sweave. C'est essentiellement Sweave sur les stéroïdes. Il est aussi facile, sinon plus facile à apprendre et beaucoup plus flexible.
Christoph_J
4

zoo et xts sont un must dans mon travail!

Dr G
la source
4

Je trouve le réseau avec le livre compagnon "Lattice: Multivariate Data Visualization with R" de Deepayan Sarkar inestimable.

NPE
la source
4

Si vous faites tout type de modélisation prédictive, le signe d'insertion est une aubaine. Particulièrement combiné avec le package multicœur , certaines choses assez étonnantes sont possibles.

Zach
la source
4

Au jour le jour, le package le plus utile doit être "étranger" qui a des fonctions pour lire et écrire des données pour d'autres packages statistiques, par exemple Stata, SPSS, Minitab, SAS, etc. Travailler dans un domaine où R n'est pas si courant signifie que cela est un paquet très important.

Graham Cookson
la source
3

j'utilise

voiture, doBy, Epi, ggplot2, gregmisc (gdata, gmodels, gplots, gtools), Hmisc, plyr, RCurl, RDCOMClient, remodeler, RODBC, TeachingDemos, XML.

beaucoup.

esco
la source
3

Je ne pourrais pas vivre sans:

  • treillis pour les graphiques
  • xlsx ou XLConnect pour lire des fichiers Excel
  • rtf pour créer des rapports au format rtf (je préférerais Sword ou R2wd mais je ne peux pas installer statconn au travail; je vais sûrement essayer odfWeave bientôt.)
  • nlme et lme4 pour les modèles mixtes
  • ff pour travailler avec de grands tableaux
Stéphane Laurent
la source
2

RODBC pour accéder aux données des bases de données, sqldf pour effectuer des requêtes SQL simples sur les trames de données (bien que je me force à utiliser des commandes R natives), et ggplot2 et plyr

wahalulu
la source
2

Nous utilisons principalement:

  • ggplot - pour les graphiques
  • Statistiques
  • e1071 - pour SVM
mohans
la source
Vous pouvez également consulter kernlab et caret pour les SVM. Ce sont des alternatives intéressantes (pas nécessairement meilleures).
Zach
2

treillis, voiture, MASSE, étranger, fête.

Peter Flom - Réintégrer Monica
la source
2

Pour moi, j'utilise kernlab pour le Machine Learning Lab basé sur le noyau et e1071 pour SVM et ggplot2 pour les graphiques

404Dreamer_ML
la source
2

J'utilise ggplot2, vegan et remodèle assez souvent.

EDi
la source
2

J'aime roxygen pour sa fonction Curry ().

charles.y.zheng
la source
2

RColorBrewer n'a pas été mentionné ici, je l'utilise souvent pour tracer si j'ai besoin de schémas de couleurs

Arne Jonas Warnke
la source
2

Je suis un grand fan de RCPP lorsque j'ai besoin d'une boucle rapide ou pour effectuer des traitements non très R conformes. Il est très bien implémenté dans le système éco R, peut recevoir Matrix / Matrice clairsemée sans conversion comme arguments dans une fonction.

La syntaxe C ++ est facile lorsque vous faites des choses simples (ce qui est souvent mon cas).

Vraiment, vous n'avez pas besoin d'être un fabricant de packages pour avoir besoin de cette bibliothèque géniale.

Ai-je dit que C ++ est très rapide?

pommedeterresautee
la source
2

Les packages doParallel et foreach m'ont tellement simplifié la vie en me permettant de paralléliser mon code et de l'exécuter sur une instance optimisée pour le calcul sur Amazon EC2 ! Je les utilise très souvent. Mais cela n'aurait pas été possible sans les AMI RStudio publiées par Louis Aslett. Enfin, je dois mentionner le package stringr qui fait vraiment travailler avec des cordes une promenade dans le parc. Utilisez-le dans toutes les applications d'exploration de texte. Et j'utilise aussi très fréquemment knitr pour produire des rapports de haute qualité sur mon travail. Merci beaucoup pour cet incroyable package Yihui Xie!

Antoine
la source
1

J'utilise ggplot2, remodeler, treillis, knitr plus souvent.

Jdbaba
la source