Comment commencer et apprendre le R?

16

J'ai essayé plusieurs fois de "faire cavalier seul" - mais avec un succès limité. Je suis un utilisateur occasionnel de SPSS et j'ai une certaine expérience SAS.

J'apprécierais un pointeur ou deux de quelqu'un qui a des antécédents similaires et utilise maintenant R.

MarketingEngineer
la source
2
Cela devrait probablement être un wiki communautaire. D' autres questions pertinentes sont des ressources pour l' apprentissage R , Où puis - je trouver des tutoriels R utiles , et les ressources liste thread logiciel meta stat R .
Andy W
Voir notre article méta, étiqueté faq : meta.stats.stackexchange.com/questions/793/... .
Andre Silva

Réponses:

17

Je pense que la seule façon d'y entrer est la prochaine fois que vous aurez besoin de faire quelque chose en SAS ou SPSS avec R à la place . C'est difficile au début et au début, vous passerez beaucoup de temps sur des tâches simples. Lorsque vous êtes bloqué sur Google, le problème et vous trouverez probablement une solution. Vous pouvez vérifier vos résultats avec SPSS ou SAS.

Finalement, vous commencez à comprendre et les travaux commencent plus rapidement. Référencer l'ancien code est toujours utile. J'espère que vous trouverez une certaine fierté dans les progrès que vous réalisez.

Ensuite, à mesure que vous devenez plus avancé et lisez des blogs ainsi que ce site, vous commencez à apprendre la véritable puissance de R, les astuces et tout ce qui est possible avec.

Glen
la source
2
Un gros problème: le système d'aide de R est bon lorsque vous savez sur quoi vous voulez des détails. Ce n'est pas si bon si vous n'avez pas la moindre idée de ce que vous devez faire. Trouvez donc une ressource qui vous montre les bases comme: comment lire des données, comment enregistrer votre travail jusqu'à présent, comment créer et enregistrer des graphiques, comment obtenir de l'aide, etc. Par exemple, si vous dites: "Hé, Je veux prévoir quelque chose, je vais donc taper? Prévision pour obtenir de l'aide à ce sujet. " Vous ne trouverez rien. Dans R, le terme habituel est "prédire". J'AIME R, mais je dois le garder réel. De plus, réalisez que R est un langage de programmation, contrairement à SAS ou SPSS: plus difficile au début, mieux plus tard.
Wayne
13

Quelques conseils:

  1. La réponse de @Glen est la clé. Vous devez vous forcer à faire quelque chose en R, même si vous savez que vous pouvez le faire facilement avec SPSS.
  2. Il y a quelques mois, j'ai fait une liste de livres de programmation R qui n'essayaient pas d'enseigner les statistiques, ils ont plutôt décrit R.
  3. Abonnez - vous aux flux RSS de r-bloggers.com et la balise stackoverflow R . Je trouve très utile de simplement parcourir les articles pour obtenir des conseils et des astuces.
csgillespie
la source
7

Ce livre pourrait être juste dans votre ruelle: R. Muenchen (2008). R pour les utilisateurs SAS et SPSS .

J'ai eu des expériences très similaires en démarrant R plusieurs fois. Je suis cependant un utilisateur de Stata. Muenchen et Hilbe (un éditeur de temps lo-ong en charge de la section des logiciels statistiques de The American Statistician ) ont un livre similaire R pour les utilisateurs de Stata, et je l'ai trouvé amusant parfois, quand ils fournissent un segment de code de 20 lignes pour quelque chose qui est faisable en trois lignes dans Stata. (D'un autre côté, il y a bien sûr des situations où vous ne pouvez tout simplement pas faire une chose orientée objet de manière significative dans Stata.) Je suppose que le message est que vous devriez résumer votre expérience SPSS et SAS, comme R le pense en termes totalement différents. à peu près tout. Votre expérience antérieure sera probablement plus un obstacle, au moins dans le cas de R (vous pouvez probablement réapprendre de SPSS à Stata assez rapidement si vous le deviez). Il n'y a plus d'ensembles de données rectangulaires et il n'y a pas de CARTES à lire. Vous devrez éventuellement apprendre à faire des choses R, plutôt que d'essayer de faire des choses SPSS dans R.

StasK
la source
J'aime beaucoup le livre de Muenchen
Peter Flom - Reinstate Monica
7

J'ai été à votre place - et je suis probablement toujours à votre place - car j'utilise régulièrement R et SAS pour différentes tâches. Comme mentionné ci-dessus, il existe "R pour les utilisateurs SAS", et vous pouvez également envisager de consulter le blog "SAS et R": http://sas-and-r.blogspot.com/ et le livre qui l'accompagne, qui fournit des exemples travaillés dans SAS et R.

D'une manière générale, l'expérience de basculer entre SAS et R est quelque peu désorientante, car ils sont différents philosophiquement. À la base, SAS n'est pas un langage de programmation - c'est une puissante interface de ligne de commande. R ... est un langage de programmation. R avait plus de sens pour moi lorsque j'ai commencé à apprendre Python et C que lorsque je connaissais SAS. Certes, c'est un langage de programmation conçu pour les statistiques, mais vous l'avez.

Bien que l'approche de vous forcer à lancer R au lieu de SAS soit décente, je suggérerais autre chose lorsque vous commencez, car plonger les pieds d'abord dans un nouveau projet et un nouveau logiciel est effrayant comme l'enfer. Répétez une ancienne analyse . Prenez un document que vous avez écrit, un ensemble de problèmes que vous avez fait, peu importe en SAS (ou SPSS) et répétez-le dans R. Étape par étape, googler et poser des questions ici au fur et à mesure. Cela présente trois avantages:

  1. Vous ne tuerez pas accidentellement un nouveau projet avec une décision «Je devrais apprendre une nouvelle langue».
  2. Vous connaissez déjà la réponse. Cela signifie que vous pouvez être sûr d'avoir trouvé la bonne réponse dans R.
  3. Il illustrera mieux les différences entre les différentes langues. "Wow, c'était beaucoup plus facile à faire dans R ...", "Je n'avais jamais vraiment regardé ce genre de graphique", etc.
Fomite
la source
7

Beaucoup de bons conseils ici, mais je pense que la chose la plus utile que vous pourriez faire serait de simplement vous asseoir avec quelqu'un qui connaît R pendant quelques heures. J'ai probablement pris des années de ma vie en apprenant R seul; le simple fait de dire à quelqu'un: «Non, c'est beaucoup plus facile de le faire de cette façon» m'aurait sauvé tellement de chagrin. Je pense que cela est particulièrement crucial pour apprendre à faire des choses R, plutôt que des choses SPSS dans R, comme le mentionne StasK, mais cela vous empêchera également de passer des heures à courir autour de stupides petites erreurs de syntaxe.

Il ne semble pas que Pittsburgh ait un groupe d'utilisateurs R, ce qui me déroute, mais il doit y avoir beaucoup de Rgonautes dans les environs. Essayez de les trouver. Pot-de-vin pour que quelqu'un passe du temps avec vous pendant que vous travaillez sur tout ce qui est décrit ci-dessus - traduire un ancien projet en R sonne particulièrement bien.

Matt Parker
la source
Je pense que déterminer les effets sur la santé de franchir la courbe d'apprentissage R serait une excellente étude!
N Brouwer
5

Je suis d'accord avec @Matt Parker qu'il y a plein de bons conseils. Une chose que je veux souligner dans ma réponse est qu'il est essentiel de comprendre la programmation de base si vous voulez travailler avec R.

Programmation de base

Mon site préféré pour apprendre de nouvelles choses est Khan Academy qui a quelques vidéos sur les scripts Python qui sont très similaires à R et il y a en fait un plugin qui vous permet d'utiliser Python dans SPSS que vous pouvez trouver ici . J'ai beaucoup utilisé le plugin Python pour effectuer des fusions complexes, compter les occurrences, créer des tables personnalisées, etc. C'est un très bon moyen de commencer la programmation.

Quel est le problème avec R?

Je connais plusieurs langages de programmation différents et ce qui rend R spécial, c'est ses vecteurs / matrices et sa sortie graphique. Je recommande d'apprendre les différentes façons de manipuler les vecteurs car ils sont à la base des trames de données et de la plupart des données que vous utiliserez, voici un bon tutoriel . En ce qui concerne la sortie graphique, il existe de bonnes fonctions pour la plupart des graphiques disponibles et vous n'avez probablement pas à vous soucier de cette partie.

Une autre partie fondamentale de R est la fonction install.packages ("my_package_name") qui rend la récupération de nouveaux composants et leur installation sans tracas - quelque chose que beaucoup d'autres langages rendent beaucoup plus difficile.

Débuter dans R

Mon site R préféré est Quick-R et je suggère d'essayer une partie de leur code. Une fois que vous avez obtenu le même graphique, essayez de changer les couleurs, le nombre de colonnes, le xlabel, etc. Il existe également de nombreux didacticiels R sur YouTube qui peuvent probablement vous aider à démarrer.

Apprendre en examinant le code des autres

Une excellente façon d'apprendre le R est d'essayer de comprendre le fonctionnement des différentes fonctions. Écrivez le nom des fonctions (sans parenthèses), appuyez sur Entrée et vous obtenez le code - regardez son code et essayez de comprendre ce qu'il fait. La fonction debug () peut également être utile lorsque vous essayez de comprendre comment les choses fonctionnent.

Utilisation de R sans codage

Oui, vous pouvez choisir d'utiliser R dans un environnement similaire à SPSS :

install.packages("Rcmdr")
library(Rcmdr)

R par rapport à SAS

J'en ai aussi travaillé avec SAS qui est un langage très peu intuitif qui diffère beaucoup de tous les autres langages de programmation et malheureusement vous aurez probablement très peu que vous pouvez utiliser de votre expérience SAS lorsque vous travaillez avec R. Cela dit, R est beaucoup plus simple que SAS ;-)

GUI

C'est agréable d'avoir un bon environnement avec lequel travailler lorsque vous utilisez R, ma recommandation aux débutants est RStudio .

Bonne chance!

Max Gordon
la source
Heh - Je ne suis pas d'accord que SAS est plus difficile que R. Ils sont ... différents. Si l'on vient d'une tradition de langages de programmation, R peut avoir plus de sens que SAS. Mais en réalité, ils sont différents - comme je l'ai dit dans mon article, SAS est plus une interface de ligne de commande qu'un langage de programmation approprié.
Fomite
Je suis d'accord qu'ils sont très différents et il s'agit plus d'une opinion que d'une déclaration. Il y a quelques fonctionnalités de base qui me manquaient lorsque j'essayais d'apprendre SAS où la plus basique était une bonne fonction d'aide, je n'ai jamais creusé profondément dans SAS. Une chose que j'ai remarquée est que beaucoup utilisant SAS copient leur ancienne syntaxe sans comprendre. J'ai vu des gens écrire du code où la moitié de la commande n'est même pas utilisée. C'est pourquoi je crois qu'une fois que vous maîtrisez la programmation, l'apprentissage de R n'est pas si difficile. Bonne aide, mise en évidence de la syntaxe, communauté en ligne riche vaut beaucoup et connaître la programmation est vraiment utile 2011.
Max Gordon
Le système d'aide de SAS est concentré dans ses documents de support. Mais oui, c'est surtout qu'ils sont assez différents. Chose ennuyeuse, il y a des fonctions des deux langues qui sont un peu plus difficiles à reproduire dans l'autre, ce qui me laisse parfois utiliser les deux. Ce que je préférerais vraiment ne pas faire.
Fomite
4

Je pense que la réponse mentionnée par @Glen est très importante, mais vous avez besoin de quelques livres pour commencer.

En ce qui concerne RI, croyez que vous avez besoin de 3 livres.

Tout d'abord, pour faire des statistiques avec R, je peux vous recommander R en action . Robert maintient un site R et un blog très actifs (http://www.statmethods.net/) et son livre et ses efforts sont fantastiques.

Deuxièmement, vous aurez peut-être besoin d'un livre pour la programmation en R, car R n'est pas seulement un programme de statistiques mais aussi un puissant langage. La programmation est très utile lorsque vous effectuez des analyses complexes ou lorsque vous combinez des analyses, ou pour écrire des fonctions qui exécutent la même chose sur différents ensembles de données. Je ne peux que vous recommander The Art of R Programming . Aucune statistique majeure n'est présentée ici, mais vous comprendrez comment combiner, connecter et automatiser vos analyses.

Troisièmement, vous aurez besoin d'un livre de référence , d'une encyclopédie. Je peux vous recommander The R Book . Ce n'est pas le livre que vous lirez du début à la fin mais c'est le livre que vous ouvrez de temps en temps pour voir si certaines choses sont possibles, s'il existe d'autres façons d'analyser les données, etc.

Et surtout, arrêtez d'utiliser autre chose et essayez de résoudre tous vos problèmes dans R. Résoudre les problèmes de la meilleure façon possible.

Aussi, avant d'oublier. Il y a de merveilleux blogs de personnes fantastiques écrivant sur toutes sortes de choses que l'on peut faire dans R. Search et vous les trouverez. Le site d'agrégation http://www.r-bloggers.com/ où les blogs pertinents sont rassemblés est fortement recommandé .

S'amuser!

ECII
la source
1

Si je pouvais déjà ajouter deux éléments aux nombreuses bonnes suggestions ici;

1) Trouvez un groupe R. Je sais que dans la région de Boston, il y a un groupe R assez fort. Il est parrainé par RStudio , qui est d'ailleurs l'un des meilleurs IDE autour.
Allez sur Meetup ou Google group ou RSeek.org pour les rechercher.

2) Encore une chose, j'ai trouvé l'apprentissage du R par moi-même dans une montée raide mais mon conseil général est de continuer à chercher des livres qui aident ET NE S'ARRÊTENT PAS jusqu'à ce que vous trouviez le bon.

oaxacamatt
la source
1

Ingénieur Marketing:

Je connais vos problèmes car la meilleure et la pire chose de R est trop fonctionnelle jusqu'à ce que nous ne sachions pas par où commencer.

Tout d'abord, vous devez savoir dans quel but vous apprenez R. Si vous êtes juste pour apprendre une nouvelle langue, je pense que SAS et R Blog pourraient être utiles, en tant qu'utilisateur SAS / SPSS.

Cependant, R n'est pas si difficile par rapport à SAS ou SPSS, il semble juste complexe en raison des packages et des fonctions sans cesse croissants. Donc, je suggère que vous puissiez apprendre à partir de zéro en utilisant tous les manuels ou sites Web suggérés, tels que Quick-R, par l'auteur de R in Action. Remarque: R in Action est un bon livre pour commencer.

Et si vous avez utilisé R à des fins spécifiques, il est préférable de consulter la liste R Book sur R Project Web. Il existe 129 livres liés à la R et S dans des applications spécifiques, telles que l'économétrie, le graphisme, la modélisation, etc.

Récemment, je pense à la plate - forme d'apprentissage en ligne interactive de langue R et j'avais également demandé des commentaires ici. C'est un projet open source (pas encore publié). J'avais commencé à faire un prototype fonctionnel avec des leçons de base en 3 R Language. Vous pouvez l'essayer.

J'espère que cela vous aidera :-)

Kai Feng Chew
la source
0

Il existe une première version gratuite de R pour les utilisateurs SAS et SPSS sur http://r4stats.com . Ce site contient également de nombreux exemples de livres désormais affichés sous forme de pages Web. Si vous avez accès à une bibliothèque universitaire, ils ont généralement tous les livres Springer R en ligne gratuitement.

user3155
la source