Je recherche un progiciel statistique que je peux utiliser dans un cours d'introduction aux statistiques pour un programme d'études en sciences sociales. Les étudiants n'ont aucune connaissance préalable des statistiques et aucune expérience avec les langages de programmation non plus. L'objectif est de leur présenter des concepts statistiques de base (comme les moyennes, la variance, la somme des carrés, les valeurs de p, ... et enfin la régression linéaire) et de leur permettre de mener des analyses de base par eux-mêmes à l'aide d'exemples de jeux de données. Le cours devrait porter sur l'apprentissage de concepts en faisant des statistiques plutôt qu'en mémorisant des formules (même si je pense que les formules sont importantes).
Par conséquent, je recherche une alternative à la syntaxe habituelle (comme R normal) ou au logiciel piloté par pointer-cliquer (comme SPSS ou Rcmdr). Le logiciel doit être facile à apprendre et il doit avoir une interface utilisateur graphique claire qui visualise les ensembles de données et propose les graphiques et les tableaux standard. Le mieux serait de visualiser toutes les différentes étapes d'une analyse (par exemple, lire et manipuler des données, calculer des mesures descriptives, créer des tableaux et graphiques descriptifs, calculer des mesures inférentielles, tracer des graphiques inférentiels, exporter vers un rapport).
Avez-vous des suggestions de logiciels statistiques (open-source ou gratuits) adaptés à l'apprentissage et à la première pratique des statistiques?
EDIT
Merci pour vos suggestions. Je l' ai regardé dans Gretl , et deux autres programms j'ai trouvé au cours de ma propre enquête en ligne: RapidMiner et statistique Lab . [1]
J'ai trouvé que gretl
est plus claire et ciblée de l' interface et la sortie de » que , par exemple Rcmdr, SPSS ou Stata. Par conséquent, c'est un outil bien qualifié pour commencer à enseigner les statistiques de mon point de vue.
Cependant, l'interface graphique de l'organigramme de RapidMiner
etStatistical Lab
m'a impressionné en visualisant les étapes uniques d'une analyse statistique (en commençant par le chargement des données). Je pense que cela pourrait être utile à de nombreux élèves qui ont du mal à se concentrer sur les explications mathématiques. Bien sûr, RapidMiner me semble trop surchargé de fonctions, de menus et de boutons pour les débutants alors que le Statistical Lab est beaucoup plus concentré. Le gros plus du Statistical Lab est le "R-Calculator" de type console avec un "R-code Wizard" qui aide à produire une vraie syntaxe R sur laquelle le Statistical Lab s'appuie R
pour ses calculs.
Enfin, j'ai décidé de commencer par le laboratoire de statistique au premier semestre tout en introduisant les concepts de base et de passer à RStudio (et Rcmdr) au deuxième semestre.
[1]: Gnumeric, SciPy, Scilab, GNU Octave et similaires me semblent moins orientés vers les sciences sociales.
Réponses:
Peut-être Gretl? http://gretl.sourceforge.net/
Il est gratuit et utilisé dans notre université pour les statistiques de premier cycle.
la source
J'éviterais la plupart des trucs "célèbres", MatLab , Maple , Mathematica , JMP , SAS ou Minitab , parce que lorsque vos étudiants obtiennent leur diplôme, ils doivent payer des milliers de dollars par an pour l'utiliser professionnellement. Chaque entreprise a généralement son outil préféré, et si vous lui apprenez un outil que son entreprise ne paiera pas, ses compétences seront gaspillées. Je n'aime pas non plus les bibliothèques propriétaires - elles entraînent les utilisateurs à appuyer sur des boutons et si l'utilisateur veut aller ailleurs (JMP ou autre), il n'y a pas de report d'apprentissage.
Python incluant SciPy / NumPy est plutôt bon. Il est open source et bien pris en charge. Il a une grammaire facile à apprendre. Il est toujours interprété de sorte qu'il ne crie pas rapidement, mais s'ils ne connaissent aucun script ou tableur, c'est beaucoup plus rapide qu'ils n'en auraient besoin. PythonXY est une bonne version, a de bonnes bibliothèques et un bon support. J'aime aussi que la programmation GUI soit possible grâce à elle. La création d'applications autonomes dans Windows est un peu difficile mais probablement supérieure au niveau de vos élèves. (modifier) Sage et Cythonaméliorer considérablement la proposition de valeur de Python. L'interface et la convivialité sont considérablement améliorées. Un code compilé 1000 fois plus rapide qu'un très bon code interprété me semble génial (ou étonnant). EDIT: J'ai eu du plaisir à utiliser les distributions Anaconda (aka conda), et elles sont également très simples à utiliser.
Je ne suis pas un grand fan de Perl . C'est un peu dépassé. Il s'agit d'analyser et de traiter du texte plus que des mathématiques / sciences. Ne vous méprenez pas, il peut faire des mathématiques / sciences, mais si vous connaissez VBA, alors MSWord peut faire des mathématiques / sciences. Être capable de ne pas être le même a un emploi particulier comme objectif principal.
J'aime R , même si vous ne le faites pas, car il est agressivement développé par des docteurs qualifiés en mathématiques / statistiques. Cela signifie que même si la grammaire peut être klugy, elle aura des bibliothèques à jour et sans erreur. (En général)
Excel n'est pas un mauvais début. Une fois que vous connaissez une feuille de calcul, il est plus facile d'en utiliser une autre. Dans un environnement professionnel, presque toutes les entreprises ont un bureau MicroSloth , donc Excel n'est pas une mauvaise idée. Je n'aime pas leur script, mais c'est juste une préférence, je peux toujours l'utiliser. Il coûte environ 150 dollars américains contre 5000 dollars américains pour certains des autres logiciels, donc son coût d'entrée pour les gens normaux est plus raisonnable.
Le langage de script JMP est étranger. Il ne se traduit pas sur d'autres logiciels (non SAS). Restez à l'écart. La seule caractéristique utilisable de la langue est qu'elle peut (dans un sens limité) exécuter le code "R". Si vous codez en "R", utilisez simplement "R" et "RStudio".
Je n'ai pas utilisé MathCAD donc je ne peux pas parler de sa pertinence. Je pense que c'est plus symbolique, moins sur l'importation de données externes. Jusqu'à présent, c'est moins cher. Ce n'est pas gratuit et ouvert. Facilité à elle ne se traduit pas par facilité dans une autre langue. ( EDIT ) EES , également dans cette catégorie , ne me impressionne pas non plus en dehors d'une fenêtre d'utilisation très étroite.
EDIT : J'ai été un peu impressionné par LabVIEW . Il est assez simple à utiliser que quelques heures peuvent rendre quelqu'un capable. Il fonctionne très rapidement, comme littéralement 1000 fois plus vite que MatLab pour littéralement exactement le même code ( MathScript ). Si vous avez du poids, cela vaut la peine d'être considéré. Cela coûte de l'argent, mais quelque chose dans le voisinage de 1/5 du gros fer conventionnel.
Bonne chance
EDIT: Je n'utiliserais pas LAboratory statistique parce que même lorsque vous sélectionnez "anglais" pour la langue, il sort en allemand, et il ne se désinstalle pas sur Windows 7. Les deux faiblesses administratives en font un no-go pour moi. Je ne peux pas le faire fonctionner et quand j'ai essayé de le retirer, cela a échoué.
Par essais et erreurs, j'ai découvert le réglage du menu pour qu'il s'affiche en anglais. Il semble que ce soit une interface relativement simple (et donc utile et cohérente) dans certaines bibliothèques R pour le traitement et l'affichage des données. Je vais devoir approfondir les choses, donc à ce stade «le jury est toujours absent».
MODIFIER davantage:
-> Voici <- est un lien amusant vers une toute autre discussion sur les outils et les établis.
la source
Vous pouvez essayer d'utiliser Gnumeric, une feuille de calcul très appréciée, il existe également une feuille de calcul Open Office. À condition d'expliquer les pièges de l'utilisation de feuilles de calcul, en particulier Excel, après l'université dans leur vie pratique ultérieure, ils peuvent ne pas avoir le luxe de quelque chose comme SPSS, mais pourraient toujours obtenir un service utile de ces produits gratuits qui ne sont pas trop exigeants en mathématiques et en compétences en programmation . De nombreux environnements de bureau contiennent Excel par défaut.
Jettes un coup d'oeil à:
http://groups.google.com/group/sci.stat.math/browse_thread/thread/26fe9a9a0d91139d# - Statistiques et Excel 2007
et recherchez des références similaires telles que
http://groups.google.com/group/comp.soft-sys.stat.spss/browse_frm/thread/3940bcd6c6266f1b/d85edd4978e53568?hl=en#d85edd4978e53568 Keeling, Kellie B. & Pavur, Robert J. (2007). Une étude comparative de la fiabilité de neuf progiciels statistiques. Statistiques computationnelles et analyse des données, 51, 3811–3831.
la source
J'ai été CalEst . La licence est bon marché, comme 10 buck et fournit à la fois des calculs / graphiques ainsi que de superbes activités de simulation pour les étudiants. De plus, dans leur site Web, ils ont quelques outils, principalement sur les distributions que vous trouverez utiles.
la source
Nous avons commencé à utiliser Rguroo. Ce logiciel vient d'être publié. Il est basé sur R, mais aucune connaissance du codage R n'est requise. Il s'agit également d'une application Web, il vous suffit de vous connecter sur un navigateur. Mes élèves peuvent sauvegarder leur travail à tout moment et revenir en arrière pour terminer leur travail. L'interface utilisateur graphique est très intuitive et les sorties sont superbes.
la source
Nous utilisons la version bêta de Rguroo dans nos cours d'introduction à la statistique à la California State University, Fullerton depuis trois ans. Ils ont maintenant (août 2019) publié une version officielle, voir https://Rguroo.com. Il s'agit d'un logiciel de statistiques d'application Web qui fonctionne dans n'importe quel navigateur. Ce logiciel est conçu pour l'enseignement et offre une démonstration et une formation individuelles pour les professeurs; envoyez un e-mail ou appelez-les pour organiser une démonstration. Le logiciel exécute R en arrière-plan, mais vous n'avez pas besoin de connaître R, il suffit de pointer et de cliquer. Il possède de nombreuses fonctionnalités intéressantes, notamment des sorties détaillées, d'excellents outils graphiques, un calculateur de probabilité et des outils de simulation. J'aime particulièrement les fonctionnalités de reproductibilité où vous pouvez enregistrer votre travail à tout moment et revenir et continuer là où vous vous étiez arrêté. Vous pouvez également partager votre travail avec les étudiants via ce qu'ils appellent les fichiers RGR. En bout de ligne ... c'est un grand et nous continuons à l'utiliser.
la source
J'utilise personnellement le logiciel DataMelt pour l'enseignement des statistiques. C'est très bien documenté, il a des tutoriels, des livres et beaucoup d'exemples à regarder. Ce qui est également important, c'est que l'on peut rechercher n'importe quel exemple, et vous pouvez obtenir une réponse raisonnable (dans Javadoc et des extraits de code). Les étudiants peuvent apprendre non seulement Python (qui est le langage de programmation par défaut), mais aussi comment coder des méthodes statistiques en Java. À mon avis, c'est une force importante: les étudiants n'ont pas besoin d'apprendre un langage "statistique" très spécialisé, comme le R-stat. Ils peuvent également apprendre Java en même temps, ce qui peut ouvrir de nombreuses opportunités s'ils décident de se lancer dans l'industrie.
la source
Il existe un nouveau logiciel appelé Rguroo qui est une application web. Il est très pratique à utiliser, car il ne nécessite ni téléchargement ni installation. Rguroo a un moteur R, mais son utilisation ne nécessite pas de codage R car il vous permet d'utiliser la puissance de R en utilisant une interface graphique pointer-cliquer. Chaque analyse est enregistrable et reproductible. Nous utilisons ce logiciel pour nos cours d'introduction et de statistiques intermédiaires au cours des trois dernières années. À ce stade, il est gratuit et vous pouvez créer un compte sur www.Rguroo.com. D'après les informations dont je dispose, il restera gratuit pour toutes les facultés et il y aura un abonnement annuel raisonnable, entre 10 et 20 dollars, pour les étudiants.
la source