Bien que j'ai été formé comme ingénieur, je trouve que je m'intéresse de plus en plus à l'exploration de données. En ce moment, j'essaie d'enquêter davantage sur le terrain. En particulier, je voudrais comprendre les différentes catégories d'outils logiciels qui existent et quels outils sont remarquables dans chaque catégorie et pourquoi. (Notez que je n'ai pas dit les "meilleurs" outils, juste les plus remarquables de peur que nous ne commencions une guerre des flammes.) Surtout notez les outils qui sont open-source et librement disponibles - bien que cela ne signifie pas que Je ne suis intéressé que par l'open source et gratuit.
data-mining
John Berryman
la source
la source
Réponses:
C'est probablement la liste la plus complète que vous trouverez: mloss.org
la source
Jettes un coup d'oeil à
et le référentiel d'apprentissage automatique UCI pour les ensembles de données.
la source
Rattle est une interface graphique d'exploration de données qui fournit une interface à une large gamme de packages R.
la source
Jetez un œil à KNIME .
Très facile à apprendre. Avec beaucoup de possibilités pour de nouveaux progrès. S'intègre parfaitement avec Weka et R.
la source
Du point de vue de la popularité, cet article (2008) examine les 10 meilleurs algorithmes d'exploration de données .
la source
RapidMiner (Java) [open source]
la source
Il y a ELKI , un projet universitaire open source quelque peu comparable à WEKA, mais beaucoup plus puissant en ce qui concerne le clustering et la détection des valeurs aberrantes. WEKA n'est pas vraiment de l'exploration de données, mais un logiciel d'apprentissage automatique.
la source
Il y a ce Red-R qui a une belle interface graphique et de programmation visuelle. Il utilise R pour traiter les différentes analyses de données.
la source
Rexer Anlaytics réalise chaque année une enquête sur la boîte à outils. KDnuggets a des descriptions de logiciels par secteur ainsi que par intention.
la source
L'exploration de données SQL Server (SSDM) n'a pas été mise à jour depuis longtemps, mais elle reste très compétitive si vous extrayez de grandes bases de données relationnelles et des cubes. Je progresse lentement mais systématiquement à travers les tests du plus grand nombre d'outils d'exploration possible et l'interface Windows de SQL Server est la plus productive et la plus stable que j'ai trouvée à ce jour (en particulier en ce qui concerne les bases de données d'entreprise, dont certaines ont étonnamment interfaces bâclées) malgré son âge. Je préfère une interface Windows Presentation Foundation (WPF) moderne, mais c'est la meilleure chose à faire.
J'ai écrit toute une série de tutoriels amateurs détaillés à ce sujet, intitulé Un escalier Rickety vers l'exploration de données SQL Server , à l'époque où j'essayais d'acquérir des compétences de base en matière d'exploration de données. Malgré mon inexpérience, ils sont toujours utiles pour aider à identifier certains des "pièges" à l'avance.
la source