Lors de l'analyse exploratoire des données, je vais souvent imprimer les graphiques et écrire des commentaires / annotations, etc.
Les gens ont-ils des suggestions pour une meilleure méthodologie électronique? Je suis particulièrement intéressé par python / R.
Je recherche quelque chose de «rapide (et sale)» qui ne ralentit pas le travail d'exploration, mais aide à enregistrer les informations que j'ai faites.
Ce que je pourrais imaginer, c'est générer des graphiques au format PDF, puis ajouter des commentaires.
Idéalement, j'aimerais avoir la possibilité de le faire par programme, de sorte que si je refais les graphiques, je peux ajouter automatiquement les commentaires.
data-visualization
eda
project-management
seanv507
la source
la source
R
, c'est d'ajouter un tracé séparé (sur une page séparée à la fin du pdf) et de l'utiliser pourpaste
certains commentaires.Réponses:
Voici une solution simple que de nombreuses personnes ont trouvée utile. Si vous trouvez cela trivial, je ne serai pas en désaccord. Cela recoupe les logiciels statistiques, le système d'exploitation et d'autres détails informatiques.
Copiez et collez simplement vos graphiques dans votre traitement de texte ou de texte préféré, puis ajoutez vos propres commentaires. Cela pourrait signifier MS Word, un logiciel prenant en charge TeX, LaTeX, etc.
C'est ça. De toute évidence, les avantages sont la simplicité (rien de nouveau à apprendre) et la flexibilité (ajoutez ce que vous voulez comme vous le souhaitez).
Ce n'est pas une solution automatisée. Mais même les solutions automatisées dépendent de la fourniture d'informations sur les graphiques et vos commentaires, alors qu'est-ce qui est différent?
la source
Je recommande fortement Jupyter Notebook , qui vous permet de créer des documents contenant des blocs de code entrecoupés, des tracés et des notes / documentation. Le document peut inclure du démarquage et du latex, qui sont rendus automatiquement (un peu comme écrire sur CrossValidated). Lorsque vous exécutez un bloc de code, toute sortie de texte et les tracés qu'il génère sont ajoutés en ligne au document. Vous pouvez modifier un bloc de code et réexécuter pour mettre à jour la sortie / les tracés. C'est bien pour tester des choses de manière interactive (par exemple, ajuster le code / les paramètres pour voir ce qui se passe). Je pense que c'est plus facile que d'avoir à exporter des chiffres et à les coller dans un document statique traditionnel, surtout si vous changez quoi que ce soit. Vous pouvez exporter un cahier au format PDF, etc. pour obtenir une copie statique.
Il est open source et fonctionne avec Python, R et d'autres langages. L'interface est basée sur un navigateur, elle est donc multiplateforme et facile à partager. Vous pouvez exécuter le backend sur votre propre machine, ou vous pouvez héberger des blocs-notes sur un site Web afin que vous / les autres puissiez les modifier / les visualiser / les exécuter de n'importe où (le code s'exécutera sur le serveur). Apparemment, il existe un moyen de configurer le bloc-notes comme l'interface d'un cluster de calcul pour les calculs parallèles.
la source
J'ai tendance à faire de plus en plus d'analyses
R notebooks
dans RStudio. De cette façon, je peux avoir du code, des annotations et des graphiques ensemble au même endroit et ne pas avoir à produire des fichiers PDF tout le temps - ce qui est un véritable gain de temps. Vous écrivez du texte et du code dans un éditeur et en cliquant sur un bouton, le code est exécuté (et le graphique dessiné) en place. Ainsi, le texte, le code et l'intrigue restent parfaitement ensemble. Il est également très facile de convertir en HTML ou PDF en quelques clics de souris. Je ne sais pas, comment cela fonctionne avec Python, car j'utilise principalement R.la source
On dirait que vous voulez une sorte de programmation alphabétisée .
R
permet à Sweave et Knitr d’ interfacer avec LaTeX . Il existe d'autres options pour différents types de formats de sortie, tels que ODFweave pour les documents modifiables (comme les documents Word) et RMarkdown qui peuvent produire plusieurs types (comme HTML en plus des éléments mentionnés ci-dessus). D'autres logiciels statistiques ont généralement des fonctionnalités analogues.(Il y a un peu de travail initial pour les utiliser. Je fais généralement des projets ponctuels au lieu de projets à plus long terme qui nécessitent des rapports réguliers et similaires, donc j'utilise généralement la méthode de @ NickCox pour vider ou copier dans un fichier et en écrivant des commentaires à ce sujet.)
la source
Dans
R
: Parfois, j'ajoute un tracé supplémentaire à un pdf avec des informations de base. Ceci est très utile si les annotations sont courtes et se rapportent aux données de tracé de sorte que vous puissiezpaste
ajouter des informations. Par exemple:Alternativement, si vous avez des annotations plus longues, la production d'un rapport à l'aide de R Markdown pourrait être une solution.
la source