Les réponses à cette question sur SO ont renvoyé un ensemble d'environ 125 noms d'une à deux lettres: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-objets
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
Et le code d'importation R:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Étant donné que le but de la question était de proposer une liste mémorable de noms d'objets à éviter, et que la plupart des humains ne sont pas si doués pour donner du sens à un bloc de texte solide, je voudrais visualiser cela.
Malheureusement, je ne suis pas exactement certain de la meilleure façon de procéder. J'avais pensé à quelque chose comme un tracé de tige et de feuille, seulement parce qu'il n'y a pas de valeurs répétées chaque "feuille" a été placée dans la colonne appropriée plutôt que d'être laissée justifiée. Ou une adaptation de style wordcloud où les lettres sont dimensionnées en fonction de sa prévalence.
Comment cela pourrait-il être visualisé le plus clairement et le plus efficacement possible?
Les visualisations qui remplissent l'une des conditions suivantes dans l'esprit de cette question:
Objectif principal: améliorer la mémorisation de l'ensemble de noms en révélant des modèles dans les données
Autre objectif: mettre en évidence les caractéristiques intéressantes de l'ensemble de noms (par exemple, qui aident à visualiser la distribution, les lettres les plus courantes, etc.)
Les réponses en R sont préférées, mais toutes les idées intéressantes sont les bienvenues.
Ignorer les noms à une seule lettre est autorisé, car ceux-ci sont plus faciles à donner en tant que liste distincte.
la source
Ok, voici ma vision très rapide d'une visualisation de type "tableau périodique", basée sur la question SO et les commentaires des autres. Le problème principal est la grande différence de nombre de variables entre les packages, ce qui entrave la visualisation ... Je me rends compte que c'est très difficile, alors n'hésitez pas à le modifier comme vous le souhaitez.
Voici la sortie actuelle (de ma liste de paquets)
Et le code
Maintenant, nous avons un bloc de données comme celui-ci:
Nous pouvons maintenant diviser les données par package
Nous pouvons voir que la plupart des variables proviennent du package de base et de statistiques
Enfin, la routine de dessin
la source
Voici un histogramme basé sur une lettre. Envisagé de dimensionner les premières lettres en nombre, mais a décidé de ne pas le faire car il est déjà encodé dans la composante verticale.
la source
Tableau périodique pour 100, Alex. Mais je n'ai pas de code pour ça. :(
On pourrait penser qu'un package "tableau périodique" pourrait déjà exister dans CRAN. L'idée d'un schéma de coloration et d'une disposition de ces données pourrait être intéressante et utile.
Ceux-ci peuvent être colorés par package et triés verticalement par fréquence, par exemple dans un échantillon de code sur CRAN ou tels qu'ils apparaissent dans la base de code locale.
la source
Les deux premières pages du chapitre 2 de l'ITILA de MacKay contiennent de beaux diagrammes montrant les probabilités conditionnelles de tous les couples de caractères en anglais. Vous pouvez le trouver utile.
Je suis gêné de dire que je ne me souviens pas quel programme a été utilisé pour les produire.
la source