Le risposte a questa domanda su SO hanno restituito un set di circa 125 nomi da una a due lettere: /programming/6979630/what-1-2-letter-object-names-conflict-with-existing -r-oggetti
[1] "Ad" "am" "ar" "as" "bc" "bd" "bp" "br" "BR" "bs" "by" "c" "C"
[14] "cc" "cd" "ch" "ci" "CJ" "ck" "Cl" "cm" "cn" "cq" "cs" "Cs" "cv"
[27] "d" "D" "dc" "dd" "de" "df" "dg" "dn" "do" "ds" "dt" "e" "E"
[40] "el" "ES" "F" "FF" "fn" "gc" "gl" "go" "H" "Hi" "hm" "I" "ic"
[53] "id" "ID" "if" "IJ" "Im" "In" "ip" "is" "J" "lh" "ll" "lm" "lo"
[66] "Lo" "ls" "lu" "m" "MH" "mn" "ms" "N" "nc" "nd" "nn" "ns" "on"
[79] "Op" "P" "pa" "pf" "pi" "Pi" "pm" "pp" "ps" "pt" "q" "qf" "qq"
[92] "qr" "qt" "r" "Re" "rf" "rk" "rl" "rm" "rt" "s" "sc" "sd" "SJ"
[105] "sn" "sp" "ss" "t" "T" "te" "tr" "ts" "tt" "tz" "ug" "UG" "UN"
[118] "V" "VA" "Vd" "vi" "Vo" "w" "W" "y"
E codice di importazione R:
nms <- c("Ad","am","ar","as","bc","bd","bp","br","BR","bs","by","c","C","cc","cd","ch","ci","CJ","ck","Cl","cm","cn","cq","cs","Cs","cv","d","D","dc","dd","de","df","dg","dn","do","ds","dt","e","E","el","ES","F","FF","fn","gc","gl","go","H","Hi","hm","I","ic","id","ID","if","IJ","Im","In","ip","is","J","lh","ll","lm","lo","Lo","ls","lu","m","MH","mn","ms","N","nc","nd","nn","ns","on","Op","P","pa","pf","pi","Pi","pm","pp","ps","pt","q","qf","qq","qr","qt","r","Re","rf","rk","rl","rm","rt","s","sc","sd","SJ","sn","sp","ss","t","T","te","tr","ts","tt","tz","ug","UG","UN","V","VA","Vd","vi","Vo","w","W","y")
Poiché il punto della domanda era quello di elaborare un elenco memorabile di nomi di oggetti da evitare, e la maggior parte degli umani non è così brava a dare un senso a un solido blocco di testo, vorrei visualizzarlo.
Sfortunatamente non sono esattamente sicuro del modo migliore per farlo. Avevo pensato a qualcosa di simile a un diagramma a gambo e foglia, solo perché non c'erano valori ripetuti ogni "foglia" veniva collocata nella colonna appropriata anziché essere giustificata a sinistra. O un adattamento in stile wordcloud in cui le lettere sono dimensionate in base alla sua prevalenza.
Come può essere visualizzato in modo più chiaro ed efficiente?
Le visualizzazioni che rientrano in una delle seguenti condizioni rientrano nello spirito di questa domanda:
Obiettivo primario: migliorare la memorabilità dell'insieme di nomi rivelando i modelli nei dati
Obiettivo alternativo: evidenziare le caratteristiche interessanti dell'insieme di nomi (ad esempio, che aiutano a visualizzare la distribuzione, le lettere più comuni, ecc.)
Le risposte in R sono preferite, ma tutte le idee interessanti sono benvenute.
È consentito ignorare i nomi di una sola lettera, poiché è più semplice fornirli come un elenco separato.