Comment trouver la longueur d'une chaîne (nombre de caractères dans une chaîne) sans la diviser en R? Je sais trouver la longueur d'une liste mais pas d'une chaîne.
Et qu'en est-il des chaînes Unicode? Comment trouver la longueur (en octets) et le nombre de caractères (runes, symboles) dans une chaîne Unicode?
Question connexe:
r
string
unicode
string-length
Igor Chubin
la source
la source
x
.Réponses:
Tu vois
?nchar
. Par exemple:la source
nchar(NA)
NA
s. (Bien que cela soit documenté).stri_length
partir destringi
- cela fonctionne bien avec les NA et c'est plus rapide :) Vérifiez mon message!nchar(NA) ## [1] NA
: voir nchar RDocumentationUtiliser le
stringi
package et lastri_length
fonctionPourquoi? Parce que c'est la PLUS RAPIDE parmi les solutions présentées :)
et fonctionne aussi très bien avec les NA
la source
stri_length('\u0105')
longueur est un, mais ...stri_numbytes('\u0105')
2 octets sont utilisésnchar()
il y a maintenant un argument qui explique les NA:allowNA = FALSE
Vous pouvez également utiliser le
stringr
package:la source
Découvrez ceci
la source
L'option keepNA = TRUE empêche les problèmes avec NA
la source
nchar(NA) ## [1] NA
: voir nchar RDocumentationvous devrez peut-être d'abord convertir en un vecteur de caractères;
la source
nchar
. Pour les entrées de facteur,nchar
générera une erreur et vous devrez donc effectuer la conversion en premier comme vous le montrez.