Trouver l'emplacement d'un caractère dans une chaîne

87

Je voudrais trouver l'emplacement d'un caractère dans une chaîne.

Dire: string = "the2quickbrownfoxeswere2tired"

Je voudrais que la fonction retourne 4et 24- l'emplacement du caractère du 2s dans string.

Ricardo
la source
Pourquoi utiliser une regex? Est-ce que r a un .indexOf()ou quelque chose?
fge
1
J'en doute. Les développeurs étaient Nixers et supposaient que tout le monde connaissait les regex. La gestion des cordes de R est un peu kludgy.
IRTFM

Réponses:

115

Vous pouvez utiliser gregexpr

 gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired")


[[1]]
[1]  4 24
attr(,"match.length")
[1] 1 1
attr(,"useBytes")
[1] TRUE

ou peut-être à str_locate_allpartir d'un package stringrqui est un wrapper pour (à partir de la version 1.0)gregexpr stringi::stri_locate_allstringr

library(stringr)
str_locate_all(pattern ='2', "the2quickbrownfoxeswere2tired")

[[1]]
     start end
[1,]     4   4
[2,]    24  24

notez que vous pouvez simplement utiliser stringi

library(stringi)
stri_locate_all(pattern = '2', "the2quickbrownfoxeswere2tired", fixed = TRUE)

Une autre option de base Rserait quelque chose comme

lapply(strsplit(x, ''), function(x) which(x == '2'))

devrait fonctionner (étant donné un vecteur de caractères x)

mnel
la source
comment extraire les entiers des listes / objets retournés par vos 3 premières solutions?
3pitt le
Utilisez regexprau lieu de gregexprpour obtenir facilement les entiers. Ou utilisez unlistsur la sortie comme indiqué dans une autre réponse ci-dessous.
Arani
42

Voici une autre alternative simple.

> which(strsplit(string, "")[[1]]=="2")
[1]  4 24
Jilber Urbina
la source
Pouvez-vous expliquer ce que [[1]]fait?
francoiskroll
@francoiskroll, [[1]] représente le premier élément de la liste.
Prafulla
20

Vous pouvez rendre la sortie seulement 4 et 24 en utilisant unlist:

unlist(gregexpr(pattern ='2',"the2quickbrownfoxeswere2tired"))
[1]  4 24

la source
2

trouver la position de la nième occurrence de str2 dans str1 (même ordre de paramètres que Oracle SQL INSTR), renvoie 0 si non trouvé

instr <- function(str1,str2,startpos=1,n=1){
    aa=unlist(strsplit(substring(str1,startpos),str2))
    if(length(aa) < n+1 ) return(0);
    return(sum(nchar(aa[1:n])) + startpos+(n-1)*nchar(str2) )
}


instr('xxabcdefabdddfabx','ab')
[1] 3
instr('xxabcdefabdddfabx','ab',1,3)
[1] 15
instr('xxabcdefabdddfabx','xx',2,1)
[1] 0
Abdelmonem Mahmoud Amer
la source
2

Pour ne trouver que les premiers emplacements, utilisez lapply()avec min():

my_string <- c("test1", "test1test1", "test1test1test1")

unlist(lapply(gregexpr(pattern = '1', my_string), min))
#> [1] 5 5 5

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(min) %>%
  unlist()
#> [1] 5 5 5

Pour ne trouver que les derniers emplacements, utilisez lapply()avec max():

unlist(lapply(gregexpr(pattern = '1', my_string), max))
#> [1]  5 10 15

# or the readable tidyverse form
my_string %>%
  gregexpr(pattern = '1') %>%
  lapply(max) %>%
  unlist()
#> [1]  5 10 15
MS Berends
la source
1

Vous pouvez également utiliser grep:

grep('2', strsplit(string, '')[[1]])
#4 24
AlexB
la source