Est-il plus rapide de rechercher des termes de recherche longs ou courts? Ou cela affecte-t-il la vitesse? En d'autres termes, devez-vous rendre les termes de recherche aussi précis que possible?
Il y a plus de 100 000 fichiers et chaque fichier contient entre 20 et plus de 5000 lignes de données. Généralement, le grep est utilisé pour trouver une seule instance du terme de recherche.
Disons que le terme de recherche est SEARCHTERM
, et il sera dans une rangée comme celle-ci:
NAD+DP+1234567890:92++UNIQUE+NAME+SEARCHTERM++12345+FI'
Est-il plus rapide de rechercher "SEARCH" ou "SEARCHTERM"? Disons que dans ce cas, nous ne nous soucions pas si nous trouvons également des correspondances dans d'autres lignes non liées.
Voici comment je le fais actuellement:
grep NAD+DP 123* | grep SEARCHTERM
Mais je trouve ça assez lent, quand même. Il faut généralement environ 3 à 5 minutes pour trouver les données, même lorsque je connais le nom de fichier approximatif, ce qui limite la plage à environ 10 000 fichiers.
Alors, un terme de recherche plus ou moins long serait-il utile? Pour autant que je sache, grep recherche des "blocs" de mots d'une certaine longueur?
la source