FTS ne prend pas en charge LIKE
La réponse précédemment acceptée était incorrecte. La recherche de texte intégral avec ses index de texte intégral n'est pas du tout pour l' LIKE
opérateur, elle a ses propres opérateurs et ne fonctionne pas pour les chaînes arbitraires. Il fonctionne sur des mots basés sur des dictionnaires et des souches. Il prend en charge la correspondance de préfixe pour les mots , mais pas avec l' LIKE
opérateur:
Index trigrammes pour LIKE
Installez le module supplémentaire pg_trgm
qui fournit des classes d'opérateurs pour les index GIN et GiST trigrammes pour soutenir tous LIKE
et ILIKE
modèles , non seulement ceux de gauche ancrés:
Exemple d'index:
CREATE INDEX tbl_col_gin_trgm_idx ON tbl USING gin (col gin_trgm_ops);
Ou:
CREATE INDEX tbl_col_gist_trgm_idx ON tbl USING gist (col gist_trgm_ops);
Exemple de requête:
SELECT * FROM tbl WHERE col LIKE '%foo%'; -- leading wildcard
SELECT * FROM tbl WHERE col ILIKE '%foo%'; -- works case insensitively as well
Trigrammes? Qu'en est-il des cordes plus courtes?
Les mots avec moins de 3 lettres dans les valeurs indexées fonctionnent toujours. Le manuel:
Chaque mot est considéré comme ayant deux espaces préfixés et un espace suffixé lors de la détermination de l'ensemble de trigrammes contenus dans la chaîne.
Et les modèles de recherche avec moins de 3 lettres? Le manuel:
Pour les recherches LIKE
et les recherches d'expressions régulières, gardez à l'esprit qu'un modèle sans trigrammes extractibles dégénérera en une analyse d'index complet.
Cela signifie que les analyses d'index / bitmap fonctionnent toujours (les plans de requête pour l'instruction préparée ne seront pas interrompus), cela ne vous offrira tout simplement pas de meilleures performances. En règle générale, pas de grosse perte, car les chaînes de 1 ou 2 lettres ne sont guère sélectives (plus de quelques pour cent des correspondances de table sous-jacentes) et la prise en charge de l'index n'améliorerait pas les performances au départ, car une analyse complète de la table est plus rapide.
text_pattern_ops
pour la correspondance de préfixe
Pour les modèles uniquement ancrés à gauche (pas de caractère générique en tête), vous obtenez l'optimum avec une classe d'opérateur appropriée pour un index btree: text_pattern_ops
ou varchar_pattern_ops
. Les deux fonctionnalités intégrées de Postgres standard, aucun module supplémentaire n'est nécessaire. Performances similaires, mais indice beaucoup plus petit.
Exemple d'index:
CREATE INDEX tbl_col_text_pattern_ops_idx ON tbl(col text_pattern_ops);
Exemple de requête:
SELECT * FROM tbl WHERE col LIKE 'foo%'; -- no leading wildcard
Ou , si vous devez exécuter votre base de données avec la locale 'C' (effectivement pas de locale), alors tout est de toute façon trié selon l'ordre des octets et un simple index btree avec la classe d'opérateur par défaut fait le travail.
Plus de détails, d'explications, d'exemples et de liens dans ces réponses connexes sur dba.SE:
pg_trgm
vous avez besoin d'une chaîne de requête d'au moins 3 caractères, par exemple,fo%
ne pas frapper l'index mais effectuer une analyse à la place. Quelque chose à noter.Peut-être que les plus rapides sont des modèles ancrés avec une sensibilité à la casse comme celle qui peut utiliser des index. c'est-à-dire qu'il n'y a pas de caractère générique au début de la chaîne de correspondance afin que l'exécuteur puisse utiliser une analyse de plage d'index. ( le commentaire pertinent dans la documentation est ici ) Lower et ilike perdront également votre capacité à utiliser l'index à moins que vous ne créiez spécifiquement un index à cette fin (voir les index fonctionnels ).
Si vous souhaitez rechercher une chaîne au milieu du champ, vous devez examiner les index de texte intégral ou de trigrammes . Le premier est dans le noyau de Postgres, l'autre est disponible dans les modules contrib.
la source
Vous pouvez installer Wildspeed , un autre type d'index dans PostgreSQL. Wildspeed fonctionne avec les caractères génériques% word%, pas de problème. L'inconvénient est la taille de l'indice, cela peut être grand, très grand.
la source
Veuillez exécuter la requête mentionnée ci-dessous pour améliorer les performances de la requête LIKE dans postgresql. créez un index comme celui-ci pour des tables plus grandes:
la source
pour ce que ça vaut, Django ORM a tendance à utiliser
UPPER(text)
pour toutes lesLIKE
requêtes pour le rendre insensible à la casse,L'ajout d'un index sur
UPPER(column::text)
a considérablement accéléré mon système, contrairement à toute autre chose.En ce qui concerne les% de tête, oui, cela n'utilisera pas d'index. Voir ce blog pour une bonne explication:
https://use-the-index-luke.com/sql/where-clause/searching-for-ranges/like-performance-tuning
la source
J'ai récemment eu un problème similaire avec une table contenant 200000 enregistrements et je dois faire des requêtes LIKE répétées. Dans mon cas, la chaîne recherchée a été corrigée. D'autres domaines variaient. Parce que ça, j'ai pu réécrire:
comme
J'ai été ravi lorsque les requêtes sont revenues rapidement et que j'ai vérifié que l'index était utilisé avec
EXPLAIN ANALYZE
:la source
Vos requêtes similaires ne peuvent probablement pas utiliser les index que vous avez créés car:
1) vos critères LIKE commencent par un caractère générique.
2) vous avez utilisé une fonction avec vos critères LIKE.
la source
Chaque fois que vous utilisez une clause sur une colonne avec des fonctions par exemple LIKE, ILIKE, supérieur, inférieur, etc. Alors postgres ne prendra pas en considération votre index normal. Il effectuera une analyse complète de la table en passant par chaque ligne et sera donc lent.
La bonne façon serait de créer un nouvel index en fonction de votre requête. Par exemple, si je veux faire correspondre une colonne sans respect de la casse et ma colonne est un varchar. Ensuite, vous pouvez le faire comme ça.
De même, si votre colonne est un texte, vous faites quelque chose comme ça
De même, vous pouvez changer la fonction supérieure en toute autre fonction de votre choix.
la source