Correspondance de motifs avec indifférence: plusieurs motifs

9

Le papier SODA de 2 pages de Kalai fournit un algorithme simple et efficace pour la correspondance de motifs avec les soucis (jokers qui correspondent à un caractère). En substance, c'est aussi simple que la convolution.

Mais que se passe-t-il si nous recherchons plusieurs modèles sans souci? Peut-on encore le résoudre d'une manière ou d'une autre avec, par exemple, des techniques basées sur la FFT?

Jukka Suomela
la source

Réponses:

5

Pour le cas à motifs multiples, il semble que le simple balayage de chacun des soit la meilleure solution possible, du moins à moins que l'hypothèse forte du temps exponentiel échoue.

Rappelons que pour des ensembles donnés et T 1 , T 2 , , T n sur l'univers [ m ] , si nous pouvions décider s'il y a S i et T j tels que S iT j = [ m ] dans le temps O ( n 2 - ε poly ( m ) )S1,S2,,SnT1,T2,,Tn[m]SjeTjSjeTj=[m]O(n2-εpoly(m)), alors SETH échoue, c'est-à-dire que nous avons un algorithme CNF-SAT avec le temps d'exécution .O(2(1-ε/2)n)

Étant donné les ensembles et T 1 , T 2 , , T n , nous codons le problème ci-dessus comme une correspondance multi-motifs avec ne se soucie pas de l'alphabet binaire comme suit:S1,S2,,SnT1,T2,,Tn

  • Le texte est [ T i ] est le codage naturel de T i en tant que chaîne binaire.
    1[T1]dixm+21[T2]dixm+20m+21[Tn]1,
    [Tje]Tje
  • Nous avons motifs de formule 1 S i1 , où S i est une chaîne y = y 1 y 2 ... y m de telle sorte que y j = 1 si j S i et y j = * si j S i (ici est le symbole «indifférent»).n1Sje1Sjey=y1y2ymyj=1jSjeyj=jSje

Maintenant , il est clair qu'un modèle peut correspondre au texte lors d' une occurrence de 1 [ T j ] 1 , et que lorsque S iT j = [ m ] . La longueur totale des motifs et la longueur du texte sont toutes les deux O ( n m ) , par exemple, donc un algorithme à passage unique quasi linéaire pour plusieurs motifs donnerait des améliorations substantielles par rapport aux meilleurs algorithmes CNF-SAT connus ...1Sje11[Tj]1SjeTj=[m]O(nm)

(Notez que cela ne dit rien sur les algorithmes qui utilisent beaucoup de temps pour prétraiter les modèles, disons quadratiques dans la longueur totale des modèles.)

Janne H. Korhonen
la source