Une chaîne a séquences, mais elles ne sont généralement pas toutes distinctes. Quelle est la complexité de trouver la fréquence maximale d'une sous-séquence?
Par exemple, la chaîne "sous-séquence" contient 7 copies de la sous-séquence "sue" et c'est le maximum.
Exemple de code de force brute sur http://ideone.com/UIp3t
Existe-t-il des théorèmes structurels connexes? Les deux s'avèrent faux :
- la plus longue des sous-séquences de fréquence maximale est unique
- la fréquence maximale de toute sous- séquence de longueur est unimodale en
Liens éventuellement liés:
- Compter # sous-séquences distinctes http://11011110.livejournal.com/254164.html
- Problème de concours connexe pour plusieurs sources http://www.spoj.pl/problems/CSUBSEQS/
- Document connexe http://dx.doi.org/10.1016/j.tcs.2008.08.035
Modifier 10 jours plus tard: merci d'avoir regardé! Je m'étais demandé si cela poserait un joli problème de concours de programmation résoluble en temps polynomial. Je suppose que non, mais j'espère y repenser plus tard.
ds.algorithms
string-search
daveagp
la source
la source
Réponses:
à partir d'une recherche, voici un article avec quelques recherches et résultats pour la recherche de niveau universitaire mais (mise en garde) aucune référence. il contient des heuristiques, des estimations, des résultats empiriques et des commentaires sur le problème et quelques idées pour prouver sa complexité (approximative), etc.
Identification des conséquences les plus fréquentes
CSE 549 Projet de biologie computationnelle Rapport final
Mikhail Bautin 2006
(Bien qu'il existe des problèmes de sous-séquence standard qui soient quelque peu similaires et étudiés, par exemple dans l'article d'Elzinga et al, est-il possible que ce problème de sous-séquence particulier n'ait pas été trop étudié?)
la source
Pas une réponse, juste un lemme.
la source