Que sait-on du problème suivant?
Étant donné une collection de fonctions f : { 0 , 1 } n → { 0 , 1 } , trouver une plus grande sous-collection S ⊆ C soumise à la contrainte VC-Dimension ( S ) ≤ k pour un entier k .
Existe-t-il des algorithmes d'approximation ou des résultats de dureté pour ce problème?
reference-request
approximation-algorithms
cg.comp-geom
lg.learning
vc-dimension
Aaron Roth
la source
la source
Réponses:
Edit : le problème d'origine est -hard à approximer lorsque k = 1 où n désigne le nombre d'ensembles.n1 - ϵ k=1 n
Le dual d'un hypergraphe est obtenu en échangeant des sommets avec des arêtes et en préservant les incidences. Il est plus facile de comprendre le problème lorsque nous notons qu'un hypergraphe a une dimension VC 1 si son double est sans croix (pour tous les dans A , au moins l'un de P ∩ Q , P ∖ Q , Q ∖ P , ( P ∪ Q ) c est vide).P,Q A P∩Q,P∖Q,Q∖P,(P∪Q)c
Par dualité, le problème d'origine (pour ) est équivalent à, étant donné un hypergraphe ( V , S ) , trouver une taille maximale U ⊆ V avec ( U , { S ∩ U ∣ S ∈ S } ) sans croix.k=1 (V,S) U⊆V (U,{S∩U∣S∈S})
En fait, ce problème (double) est très difficile , même si tous les ensembles de ont une taille 2: il est un graphique et nous sommes à la recherche d'une taille de vertex taille max dont sous - graphe induit qui ne ne contient aucun chemin de deux bords ( il n'est pas difficile de voir que c'est la seule façon dont une paire croisée peut se produire, en supposant que le graphique a au moins 4 sommets). Mais cette propriété est héréditaire et non triviale et nous pouvons donc utiliser un résultat de Feige et Kogan pour montrer la dureté.S
Réponse originale
Mais pour le problème d'origine (primal), il semble qu'il faille encore réfléchir ... semble intéressant!
la source
Quelques travaux connexes pertinents: L'estimation de la dimension VC elle-même (sans parler de trouver une grande sous-collection avec une dimension VC bornée) dans votre représentation est LOGNP-complete (LOGNP est NP limité à log n bits de non-déterminisme). Il y a aussi un peu de travail connexe sur l' estimation et l'approximation de la dimension VC lorsque la présentation de l'espace de plage est plus compacte (voir également les références à l'intérieur)
la source