Estimation de la dimension VC

12

Que sait-on du problème suivant?

Étant donné une collection de fonctions f : { 0 , 1 } n{ 0 , 1 } , trouver une plus grande sous-collection S C soumise à la contrainte VC-Dimension ( S ) k pour un entier k .Cf:{0,1}n{0,1}SC(S)kk

Existe-t-il des algorithmes d'approximation ou des résultats de dureté pour ce problème?

Aaron Roth
la source
Les fonctions semblent ne jouer aucun rôle dans la maximisation de | S |
Suresh Venkat
Le choix des fonctions détermine la dimension VC de S. Le problème est de trouver une classe de fonctions aussi large que possible, soumise à une contrainte de dimension VC.
Aaron Roth
Je vois. Ainsi traduit en "géométrie terrestre", on vous donne une collection de plages (f agit comme une fonction caractéristique) et vous voulez une plus grande sous-collection de dimension VC bornée.
Suresh Venkat
L'autre problème pour répondre à la question: comment est présenté C? Nous savons que la taille maximale possible de est O ( 2 n k ) par le lemme de Sauer, et écrire une seule fonction en C nécessite n bits. SO(2nk)Cn
Suresh Venkat
1
Droite. Je m'intéresse aux résultats dans tout régime de représentation. Vous pourriez imaginer que est présenté comme un 2 n × | C | matrice, auquel cas durée d'exécution 2 n × | C | serait `` efficace '' (bien que ce ne soit pas le temps 2 n × k , ce qu'il faudrait pour vérifier de manière exhaustive si toutes les collections de k points ont été brisées). Si des résultats algorithmiques sont possibles avec un accès aux requêtes en boîte noire aux fonctions en C , ce serait encore mieux. C2n×|C|2n×|C|2n×kkC
Aaron Roth

Réponses:

7

Edit : le problème d'origine est -hard à approximer lorsque k = 1n désigne le nombre d'ensembles.n1ϵk=1n

Le dual d'un hypergraphe est obtenu en échangeant des sommets avec des arêtes et en préservant les incidences. Il est plus facile de comprendre le problème lorsque nous notons qu'un hypergraphe a une dimension VC 1 si son double est sans croix (pour tous les dans A , au moins l'un de P Q , P Q , Q P , ( P Q ) c est vide).P,QAPQ,PQ,QP,(PQ)c

Par dualité, le problème d'origine (pour ) est équivalent à, étant donné un hypergraphe ( V , S ) , trouver une taille maximale U V avec ( U , { S U S S } ) sans croix.k=1(V,S)UV(U,{SUSS})

En fait, ce problème (double) est très difficile , même si tous les ensembles de ont une taille 2: il est un graphique et nous sommes à la recherche d'une taille de vertex taille max dont sous - graphe induit qui ne ne contient aucun chemin de deux bords ( il n'est pas difficile de voir que c'est la seule façon dont une paire croisée peut se produire, en supposant que le graphique a au moins 4 sommets). Mais cette propriété est héréditaire et non triviale et nous pouvons donc utiliser un résultat de Feige et Kogan pour montrer la dureté.S

Réponse originale

k=1SSn1ϵΘ(n)

AP,QAPQ,PQ,QP,(PQ)c

G=(V,E)H=(X,S)X=VE{0}0vGTvS

{v}{ee is an edge incident to v}.

{Tv}vUUG

Mais pour le problème d'origine (primal), il semble qu'il faille encore réfléchir ... semble intéressant!

daveagp
la source
4

Quelques travaux connexes pertinents: L'estimation de la dimension VC elle-même (sans parler de trouver une grande sous-collection avec une dimension VC bornée) dans votre représentation est LOGNP-complete (LOGNP est NP limité à log n bits de non-déterminisme). Il y a aussi un peu de travail connexe sur l' estimation et l'approximation de la dimension VC lorsque la présentation de l'espace de plage est plus compacte (voir également les références à l'intérieur)

Suresh Venkat
la source