Je souhaite connaître les ensembles d'éléments fréquents maximaux et les ensembles d'éléments fréquents fermés .
- L'ensemble d'éléments fréquents est maximal s'il n'a pas de sur-ensembles fréquents.
- L'ensemble d'éléments fréquents X ∈ F est fermé s'il n'a pas de sur-ensemble avec la même fréquence
J'ai donc compté l'occurrence de chaque ensemble d'éléments.
{A} = 4 ; {B} = 2 ; {C} = 5 ; {D} = 4 ; {E} = 6
{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2;
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3
{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3;
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3
{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0
Min_Support réglé à // Très important. Merci steffen de l'avoir rappelé.
Est-ce que maximal = ?
Est-ce que fermé = ?
data-mining
dataset
association-rules
Mike John
la source
la source
Vous voudrez peut-être lire sur l'algorithme APRIORI. Il évite les ensembles d'éléments inutiles par une taille intelligente.
B n'est pas fréquent, supprimez.
Construisez et comptez deux ensembles d'éléments (pas encore de magie, sauf que
B
c'est déjà sorti)Tout cela est fréquent (notez que tout ce qui avait
B
ne peut pas être fréquent!)Utilisez maintenant la règle de préfixe. Combinez UNIQUEMENT les ensembles d'éléments commençant par les mêmes n-1 éléments. Supprimez tout, là où un sous-ensemble n'est pas fréquent. Comptez les ensembles d'éléments restants.
Notez que ce
{A,C,D}
n'est pas fréquent. Comme il n'y a pas de préfixe partagé, il ne peut pas y avoir un plus grand nombre d'éléments fréquents!Remarquez combien moins de travail que j'ai fait!
Pour les ensembles d'éléments maximaux / fermés, vérifiez les sous-ensembles / sur-ensembles.
Notez que par exemple
{E}=6
, et{A,E}=4
.{E}
est un sous-ensemble, mais a un support plus élevé, c'est-à-dire qu'il est fermé mais pas maximal.{A}
n'est pas non plus, car il n'a pas un support plus élevé que{A,E}
, c'est-à-dire qu'il est redondant .la source