Pourquoi le contrôle du FDR est-il moins strict que le contrôle du FWER?

16

J'ai lu que le contrôle du FDR est moins strict que le contrôle du FWER, comme dans Wikipedia :

Les procédures de contrôle FDR exercent un contrôle moins strict sur les fausses découvertes par rapport aux procédures à taux d'erreur familial (FWER) (telles que la correction de Bonferroni). Cela augmente la puissance au prix d'une augmentation du taux d'erreurs de type I, c'est-à-dire de rejeter l'hypothèse nulle d'absence d'effet lorsqu'elle devrait être acceptée.

Mais je me demandais comment cela se révèle mathématiquement vrai?

Existe-t-il une relation entre le FDR et le FWER?

StackExchange pour tous
la source
4
Avez-vous lu le document original? C'est à peu près tout ce que l'on peut espérer dans un document de statistiques: une seule idée fondamentale, une histoire claire et concise à raconter, un exemple utile et (bref!) Des preuves précises.
Cardinal

Réponses:

10

En effet, @cardinal a tout à fait raison de dire que le document est aussi clair que possible. Donc, pour ce que ça vaut, au cas où vous n'auriez pas accès au papier, voici une version légèrement élaborée de la façon dont Benjamini – Hochberg soutiennent:

Le FDR est la valeur attendue de la proportion de faux rejets v à tous les rejets r . Or, r est, évidemment, la somme des rejets faux et corrects; appeler ce dernier s .Qevrrs

En résumé, (en utilisant des majuscules pour les variables aléatoires et des minuscules pour les valeurs réalisées),

Qe=E(VR)=E(VV+S)=:E(Q).

On prend si R = 0 .Q=0R=0

Maintenant, il y a deux possibilités: soit tous les nulls sont vrais ou juste m 0 < m d'entre eux sont vrais. Dans le premier cas, il ne peut pas y avoir de rejets corrects, donc r = v . Ainsi, s'il y a des rejets ( r 1 ), q = 1 , sinon q = 0 . Par conséquent,mm0<mr=vr1q=1q=0

FDR=E(Q)=1P(Q=1)+0P(Q=0)=P(Q=1)=P(V1)=FWER

Ainsi, dans ce cas, de sorte que toute procédure qui contrôle le F D R contrôle également trivialement le F W E R et vice versa.FDR=FWERFDRFWER

Dans le second cas où , si v > 0 (donc s'il y a au moins un faux rejet), on a évidemment (ceci étant une fraction avec aussi v au dénominateur) v / r 1 . Cela implique que la fonction indicatrice qui prend la valeur 1 s'il y a au moins un faux rejet, 1 V 1 ne sera jamais inférieur à Q , 1 V 1Q . Maintenant, prenez l'espérance de chaque côté de l'inégalité, qui par la monotonie de Em0<mv>0vv/r11V1Q1V1QE laisse l'inégalité intacte,

E(1V1)E(Q)=FDR

La valeur attendue d'une fonction d'indicateur étant la probabilité de l'événement dans l'indicateur, on a , qui est à nouveau le F W E R .E(1V1)=P(V1)FWER

Thus, when we have a procedure that controls the FWER in the sense that FWERα, we must have that FDRα.

Conversely, having FDR control at some α may come with a substantially larger FWER. Intuitively, accepting a nonzero expected fraction of false rejections (FDR) out of a potentially large total of hypotheses tested may imply a very high probability of at least one false rejection (FWER).

So, a procedure has to be less strict when only FDR control is desired, which is also good for power. This is the same idea as in any basic hypothesis test: when you test at the 5% level you reject more frequently (both correct and false nulls) than when testing at the 1% level simply because you have a smaller critical value.

Christoph Hanck
la source
2
(+1) Good exposition. Obviously, in the first case we can also say FWER control implies FDR control (which is the matter in question). Also, it may be worth pointing out that this property comes with no distributional assumptions (e.g., independence) on the test statistics, unlike the procedure given in the original paper for control of the FDR.
cardinal