Formule de taille d'échantillon pour un test F?

12

Je me demande s'il existe une formule de taille d'échantillon comme la formule de Lehr qui s'applique à un test F? La formule de Lehr pour les tests t est , où est la taille de l'effet ( par exemple ). Cela peut être généralisé à où est une constante qui dépend du taux de type I, de la puissance souhaitée et du fait que l'on effectue un test unilatéral ou bilatéral.n=16/Δ2Δ Δ=(μ1μ2)/σn=c/Δ2c

Je recherche une formule similaire pour un test F. Ma statistique de test est distribuée, sous l'alternative, comme un F non central avec degrés de liberté et le paramètre de non-centralité , où ne dépend que des paramètres de population, qui sont inconnus mais supposés prendre une certaine valeur . Le paramètre est fixé par l'expérience et est la taille de l'échantillon. Idéalement, je recherche une formule (de préférence bien connue) de la forme où ne dépend que du taux de type I et de la puissance.k,nnλλkn

n=cg(k,λ)
c

La taille de l'échantillon doit satisfaire où est le CDF d'un F non central avec dof et le paramètre de non-centralité , et sont les taux de type I et de type II. Nous pouvons supposer que , c'est-à - dire que doit être «suffisamment grand».F ( x ; k , n , δ ) k , n δ α , β k n

F(F1(1α;k,n,0);k,n,nλ)=β,
F(x;k,n,δ)k,nδα,βkn n

Mes tentatives pour jouer avec cela dans R n'ont pas été fructueuses. J'ai vu suggéré mais les ajustements n'ont pas été très bons.g(k,λ)=λ/k+1

edit: à l' origine, j'avais vaguement déclaré que le paramètre de non-centralité «dépend» de la taille de l'échantillon. Après réflexion, j'ai trouvé cela trop déroutant, alors j'ai clarifié la relation.

De plus, je peux calculer la valeur de exactement en résolvant l'équation implicite via un finder racine ( par exemple la méthode de Brent). Je suis à la recherche d'une équation pour guider mon intuition et à utiliser en règle générale.n

shabbychef
la source
1
Pour clarifier, est-il exact que vous êtes déjà en mesure d'obtenir le requis , mais vous cherchez une formule générale? Je serais très surpris s'il existe une formule générale utile. n
mark999

Réponses:

1

Je me demande s'il existe une formule de taille d'échantillon comme la formule de Lehr qui s'applique à un test F?

La page Web " Power Tools for Epidemiologists " explique:

  • Différence entre deux moyens (Lehr):

    Supposons, par exemple, que vous souhaitiez démontrer une différence de 10 points de QI entre deux groupes, dont l'un est exposé à une toxine potentielle, l'autre non. En utilisant un QI moyen de population de 100 et un écart-type de 20:

    ngroup=16(10090/20)2

    ngroup=16(.5)2=64
  • Variation en pourcentage des moyennes

    Les chercheurs cliniciens peuvent être plus à l'aise de penser en termes de changements en pourcentage plutôt qu'en différences de moyens et de variabilité. Par exemple, quelqu'un pourrait être intéressé par une différence de 20% entre deux groupes dans les données avec une variabilité d'environ 30%. Le professeur van Belle présente une approche soignée de ces types de nombres qui utilise le coefficient de variation (cv) 4 et traduit la variation en pourcentage en un rapport de moyennes.

    La variance sur l'échelle logarithmique (voir le chapitre 5 dans van Belle) est approximativement égale au coefficient de variation sur l'échelle originale, donc la formule de Lehr peut être traduite en une version qui utilise cv

    ngroup=16(c.v.)2(ln(μ0)ln(μ1))2

    Nous pouvons alors utiliser la variation en pourcentage comme rapport des moyennes, où

    r.m.=μ0μ1μ0=1μ1μ0

    pour formuler une règle d'or:

    ngroup=16(c.v.)2(ln(r.m.))2

    Dans l'exemple ci-dessus, une variation de 20% se traduit par un rapport de moyennes de 1 - .20 = .80. (Un changement de 5% entraînerait un rapport de moyennes de 1 −05 = .95; un changement de 35% 1 − .35 = .65, et ainsi de suite.) Ainsi, la taille de l'échantillon pour une étude cherchant à démontrer un Une variation de 20% des moyennes avec des données variant d'environ 30% autour des moyennes serait

    ngroup=16(.3)2(ln(.8))2=29

An R function based on this rule would be:

1   nPC<-function(cv, pc){
2       x<-16*(cv)^2/((log((1-pc)))^2)
3       print(x)
4   }

Say you were interested in a 15% change from one group to another, but were uncertain about how the data varied. You could look at a range of values for the coefficient of variation:

1   a<-c(.05,.10,.15,.20,.30,.40,.50,.75,1)
2   nPC(a,.15)

You could use this to graphically display your results:

1   plot(a,nPC(a,.15),  ylab="Number in Each Group", 
2   xlab="By Varying Coefficent of Variation", 
3   main="Sample Size Estimate for a 15% Difference")

Voir aussi: iSixSigma " Comment déterminer la taille de l'échantillon " et RaoSoft " Calculateur de taille de l'échantillon en ligne ".

Rob
la source