Existe-t-il une généralisation de la trace Pillai et de la trace Hotelling-Lawley?

10

Dans le cadre de la régression multiple multivariée (régresseur vectoriel et régresseur), les quatre principaux tests de l'hypothèse générale (Wilk's Lambda, Pillai-Bartlett, Hotelling-Lawley et Roy's Largest Root) dépendent tous des valeurs propres de la matrice , où et sont les matrices de variation «expliquées» et «totales». H EHE1HE

J'avais remarqué que les statistiques de Pillai et Hotelling-Lawley pouvaient toutes deux être exprimées comme pour, respectivement, . Je regarde une application où la distribution de cette trace, définie pour les analogues de population de et , est intéressante pour le cas . (erreurs modulo dans mon travail.) Je suis curieux de savoir s'il existe une unification connue des statistiques d'échantillonnage pour le général , ou une autre généralisation qui capture au moins deux des quatre tests classiques. Je me rends compte que pour pas égal à ouκ = 1 , 0 H E κ = 2 κ κ 0 1

ψκ=Tr(H[κH+E]1),
κ=1,0HEκ=2κκ01, le numérateur ne ressemble plus à un chi carré sous le zéro, et donc une approximation centrale de F semble discutable, donc c'est peut-être une impasse.

J'espère qu'il y a eu des recherches sur la distribution de sous le zéro ( c'est -à- dire que la vraie matrice des coefficients de régression est entièrement nulle) et sous l'alternative. Je m'intéresse particulièrement au cas , mais s'il y a du travail sur le cas général , je pourrais bien sûr l'utiliser.ψκκκ=2κ

shabbychef
la source
Attendez, est la variation « » expliquée et est la variation «T» totale? Je vérifie juste mes mnémoniques. EHE
cardinal
@cardinal, c'est exact. Lorsque correspond aux moindres carrés multivariés aux coefficients de corrélation, nous avons et Un aperçu (littéralement) de Michael Friendly m'a été très utile: psych.yorku.ca/lab/psy6140/lectures/… H= B(XX) B E=(Y-X B )(Y-X B ).B^H=B^(XX)B^E=(YXB^)(YXB^).
shabbychef
Merci! Je vais regarder. (Soit dit en passant, je me suis contenté de taquiner en fonction du choix des lettres, «h» pour «expliqué» et «e» pour «total».) Question intéressante, soit dit en passant; (+1) de ma part.
cardinal
@cardinal J'étais insuffisamment caféiné pour remarquer la blague. Oui, les mnémoniques sont mauvais, mais le choix de et (et ) est plutôt standard. E T = H + EHET=H+E
shabbychef
La plaisanterie était suffisamment grave pour qu'il aurait fallu beaucoup de caféine à remarquer.
cardinal

Réponses:

2

J'imagine que des généralisations productives sortiraient d'observations qui

  1. certains de ces tests sont des normes du vecteur , donc la trace de Hotelling-Lawley est la norme , , et la plus grande racine de Roy est la norme , .l 1{ λ 1 , , λ p } 1 l { λ 1 , , λ p } spec[HE1]={λ1,,λp}l1{λ1,,λp}1l{λ1,,λp}
  2. certains de ces tests peuvent être une norme de la matrice , par exemple, la plus grande racine de Roy est la norme spectrale, ou , . l 2H E - 12HE1l2HE12
  3. certains des tests peuvent être de la forme entropique généralisée , par exemple, la trace de Hotelling-Lawley est GE (1), la plus grande racine de Roy est GE ( ), et Wilks est GE (-1) sur , jusqu'à une transformation monotone chacun.Λ { 1 + λ 1 , , 1 + λ p }Λ{1+λ1,,1+λp}

Lorsque d'autres normes ou d'autres paramètres d'entropie généralisés sont pris en compte, d'autres statistiques peuvent être obtenues qui pourraient être significatives. Je doute cependant que l'un d'eux produise votre .ψ2

StasK
la source
Je crois que nous avons , où sont les valeurs propres de . Mais cela ne semble me mener nulle part. Je suppose que je ne connais pas assez la distribution des sommes des valeurs propres ... λiHE-1ψκ=iλi1+κλiλiHE1
shabbychef