Comment puis-je calculer la moyenne tronquée ou rognée? Disons tronqué de 10%?
Je peux imaginer comment le faire si vous avez environ 10 entrées, mais comment puis-je le faire pour beaucoup d'entrées?
mean
robust
truncation
trimmed-mean
Queops
la source
la source
Réponses:
La moyenne ajustée consiste à ajuster les observations du pourcentage de aux deux extrémités.P
Par exemple: si l'on vous demande de calculer une moyenne ajustée de 10%, .P=10
Étant donné un tas d'observations, :Xi
Si est un entier, utilisez et coupez observations aux deux extrémités.np k=np k
Moyenne ajustée =(1/R)(Xk+1+Xk+2+…+Xn−k).
Exemple : trouver une moyenne ajustée de 10%
2, 4, 6, 7, 11, 21, 81, 90, 105, 121
Ici, qui est un entier, donc coupez exactement une observation à chaque extrémité, car . Ainsi, coupez 2 et 121. Nous nous retrouvons avec observations.n=10,p=0.10,k=np=1 k=1 R=n−2k=10−2=8
10% moyenne ajustée = (1/8) * (4 + 6 + 7 + 11 + 21 + 81 + 90 + 105) = 40,625
Si a une partie fractionnaire présente, la moyenne ajustée est un peu plus compliquée. Dans l'exemple ci-dessus, si nous voulions une moyenne ajustée de 15%, . Celui-ci a une partie entière 1 et une partie fractionnaire 0,5 est présente. . Ainsi, observations sont conservées.np P=15,p=0.15,n=10,k=np=1.5 R=n−2k=10−2∗1.5=10−3=7 R=7
Addendum au commentaire de @ whuber: Pour rester impartial (après avoir supprimé 2 et 121), il semble que nous devons supprimer la moitié des 4 et la moitié des 105 pour une moyenne tronquée de(4/2+6+7+11+21+81+90+105/2)/7=38.64
Source: Notes de classe sur la moyenne ajustée du pourcentage de P
la source
$X_i$
En plus de la réponse ci-dessus, s'il y a de nombreuses entrées (disons n), leur premier tri prend du temps O (n log n). Cependant, il existe une solution en temps linéaire.
Calculez le P-quantile L et (1-P) -quantile U. Il existe un algorithme simple (semblable à un tri rapide) qui s'exécute dans le temps linéaire attendu. Il existe également un algorithme plus compliqué qui s'exécute dans le pire des cas en temps linéaire. Les deux peuvent être trouvés, par exemple, dans: Cormen, Leiserson, Rivest, Stein: Introduction to Algortithms.
Parcourez toutes les valeurs et ajoutez celles entre L et U. Cela prend évidemment du temps linéaire.
S'il existe des liens et que les quantiles calculés existent plusieurs fois parmi les valeurs, il se peut que nous ayons ajouté trop ou trop peu de valeurs et que nous devions peut-être corriger cela de manière appropriée. Puisque nous savons combien de nombres nous avons ajoutés à l'étape 2, et aussi combien de fois nous avons vu L et U, cela peut être fait en temps constant.
Divisez la somme totale par le nombre de sommations.
Notez que la recette ci-dessus ne vaut que si n est vraiment grand et le tri de tous serait un succès de performance, peut-être quelques millions.
la source