J'observe les temps de traitement d'un processus avant et après un changement afin de savoir si le processus s'est amélioré par le changement. Le processus s'est amélioré si le temps de traitement est réduit. La distribution du temps de traitement est grossière, donc une comparaison basée sur la moyenne n'est pas raisonnable. Au lieu de cela, je voudrais savoir si la probabilité d'observer un temps de traitement inférieur après le changement est nettement supérieure à 50%.
Soit la variable aléatoire pour le temps de traitement après la modification et Y la précédente. Si P ( X < Y ) est nettement supérieur à 0,5, je dirais que le processus s'est amélioré.
Maintenant , j'ai observations ix i de X et m observations y j de Y . La observé probabilité de P ( X < Y ) est p = 1.
Que puis-je dire à propos de compte tenu des observations x i et y j ?
la source
@jbowman fournit une (belle) solution standard au problème d'estimation de connu sous le nom de modèle de résistance aux contraintes .θ = P( X< O)
Une autre alternative non paramétrique a été proposée dans Baklizi et Eidous (2006) pour le cas où et Y sont indépendants. Ceci est décrit ci-dessous.X Oui
Par définition, nous avons cela
où est le CDF de X et f Y est la densité de Y . Ensuite, en utilisant les échantillons de X et Y, nous pouvons obtenir des estimateurs de noyau de F X et f Y et par conséquent et un estimateur de θFX X FOui Oui X Oui FX FOui θ
Ceci est implémenté dans le code R suivant en utilisant un noyau gaussien.
Afin d'obtenir un intervalle de confiance pour vous pouvez obtenir un échantillon bootstrap de cet estimateur comme suit.θ
D'autres types d'intervalles de bootstrap pourraient également être envisagés.
la source
la source