Comment expliqueriez-vous iid (indépendant et identiquement distribué) à des personnes non techniques?
random-variable
intuition
utilisateur333
la source
la source
Explication non technique:
L'indépendance est une notion très générale. Deux événements sont dits indépendants si l'occurrence de l'un ne vous donne aucune information quant à savoir si l'autre événement s'est produit ou non. En particulier, la probabilité que nous attribuions le deuxième événement n'est pas affectée par la connaissance du fait que le premier événement s'est produit.
Exemple d'événements indépendants, éventuellement distribués à l'identique
Envisagez de lancer deux pièces différentes l'une après l'autre. En supposant que votre pouce ne soit pas indûment fatigué lorsqu’il a retourné la première pièce, il est raisonnable de supposer que le fait de savoir que le premier tirage au sort a eu pour résultat que Heads n’influence en rien la probabilité que vous pensez avoir sur Heads lors du second tirage. Les deux événements sont dits être des événements indépendants .
Si nous savons ou insistons obstinément sur le fait que les probabilités de produire des têtes sont différentes pour les deux pièces, les événements ne sont pas distribués de manière identique.
Si nous savons ou supposons que les deux pièces ont la même probabilité de remonter les têtes, alors les événements ci-dessus sont également distribués de manière identique, ce qui signifie qu'ils ont tous les deux la même probabilité p . Mais remarquez que sauf si p = 1p p , la probabilité de Heads n'est pas égale à la probabilité de Tails. Comme indiqué dans l'un des commentaires, "distribution identique" n'est pas la même chose que "également probable".p = 12
la source
Une variable aléatoire est une variable qui contient la probabilité de tous les événements possibles dans un scénario. Par exemple, créons une variable aléatoire qui représente le nombre de têtes par 100 lancers de pièces. La variable aléatoire contiendra la probabilité d'obtenir 1 tête, 2 têtes, 3 têtes ..... jusqu'à 100 têtes. Appelons cette variable aléatoire X .
Si vous avez deux variables aléatoires alors elles sont IID (indépendantes identiquement distribuées) si:
Note latérale: L'indépendance signifie également que vous pouvez multiplier les probabilités. Disons que la probabilité de têtes est p, alors la probabilité d'obtenir deux têtes d'affilée est p * p, ou p ^ 2.
la source
Cet exemple montre que deux variables dépendantes peuvent avoir la même distribution:
Supposons deux expériences successives impliquant chaque 100 lancements d'une pièce biaisée, où le nombre total de têtes est modélisé comme une variable aléatoire X1 pour la première expérience et X2 pour la deuxième expérience. X1 et X2 sont des variables aléatoires binomiales de paramètres 100 et p, où p est le biais de la pièce.
En tant que tels, ils sont distribués de manière identique. Cependant, ils ne sont pas indépendants, car la valeur de la première est assez informative sur la valeur de la seconde. C’est-à-dire que si le résultat de la première expérience est de 100 têtes, cela nous en dit long sur le biais de la pièce et nous donne donc beaucoup de nouvelles informations concernant la distribution de X2.
Encore X2 et X1 sont distribués de manière identique car ils sont dérivés de la même pièce.
Ce qui est également vrai, c’est que si 2 variables aléatoires sont dépendantes, l’a posteriori de X2 étant donné que X1 ne sera jamais identique à l’antérieur de X2 et inversement. Tandis que quand X1 et X2 sont indépendants, leurs postérieurs sont égaux à leurs a priori. Par conséquent, lorsque deux variables sont dépendantes, l’observation de l’une d’entre elles aboutit à des estimations révisées concernant la distribution de la seconde. Pourtant, les deux peuvent provenir de la même distribution, nous en apprenons simplement davantage sur la nature de cette distribution. Revenons donc aux expériences de tirage au sort. Initialement, en l'absence de toute information, nous pourrions supposer que X1 et X2 suivent une distribution binomiale avec les paramètres 100 et 0.5. Mais après avoir observé 100 têtes de suite, nous réviserions certainement notre estimation du paramètre p pour la ramener assez proche de 1.
la source
Une agrégation de plusieurs tirages aléatoires de la même distribution. Un exemple étant de tirer une bille du sac 10 000 fois et de compter le nombre de fois que vous tirez la bille rouge.
la source
Néanmoins, une distribution identique n'implique pas nécessairement l'indépendance.
la source