Quelqu'un peut-il aider à expliquer la différence entre indépendant et aléatoire?

21

En statistiques, indépendant et aléatoire décrivent-ils les mêmes caractéristiques? Quelle est la différence entre eux? Nous rencontrons souvent la description comme «deux variables aléatoires indépendantes» ou «échantillonnage aléatoire». Je me demande quelle est la différence exacte entre eux. Quelqu'un peut-il expliquer cela et donner des exemples? par exemple un processus non indépendant mais aléatoire?

tiantianchen
la source
Voici deux concepts distincts (à un niveau pas très profond) fusionnés. Des observations "indépendantes" dans le sens généré indépendamment, et des "variables indépendantes" par rapport à leurs distributions.
ttnphns
3
C'est une question étrange, car si vous consultiez les définitions formelles de "variable aléatoire" et "indépendant" - ce que semble suggérer "en statistique" - vous trouveriez qu'elles ont peu en commun.
whuber
@ttnphns, Oui, je suppose que j'étais plus confus au sujet du terme "observations générées indépendamment" par "générées aléatoirement". Dans l'échantillonnage, nous entendons souvent un échantillonnage aléatoire (simple), ce qui me donne l'impression d'être des échantillons indépendants. Je suppose que si nous voulons vraiment combiner les deux caractéristiques dans la description d'une méthode d'échantillonnage, cela devrait être: la sélection des observations ne dépend pas l'une de l'autre (= indépendamment) et la probabilité de sélection d'une observation est connue (= au hasard)?
tiantianchen
1
Si nous vérifions la définition de l'indépendance par rapport au wiki: "Dans la théorie des probabilités, deux événements sont indépendants, statistiquement indépendants ou stochastiquement indépendants si l'occurrence de l'un n'affecte pas la probabilité de l'autre.", La dépendance de deux observations doit être basée sur la façon dont ils sont générés / sélectionnés, plutôt que sur leur apparence dans les données. Ensuite, les deux observations identiques dans le cas que j'ai mentionné ci-dessus devraient toujours être indépendantes.
tiantianchen
2
Veuillez ne pas confondre l'explication heuristique au début d'une entrée Wikipedia avec une définition. La définition est donnée sous le titre "définition" dans le même article . C'est celui proposé dans la réponse de Tim ici.
whuber

Réponses:

35

Je vais essayer de l'expliquer en termes non techniques: une variable aléatoire décrit le résultat d'une expérience; vous ne pouvez pas savoir à l'avance quel sera le résultat exact mais vous avez quelques informations: vous savez quels résultats sont possibles et vous connaissez, pour chaque résultat, sa probabilité.

Par exemple, si vous lancez une bonne pièce, vous ne savez pas à l'avance si vous obtiendrez la tête ou la queue, mais vous savez que ce sont les résultats possibles et vous savez que chacun a 50% de chances de se produire.

Pour expliquer l'indépendance, vous devez lancer deux pièces justes. Après avoir lancé la première pièce, vous savez que pour le deuxième lancer, les probabilités de tête sont toujours de 50% et pour la queue également. Si le premier lancer n'a aucune influence sur les probabilités du second, les deux lancers sont indépendants. Si le premier tirage au sort a une influence sur les probabilités du deuxième tirage au sort, ils dépendent.

Un exemple de lancers dépendants est lorsque vous collez les deux pièces ensemble.


la source
3
Une autre paire de variables dépendantes serait "si vous avez des têtes" et "si vous avez des queues". Les deux sont aléatoires mais ne sont pas indépendants l'un de l'autre.
user253751
3
@immibis Ou lancez un dé juste, notez la valeur. puis roulez-le une fois de plus et multipliez la valeur par la valeur notée. Cette valeur est aléatoire, mais dépend du premier lancer.
Crowley
8

Aléatoire se rapporte à la variable aléatoire , et indépendant se rapporte à l'indépendance probabiliste. Par indépendance, nous voulons dire que l'observation d'une variable ne nous dit rien sur l'autre, ou en termes plus formels, si et Y sont deux variables aléatoires, alors nous disons qu'elles sont indépendantes siXOui

pX,Oui(X,y)=pX(X)pOui(y)

en outre

E(XOui)=E(X)E(Oui)

et leur covariance est nulle. La variable aléatoire dépend de X si elle peut être écrite en fonction de XOuiXX

Oui=F(X)

Donc dans ce cas est aléatoire et dépend de X .OuiX

Appeler le processus "non indépendant" est assez trompeur - indépendamment de quoi? Je suppose que vous vouliez dire qu'il existe des variables aléatoires indépendantes et distribuées de manière identique (vérifiez ici ou ici ) qui proviennent d'un processus. Par indépendants, nous voudrions dire ici qu'ils sont indépendants les uns des autres. Il existe des processus produisant des variables aléatoires dépendantes, par exempleX1,,Xk

Xi=Xi1+ε

est un bruit aléatoire. Évidemment, dans ce cas, X i dépend de X i - 1 , mais il est également aléatoire.εXiXi1

Tim
la source
Que signifie si X est une variable aléatoire? Je pense que vous confondez VR et événements: deux VR X et Y sont indépendants si les événements P ( X r ) et P ( Y s ) sont indépendants pour tous les r, sP(X) P(Xr)P(Ys)
Matthew Towers
Ensuite, deux variables aléatoires continues sont indépendantes.
Matthew Towers
@m_t_ Je ne pense vraiment pas que discuter de la notation mène nulle part (voir par exemple en.wikipedia.org/wiki/… )
Tim
2
@tiantianchen dans l'autre sens: si vous avez des variables aléatoires iid, alors vous pouvez construire une fonction de vraisemblance en multipliant les pdf individuels car ils sont indépendants.
Tim
1

Les variables sont utilisées dans tous les domaines des mathématiques. Les définitions de l'indépendance et du caractère aléatoire d'une variable sont appliquées unilatéralement à toutes les formes de mathématiques, pas seulement aux statistiques.

Par exemple, les axes X et Y en géométrie euclidienne bidimensionnelle représentent des variables indépendantes, cependant, leurs valeurs ne sont pas (généralement) attribuées au hasard.

Deux variables données peuvent être aléatoires ou indépendantes (l'une de l'autre), ou les deux, ou aucune. Les statistiques ont tendance à se concentrer sur le caractère aléatoire (plus correctement, sur la probabilité), et le fait que deux variables soient ou non indépendantes peut avoir de nombreuses implications pour les probabilités de résultats donnés observés.

Vous avez tendance à voir ces deux propriétés (indépendance et caractère aléatoire) décrites ensemble lorsque vous étudiez les statistiques, car les deux sont importantes à connaître et peuvent influencer la réponse à la question posée. Cependant, ces propriétés ne sont pas synonymes et, dans d'autres domaines des mathématiques, elles ne se produisent pas nécessairement ensemble.

Steve-O
la source
Merci. Pouvez-vous expliquer davantage «si deux variables sont indépendantes peut avoir de nombreuses implications pour les probabilités de résultats donnés observés».
tiantianchen
3
Il s'agit d'une réponse non statistique qui répond à un sens «indépendant» différent de celui utilisé dans la question. Cela confond également deux sens de «variable»: l'un est mathématique et l'autre est la définition statistique de variable aléatoire (qui n'est certainement pas la même chose que des variables sur des axes géométriques).
whuber
1

La notion d'indépendance est relative, alors que vous pouvez être aléatoire par vous-même. Dans votre exemple, vous avez "deux variables aléatoires indépendantes" et n'avez pas besoin de parler de plusieurs "échantillonnage aléatoire".

Supposons que vous lanciez plusieurs fois un dé parfait. Les résultats sont a priori aléatoires. Connaissant le passé, vous ne pouvez pas prédire le nombre suivant 4. Supposons que je génère une séquence de l'autre côté du dé: 6 1 , 3 4 . Je reçois 1 , 2 , 4 , 2 , 3 . Il est aussi aléatoire que le premier. Vous ne pouvez pas deviner ce qui vient après 3 . Mais les deux séquences sont complètement dépendantes.6,5,3,5,461341,2,4,2,33

Si l'on jette deux dés en parallèle (sans interaction entre eux), leurs séquences respectives seront aléatoires et indépendantes.

Laurent Duval
la source
1
Cela peut être un peu technique étant donné le niveau de l'OP, mais en ce qui concerne votre déclaration "Vous ne pouvez pas être indépendant (de quelque chose) seul (comme un processus, une séquence)", considérez ce qui suit: Toute variable aléatoire X, qui équivaut à une constante c avec une probabilité, est indépendant de "tout", y compris lui-même. C'est-à-dire que pour un tel X, X est indépendant de X. Vous pouvez facilement vérifier cela selon la définition de l'indépendance.
Mark L. Stone
XX et Xsont indépendants?
Laurent Duval
X est indépendant de lui-même. C'est-à-dire que X est indépendant de X.
Mark L. Stone
0

Lorsque vous avez une paire de valeurs lorsque la première est générée de manière aléatoire et que la seconde dépend de la première. par exemple la taille et le poids d'un homme. Il y a une corrélation entre eux. Mais ils sont tous les deux aléatoires.

scarabée
la source
Bien que cet article utilise les mots «aléatoire» et «dépendant», il ne les définit pas et ne les distingue pas clairement. En effet, il semble suggérer que "aléatoire = dépendant"!
whuber
0

L'exemple de pièce de monnaie est une excellente illustration d'une variable aléatoire et indépendante, une bonne bonne façon de penser à une variable aléatoire mais dépendante serait la prochaine carte tirée d'un sabot de sept cartes à jouer, la probabilité de tout résultat numérique spécifique change en fonction des cartes précédemment distribuées, mais jusqu'à ce qu'une seule valeur de carte reste dans la chaussure, la valeur de la carte à venir restera aléatoire.

tête fantôme
la source
3
Il vaut probablement la peine de remplacer le mot "probabilité" par "probabilité" ici, car la probabilité a une définition technique distincte dans les statistiques
Silverfish
1
Une probabilité qui dépend d'autres événements (souvent des événements antérieurs, mais parfois basée sur la connaissance d'événements futurs ou simultanés - il n'y a en fait aucune direction temporelle) est appelée probabilité conditionnelle . Le mot vraisemblance est utilisé pour désigner une sorte de "probabilité inverse" (ou dans le cas continu, une densité de probabilité) - c'est-à-dire que l'on calcule la probabilité d'un résultat (par exemple vos données) en fonction de votre paramètre de modèle (s ), mais si nous pensons à cela dans l'autre sens, c'est la probabilité de ce paramètre, compte tenu de vos données .
Silverfish
1
À moins que vous ne calculiez la probabilité d'un paramètre, il vaut mieux éviter le mot "vraisemblance" dans les statistiques, même lorsque, en anglais normal, on utilise "vraisemblance" comme synonyme de la probabilité d'un événement (par exemple, "rouler dix six dans une rangée dans un jeu de dés a une très faible probabilité "est bien pour l'anglais familier, mais n'utilise pas le mot correctement dans un sens statistique). "Laisserπêtre un paramètre dénotant la probabilité qu'un dé biaisé lance un six; calculer la probabilité queπ=1/6étant donné que dix lancers du dé étaient tous des six "est statistiquement correct mais jargon
Silverfish
-1

David Bohm dans son ouvrage Causality and Chance in Modern Physics (Londres: Routledge, 1957/1984) décrit la causalité, le hasard, le hasard et l'indépendance:

"Dans la nature, rien ne reste constant. Tout est dans un état perpétuel de transformation, de mouvement et de changement. Cependant, nous découvrons que rien ne surgit simplement de rien sans avoir d'antécédents qui existaient auparavant. De même, rien ne disparaît jamais sans laisser de trace, dans le sens qu'il ne donne lieu à rien d'existant plus tard ... tout vient d'autres choses et donne naissance à d'autres choses. Ce principe n'est pas encore une déclaration de l'existence de la causalité dans la nature. Pour en venir à la causalité, l'étape suivante consiste alors à noter que, lorsque nous étudions des processus se déroulant dans un large éventail de conditions, nous découvrons qu'à l'intérieur de toute la complexité du changement et de la transformation, il existe des relationsqui restent effectivement constants. .... À ce stade, cependant, nous rencontrons un nouveau problème. Car la nécessité d'une loi causale n'est jamais absolue. Ainsi, nous voyons que l'on ne doit concevoir la loi de la nature comme nécessaire que si l'on fait abstraction des contingences , représentant des facteurs essentiellement indépendants qui peuvent exister en dehors du champ des choses qui peuvent être traitées par les lois considérées, et qui ne suivent pas nécessairement de tout ce qui peut être spécifié dans le cadre de ces lois. De telles éventualités conduisent au hasard . "(Pp.1-2)

"La tendance des contingences situées à l'extérieur d'un contexte donné à fluctuer indépendamment des événements à l'intérieur de ce contexte s'est révélée si répandue que l'on peut l'énoncer comme un principe, à savoir le principe de l'aléatoire. Par hasard, nous voulons dire simplement que cette indépendance conduit à la fluctuation de ces contingences d'une manière très compliquée sur un large éventail de possibilités, mais de telle manière que les moyennes statistiques aient un comportement régulier et approximativement prévisible. " (p.22)

noumenal
la source
3
Votre définition de «aléatoire» semble inhabituelle. Il semble être intimement lié aux concepts de «prévisibilité» et de «modèle» - mais que signifient-ils exactement? Par exemple, si une expérience qui pourrait potentiellement donner n'importe quel nombre entre0 et 1 ont été systématiquement observés pour donner des valeurs de 1/3 ou 4/7, cela semblerait être un «modèle» et - dans la mesure où il diffère de l'ensemble infini initial de valeurs possibles - est au moins partiellement «prévisible». Là où vous écrivez "si vous tracez ...", vous semblez affirmer qu'aucune variable univariée ne peut être aléatoire!
whuber
3
Vous semblez discuter des processus stochastiques (dans le temps) plutôt que du hasard et des variables aléatoires.
whuber
4
Je crois qu'une partie de la difficulté que nous avons à communiquer est que vous semblez penser à «indépendant» au sens d'une variable indépendante dans la régression. Bien que certains éléments de la question le suggèrent, les expressions "deux variables aléatoires indépendantes" et "échantillonnage aléatoire" indiquent le contraire.
whuber
1
Je ne peux même pas dire quelle est votre compréhension, car votre réponse ne donne aucune définition. Je dois deviner ce que vous essayez de dire à partir des exemples et des descriptions que vous donnez. Ils semblent différer des sens de «aléatoire» et «indépendant» dans les manières que j'ai décrites dans les commentaires précédents.
whuber
1
J'ajouterais aux commentaires @whuber que votre définition mentionnant des variables aléatoires s'influençant mutuellement peut être trompeuse. "Influence" est un terme très fort impliquant une sorte de causalité, etc. tandis que la définition formelle de l'indépendance ne nécessite aucune causalité ou influence mais il s'agit simplement de relations de probabilités conjointes vs individuelles.
Tim