Est-il vrai que pour deux variables aléatoires et ,AAABBB E(A∣B)=E(B∣A)E(A)E(B)?E(A∣B)=E(B∣A)E(A)E(B)?E(A\mid B)=E(B\mid
Est-il vrai que pour deux variables aléatoires et ,AAABBB E(A∣B)=E(B∣A)E(A)E(B)?E(A∣B)=E(B∣A)E(A)E(B)?E(A\mid B)=E(B\mid
Laissez et , . Quelle est l'attente de comme ?X1∼U[0,1]X1∼U[0,1]X_1 \sim U[0,1]Xi∼U[Xi−1,1]Xi∼U[Xi−1,1]X_i \sim U[X_{i - 1}, 1]i=2,3,...i=2,3,...i = 2, 3,...X1X2⋯XnX1X2⋯XnX_1 X_2 \cdots X_nn→∞n→∞n \rightarrow
J'espérais que quelqu'un pourrait proposer un argument expliquant pourquoi les variables aléatoires et , ayant la distribution normale standard, sont statistiquement indépendantes. La preuve de ce fait découle facilement de la technique MGF, mais je la trouve extrêmement contre-intuitive.Y 2 = X 1...
Existe-t-il une définition mathématique ou algorithmique du sur-ajustement? Les définitions souvent fournies sont le tracé 2D classique de points avec une ligne passant par chaque point et la courbe de perte de validation qui augmente soudainement. Mais y a-t-il une définition mathématiquement...
La question a déjà été soulevée, mais je veux poser une question spécifique qui tentera d'obtenir une réponse qui la clarifiera (et la classera): Dans "Poor Man's Asymptotics", on garde une distinction claire entre (a) une séquence de variables aléatoires qui converge en probabilité vers une...
J'étudie les statistiques et je rencontre souvent des formules contenant le loget je suis toujours confus si je dois interpréter cela comme la signification standard de log, c'est-à-dire la base 10, ou si dans les statistiques le symbole log est généralement supposé être le logarithme naturel ln....
Je lis le livre: Bishop, Reconnaissance des formes et apprentissage automatique (2006) qui définit la famille exponentielle comme des distributions de la forme (Eq. 2.194): p(x|η)=h(x)g(η)exp{ηTu(x)}p(x|η)=h(x)g(η)exp{ηTu(x)}p(\mathbf x|\boldsymbol \eta) = h(\mathbf x) g(\boldsymbol \eta) \exp...
J'ai pensé à écrire un article de blog sur cette intéressante analyse de Kleinberg (2002) qui explore la difficulté du clustering. Kleinberg décrit trois desiderata apparemment intuitifs pour une fonction de clustering et prouve ensuite qu'aucune fonction de ce type n'existe. Il existe de nombreux...
Je republie une "réponse" à une question que j'avais posée il y a environ deux semaines: Pourquoi le Jeffreys est-il utile avant? C'était vraiment une question (et je n'avais pas non plus le droit de poster des commentaires à l'époque), donc j'espère que c'est OK de le faire: Dans le lien...
On m'a posé cette question l'autre jour et je ne l'avais jamais envisagée auparavant. Mon intuition vient des avantages de chaque estimateur. La probabilité maximale est de préférence lorsque nous sommes confiants dans le processus de génération de données car, contrairement à la méthode des...
Je lisais la justification suivante (à partir des notes de cours cs229) sur la raison pour laquelle nous divisons les données brutes par son écart type: même si je comprends ce que dit l'explication, il n'est pas clair pour moi pourquoi la division par l'écart-type permettrait d'atteindre un tel...
J'ai (approximativement) entendu que: l'ensachage est une technique pour réduire la variance d'un prédicteur / estimateur / algorithme d'apprentissage. Cependant, je n'ai jamais vu de preuve mathématique formelle de cette affirmation. Est-ce que quelqu'un sait pourquoi c'est mathématiquement vrai?...
J'ai eu un débat avec mon professeur de statistique de niveau supérieur sur les "distributions normales". Je soutiens que pour vraiment obtenir une distribution normale, il faut avoir le mode moyenne = médiane =, toutes les données doivent être contenues sous la courbe en cloche et parfaitement...
Je suis AW van der Vaart, statistiques asymptotiques (1998). Il parle d'expériences statistiques, affirmant qu'elles sont différentes d'un modèle statistique, mais il ne définit ni l'une ni l'autre. Ma question: Qu'est-ce que (1) une expérience statistique, (2) un modèle statistique et (3) quel est...
Avant de poser ma question, permettez-moi de vous donner un aperçu de ce que je sais sur les statistiques afin que vous ayez une meilleure idée des types de ressources que je recherche. Je suis un étudiant diplômé en psychologie, et en tant que tel, j'utilise des statistiques presque tous les...
La distribution de Kolmogorov – Smirnov est connue d'après le test de Kolmogorov – Smirnov . Mais c'est aussi la distribution du supremum du pont brownien. Comme c'est loin d'être évident (pour moi), je voudrais vous demander une explication intuitive de cette coïncidence. Les références sont...
Qui de vous dans ce forum utilise "> R avec le multicœur , les packages snow ou CUDA , donc pour des calculs avancés qui nécessitent plus de puissance qu'un processeur de station de travail? Sur quel matériel calculez-vous ces scripts? À la maison / au travail ou avez-vous accès au centre de...
Ma question est: quelle est la relation mathématique entre la distribution bêta et les coefficients du modèle de régression logistique ? Pour illustrer: la fonction logistique (sigmoïde) est donnée par f(x)=11+exp(−x)f(x)=11+exp(−x)f(x) = \frac{1}{1+\exp(-x)} et il est utilisé pour modéliser les...
(Initialement publié sur MSE.) J'ai vu de nombreuses discussions heuristiques du théorème de la limite centrale classique parler de la distribution normale (ou de n'importe laquelle des distributions stables) comme d'un "attracteur" dans l'espace des densités de probabilité. Par exemple, considérez...
Pour la distribution normale, il existe un estimateur non biaisé de l'écart-type donné par: σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2−−−−−−−−−−−−√σ^unbiased=Γ(n−12)Γ(n2)12∑k=1n(xi−x¯)2\hat{\sigma}_\text{unbiased} = \frac{\Gamma(\frac{n-1}{2})}{\Gamma(\frac{n}{2})}...