Une probabilité de modèle est constitué d'un triplet , où Ω est l'espace échantillon, F est un σ -alg'ebre (événements) , et P est une mesure de probabilité sur F .(Ω,F,P)ΩFσPF
Explication intuitive . Un modèle de probabilité peut être interprété comme une connu variable aléatoire . Par exemple, soit X une variable aléatoire normalement distribuée avec une moyenne de 0 et une variance de 1 . Dans ce cas, la mesure de probabilité P est associée à la fonction de distribution cumulative (CDF) F parXX01PF
F(x)=P(X≤x)=P(ω∈Ω:X(ω)≤x)=∫x−∞12π−−√exp(−t22)dt.
Généralisations . La définition du modèle de probabilité dépend de la définition mathématique de la probabilité, voir par exemple Probabilité libre et Probabilité quantique .
Un modèle statistique est un ensemble de modèles de probabilité, c'est-à-dire un ensemble de mesures / distributions de probabilité sur l'espace d'échantillonnage Ω .SΩ
Cet ensemble de distributions de probabilité est généralement sélectionné pour modéliser un certain phénomène à partir duquel nous avons des données.
Explication intuitive . Dans un modèle statistique, les paramètres et la distribution qui décrivent un certain phénomène sont tous deux inconnus. Un exemple de ceci est la famille des distributions normales avec la moyenne et la variance σ 2 ∈ R + , c'est-à-dire que les deux paramètres sont inconnus et vous voulez généralement utiliser l'ensemble de données pour estimer les paramètres (c'est-à-dire sélectionner un élément de S ). Cet ensemble de distributions peut être choisi sur n'importe quel Ω et F , mais, si je ne me trompe pas, dans un exemple réel uniquement ceux définis sur la même paire ( Ω , F )μ∈Rσ2∈R+SΩF(Ω,F) sont raisonnables à considérer.
Généralisations . Cet article fournit une définition très formelle du modèle statistique, mais l'auteur mentionne que "le modèle bayésien nécessite une composante supplémentaire sous la forme d'une distribution antérieure ... Bien que les formulations bayésiennes ne soient pas le principal objectif de cet article". Par conséquent, la définition du modèle statistique dépend du type de modèle que nous utilisons: paramétrique ou non paramétrique. Toujours dans le cadre paramétrique, la définition dépend de la façon dont les paramètres sont traités (par exemple classique vs bayésien).
La différence est la suivante: dans un modèle de probabilité, vous connaissez exactement la mesure de probabilité, par exemple une , où μ 0 , σ 2 0 sont des paramètres connus., Tandis que dans un modèle statistique, vous envisagez des ensembles de distributions , par exemple Normal ( μ , σ 2 ) , où μ , σ 2Normal(μ0,σ20)μ0,σ20Normal(μ,σ2)μ,σ2 sont des paramètres inconnus.
Aucun d'entre eux ne nécessite un ensemble de données, mais je dirais qu'un modèle statistique est généralement sélectionné pour en modéliser un.