La probabilité pourrait être définie de plusieurs façons, par exemple:
la fonction de qui mappe à ie .
la fonction aléatoire
on pourrait aussi considérer que la vraisemblance n'est que la vraisemblance "observée"
en pratique, la vraisemblance n'apporte des informations sur qu'à une constante multiplicative, nous pourrions donc considérer la vraisemblance comme une classe d'équivalence de fonctions plutôt que comme une fonction
Une autre question se pose lorsque l'on envisage un changement de paramétrage: si est la nouvelle paramétrisation que nous désignons couramment par la probabilité sur et ce n'est pas l'évaluation de la fonction précédente à mais à . Il s'agit d'une notation abusive mais utile qui pourrait causer des difficultés aux débutants si elle n'est pas soulignée.
Quelle est votre définition rigoureuse préférée de la probabilité?
De plus, comment appelez-vous ? Je dis habituellement quelque chose comme "la probabilité sur lorsque est observé".
EDIT: Au vu de certains commentaires ci-dessous, je me rends compte que j'aurais dû préciser le contexte. Je considère un modèle statistique donné par une famille paramétrique de densités par rapport à une mesure dominante, avec chaque défini sur l'espace d'observation . Par conséquent, nous définissons et la question est "qu'est-ce que ?" (la question ne porte pas sur une définition générale de la probabilité)
la source
Réponses:
Votre troisième élément est celui que j'ai vu le plus souvent utilisé comme définition rigoureuse.
Les autres sont également intéressants (+1). En particulier, le premier est attrayant, avec la difficulté que la taille de l'échantillon ne soit pas (encore) définie, il est plus difficile de définir l'ensemble "de".
Pour moi, l'intuition fondamentale de la vraisemblance est qu'elle est fonction du modèle + de ses paramètres, et non d'une fonction des variables aléatoires (également un point important pour l'enseignement). Je m'en tiendrai donc à la troisième définition.
La source de l'abus de notation est que l'ensemble "de" de la probabilité est implicite, ce qui n'est généralement pas le cas pour des fonctions bien définies. Ici, l'approche la plus rigoureuse consiste à se rendre compte qu'après la transformation, la probabilité se rapporte à un autre modèle. C'est l'équivalent du premier, mais encore un autre modèle. La notation de vraisemblance doit donc montrer à quel modèle elle se réfère (par indice ou autre). Je ne le fais jamais, bien sûr, mais pour l'enseignement, je pourrais.
Enfin, pour être cohérent avec mes réponses précédentes, je dis la "probabilité de " dans votre dernière formule.θ
la source
Je pense que je l'appellerais quelque chose de différent. La vraisemblance est la densité de probabilité pour le x observé étant donné la valeur du paramètre exprimée en fonction de θ pour le x donné . Je ne partage pas le point de vue sur la constante de proportionnalité. Je pense que cela n'entre en jeu que parce que maximiser toute fonction monotone de la vraisemblance donne la même solution pour θ . Vous pouvez donc maximiser c L ( θ ∣ x ) pour c > 0 ou d'autres fonctions monotones telles que log ( L ( θ ∣ x ) )θ θ x θ cL(θ∣x) c>0 log(L(θ∣x)) ce qui est communément fait.
la source
Voici une tentative de définition mathématique rigoureuse:
Soit un vecteur aléatoire qui admet une densité f ( x | θ 0 ) par rapport à une mesure ν sur R n , où pour θ ∈ Θ , { f ( x | θ ) : θ ∈ Θ } est une famille de densités sur R n par rapport à ν . Ensuite, pour tout x ∈ R n, nous définissons la fonction de vraisemblanceX:Ω→Rn f(x|θ0) ν Rn θ∈Θ {f(x|θ):θ∈Θ} Rn ν x∈Rn . être f ( x | θ ) ; pourclarté, pour chaque x nous avons L x : & thetav → R . On peut penser que x est un potentiel particulier x o b s et θ 0 la valeur "vraie" de θL(θ|x) f(x|θ) x Lx:Θ→R x xobs θ0 θ
Quelques observations sur cette définition:
la source