Le processus exponentiel univarié de Hawkes est un processus ponctuel auto-excitant avec un taux d'arrivée d'événements de: λ(t)=μ+∑ti<tαe−β(t−ti)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
Le processus exponentiel univarié de Hawkes est un processus ponctuel auto-excitant avec un taux d'arrivée d'événements de: λ(t)=μ+∑ti<tαe−β(t−ti)λ(t)=μ+∑ti<tαe−β(t−ti) \lambda(t) = \mu +
L'estimation des paramètres à l'aide de l'estimation du maximum de vraisemblance (MLE) implique l'évaluation de la fonction de vraisemblance, qui met en correspondance la probabilité que l'échantillon (X) se produise avec les valeurs (x) sur l'espace des paramètres (θ) étant donné une famille de...
Le calcul bayésien approximatif est une technique vraiment cool pour ajuster essentiellement n'importe quel modèle stochastique, destiné aux modèles où la probabilité est intraitable (par exemple, vous pouvez échantillonner à partir du modèle si vous fixez les paramètres mais vous ne pouvez pas...
Je suis confus quant à la méthode du maximum de vraisemblance par rapport, par exemple, au calcul de la moyenne arithmétique. Quand et pourquoi la probabilité maximale produit-elle de "meilleures" estimations que, par exemple, la moyenne arithmétique? Comment est-ce
J'essaie de prouver que la matrice d'information observée évaluée à l'estimateur du maximum de vraisemblance faiblement cohérent (MLE) est un estimateur faiblement cohérent de la matrice d'information attendue. C'est un résultat largement cité mais personne ne donne de référence ou de preuve (j'ai...
Quels sont les avantages et les inconvénients des deux
Diverses descriptions sur la sélection des modèles sur les effets aléatoires des modèles mixtes linéaires indiquent l'utilisation de REML. Je connais la différence entre REML et ML à un certain niveau, mais je ne comprends pas pourquoi REML devrait être utilisé parce que ML est biaisé. Par exemple,...
J'essaie de reproduire avec optimles résultats d'une simple régression linéaire équipée glmou même de nlsfonctions R. Les estimations des paramètres sont les mêmes, mais l'estimation de la variance résiduelle et les erreurs-types des autres paramètres ne sont pas les mêmes, en particulier lorsque...
Jeffrey Wooldridge, dans son analyse économétrique des données de sections et de panels (page 357), dit que la Hesse empirique "n'est pas garantie d'être définie positive, ou même semi-définie positive, pour l'échantillon particulier avec lequel nous travaillons.". Cela me semble faux car (à part...
Pour un problème d'inférence donné, nous savons qu'une approche bayésienne diffère généralement à la fois dans sa forme et résulte d'une approche féquentiste. Les Frequentists (qui m'incluent généralement) soulignent souvent que leurs méthodes ne nécessitent pas de priorité et sont donc plus...
Question générale Supposons que nous ayons des données iid X1X1x_1 , X2X2x_2 , ... streaming. Nous voulons calculer récursivement l'estimation de la probabilité maximale de . Autrement dit, avoir calculé nous observons un nouveau x_n et souhaitons en quelque sorte mettre à jour progressivement...
Quel est le point de vue fréquentiste sur l'histoire du voltmètre et ses variations? L'idée sous-jacente est qu'une analyse statistique qui fait appel à des événements hypothétiques devrait être révisée si l'on apprenait plus tard que ces événements hypothétiques n'auraient pas pu se produire comme...
Le phénomène de «sur-dispersion» dans un GLM survient chaque fois que nous utilisons un modèle qui restreint la variance de la variable de réponse, et les données présentent une variance plus grande que la restriction du modèle ne le permet. Cela se produit généralement lors de la modélisation des...
Cette question découle de la question: quand (si jamais) une approche fréquentiste est-elle substantiellement meilleure qu'une approche bayésienne? Comme je l'ai signalé dans ma solution à cette question, à mon avis, si vous êtes un fréquentiste, vous n'avez pas à croire / adhérer au principe de...
Dans le premier chapitre de l'ouvrage Algebraic Geometry and Statistical Learning Theory qui parle de la convergence des estimations dans différents espaces fonctionnels, il mentionne que l'estimation bayésienne correspond à la topologie de la distribution de Schwartz, tandis que l'estimation du...
Dans le cadre de la sortie d'un modèle linéaire généralisé, la déviance nulle et résiduelle est utilisée pour évaluer le modèle. Je vois souvent les formules de ces quantités exprimées en termes de probabilité logarithmique du modèle saturé, par exemple: /stats//a/113022/22199 , Régression...
Je me demande si l'estimation du maximum de vraisemblance n'a jamais été utilisée dans les statistiques. Nous en apprenons le concept mais je me demande quand il est réellement utilisé. Si nous supposons la distribution des données, nous trouvons deux paramètres, un pour la moyenne et un pour la...
MLE = Estimation du maximum de vraisemblance MAP = Maximum a posteriori Le MLE est intuitif / naïf en ce qu'il ne commence qu'avec la probabilité d'observation compte tenu du paramètre (c'est-à-dire la fonction de vraisemblance) et essaie de trouver le paramètre le plus conforme à l'observation ....
Il semble y avoir beaucoup de confusion dans la comparaison de l'utilisation à l' glmnetintérieur caretpour rechercher un lambda optimal et à utiliser cv.glmnetpour faire la même tâche. De nombreuses questions ont été posées, par exemple: Modèle de classification train.glmnet vs cv.glmnet? Quelle...
Cette question traite de l'estimation du maximum de vraisemblance restreint (REML) dans une version particulière du modèle linéaire, à savoir: Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)),Y=X(α)β+ϵ,ϵ∼Nn(0,Σ(α)), Y = X(\alpha)\beta + \epsilon, \\ \epsilon\sim N_n(0, \Sigma(\alpha)), où X(α)X(α)X(\alpha) est une matrice (...