Questions marquées «model»

12
Quand un effet fixe est-il vraiment fixe?

Considérons un modèle d'effets non observés linéaire du type: où est une caractéristique non observée mais invariable dans le temps et est une erreur, et indexer les observations individuelles et le temps, respectivement. L'approche typique dans une régression à effets fixes (FE) serait de...

12
Critères de sélection du «meilleur» modèle dans un modèle de Markov caché

J'ai un ensemble de données de série chronologique auquel j'essaie d'adapter un modèle de Markov caché (HMM) afin d'estimer le nombre d'états latents dans les données. Mon pseudo-code pour ce faire est le suivant: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ......

12
Modèle mixte avec 1 observation par niveau

J'adapte un modèle d'effets aléatoires glmerà certaines données d'entreprise. L'objectif est d'analyser la performance commerciale par distributeur en tenant compte des variations régionales. J'ai les variables suivantes: distcode: ID distributeur, avec environ 800 niveaux region: ID géographique...

12
Test exact de Fisher et distribution hypergéométrique

Je voulais mieux comprendre le test exact du pêcheur, j'ai donc imaginé l'exemple de jouet suivant, où f et m correspond à l'homme et à la femme, et n et y correspond à la "consommation de soda" comme ceci: > soda_gender f m n 0 5 y 5 0 Évidemment, c'est une simplification drastique, mais je ne...

12
Vous avez du mal à trouver un bon modèle adapté aux données de comptage avec des effets mixtes - ZINB ou autre chose?

J'ai un très petit ensemble de données sur l'abondance des abeilles solitaires que j'ai du mal à analyser. Ce sont des données de comptage, et presque tous les comptages sont dans un traitement avec la plupart des zéros dans l'autre traitement. Il existe également quelques valeurs très élevées (une...

12
Comment effectuer l'imputation de valeurs dans un très grand nombre de points de données?

J'ai un très grand ensemble de données et il manque environ 5% de valeurs aléatoires. Ces variables sont corrélées entre elles. L'exemple de jeu de données R suivant n'est qu'un exemple de jouet avec des données corrélées factices. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1,...

12
Est-il possible d'évaluer GLM en Python / scikit-learn en utilisant les distributions de Poisson, Gamma ou Tweedie comme famille pour la distribution d'erreur?

J'essaie d'apprendre un peu Python et Sklearn, mais pour mon travail, j'ai besoin d'exécuter des régressions qui utilisent des distributions d'erreur des familles Poisson, Gamma et surtout Tweedie. Je ne vois rien dans la documentation à leur sujet, mais ils se trouvent dans plusieurs parties de la...