Statistiques et Big Data

8
Pourquoi voudrais-je bootstrap lors du calcul d'un échantillon t-test indépendant? (comment justifier, interpréter et signaler un test t amorcé)

Disons que j'ai deux conditions, et ma taille d'échantillon pour les deux conditions est extrêmement faible. Disons que je n'ai que 14 observations dans la première condition et 11 dans l'autre. Je veux utiliser le test t pour tester si les différences moyennes sont significativement différentes...

8
Convertir le rapport de risques en rapport de cotes

En méta-analyse: comment convertir les ratios de risque dans certaines études en odds ratio? Il y a des études de cas témoins et de cohorte à inclure et certaines d'entre elles font état de ratios de risque. Les données brutes ne sont pas rapportées de manière à calculer le rapport de...

8
Termes d'erreur vs Innovations

J'ai remarqué que nous appelons parfois les termes d'erreur «innovations». Je ne comprends pas si c'est dans des situations particulières ou si ces termes peuvent être utilisés les uns pour les autres. Ensuite, une autre question est "pourquoi appelons-nous les termes d'erreur" innovations "?...

8
Examen du document sur le filtre à particules

J'ai trouvé en ligne une ébauche d'un excellent article de synthèse de Zhe Chen intitulé "Filtrage bayésien: des filtres de Kalman aux filtres à particules et au-delà". Selon Google Scholar, la citation de la version publiée est "Statistics 182 (1), 1-69, 2003" mais le journal que je trouve avec ce...

8
Formule Schuette – Nesbitt

Je lisais l'article sur la formule Schuette-Nesbitt , qui est décrite comme "une généralisation du principe d'inclusion-exclusion" , qui a à la fois une version combinatoire et probabiliste. Un autre site Web a fourni une preuve des événements dépendants (téléchargement en pdf) et en a trouvé un...

8
Quelles sont les raisons pour lesquelles les moindres carrés itérativement repondérés ne convergeraient pas lorsqu'ils sont utilisés pour la régression logistique?

J'ai utilisé la fonction glm.fit dans R pour ajuster les paramètres à un modèle de régression logistique. Par défaut, glm.fit utilise des moindres carrés itérativement repondérés pour ajuster les paramètres. Quelles sont les raisons pour lesquelles cet algorithme ne parviendrait pas à converger,...