Questions marquées «bootstrap»

9
Taille des échantillons bootstrap

J'apprends le bootstrap comme moyen d'estimer la variance d'un échantillon statistique. J'ai un doute fondamental. Citant de http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Combien d'observations devons-nous rééchantillonner? Une bonne suggestion est la taille de...

9
Quel modèle d'apprentissage en profondeur peut classer des catégories qui ne s'excluent pas mutuellement

Exemples: J'ai une phrase dans la description de poste: "Java senior engineer in UK". Je veux utiliser un modèle d'apprentissage profond pour le prédire en 2 catégories: English et IT jobs. Si j'utilise un modèle de classification traditionnel, il ne peut prédire qu'une seule étiquette avec...

8
Effectuer des régressions sur des échantillons d'un fichier très volumineux: les moyennes et les ES des coefficients d'échantillonnage sont-ils des estimateurs cohérents?

J'ai un fichier assez volumineux de 100 millions de lignes et 30 colonnes environ, sur lequel j'aimerais exécuter plusieurs régressions. J'ai un code spécialisé pour exécuter les régressions sur l'ensemble du fichier, mais ce que je voudrais faire est de tirer des échantillons aléatoires du fichier...

8
Bootstrapping avec un petit nombre d'observations

Disons que j'ai collecté un petit nombre (N) d'observations pour une hypothèse que j'aimerais tester. Je pourrais utiliser la méthode bootstrap pour produire une distribution d'échantillon pour le résultat moyen de N observations, mais je crains que ce modèle ne se décompose lorsque N devient très...

8
Bootstrap vs intégration numérique

Ma compréhension de l'approche bootstrap est basée sur le cadre de Wasserman (presque mot pour mot): Soit une statistique ( est l'échantillon iid tiré de la distribution ). Supposons que nous voulons estimer - la variance de donné .Tn=g(X1,...,Xn)Tn=g(X1,...,Xn)T_n = g(X_1, ...,...

8
Pourquoi un modèle statistique serait-il surchargé s'il était doté d'un énorme ensemble de données?

Mon projet actuel peut m'obliger à construire un modèle pour prédire le comportement d'un certain groupe de personnes. l'ensemble de données de formation ne contient que 6 variables (id est uniquement à des fins d'identification): id, age, income, gender, job category, monthly spend dans laquelle...

8
Pourquoi voudrais-je bootstrap lors du calcul d'un échantillon t-test indépendant? (comment justifier, interpréter et signaler un test t amorcé)

Disons que j'ai deux conditions, et ma taille d'échantillon pour les deux conditions est extrêmement faible. Disons que je n'ai que 14 observations dans la première condition et 11 dans l'autre. Je veux utiliser le test t pour tester si les différences moyennes sont significativement différentes...