Quelles sont les similitudes et les différences entre ces 3 méthodes: Ensachage, Boosting, Empiler? Quel est le meilleur? Et pourquoi? Pouvez-vous me donner un exemple pour
Quelles sont les similitudes et les différences entre ces 3 méthodes: Ensachage, Boosting, Empiler? Quel est le meilleur? Et pourquoi? Pouvez-vous me donner un exemple pour
J'ai lu que "la distance euclidienne n'est pas une bonne distance dans les grandes dimensions". Je suppose que cette déclaration a quelque chose à voir avec la malédiction de la dimensionnalité, mais quoi au juste? En outre, qu'est-ce que les «grandes dimensions»? J'appliquais la classification...
Peut-être que le concept, pourquoi il est utilisé et un
J'ai parcouru quelques notes de cours de Cosma Shalizi (en particulier, la section 2.1.1 de la deuxième leçon ), et il m'a été rappelé que vous pouvez obtenir un très faible même avec un modèle complètement linéaire.R2R2R^2 Pour paraphraser l'exemple de Shalizi: supposons que vous ayez un modèle ,...
Les pages d’aide de R supposent que je sais ce que signifient ces chiffres, mais je ne les connais pas. J'essaie de comprendre intuitivement chaque chiffre ici. Je vais simplement poster le résultat et commenter ce que j'ai découvert. Il y aura peut-être des erreurs, car je vais simplement écrire...
L'échange de Joris et Srikant ici m'a demander (encore une fois) si mes explications internes de la différence entre les intervalles de confiance et les intervalles crédibles étaient les bonnes. Comment expliqueriez-vous la
Cherché haut et bas et n'ont pas été en mesure de savoir ce que AUC, en ce qui concerne la prédiction, signifie ou
Il semble que, grâce à diverses questions connexes, il existe un consensus sur le fait que la partie "95%" de ce que nous appelons un "intervalle de confiance à 95%" fait référence au fait que si nous reproduisions exactement nos procédures d'échantillonnage et de calcul CI , 95% des IC ainsi...
Je suis un étudiant diplômé en psychologie et, au fur et à mesure que je poursuis mes études indépendantes en statistique, je suis de plus en plus émerveillé par l'insuffisance de ma formation. Les expériences personnelles et de seconde main suggèrent que le manque de rigueur statistique dans la...
Lors de la formation d'un réseau de neurones, quelle différence cela fait-il de définir: taille du lot à et nombre d'itérations àaaabbb en fonction de la taille du lot à et du nombre d'itérations àcccddd où ?ab=cdab=cd ab = cd Autrement dit, en supposant que nous formions le réseau de neurones avec...
L'AIC et le BIC sont deux méthodes d'évaluation de l'adéquation du modèle pénalisées pour le nombre de paramètres estimés. Si je comprends bien, BIC pénalise davantage les modèles pour les paramètres libres que l’AIC. Au-delà d'une préférence basée sur la rigueur des critères, existe-t-il d'autres...
Il semble qu'un certain nombre de progiciels statistiques que j'utilise réunissent ces deux concepts. Cependant, je me demande s'il existe différentes hypothèses ou «formalités» de données qui doivent être vraies pour pouvoir être utilisées l'une par rapport à l'autre. Un exemple réel serait...
Quelle est la différence entre l'exploration de données, les statistiques, l'apprentissage automatique et l'IA? Serait-il juste de dire que ce sont 4 domaines qui tentent de résoudre des problèmes très similaires mais avec des approches différentes? Qu'ont-ils en commun et en quoi diffèrent-ils?...
Imaginez un scénario d’apprentissage automatique standard: Vous êtes confronté à un vaste ensemble de données multivariées et vous en avez une compréhension assez floue. Ce que vous devez faire est de faire des prédictions sur certaines variables en fonction de ce que vous avez. Comme d'habitude,...
... en supposant que je puisse augmenter leurs connaissances sur la variance de manière intuitive ( comprendre "variance" intuitivement ) ou en disant: C'est la distance moyenne des valeurs de données à partir de la "moyenne" - et puisque la variance est en carré unités, nous prenons la racine...
Nous avons donc la moyenne arithmétique (AM), la moyenne géométrique (GM) et la moyenne harmonique (HM). Leur formulation mathématique est également bien connue, ainsi que leurs exemples stéréotypés associés (par exemple, la moyenne harmonique et son application aux problèmes liés à la «rapidité»)....
J'aimerais implémenter un algorithme pour la sélection automatique de modèles. Je pense faire une régression par étapes, mais tout ira bien (il faut que cela soit basé sur des régressions linéaires). Mon problème est que je suis incapable de trouver une méthodologie, ou une implémentation open...
Quel est le meilleur manuel d'introduction aux statistiques bayésiennes? Un livre par réponse, s'il vous
Si j'ai des données positives très asymétriques, je prends souvent des journaux. Mais que dois-je faire avec des données non négatives hautement asymétriques qui incluent des zéros? J'ai vu deux transformations utilisées: log(x+1)log(x+1)\log(x+1) qui a la particularité que 0 mappe sur 0....
Je suis sûr que beaucoup de gens répondront avec des liens vers "laissez-moi google ça pour vous", alors je tiens à dire que j'ai essayé de comprendre cela, alors pardonnez mon manque de compréhension ici, mais je ne peux pas comprendre comment le La mise en œuvre pratique d'un réseau de neurones...