Il y a plusieurs usages distincts: estimation de la densité du noyau astuce du noyau lissage du noyau Veuillez expliquer ce que signifie le "noyau" en eux, en termes simples, avec vos propres
Les techniques de lissage du noyau, telles que l'estimation de la densité du noyau (KDE) et la régression du noyau de Nadaraya-Watson, estiment les fonctions par interpolation locale à partir de points de données. A ne pas confondre avec [kernel-trick], pour les noyaux utilisés par exemple dans les SVM.
Il y a plusieurs usages distincts: estimation de la densité du noyau astuce du noyau lissage du noyau Veuillez expliquer ce que signifie le "noyau" en eux, en termes simples, avec vos propres
plot(density(rexp(100)) De toute évidence, toute densité à gauche de zéro représente un biais. Je cherche à résumer certaines données relatives aux non-statisticiens et à éviter de se demander pourquoi les données non négatives ont une densité inférieure à zéro. Les parcelles sont destinées à la...
Pour les estimateurs univariés de densité de noyau (KDE), j'utilise la règle de Silverman pour calculer hhh : 0.9min(sd,IQR/1.34)×n−0.20.9min(sd,IQR/1.34)×n−0.2\begin{equation} 0.9 \min(sd, IQR/1.34)\times n^{-0.2} \end{equation} Quelles sont les règles standard pour KDE multivarié (en supposant un...
J'essaie de mieux comprendre l'estimation de la densité du noyau. En utilisant la définition de Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^(x)=1n∑ni=1Kh(x−xi)=1nh∑ni=1K(x−xih)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x...
L'estimation de la densité de fenêtre de Parzen est décrite comme p(x)=1n∑i=1n1h2ϕ(xi−xh)p(x)=1n∑i=1n1h2ϕ(xi−xh) p(x)=\frac{1}{n}\sum_{i=1}^{n} \frac{1}{h^2} \phi \left(\frac{x_i - x}{h} \right) où est le nombre d'éléments dans le vecteur, x est un vecteur, p ( x ) est une densité de probabilité de...
Après avoir effectué l'analyse des composants principaux (PCA), je souhaite projeter un nouveau vecteur sur l'espace PCA (c'est-à-dire trouver ses coordonnées dans le système de coordonnées PCA). J'ai calculé PCA en langage R en utilisant prcomp. Maintenant, je devrais pouvoir multiplier mon...
J'ai lu (par exemple, ici ) que le noyau Epanechnikov est optimal, au moins dans un sens théorique, lors de l'estimation de la densité du noyau. Si cela est vrai, pourquoi le gaussien apparaît-il si fréquemment comme noyau par défaut, ou dans de nombreux cas le seul noyau, dans les bibliothèques...
Cette question est motivée par une discussion ailleurs . Les noyaux variables sont souvent utilisés dans la régression locale. Par exemple, le loess est largement utilisé et fonctionne bien comme un régulateur de régression, et est basé sur un noyau de largeur variable qui s'adapte à la rareté des...
J'essaie d'utiliser la fonction « densité » dans R pour faire des estimations de densité du noyau. J'ai de la difficulté à interpréter les résultats et à comparer divers ensembles de données car il semble que l'aire sous la courbe ne soit pas nécessairement 1. Pour toute fonction de densité de...
Les tests de permutation (également appelés test de randomisation, test de re-randomisation ou test exact) sont très utiles et s'avèrent utiles lorsque l'hypothèse de distribution normale requise par exemple t-testn'est pas remplie et lorsque la transformation des valeurs par classement des un test...
J'ai un échantillon de 100 points qui sont continus et unidimensionnels. J'ai estimé sa densité non paramétrique en utilisant les méthodes du noyau. Comment puis-je tirer des échantillons aléatoires de cette distribution
Quelqu'un pourrait-il expliquer en anglais simple quelle est la différence entre les règles empiriques de Scott et Silverman pour la sélection de la bande passante? Plus précisément, quand est-ce que l'un est meilleur que l'autre? Est-ce lié à la distribution sous-jacente? Nombre d'échantillons? PS...
J'ai besoin d'estimer la fonction de densité sur la base d'un ensemble d'observations à l'aide de l'estimateur de densité du noyau. Sur la base du même ensemble d'observations, j'ai également besoin d'estimer les première et deuxième dérivées de la densité en utilisant les dérivées de l'estimateur...
Après avoir parcouru quelques mathématiques légèrement laconiques, je pense avoir une légère intuition de l'estimation de la densité du noyau. Mais je suis également conscient que l'estimation de la densité multivariée pour plus de trois variables pourrait ne pas être une bonne idée, en termes de...
Je cherche une méthode pour calculer la zone de chevauchement entre deux estimations de densité de noyau dans R, comme mesure de similitude entre deux échantillons. Pour clarifier, dans l'exemple suivant, il me faudrait quantifier l'aire de la région de chevauchement violacé: library(ggplot2)...
Comment définit-on la variance à long terme dans le domaine de l'analyse des séries chronologiques? Je comprends qu'il est utilisé dans le cas où il y a une structure de corrélation dans les données. Notre processus stochastique ne serait donc pas une famille de variables aléatoires iid mais plutôt...
J'utilise Bayes pour résoudre un problème de clustering. Après avoir fait quelques calculs, je me retrouve avec la nécessité d'obtenir le rapport de deux probabilités: P(A)/P(B)P(A)/P(B)P(A)/P(B) pouvoir obtenir . Ces probabilités sont obtenues par intégration de deux KDE multivariés 2D différents...
Je viens de cette question au cas où quelqu'un voudrait suivre la piste. Fondamentalement, j'ai un ensemble de données composé de objets où chaque objet a un nombre donné de valeurs mesurées qui lui sont attachées (deux dans ce cas):NΩΩ\OmegaNNN
Lors de la visualisation de données unidimensionnelles, il est courant d'utiliser la technique d'estimation de la densité du noyau pour tenir compte des largeurs de bac mal choisies. Lorsque mon ensemble de données unidimensionnel présente des incertitudes de mesure, existe-t-il un moyen standard...
Je viens de penser à une façon soignée (pas nécessairement bonne) de créer des estimations de densité unidimensionnelles et ma question est: Cette méthode d'estimation de la densité a-t-elle un nom? Sinon, s'agit-il d'un cas particulier d'une autre méthode dans la littérature? Voici la méthode:...