Je travaille sur le livre ESL de Hastie et j'ai du mal avec la question 2.3. La question est la suivante:
Nous considérons une estimation du plus proche voisin à l'origine, et la distance médiane de l'origine au point de données le plus proche est donnée par cette équation. Je ne sais pas par où commencer pour essayer de dériver cela.
Je sais que la plupart des points de données sont plus proches de la limite de l'espace d'échantillonnage que de tout autre point de données (malédiction de dimensionnalité), mais j'ai du mal à traduire cela en sens Algèbre linéaire / Probabilité.
Merci!
Réponses:
Par définition de la médiane, nous avons que nous pouvons réécrire comme ce qui équivaut au résultat souhaité.(1-dp)n=1
EDIT: Tentative de réponse de style " ELI5 ", en trois parties.
Pour le cas 1D avec un seul point, la distance est uniformément répartie sur , donc la médiane sera .1[0,1] 12
En 1D, la distribution du minimum sur points est le premier cas à la ème puissance.nn n
En dimensions, la distance n'est pas uniformément distribuée, mais est.r r pp r rp
la source