J'ai un carré 2D et j'ai un ensemble de points à l'intérieur, disons 1000 points. J'ai besoin d'un moyen de voir si la distribution des points à l'intérieur du carré est étalée (ou plus ou moins uniformément distribuée) ou s'ils ont tendance à se rassembler à un endroit à l'intérieur du carré.
J'ai besoin d'un moyen mathématique / statistique (pas de programmation) pour le déterminer. J'ai googlé, trouvé quelque chose comme la qualité de l'ajustement, Kolmogorov, etc., et je me demande simplement s'il existe d'autres approches pour y parvenir. Besoin de cela pour du papier de classe.
Entrées: un carré 2D et 1000 points. Sortie: oui / non (oui = uniformément réparti, non = se rassemblant à certains endroits).
R
, il existe de nombreux outils pour cette tâche .Réponses:
Je pense que l'idée de @John d'un test chi = carré est une façon de procéder.
Vous voudriez des correctifs sur 2-d, mais vous voudriez les tester en utilisant un test chi carré 1 voie; c'est-à-dire que les valeurs attendues pour les cellules seraient où N est le nombre de cellules.1000N
Mais il est possible qu'un nombre différent de cellules donne des conclusions différentes.
Une autre possibilité consiste à calculer la distance moyenne entre les points, puis à la comparer aux résultats simulés de cette moyenne. Cela évite le problème d'un nombre arbitraire de cellules.
EDIT (plus sur la distance moyenne)
Avec 1000 points, il y a distances par paires entre les points. Celles-ci peuvent chacune être calculées (en utilisant, disons, la distance euclidienne). Ces distances peuvent être moyennées.1000 ∗ 9992
Ensuite, vous pouvez générer N (un grand nombre) d'ensembles de 1000 points qui sont uniformément distribués. Chacun de ces N ensembles a également une distance moyenne entre les points.
Comparez les résultats des points réels aux points simulés, soit pour obtenir une valeur de p, soit simplement pour voir où ils se situent.
la source
Une autre possibilité est un test Chi-Squared. Divisez le carré en correctifs de taille identique sans chevauchement et testez le nombre de points tombant dans les correctifs par rapport à leur nombre attendu sous l'hypothèse d'uniformité (l'attente pour un correctif est total_points / total_patches s'ils sont tous de taille égale) et appliquez le test du chi carré. Pour 1000 points, 9 correctifs devraient être suffisants, mais vous voudrez peut-être utiliser plus de granularité selon l'apparence de vos données.
la source
Pourquoi ne pas utiliser le test de Kolmogorov-Smirnov? C'est ce que je ferais, d'autant plus que la taille de votre échantillon est suffisamment grande pour compenser le manque de puissance.
Alternativement, vous pouvez faire de la simulation. Ce n'est pas rigoureux, mais cela fournit des preuves quant à la distribution uniforme des données.
@whuber L'extension bidimensionnelle du KS est bien connue (voir ici ). Dans ce cas, nous cherchons à savoir si ces 1 000 tracés (coordonnées (x, y)) pourraient être tirés de la distribution uniforme uniforme à deux dimensions - du moins c'est ainsi que je lis «uniformément étalé». @John Je me suis peut-être exprimé maladroitement (ni les mathématiques ni l'anglais ne sont mes premières langues). Ce que je voulais dire, c'est que la valeur de p exacte peut être calculée à l'aide d'un test tel que le KS, tandis que la valeur de p (ou tout ce que vous appelez l'équivalent) n'a tendance qu'à être asymptotique lors des simulations.
la source