Statistiques et Big Data

9
Comment effectuer plusieurs tests chi carré post-hoc sur une table 2 X 3?

Mon ensemble de données comprend la mortalité totale ou la survie d'un organisme sur trois types de sites: côtier, médian et extracôtier. Les nombres dans le tableau ci-dessous représentent le nombre de sites. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Je voudrais...

9
Cluster efficace dans l'espace

La plupart des algorithmes de clustering que j'ai vus commencent par créer des distances de chaque point entre tous les points, ce qui devient problématique sur des ensembles de données plus importants. Y en a-t-il un qui ne le fait pas? Ou le fait-il dans une sorte d'approche partielle /...

9
Cyclisme dans l'algorithme k-means

Selon wiki, le critère de convergence le plus utilisé est "l'assignation n'a pas changé". Je me demandais si le cyclisme peut se produire si nous utilisons un tel critère de convergence? Je serais heureux si quelqu'un faisait référence à un article qui donne un exemple de cyclisme ou prouve que...

9
Comment calculer l'erreur standard des rapports de cotes?

J'ai deux ensembles de données provenant d'études d'association à l'échelle du génome. Les seules informations disponibles sont le rapport de cotes et la valeur de p pour le premier ensemble de données. Pour le deuxième ensemble de données, j'ai le rapport de cotes, la valeur de p et les fréquences...

9
Techniques de catégorisation / segmentation

Tout d'abord, permettez-moi de dire que je suis un peu hors de ma profondeur ici, donc si cette question doit être reformulée ou fermée en double, veuillez me le faire savoir. Il se peut simplement que je n'ai pas le vocabulaire approprié pour exprimer ma question. Je travaille sur une tâche de...

9
Critères du coude pour déterminer le nombre de grappes

Il est mentionné ici qu'une des méthodes pour déterminer le nombre optimal de grappes dans un ensemble de données est la "méthode du coude". Ici, le pourcentage de variance est calculé comme le rapport de la variance entre les groupes à la variance totale. J'avais du mal à comprendre ce calcul....