Disons que vous avez un large échantillon aléatoire de joueurs de football en Europe, mais que vous ne vous intéressez qu'à ce qui se passe en Espagne. Pourriez-vous réduire votre échantillon à des joueurs en Espagne et toujours l'appeler un échantillon aléatoire (mais d'une population différente)? Sinon, comment qualifieriez-vous ce sous-échantillon et quelles précautions spécifiques devriez-vous prendre pour pouvoir faire des déductions sur la population de footballeurs espagnols?
Mon sentiment est que l'utilisation de ce sous-échantillon serait bien tant qu'il est assez grand, mais peut-être que je manque quelque chose.
sampling
sample
resampling
Antoine Vernet
la source
la source
Réponses:
D'une manière générale, ce que vous attendez vraiment d'un échantillon, c'est d'être "représentatif". L'échantillonnage aléatoire est une bonne façon de procéder car il permet à tous les sujets d'avoir la même probabilité d'être échantillonnés; Dans l'espoir que tous les attributs et relations d'attributs existant dans la population existeront dans l'échantillon. Le rendre "représentatif". Dans votre cas, si vous pensez que tous les joueurs espagnols avaient a priori une chance égale d'être tirés au sort dans le (sous-) échantillon, alors c'est "aléatoire".
Concernant les considérations de taille: Une seule observation peut toujours être un "échantillon aléatoire". Des échantillons plus grands sont nécessaires lorsque vous souhaitez plus de précision, et en particulier lorsque vous recherchez des relations rares dans la population, qui pourraient ne pas être présentes dans un petit échantillon.
la source
En supposant qu'il n'y ait pas de biais dans la technique d'échantillonnage, cela devrait convenir. Certaines questions à poser pourraient être:
-> L'enquête a-t-elle été réalisée en espagnol sur demande? (Préjugé linguistique) -> L'enquête a-t-elle été réalisée par téléphone ou en personne? Si par téléphone et que les téléphones portables étaient exclus, les joueurs espagnols sont-ils plus ou moins susceptibles de posséder des téléphones portables que les joueurs du reste de l'Europe, et pour quelles raisons? -> Le taux auquel les joueurs espagnols ont refusé de répondre aux questions du sondage était-il différent du taux pour les joueurs dans leur ensemble? -> Globalement, quelle proportion de joueurs espagnols ont été échantillonnés?
Sans connaître la composition exacte des données, il est difficile d'en dire plus. Y a-t-il des problèmes spécifiques qui vous préoccupent?
la source