Un professeur de mon université a posé une question comme celle-ci (pas pour les devoirs car le cours est terminé et je n'y étais pas). Je ne sais pas comment l'aborder.
La question concerne 2 sachets contenant chacun un assortiment de différents types de fruits:
Le premier sac contient les fruits sélectionnés au hasard suivants:
+ ------------- + -------- + --------- + | diamètre cm | masse g | pourri? | + ------------- + -------- + --------- + | 17,28 | 139,08 | 0 | | 6,57 | 91,48 | 1 | | 7.12 | 74,23 | 1 | | 16,52 | 129,8 | 0 | | 14,58 | 169,22 | 0 | | 6,99 | 123,43 | 0 | | 6,63 | 104,93 | 1 | | 6,75 | 103,27 | 1 | | 15,38 | 169.01 | 1 | | 7.45 | 83,29 | 1 | | 13.06 | 157,57 | 0 | | 6,61 | 117,72 | 0 | | 7.19 | 128,63 | 0 | + ------------- + -------- + --------- +
Le deuxième sac contient 6 fruits sélectionnés au hasard dans le même magasin que le premier sac. La somme de leurs diamètres est de 64,2 cm et 4 sont pourris.
Donnez une estimation de la masse du deuxième sac.
Je peux voir qu'il semble y avoir deux types de fruits différents avec des diamètres et des masses normalement distribués, mais je ne sais pas comment procéder.
regression
estimation
rutilusk
la source
la source
Réponses:
Commençons par tracer les données et examinons-les. Il s'agit d'une quantité très limitée de données, donc cela va être quelque peu ponctuel avec beaucoup d'hypothèses.
Voici donc les données, les points rouges représentent les fruits pourris:
Vous avez raison de supposer qu'il semble y avoir deux sortes de fruits. Les hypothèses que je fais sont les suivantes:
Étant donné que la somme du diamètre est de 64,2 cm, il est très probable que deux fruits soient gros et quatre petits. Maintenant, il y a 3 cas pour le poids. Il y a 2, 3 ou 4 petits fruits pourris ( un gros fruit pourri n'affecte pas la masse par hypothèse ). Alors maintenant, vous pouvez obtenir des limites sur votre masse en calculant ces valeurs.
Nous pouvons estimer empiriquement la probabilité que le nombre de petits fruits pourris. Nous utilisons les probabilités pour pondérer nos estimations de la masse, en fonction du nombre de fruits pourris:
Nous donnant une estimation finale de 691,5183g . Je pense que vous devez faire la plupart des hypothèses que j'ai faites pour arriver à une conclusion, mais je pense qu'il pourrait être possible de le faire de manière plus intelligente. J'ai aussi échantillonné empiriquement pour obtenir la probabilité du nombre de petits fruits pourris, c'est juste de la paresse et cela peut être fait "analytiquement".
la source
Je proposerais l'approche suivante:
Tout cela est gérable par un simple script.
la source
Les approches multiples incluent, du plus simple au plus complexe,
. . .
méthodes combinatoires
Les approches sont classées par ordre de simplicité de calcul, et non par ordre d'approche meilleure ou de bien quelconque. Le choix de l'approche à utiliser dépend des caractéristiques de la population connues ou supposées. Par exemple, si les masses de fruits dans la population des magasins sont normalement distribuées et indépendantes des diamètres et du statut de pourriture, on pourrait utiliser la première approche la plus simple sans aucun avantage (ou même les inconvénients de l'erreur d'échantillonnage de plusieurs variables) d'utiliser des approches plus complexes . S'il ne s'agit pas de variables aléatoires indépendantes réparties de manière identique, un choix plus complexe en fonction des informations connues ou supposées sur la population peut être préférable.
la source