Sélectionnez 50 éléments de la liste au hasard pour écrire dans un fichier

129

Jusqu'à présent, j'ai compris comment importer le fichier, créer de nouveaux fichiers et randomiser la liste.

J'ai du mal à sélectionner seulement 50 éléments de la liste au hasard pour écrire dans un fichier?

def randomizer(input,output1='random_1.txt',output2='random_2.txt',output3='random_3.txt',output4='random_total.txt'):

#Input file 
    query=open(input,'r').read().split()
    dir,file=os.path.split(input)

    temp1 = os.path.join(dir,output1)
    temp2 = os.path.join(dir,output2)
    temp3 = os.path.join(dir,output3)
    temp4 = os.path.join(dir,output4)


    out_file4=open(temp4,'w')

    random.shuffle(query)

    for item in query:
        out_file4.write(item+'\n')   

Donc, si le fichier de randomisation totale était

example:

random_total = ['9','2','3','1','5','6','8','7','0','4']

Je voudrais 3 fichiers (out_file1 | 2 | 3) avec le premier ensemble aléatoire de 3, le deuxième ensemble aléatoire de 3 et le troisième ensemble aléatoire de 3 (pour cet exemple, mais celui que je veux créer devrait en avoir 50)

random_1 = ['9','2','3']
random_2 = ['1','5','6']
random_3 = ['8','7','0']

Donc, le dernier «4» ne sera pas inclus, ce qui est bien.

Comment puis-je sélectionner 50 dans la liste que j'ai randomisée?

Mieux encore, comment pourrais-je sélectionner 50 au hasard dans la liste d'origine?

O.rka
la source
Que voulez-vous dire?
O.rka

Réponses:

269

Si la liste est dans un ordre aléatoire, vous pouvez simplement prendre les 50 premiers.

Sinon, utilisez

import random
random.sample(the_list, 50)

random.sample Texte d'aide:

sample(self, population, k) method of random.Random instance
    Chooses k unique random elements from a population sequence.

    Returns a new list containing elements from the population while
    leaving the original population unchanged.  The resulting list is
    in selection order so that all sub-slices will also be valid random
    samples.  This allows raffle winners (the sample) to be partitioned
    into grand prize and second place winners (the subslices).

    Members of the population need not be hashable or unique.  If the
    population contains repeats, then each occurrence is a possible
    selection in the sample.

    To choose a sample in a range of integers, use xrange as an argument.
    This is especially fast and space efficient for sampling from a
    large population:   sample(xrange(10000000), 60)
John La Rooy
la source
1
Puis-je avoir le random.sampleretour également des indices qu'il a choisis?
zyy
43

Un moyen simple de sélectionner des éléments aléatoires consiste à mélanger puis à découper.

import random
a = [1,2,3,4,5,6,7,8,9]
random.shuffle(a)
print a[:4] # prints 4 random variables
Mani
la source
@MonicaHeddneck Pourquoi le mélange aléatoire et le découpage en tranches seraient-ils meilleurs? La sélection d'un certain nombre d'échantillons en randomisant la sélection n'aurait-elle pas les mêmes mérites que le mélange aléatoire et la prise d'une tranche des échantillons mélangés? Pouvez-vous expliquer? Merci.
salvu
7
Je l'ai utilisé pour créer facilement un ensemble de test / train pour un projet d'apprentissage automatique. Utiliser random.choice(mylist,3)ne créerait pas deux ensembles disjoints comme cela.
Monica Heddneck
29

Je pense que random.choice()c'est une meilleure option.

import numpy as np

mylist = [13,23,14,52,6,23]

np.random.choice(mylist, 3, replace=False)

la fonction renvoie un tableau de 3 valeurs choisies au hasard dans la liste

Moein
la source
7
Je pense que vous devez utiliser random.choice(mylist, 3, replace=False). Aussi moins déroutant à utiliser import numpy as npetnp.random.choice(mylist, 3, replace=False)
John La Rooy
10
Ceci a des chances de répéter l'élément de liste
Paullo
Non, ce n'est pas une meilleure option, c'est ~ 100 fois plus lent
Nitesh Kansal
-3

Supposons que votre liste comporte 100 éléments et que vous souhaitiez en choisir 50 de manière aléatoire. Voici les étapes à suivre:

  1. Importez les bibliothèques
  2. Créez la graine pour le générateur de nombres aléatoires, je l'ai mise à 2
  3. Préparez une liste de nombres à partir de laquelle vous pourrez récupérer de manière aléatoire
  4. Faites les choix aléatoires dans la liste des nombres

Code:

from random import seed
from random import choice

seed(2)
numbers = [i for i in range(100)]

print(numbers)

for _ in range(50):
    selection = choice(numbers)
    print(selection)
AlketCecaj
la source