J'essaie de convertir une liste de listes qui ressemble à la suivante en un cadre de données Pandas
[['New York Yankees ', '"Acevedo Juan" ', 900000, ' Pitcher\n'],
['New York Yankees ', '"Anderson Jason"', 300000, ' Pitcher\n'],
['New York Yankees ', '"Clemens Roger" ', 10100000, ' Pitcher\n'],
['New York Yankees ', '"Contreras Jose"', 5500000, ' Pitcher\n']]
J'essaie essentiellement de convertir chaque élément du tableau en un cadre de données pandas qui comporte quatre colonnes. Quelle serait la meilleure approche à ce sujet, car pd.Dataframe ne me donne pas tout à fait ce que je recherche.
Réponses:
la source
DataFrame["Team"]
doit se référer au premier élément de chaque sous-liste (iedata[i][0]
) etDataFrame["Position"]
se référer au dernier élément de chaque sous-liste (iedata[i][-1]
)?columns
paramètre de DataFrame.from_records .Une fois que vous avez les données:
Vous pouvez créer un cadre de données à partir de la transposition des données:
Autrement:
la source
Vous pouvez simplement le définir directement comme un bloc de données comme suit:
la source
la source
Celui-ci était de loin le plus simple:
maintenant, si les clés sont la première liste dans la liste des listes (données [0]), vous pouvez les affecter aux en-têtes de colonne dans la trame de données comme ceci:
la source