Questions marquées «pandas»

136
Comment charger un fichier tsv dans un Pandas DataFrame?

Je suis nouveau sur python et pandas. J'essaye de tsvcharger un fichier dans un pandas DataFrame. Voici ce que j'essaye et l'erreur que j'obtiens: >>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t')) Traceback (most recent call last): File "<pyshell#28>",...

135
Les pandas divisent la colonne de listes en plusieurs colonnes

J'ai un pandas DataFrame avec une colonne: import pandas as pd df = pd.DataFrame( data={ "teams": [ ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ["SF", "NYG"], ] } ) print(df) Production: teams 0 [SF, NYG] 1 [SF, NYG] 2 [SF, NYG] 3 [SF, NYG] 4 [SF, NYG]...

135
ImportError: aucun module nommé dateutil.parser

Je reçois l'erreur suivante lors de l'importation pandasdans un Pythonprogramme monas-mbp:book mona$ sudo pip install python-dateutil Requirement already satisfied (use --upgrade to upgrade): python-dateutil in /System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python Cleaning...

134
Comment imprimer un objet groupby

Je veux imprimer le résultat du regroupement avec Pandas. J'ai un dataframe: import pandas as pd df = pd.DataFrame({'A': ['one', 'one', 'two', 'three', 'three', 'one'], 'B': range(6)}) print(df) A B 0 one 0 1 one 1 2 two 2 3 three 3 4 three 4 5 one 5 Lors de l'impression après regroupement par 'A',...

134
comment vérifier le dtype d'une colonne dans les pandas python

J'ai besoin d'utiliser différentes fonctions pour traiter les colonnes numériques et les colonnes de chaînes. Ce que je fais maintenant est vraiment stupide: allc = list((agg.loc[:, (agg.dtypes==np.float64)|(agg.dtypes==np.int)]).columns) for y in allc: treat_numeric(agg[y]) allc = list((agg.loc[:,...

134
pandas valeurs uniques plusieurs colonnes

df = pd.DataFrame({'Col1': ['Bob', 'Joe', 'Bill', 'Mary', 'Joe'], 'Col2': ['Joe', 'Steve', 'Bob', 'Bob', 'Steve'], 'Col3': np.random.random(5)}) Quelle est la meilleure façon de renvoyer les valeurs uniques de «Col1» et «Col2»? La sortie souhaitée est 'Bob', 'Joe', 'Bill', 'Mary',...

133
Pandas Python: remplissez un dataframe ligne par ligne

La simple tâche d'ajouter une ligne à un pandas.DataFrameobjet semble être difficile à accomplir. Il y a 3 questions de stackoverflow liées à cela, dont aucune ne donne de réponse fonctionnelle. Voici ce que j'essaye de faire. J'ai un DataFrame dont je connais déjà la forme ainsi que les noms des...

132
Les pandas convertissent la trame de données en tableau de tuples

J'ai manipulé certaines données à l'aide de pandas et je souhaite maintenant effectuer une sauvegarde par lots dans la base de données. Cela m'oblige à convertir le dataframe en un tableau de tuples, chaque tuple correspondant à une "ligne" du dataframe. Mon DataFrame ressemble à quelque chose...

131
Normaliser les données dans les pandas

Supposons que j'ai une trame de données pandas df : Je veux calculer la moyenne par colonne d'un bloc de données. C'est facile: df.apply(average) puis la plage par colonne max (col) - min (col). C'est encore facile: df.apply(max) - df.apply(min) Maintenant, pour chaque élément, je veux soustraire...

131
vérifier si la variable est dataframe

quand ma fonction f est appelée avec une variable, je veux vérifier si var est un dataframe pandas: def f(var): if var == pd.DataFrame(): print "do stuff" Je suppose que la solution peut être assez simple mais même avec def f(var): if var.values != None: print "do stuff" Je ne peux pas le faire...