Questions marquées «pandas»

104
Comparez deux colonnes à l'aide de pandas

En utilisant ceci comme point de départ: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Je veux utiliser quelque chose comme une ifdéclaration dans les pandas. if...

103
L'objet 'DataFrame' n'a pas d'attribut 'sort'

Je rencontre un problème ici, dans mon package python, j'ai installé numpy, mais j'ai toujours cette erreur 'DataFrame' object has no attribute 'sort' Tout le monde peut me donner une idée. Voici mon code: final.loc[-1] =['', 'P','Actual'] final.index = final.index + 1 # shifting index final =...

103
Renvoie plusieurs colonnes de pandas apply ()

J'ai un dataframe pandas géants, df_test. Il contient une colonne «taille» qui représente la taille en octets. J'ai calculé Ko, Mo et Go à l'aide du code suivant: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] =...

101
Comment déplacer une colonne dans Pandas DataFrame

Je voudrais déplacer une colonne dans un Pandas DataFrame, mais je n'ai pas été en mesure de trouver une méthode pour le faire à partir de la documentation sans réécrire l'ensemble du DF. Quelqu'un sait-il comment le faire? Trame de données: ## x1 x2 ##0 206 214 ##1 226 234 ##2 245 253 ##3 265 272...

101
Ajouter un niveau à un pandas MultiIndex

J'ai un DataFrame avec un MultiIndex créé après un certain regroupement: import numpy as np import pandas as p from numpy.random import randn df = p.DataFrame({ 'A' : ['a1', 'a1', 'a2', 'a3'] , 'B' : ['b1', 'b2', 'b3', 'b4'] , 'Vals' : randn(4) }).groupby(['A', 'B']).sum() df Output> Vals...

101
Sélection de la colonne pandas par emplacement

J'essaie simplement d'accéder aux colonnes pandas nommées par un entier. Vous pouvez sélectionner une ligne par emplacement à l'aide de df.ix[3]. Mais comment sélectionner une colonne par entier? Mon dataframe: df=pandas.DataFrame({'a':np.random.rand(5),

100
comment filtrer les dataframes pandas par plusieurs colonnes

Pour filtrer un dataframe (df) par une seule colonne, si nous considérons les données avec des hommes et des femmes, nous pourrions: males = df[df[Gender]=='Male'] Question 1 - Mais que se passerait-il si les données s'étalaient sur plusieurs années et que je voulais voir uniquement les hommes...