Questions marquées «pandas»

251

Comment trouver la version pandas installée

J'ai des problèmes avec certaines fonctionnalités de pandas. Comment vérifier quelle est ma version

python pandas

245

Afficher DataFrame sous forme de tableau dans le bloc-notes iPython

J'utilise le bloc-notes iPython. Quand je fais ça: df Je reçois une belle table avec des cellules. Cependant, si je fais cela: df1 df2 il n'imprime pas le premier beau tableau. Si j'essaye ceci: print df1 print df2 Il imprime le tableau dans un format différent qui déborde les colonnes et rend la...

pandas printing ipython-notebook jupyter-notebook display

245

Obtenez les lignes qui ont le nombre maximal de groupes en utilisant groupby

Comment puis-je trouver toutes les lignes dans une trame de données pandas qui ont la valeur maximale pour la countcolonne, après le regroupement par ['Sp','Mt']colonnes? Exemple 1: le dataFrame suivant, que je regroupe ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3...

python pandas max pandas-groupby

243

Pandas: supprimer un niveau d'un index de colonne à plusieurs niveaux?

Si j'ai un index de colonne à plusieurs niveaux: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) une --- + - b | c - + --- + - 0 | 1 | 2 1 | 3 | 4 Comment puis-je supprimer le niveau "a" de cet index, donc je me...

python pandas

242

Convertir la colonne Pandas en DateTime

J'ai un champ dans un pandas DataFrame qui a été importé au format chaîne. Il doit s'agir d'une variable datetime. Comment puis-je le convertir en une colonne datetime, puis filtrer en fonction de la date. Exemple: Nom du DataFrame : raw_data Nom de la colonne: Mycol Format de valeur dans la...

python datetime pandas

239

Pandas lus dans le tableau sans en-têtes

Comment puis-je lire dans un fichier .csv (sans en-têtes) et quand je veux seulement un sous-ensemble des colonnes (disons 4e et 7e sur un total de 20 colonnes), en utilisant des pandas? Je n'arrive pas à

python pandas

239

Pourquoi ma fonction "Appliquer" de Pandas référençant plusieurs colonnes ne fonctionne-t-elle pas? [fermé]

Fermé. Cette question n'est pas reproductible ou a été causée par des fautes de frappe . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle soit sur le sujet de Stack Overflow. Fermé l'année dernière . Améliorez cette question...

python python-2.7 pandas dataframe apply

237

comment trier la trame de données pandas d'une colonne

J'ai une trame de données comme celle-ci: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Comme vous...

python pandas sorting

235

Sélection avec des critères complexes de pandas.DataFrame

Par exemple, j'ai un DF simple: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Puis-je sélectionner des valeurs dans 'A' pour lesquelles les...

python pandas

234

Comment sélectionner des lignes avec un ou plusieurs null dans un DataFrame pandas sans lister explicitement les colonnes?

J'ai une trame de données avec ~ 300K lignes et ~ 40 colonnes. Je veux savoir si des lignes contiennent des valeurs nulles - et mettre ces lignes «nulles» dans une trame de données distincte afin de pouvoir les explorer facilement. Je peux créer un masque explicitement: mask = False for col in...

python pandas null nan

230

les pandas obtiennent des lignes qui ne sont PAS dans d'autres trames de données

J'ai deux trames de données pandas qui ont des lignes en commun. Supposons que dataframe2 soit un sous-ensemble de dataframe1. Comment puis-je obtenir les lignes de dataframe1 qui ne sont pas dans dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]})...

python pandas dataframe

230

Convertir des flotteurs en pouces dans Pandas?

J'ai travaillé avec des données importées d'un CSV. Les pandas ont changé certaines colonnes pour qu'elles flottent, alors maintenant les nombres dans ces colonnes s'affichent en virgule flottante! Cependant, j'ai besoin qu'ils soient affichés sous forme d'entiers ou sans virgule. Existe-t-il un...

python pandas floating-point integer dataset

229

Comment puis-je obtenir le NON logique élément par élément d'une série pandas?

J'ai un Seriesobjet pandas contenant des valeurs booléennes. Comment puis-je obtenir une série contenant la logique NOTde chaque valeur? Par exemple, considérons une série contenant: True True True False La série que j'aimerais obtenir contiendrait: False False False True Cela semble être assez...

python pandas boolean-logic

227

Normaliser les colonnes du bloc de données pandas

J'ai une trame de données dans les pandas où chaque colonne a une plage de valeurs différente. Par exemple: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Une idée comment je peux normaliser les colonnes de cette trame de données où chaque valeur est comprise entre 0 et 1? Ma sortie souhaitée est: A B...

python pandas dataframe normalize

221

Extraire uniquement le mois et l'année séparément de la colonne Pandas Datetime

J'ai un Dataframe, df, avec la colonne suivante: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Les éléments de la colonne sont pandas.tslib.Timestamp....

python pandas

221

Comment faire de bons exemples de pandas reproductibles

Les réponses à cette question sont un effort communautaire . Modifiez les réponses existantes pour améliorer ce post. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Après avoir passé un temps décent à regarder à la fois r et pandasbalises sur SO, l'impression que j'ai, c'est...

python pandas

221

Appliquer plusieurs fonctions à plusieurs colonnes groupby

Les documents montrent comment appliquer plusieurs fonctions sur un objet groupby à la fois en utilisant un dict avec les noms des colonnes de sortie comme clés: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537...

python group-by aggregate-functions pandas

220

supprimer des valeurs infinies des trames de données dans les pandas?

quel est le moyen le plus rapide / le plus simple de supprimer des valeurs nan et inf / -inf d'un DataFrame pandas sans réinitialiser mode.use_inf_as_null? J'aimerais pouvoir utiliser les arguments subsetet howde dropna, sauf avec des infvaleurs considérées comme manquantes, comme:...

python numpy scipy pandas

220

Obtenir l'index des colonnes à partir du nom de colonne dans les pandas python

Dans R lorsque vous devez récupérer un index de colonne en fonction du nom de la colonne que vous pourriez faire idx <- which(names(my_data)==my_colum_name) Existe-t-il un moyen de faire de même avec les cadres de données

python pandas dataframe indexing

218

Pandas Remplacer NaN par une chaîne vide / vide

J'ai un cadre de données Pandas comme indiqué ci-dessous: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Je veux supprimer les valeurs NaN avec une chaîne vide pour qu'elle ressemble à ceci: 1 2 3 0 a "" read 1 b l unread 2 c ""

python pandas dataframe nan