J'ai des problèmes avec certaines fonctionnalités de pandas. Comment vérifier quelle est ma version
J'ai des problèmes avec certaines fonctionnalités de pandas. Comment vérifier quelle est ma version
J'utilise le bloc-notes iPython. Quand je fais ça: df Je reçois une belle table avec des cellules. Cependant, si je fais cela: df1 df2 il n'imprime pas le premier beau tableau. Si j'essaye ceci: print df1 print df2 Il imprime le tableau dans un format différent qui déborde les colonnes et rend la...
Comment puis-je trouver toutes les lignes dans une trame de données pandas qui ont la valeur maximale pour la countcolonne, après le regroupement par ['Sp','Mt']colonnes? Exemple 1: le dataFrame suivant, que je regroupe ['Sp','Mt']: Sp Mt Value count 0 MM1 S1 a **3** 1 MM1 S1 n 2 2 MM1 S3 cb 5 3...
Si j'ai un index de colonne à plusieurs niveaux: >>> cols = pd.MultiIndex.from_tuples([("a", "b"), ("a", "c")]) >>> pd.DataFrame([[1,2], [3,4]], columns=cols) une --- + - b | c - + --- + - 0 | 1 | 2 1 | 3 | 4 Comment puis-je supprimer le niveau "a" de cet index, donc je me...
J'ai un champ dans un pandas DataFrame qui a été importé au format chaîne. Il doit s'agir d'une variable datetime. Comment puis-je le convertir en une colonne datetime, puis filtrer en fonction de la date. Exemple: Nom du DataFrame : raw_data Nom de la colonne: Mycol Format de valeur dans la...
Comment puis-je lire dans un fichier .csv (sans en-têtes) et quand je veux seulement un sous-ensemble des colonnes (disons 4e et 7e sur un total de 20 colonnes), en utilisant des pandas? Je n'arrive pas à
Fermé. Cette question n'est pas reproductible ou a été causée par des fautes de frappe . Il n'accepte pas actuellement les réponses. Voulez-vous améliorer cette question? Mettez à jour la question pour qu'elle soit sur le sujet de Stack Overflow. Fermé l'année dernière . Améliorez cette question...
J'ai une trame de données comme celle-ci: print(df) 0 1 2 0 354.7 April 4.0 1 55.4 August 8.0 2 176.5 December 12.0 3 95.5 February 2.0 4 85.6 January 1.0 5 152 July 7.0 6 238.7 June 6.0 7 104.8 March 3.0 8 283.5 May 5.0 9 278.8 November 11.0 10 249.6 October 10.0 11 212.7 September 9.0 Comme vous...
Par exemple, j'ai un DF simple: import pandas as pd from random import randint df = pd.DataFrame({'A': [randint(1, 9) for x in xrange(10)], 'B': [randint(1, 9)*10 for x in xrange(10)], 'C': [randint(1, 9)*100 for x in xrange(10)]}) Puis-je sélectionner des valeurs dans 'A' pour lesquelles les...
J'ai une trame de données avec ~ 300K lignes et ~ 40 colonnes. Je veux savoir si des lignes contiennent des valeurs nulles - et mettre ces lignes «nulles» dans une trame de données distincte afin de pouvoir les explorer facilement. Je peux créer un masque explicitement: mask = False for col in...
J'ai deux trames de données pandas qui ont des lignes en commun. Supposons que dataframe2 soit un sous-ensemble de dataframe1. Comment puis-je obtenir les lignes de dataframe1 qui ne sont pas dans dataframe2? df1 = pandas.DataFrame(data = {'col1' : [1, 2, 3, 4, 5], 'col2' : [10, 11, 12, 13, 14]})...
J'ai travaillé avec des données importées d'un CSV. Les pandas ont changé certaines colonnes pour qu'elles flottent, alors maintenant les nombres dans ces colonnes s'affichent en virgule flottante! Cependant, j'ai besoin qu'ils soient affichés sous forme d'entiers ou sans virgule. Existe-t-il un...
J'ai un Seriesobjet pandas contenant des valeurs booléennes. Comment puis-je obtenir une série contenant la logique NOTde chaque valeur? Par exemple, considérons une série contenant: True True True False La série que j'aimerais obtenir contiendrait: False False False True Cela semble être assez...
J'ai une trame de données dans les pandas où chaque colonne a une plage de valeurs différente. Par exemple: df: A B C 1000 10 0.5 765 5 0.35 800 7 0.09 Une idée comment je peux normaliser les colonnes de cette trame de données où chaque valeur est comprise entre 0 et 1? Ma sortie souhaitée est: A B...
J'ai un Dataframe, df, avec la colonne suivante: df['ArrivalDate'] = ... 936 2012-12-31 938 2012-12-29 965 2012-12-31 966 2012-12-31 967 2012-12-31 968 2012-12-31 969 2012-12-31 970 2012-12-29 971 2012-12-31 972 2012-12-29 973 2012-12-29 ... Les éléments de la colonne sont pandas.tslib.Timestamp....
Les réponses à cette question sont un effort communautaire . Modifiez les réponses existantes pour améliorer ce post. Il n'accepte pas actuellement de nouvelles réponses ou interactions. Après avoir passé un temps décent à regarder à la fois r et pandasbalises sur SO, l'impression que j'ai, c'est...
Les documents montrent comment appliquer plusieurs fonctions sur un objet groupby à la fois en utilisant un dict avec les noms des colonnes de sortie comme clés: In [563]: grouped['D'].agg({'result1' : np.sum, .....: 'result2' : np.mean}) .....: Out[563]: result2 result1 A bar -0.579846 -1.739537...
quel est le moyen le plus rapide / le plus simple de supprimer des valeurs nan et inf / -inf d'un DataFrame pandas sans réinitialiser mode.use_inf_as_null? J'aimerais pouvoir utiliser les arguments subsetet howde dropna, sauf avec des infvaleurs considérées comme manquantes, comme:...
Dans R lorsque vous devez récupérer un index de colonne en fonction du nom de la colonne que vous pourriez faire idx <- which(names(my_data)==my_colum_name) Existe-t-il un moyen de faire de même avec les cadres de données
J'ai un cadre de données Pandas comme indiqué ci-dessous: 1 2 3 0 a NaN read 1 b l unread 2 c NaN read Je veux supprimer les valeurs NaN avec une chaîne vide pour qu'elle ressemble à ceci: 1 2 3 0 a "" read 1 b l unread 2 c ""