J'essaie de décompresser un fichier csv et de le transmettre aux pandas afin que je puisse travailler sur le fichier. Le code que j'ai essayé jusqu'à présent est: import requests, zipfile, StringIO r =
J'essaie de décompresser un fichier csv et de le transmettre aux pandas afin que je puisse travailler sur le fichier. Le code que j'ai essayé jusqu'à présent est: import requests, zipfile, StringIO r =
Dataframe.resample () fonctionne uniquement avec les données de séries temporelles. Je ne peux pas trouver un moyen d'obtenir chaque nième ligne à partir de données non chronologiques. Quelle est la meilleure
Cible J'ai une trame de données Pandas, comme indiqué ci - dessous, avec plusieurs colonnes et que vous souhaitez obtenir le total de la colonne, MyColumn. Trame de données -df: print df X MyColumn Y Z 0 A 84 13.0 69.0 1 B 76 77.0 127.0 2 C 28 69.0 16.0 3 D 28 28.0 31.0 4 E 19 20.0 85.0 5 F 84...
Ce sujet n'a pas été abordé depuis un moment, ici ou ailleurs. Existe-t-il une solution pour convertir un SQLAlchemy <Query object>en un pandas DataFrame? Pandas a la capacité d'utiliser pandas.read_sqlmais cela nécessite l'utilisation de SQL brut. J'ai deux raisons de vouloir l'éviter: 1)...
J'ai un dataframe dans les pandas et j'essaie de comprendre quels sont les types de ses valeurs. Je ne sais pas quel est le type de colonne 'Test'. Cependant, quand je cours myFrame['Test'].dtype, je reçois; dtype('O') Qu'est-ce que ça veut
Les forboucles sont-elles vraiment «mauvaises»? Sinon, dans quelle (s) situation (s) seraient-ils mieux que d'utiliser une approche «vectorisée» plus conventionnelle? 1 Je connais le concept de "vectorisation" et la manière dont les pandas utilisent des techniques vectorisées pour accélérer le...
Comment convertir les données d'un objet Scikit-learn Bunch en un Pandas DataFrame? from sklearn.datasets import load_iris import pandas as pd data = load_iris() print(type(data)) data1 = pd. # Is there a Pandas method to accomplish
J'utilise des trames de données Pandas. J'ai une trame de données initiale, disons D. J'en extrait deux trames de données comme ceci: A = D[D.label == k] B = D[D.label != k] puis je change l'étiquette AetB A.label = 1 B.label = -1 Je veux combiner A et B afin de pouvoir les avoir comme une seule...
J'ai un dataframe pandas avec les noms de colonnes suivants: Résultat1, Test1, Résultat2, Test2, Résultat3, Test3, etc ... Je souhaite supprimer toutes les colonnes dont le nom contient le mot "Test". Le nombre de ces colonnes n'est pas statique mais dépend d'une fonction précédente. Comment puis...
J'ai un dataframe df: 20060930 10.103 NaN 10.103 7.981 20061231 15.915 NaN 15.915 12.686 20070331 3.196 NaN 3.196 2.710 20070630 7.907 NaN 7.907 6.459 Ensuite, je veux sélectionner des lignes avec certains numéros de séquence indiqués dans une liste, supposons que voici [1,3], puis à gauche:...
J'ai une liste 'abc' et un dataframe 'df': abc = ['foo', 'bar'] df = A B 0 12 NaN 1 23 NaN Je veux insérer la liste dans la cellule 1B, donc je veux ce résultat: A B 0 12 NaN 1 23 ['foo', 'bar'] Comment puis-je faire ça? 1) Si j'utilise ceci: df.ix[1,'B'] = abc Je reçois le message d'erreur...
Existe-t-il un moyen de réorganiser les colonnes dans la trame de données pandas en fonction de mes préférences personnelles (c'est-à-dire pas triées par ordre alphabétique ou numérique, mais plutôt en suivant certaines conventions)? Exemple simple: frame = pd.DataFrame({ 'one thing':[1,2,3,4],...
J'essaie de tracer des données à l'aide de pandas dans Ipython Notebook, et bien qu'il me donne l'objet, il ne trace pas réellement le graphique lui-même. Donc ça ressemble à ça: In [7]: pledge.Amount.plot() Out[7]: <matplotlib.axes.AxesSubplot at 0x9397c6c> Le graphique devrait suivre après...
En utilisant ceci comme point de départ: a = [['10', '1.2', '4.2'], ['15', '70', '0.03'], ['8', '5', '0']] df = pd.DataFrame(a, columns=['one', 'two', 'three']) Out[8]: one two three 0 10 1.2 4.2 1 15 70 0.03 2 8 5 0 Je veux utiliser quelque chose comme une ifdéclaration dans les pandas. if...
Disons que j'ai le DataFrame suivant Numéro de lettre A 1 B 2 C 3 D 4 Qui peut être obtenu via le code suivant import pandas as pd letters=pd.Series(('A', 'B', 'C', 'D')) numbers=pd.Series((1, 2, 3, 4)) keys=('Letters', 'Numbers') df=pd.concat((letters, numbers), axis=1, keys=keys) Maintenant, je...
J'ai une trame de données Pandas, l'une des colonnes contient des chaînes de date au format YYYY-MM-DD Pour par exemple '2013-10-28' Au moment où dtypela colonne est object. Comment convertir les valeurs de colonne au format de date
Je cherche un moyen de faire l'équivalent du SQL SELECT DISTINCT col1, col2 FROM dataframe_table La comparaison pandas sql n'a rien à propos de distinct. .unique() ne fonctionne que pour une seule colonne, donc je suppose que je pourrais concaténer les colonnes, ou les mettre dans une liste /...
C'est probablement facile, mais j'ai les données suivantes: Dans le bloc de données 1: index dat1 0 9 1 5 Dans la trame de données 2: index dat2 0 7 1 6 Je veux un bloc de données avec la forme suivante: index dat1 dat2 0 9 7 1 5 6 J'ai essayé d'utiliser la appendméthode, mais j'obtiens une...
Je peux utiliser la pandas dropna()fonctionnalité pour supprimer des lignes avec certaines ou toutes les colonnes définies comme NAs. Existe-t-il une fonction équivalente pour supprimer des lignes avec toutes les colonnes ayant la valeur 0? P kt b tt mky depth 1 0 0 0 0 0 2 0 0 0 0 0 3 0 0 0 0 0 4...
J'ai un DataFrame: import pandas as pd import numpy as np df = pd.DataFrame({'foo.aa': [1, 2.1, np.nan, 4.7, 5.6, 6.8], 'foo.fighters': [0, 1, np.nan, 0, 0, 0], 'foo.bars': [0, 0, 0, 0, 0, 1], 'bar.baz': [5, 5, 6, 5, 5.6, 6.8], 'foo.fox': [2, 4, 1, 0, 0, 5], 'nas.foo': ['NA', 0, 1, 0, 0, 0],...