Questions marquées «pandas»

pandas est une bibliothèque python pour la manipulation et l'analyse de données de panel, par exemple des séries chronologiques multidimensionnelles et des ensembles de données transversales que l'on trouve couramment dans les statistiques, les résultats scientifiques expérimentaux, l'économétrie ou la finance.

73
Différence entre isna () et isnull () dans les pandas

J'utilise des pandas depuis un certain temps. Mais, je n'ai pas compris quelle est la différence entre isna()et isnull()dans les pandas. Et, plus important encore, lequel utiliser pour identifier les valeurs manquantes dans le cadre de données. Quelle est la différence fondamentale sous-jacente de...

69
Pourquoi les gens préfèrent-ils les pandas à SQL?

J'utilise SQL depuis 1996, donc je peux être partial. J'ai beaucoup utilisé MySQL et SQLite 3, mais j'ai également utilisé Microsoft SQL Server et Oracle. La grande majorité des opérations que j'ai vues effectuer avec des pandas peuvent être effectuées plus facilement avec SQL. Cela inclut le...

31
Convertir une liste de listes en un cadre de données Pandas

J'essaie de convertir une liste de listes qui ressemble à la suivante en un cadre de données Pandas [['New York Yankees ', '"Acevedo Juan" ', 900000, ' Pitcher\n'], ['New York Yankees ', '"Anderson Jason"', 300000, ' Pitcher\n'], ['New York Yankees ', '"Clemens Roger" ', 10100000, ' Pitcher\n'],...

29
Pourquoi xgboost est-il tellement plus rapide que sklearn GradientBoostingClassifier?

J'essaie de former un modèle d'augmentation de gradient sur plus de 50k exemples avec 100 fonctionnalités numériques. XGBClassifiergère 500 arbres en 43 secondes sur ma machine, alors qu'il GradientBoostingClassifierne gère que 10 arbres (!) en 1 minute et 2 secondes :( Je n'ai pas pris la peine...

16
agrandir la carte thermique de Seaborn

Je crée un corr()df à partir d'un df d'origine. Le corr()df est sorti 70 X 70 et il est impossible de visualiser le heatmap ... sns.heatmap(df). Si j'essaie d'afficher le corr = df.corr(), le tableau ne correspond pas à l'écran et je peux voir toutes les corrélations. Est-ce un moyen d'imprimer...

14
Pandas Dataframe à DMatrix

J'essaie d'exécuter xgboost dans scikit learn. Et j'utilise uniquement des Pandas pour charger des données dans la trame de données. Comment suis-je censé utiliser pandas df avec xgboost. Je suis confus par la routine DMatrix requise pour exécuter xgboost

12
Combien de cellules LSTM dois-je utiliser?

Existe-t-il des règles générales (ou des règles réelles) concernant la quantité minimale, maximale et "raisonnable" de cellules LSTM que je devrais utiliser? Plus précisément, je me rapporte à BasicLSTMCell de TensorFlow et à la num_unitspropriété. Veuillez supposer que j'ai un problème de...