Ils semblent tous deux extrêmement similaires et je suis curieux de savoir quel package serait le plus avantageux pour l'analyse des données financières.
195
pandas fournit des outils de manipulation de données de haut niveau construits sur NumPy. NumPy en lui-même est un outil de bas niveau, similaire à MATLAB. pandas, d'autre part, offre une riche fonctionnalité de séries chronologiques, l'alignement des données, des statistiques compatibles avec NA, des méthodes de regroupement, de fusion et de jointure et de nombreuses autres commodités. Il est devenu très populaire ces dernières années dans les applications financières. J'aurai un chapitre consacré à l'analyse des données financières à l'aide de pandas dans mon prochain livre.
NA-friendly statistics
, mentionné dans votre réponse.Numpy est requis par les pandas (et par pratiquement tous les outils numériques pour Python). Scipy n'est pas strictement requis pour les pandas mais est répertorié comme une "dépendance facultative". Je ne dirais pas que les pandas sont une alternative à Numpy et / ou Scipy. Il s'agit plutôt d'un outil supplémentaire qui fournit une manière plus rationalisée de travailler avec des données numériques et tabulaires en Python. Vous pouvez utiliser des structures de données pandas mais utiliser librement les fonctions Numpy et Scipy pour les manipuler.
la source
Les pandas offrent un excellent moyen de manipuler les tableaux, car vous pouvez simplifier le regroupement ( regrouper un cadre de données dans les pandas en Python ) et calculer des statistiques. Une autre chose qui est géniale dans les pandas est la classe Panel que vous pouvez joindre à une série de couches avec différentes propriétés et la combiner en utilisant la fonction groupby.
la source