Jusqu'où peut-on aller avec Excel? [fermé]

8

dans mon entreprise, nous traitons toutes les analyses via Excel. Cela comprend principalement la planification, la planification de la production et les opérations comptables. Nous envisageons actuellement d'ajouter un peu de modélisation prédictive et Excel suffit à un certain point, mais ne prend pas en charge les modèles complexes.

À mon avis, les principaux avantages d'Excel sont sa facilité d'utilisation et la facilité avec laquelle vous pouvez trouver et former des personnes à s'y habituer. D'un autre côté, des environnements plus sophistiqués (par exemple R, python) peuvent gérer une plus grande variété de tâches d'analyse, mais nécessitent des individus mieux formés.

J'ai également lu cette question sur si Excel est suffisant pour la science des données et bien qu'il soit un peu hors de portée pour mon objectif, la conclusion est que des outils comme R et Python sont bien meilleurs qu'Excel.

Ma question est (dans le contexte de l'analyse de données): "Jusqu'où pouvons-nous aller avec Excel, sans avoir besoin de passer à un outil plus sophistiqué?" ou "A quel moment devons-nous migrer d'Excel vers -let's-R?"

Merci beaucoup!

Jcart
la source
Mon commentaire, pour ce que ça vaut: Excel est OK pour des ensembles de données relativement petits de taille connue. C'est terrible pour les grands ensembles de données et pour les ensembles de données de longueur variable.
Adrian Keister

Réponses:

2

TL; DR

Si vous avez un temps illimité et utilisez une version 64 bits d'Excel, vous pouvez aller aussi loin avec Excel que tout autre outil d'analyse de données.

Temps

Je mentionne le temps comme premier facteur, car Excel n'a que des fonctionnalités de base intégrées, telles que la sommation, la génération de nombres aléatoires, les recherches, etc. Cela correspond à une sorte de bibliothèque standard , que Python et R ont également. En utilisant ces fonctions de base, avec suffisamment de temps, vous pouvez créer à peu près n'importe quel outil d'analyse. Ne vous attendez pas à de bonnes performances d'exécution. En Python et R, cependant, il existe de nombreux packages que les gens ont déjà créés, qui fonctionnent bien et ont été testés par de nombreuses personnes et sont donc fiables.

Mémoire

Mon deuxième point concernant Excel 64 bits est parce que cela permet à beaucoup plus de mémoire d'être utilisée par une seule instance d'Excel. Il permet de remplir beaucoup plus de cellules. L'utilisation d'Excel 32 bits vous limitera aux projets d'environ 2 Go. C'est une bonne quantité de données, mais c'est une limite stricte.

Ensuite, étapes dans Excel 64 bits, ce qui signifie essentiellement plus de limites de mémoire - uniquement celles qui proviennent de votre matériel, et cela signifie que Python et R seront également arrêtés sur leurs traces.

Pour fournir quelques chiffres, nous pouvons simplement calculer le nombre de bits pouvant être stockés dans chaque version. Ici, dans l'invite interactive de Python:

In [1]: (2**32) / 10**9          # 10^9 means the result is 4.3 Gb
Out[1]: 4.294967296

In [9]: (2**64) / 10**18         # 10^15 means the result is 18.4 Eb
Out[9]: 18.446744073709553

Ebsignifie exa-octets . Cela signifie 18,4 millions de millions de gigaoctets.

Je remarque que le calcul montre 4 Go pour 32 bits, alors que j'ai dit 2 Go ci-dessus. J'ai lu qu'il y avait une sorte de limite stricte sur la version 32 bits. Je ne sais pas pourquoi je m'en soucie ... J'utilise Python et R ;-)

En tout cas, j'espère que cela suffira à vous convaincre que la mémoire n'est pas un problème, si vous êtes une personne courageuse prête à investir tout votre temps à construire des outils à partir de zéro!

Sommaire

Si vous avez une logique métier compliquée, où l'analyse réelle est mathématiquement simple, respectez Excel. Les gens d'affaires vous aimeront pour cela.

Si vous voulez faire plus qu'une régression linéaire, utilisez Python ou R.

Avertissements

Pour autant que je sache, vous ne pouvez pas exécuter des tâches distantes ou distribuées à l'aide d'Excel, alors que c'est relativement facile à l'aide de Python et (un peu moins à mon avis) R. Donc, à ce stade, j'abandonnerais Excel. Vous devrez probablement implémenter vos propres outils en C # ou C ++ en utilisant le framework .Net.

n1k31t4
la source