J'ai une petite liste de sociétés qui fournissent une plate-forme pour l'exécution de scripts R, python ou octave sur des clusters construits au-dessus d'Amazon EC2. Y a-t-il d'autres noms que je devrais ajouter?
r
machine-learning
Zach
la source
la source
Réponses:
Je n'ai pas utilisé ces entreprises, mais ce ne sont que quelques-unes des options. Cependant, la configuration sur EC2 est très simple. Au moins après que vous ayez engourdi votre tête en la frappant contre le mur assez fort et assez souvent. Cela augmente également votre seuil de douleur. Les enfants de nos jours ont tellement plus facile. Quand j'ai commencé, nous faisions de l'informatique dans le brouillard: nous n'avions pas ce qu'il y avait de plus brumeux.
Réminiscences mises à part ... Il existe des outils et des ressources pour contourner ces fournisseurs et démarrer par vous-même. JD Long a, avec
segue
, rendu plus facile l’utilisation de R sur EMR.En ce qui concerne Python, boto est une suite qui permet à Python de fonctionner facilement sur EC2. Il est également assez facile de lancer Python sur AppEngine de Google si vous êtes prêt à envisager une alternative EC2. Si vous connaissez Python, vous n’avez vraiment pas besoin de faire appel à une entreprise pour effectuer le levage à votre place, à moins que vous ne connaissiez pas la mise à l’échelle, le sharding, l’équilibrage de charge, etc., même au niveau conceptuel. D'autre part, si vous envisagez de dépenser beaucoup d'argent pour de tels services, il est judicieux de vous familiariser avec la façon de rendre votre code efficace.
En ce qui concerne Octave sur le cloud, je n'ai aucune idée de ce qui existe autre que ces trois sociétés. Monkey Analytics l'utilisait auparavant, mais il semble qu'ils soient partis. Je recommanderais d'éviter Octave et de me concentrer sur Python ou R.
StarCluster est une ressource facilitant la configuration . Encore une fois, aucune expérience avec eux, mais cela peut être une voie utile.
En toute honnêteté, Ubuntu (ou Windows) et EC2 ne sont pas si difficiles à apprendre. Je ne recommanderais pas vraiment Windows pour R, car il n’ya pas beaucoup d’amour parmi les développeurs de R et Windows. (Remarque: pour autant que je sache, il n'existe pas de services cloud Mac OS X sérieux.) Une fois que vous disposez d'un poste de travail distant, vous êtes en activité. Apprendre à évoluer est la prochaine étape.
Mise à jour 1: Les autres services de gestion en nuage, plus généraux, incluent RighstScale et Scalr.
Mise à jour 2: Je tiens à souligner qu’il est important d’apprendre à configurer vous-même vos instances et vos clusters dans le cloud. Parmi les avantages du travail pratique:
gputools
)L'utilisation d'un fournisseur géré présente des avantages, tels qu'une courbe d'apprentissage plus courte, éventuellement une meilleure prise en charge du partage de ressources entre plusieurs groupes, et peut-être de beaux gadgets, mais je ne peux pas en parler, car j'ai commencé à utiliser EC2 auparavant. est venu au marché.
la source
Il y a aussi PiCloud pour exécuter du code Python en parallèle sur EC2.
De leur page produit :
la source
Avez-vous déjà essayé CloudStat ? Différent des autres nuages, CloudStat est destiné uniquement aux utilisateurs du langage R. Il n'y a plus de configuration. vous pouvez simplement vous connecter et utiliser gratuitement jusqu'à 7,5 Go de RAM.
Cependant, avec un compte gratuit, votre analyse sera vue et utilisée par le public. L'option est de payer 5 $ par mois pour rendre votre analyse privée.
la source
Une des plateformes de cloud computing que je peux recommander est Backbone, qui fournit une plateforme de cloud computing sécurisée qui améliore la productivité .
la source