Questions marquées «distributed-computing»

376
Expliquer Apache ZooKeeper

J'essaie de comprendre ZooKeeper, comment cela fonctionne et ce qu'il fait. Existe-t-il une application comparable à ZooKeeper? Si vous le savez, comment décririez-vous ZooKeeper à un profane? J'ai essayé apache wiki, zookeeper sourceforge ... mais je ne suis toujours pas en mesure de m'identifier...

254
Spark - répartition () vs coalesce ()

Selon Learning Spark Gardez à l'esprit que la répartition de vos données est une opération assez coûteuse. Spark a également une version optimisée de repartition()appelée coalesce()qui permet d'éviter le mouvement des données, mais uniquement si vous diminuez le nombre de partitions RDD. Une...

127
Calculez la médiane d'un milliard de nombres

Si vous avez un milliard de nombres et cent ordinateurs, quelle est la meilleure façon de localiser la médiane de ces nombres? Une solution que j'ai est: Répartissez l'ensemble de manière égale entre les ordinateurs. Triez-les. Trouvez les médianes pour chaque ensemble. Triez les ensembles sur les...