Neo4j vs OrientDB vs Titan

13

Je travaille sur un projet de science des données lié à l'exploration des relations sociales et j'ai besoin de stocker des données dans certaines bases de données graphiques. Au départ, j'ai choisi Neo4j comme base de données. Mais il semble que Neo4j ne soit pas à l'échelle. L'alternative que j'ai découverte est Titan et oriebtDB. J'ai parcouru cette comparaison sur ces trois bases de données, mais je voudrais obtenir plus de détails sur ces bases de données. Alors, quelqu'un pourrait-il m'aider à choisir le meilleur? Je voudrais principalement comparer les performances, la mise à l'échelle, la documentation en ligne / les didacticiels disponibles, le support de la bibliothèque Python, la complexité du langage de requête et le support de l'algorithme graphique de ces bases de données. Existe-t-il également d'autres bonnes options de base de données?

Sreejithc321
la source
1
Pensez également à Graphlab (basé sur python): graphlab.com/products/create/overview.html Voici également un bon article de blog à ce sujet: bugra.github.io/work/notes/2014-04-06/… Je ne peux pas vous aider avec la discussion Titan vs oriebtDB cependant. Avec un peu de chance, quelqu'un se mettra d'accord avec ça.
nfmcclure
Également possible d'utiliser Spark et GraphX
sheldonkreger
Cet article montre quelques détails sur l'évolutivité, avantage spécial pour Titan. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Henry H.
2
Non ce n'est pas; GraphX ​​n'est pas une base de données.
Emre
Puisque c'était il y a quelques mois, je suppose que vous avez fait des progrès. Pourquoi ne pas ajouter votre propre réponse (ici ou ailleurs?)
Jayan

Réponses:

1

Je pense que vous devrez peut-être garder à l'esprit les pipelines de données globaux et les pipelines d'apprentissage automatique. Pour lequel vous avez besoin d'un cadre robuste pour déplacer les données entre le stockage sous forme de tableau et de graphique en dehors d'un traitement distribué puissant. D'après ma compréhension, Spark GraphX ​​promet de construire ces pipelines. La discussion de Joseph Gonzalez (l'un des créateurs de GraphLab de CMU) sur GraphX ​​sur youtube mérite d'être regardée.

Srini Vemula
la source