Neo4j vs OrientDB vs Titan


13

Sto lavorando a un progetto di scienza dei dati relativo al mining delle relazioni sociali e ho bisogno di archiviare i dati in alcuni database di grafi. Inizialmente ho scelto Neo4j come database. Ma sembra che Neo4j non si ridimensioni bene. L'alternativa che ho scoperto sono Titan e oriebtDB. Ho passato questo confronto su questi tre database, ma vorrei ottenere maggiori dettagli su questi database. Quindi qualcuno potrebbe aiutarmi a scegliere il migliore. Principalmente vorrei confrontare le prestazioni, il ridimensionamento, la documentazione / tutorial online disponibili, il supporto della libreria Python, la complessità del linguaggio delle query e il supporto dell'algoritmo grafico di questi database. Esistono anche altre buone opzioni di database?


1
Considera anche Graphlab (basato su Python): graphlab.com/products/create/overview.html Ecco anche un buon post sul blog: bugra.github.io/work/notes/2014-04-06/… Non posso aiutarti con la discussione su Titan vs oriebtDB però. Si spera che qualcuno si avvicini a quello.
nfmcclure,

È anche possibile utilizzare Spark e GraphX
sheldonkreger

Questo articolo mostra alcuni dettagli sulla scalabilità, un vantaggio speciale per Titan. groups.google.com/forum/#!topic/orient-database/CpPh42ukfH4
Henry H.

2
No non lo è; GraphX ​​non è un database.
Emre,

Dato che erano passati un paio di mesi, suppongo che tu abbia fatto dei progressi. Perché non aggiungere la tua risposta (qui o altro?)
Jayan,

Risposte:


1

Penso che potresti dover tenere a mente pipeline di dati generali e pipeline di machine learning. Per cui è necessario un solido framework per spostare i dati tra tabelle come e grafici come storage oltre a una potente elaborazione distribuita. Dalla mia comprensione Spark GraphX ​​è promettente per costruire queste condutture. Vale la pena guardare il discorso di Joseph Gonzalez (uno dei creatori di GraphLab della CMU) su GraphX ​​su YouTube.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.