Sto cercando di capire come tutti i componenti dei "big data" giocano insieme in un caso d'uso reale, ad esempio hadoop, monogodb / nosql, storm, kafka, ... So che si tratta di una vasta gamma di strumenti utilizzati per tipi diversi, ma mi piacerebbe conoscere meglio la loro interazione con le applicazioni, ad esempio pensando al machine learning per un'app, una webapp, un negozio online.
Ho vistors / session, dati di transazione ecc. E li conservo; ma se voglio dare consigli al volo, non posso eseguire la mappatura lenta / ridurre i lavori per questo su alcuni grandi database di registri che ho. Dove posso saperne di più sugli aspetti dell'infrastruttura? Penso di poter usare la maggior parte degli strumenti da soli, ma collegarli l'uno con l'altro sembra essere un'arte a sé stante.
Ci sono esempi / casi d'uso pubblici disponibili? Capisco che le singole condutture dipendono fortemente dal caso d'uso e dall'utente, ma probabilmente solo gli esempi mi saranno molto utili.