Quali algoritmi utili esistono che funzionano su enormi flussi di dati e anche i loro risultati sono abbastanza piccoli e si può calcolare il risultato per una miscela di due flussi unendo in qualche modo i loro risultati?
Posso citarne alcuni:
- Le cose ovvie come sum, min, max, count, top-K ecc.
- Algoritmi di flusso approssimativi cosiddetti "basati su sketch" per istogrammi, conteggio di elementi distinti o calcolo di quantili
Quali altri ci sono?
(Sono interessato perché sto scrivendo un progetto hobby per il monitoraggio di sistemi distribuiti la cui utilità è direttamente determinata dall'utilità di tali algoritmi)