Ho ascoltato molto questa domanda di intervista e speravo di ottenere alcune opinioni su quali potrebbero essere le risposte valide: hai un file di grandi dimensioni da 10+ GB e vuoi scoprire quale elemento si presenta di più, qual è un buon modo per farlo?
Iterare e tenere traccia di una mappa non è probabilmente una buona idea poiché si utilizza molta memoria e tenere traccia quando arrivano le voci non è la migliore opzione poiché quando si pone questa domanda il file di solito esiste già.
Altri pensieri che avevo incluso dividendo il file per essere ripetuti ed elaborati da più thread e quindi combinare quei risultati, ma il problema di memoria per le mappe è ancora lì.