Domande taggate «large-data»

I "dati di grandi dimensioni" si riferiscono a situazioni in cui il numero di osservazioni (punti di dati) è così grande da richiedere cambiamenti nel modo in cui l'analista di dati pensa o conduce l'analisi. (Da non confondere con 'alta dimensionalità'.)


4
Test di ipotesi con Big Data
Come si eseguono test di ipotesi con big data? Ho scritto il seguente script MATLAB per sottolineare la mia confusione. Tutto ciò che fa è generare due serie casuali ed eseguire una semplice regressione lineare di una variabile sull'altra. Esegue questa regressione più volte utilizzando valori casuali diversi e riporta …





2
Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili dati di tutta la popolazione?
Ha senso calcolare gli intervalli di confidenza e verificare le ipotesi quando sono disponibili i dati dell'intera popolazione? A mio avviso, la risposta è no, dal momento che possiamo calcolare accuratamente i veri valori dei parametri. Ma allora, qual è la proporzione massima di dati dalla popolazione originale che ci …

3
Come visualizzare i dati di serie storiche di grandi dimensioni in modo interattivo?
Mi occupo spesso di dati di serie storiche di dimensioni ragionevoli, 50-200 milioni di raddoppia con i timestamp associati e vorrei visualizzarli dinamicamente. Esiste un software esistente per farlo efficacemente? Che ne dici di librerie e formati di dati? Zoom-cache è un esempio di libreria focalizzata su grandi serie storiche. …





2
Riduzione dimensionale scalabile
Considerando il numero di funzionalità costante, Barnes-Hut t-SNE ha una complessità di , proiezioni casuali e PCA hanno una complessità di che le rende "convenienti" per insiemi di dati molto grandi.O ( n )O(nlogn)O(nlog⁡n)O(n\log n)O(n)O(n)O(n) D'altra parte, i metodi basati sul ridimensionamento multidimensionale hanno una complessità .O ( n2)O(n2)O(n^2) Esistono …


2

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.