Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

3
Test di significatività dei picchi nella densità spettrale
A volte utilizziamo il diagramma di densità spettrale per analizzare la periodicità in serie temporali. Normalmente analizziamo la trama mediante ispezione visiva e quindi proviamo a trarre una conclusione sulla periodicità. Ma gli statistici hanno sviluppato test per verificare se eventuali picchi nella trama sono statisticamente diversi dal rumore bianco? …


2
Se utilizzare la modellazione di equazioni strutturali per analizzare studi osservazionali in psicologia
Ho notato questo problema emergere molto nelle impostazioni di consulenza statistica ed ero desideroso di avere i tuoi pensieri. Contesto Parlo spesso con studenti di ricerca che hanno condotto uno studio approssimativamente come segue: Studio osservazionale La dimensione del campione potrebbe essere 100, 200, 300, ecc. Sono state misurate più …


2
Trasformazione dei dati proporzionali: quando arcsin radice quadrata non è sufficiente
Esiste un'alternativa (più forte?) Alla trasformazione della radice quadrata di arcsin per dati percentuale / proporzionali? Nel set di dati su cui sto lavorando al momento, rimane marcata eteroscedasticità dopo che ho applicato questa trasformazione, vale a dire che la trama dei residui rispetto ai valori adattati è ancora molto …

2
Funzione "Interessante" per domande StackExchange
Sto cercando di mettere insieme un pacchetto di data mining per i siti StackExchange e, in particolare, sono bloccato nel tentativo di determinare le domande "più interessanti". Vorrei utilizzare il punteggio della domanda, ma rimuovere la distorsione a causa del numero di visualizzazioni, ma non so come affrontarlo rigorosamente. Nel …




4
Valori medi di correlazione
Diciamo che collaudo come la variabile Ydipende dalla variabile Xin diverse condizioni sperimentali e ottengo il seguente grafico: Le linee tratteggiate nel grafico sopra rappresentano la regressione lineare per ciascuna serie di dati (configurazione sperimentale) e i numeri nella legenda indicano la correlazione di Pearson di ciascuna serie di dati. …


2
Quali sono i vantaggi / gli svantaggi dell'utilizzo di spline, spline levigate ed emulatori di processi gaussiani?
Sono interessato a imparare (e implementare) un'alternativa all'interpolazione polinomiale. Tuttavia, ho difficoltà a trovare una buona descrizione di come funzionano questi metodi, come si relazionano e come si confrontano. Gradirei il tuo contributo sui pro / contro / condizioni in cui questi metodi o alternative sarebbero utili, ma alcuni buoni …


2
Come nominare le zecche in un boxplot matplotlib in pitone
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Python matplotlib ha un comando boxplot . Normalmente, tutte le parti del grafico sono barrate numericamente. Come posso cambiare i segni …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.