Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho imparato che una statistica è un attributo che puoi ottenere dai campioni. Prendendo molti campioni della stessa dimensione, calcolando questo attributo per tutti loro e tramando il pdf, otteniamo la distribuzione dell'attributo corrispondente o la distribuzione delle statistiche corrispondenti. Ho anche sentito che le statistiche sono fatte per essere …
Sono molto nuovo con R e statistiche in generale, ma ho bisogno di creare un diagramma a dispersione che penso possa essere al di là delle sue capacità native. Ho un paio di vettori di osservazioni e voglio fare un diagramma a dispersione con loro, e ogni coppia rientra in …
Ci sto pensando da una prospettiva di requisiti minimi e basilari. Quali sono le teorie chiave che uno statistico (non accademico) del settore dovrebbe conoscere, comprendere e utilizzare su base regolare? Un grande che viene in mente è la legge di grandi numeri . Quali sono i più essenziali per …
I modelli di additivi generalizzati sono quelli in cui per esempio. le funzioni sono fluide e da stimare. Di solito da spline penalizzate. MGCV è un pacchetto in R che lo fa, e l'autore (Simon Wood) scrive un libro sul suo pacchetto con esempi R. Ruppert, et al. (2003) scrive …
Questa è una domanda elementare, ma non sono riuscito a trovare la risposta. Ho due misurazioni: n1 eventi nel tempo t1 e n2 eventi nel tempo t2, entrambi prodotti (diciamo) da processi di Poisson con valori lambda possibilmente diversi. Questo in realtà proviene da un articolo di notizie, che afferma …
Ho un compito di classificazione in cui ho un numero di predittori (uno dei quali è il più informativo) e sto usando il modello MARS per costruire il mio classificatore (sono interessato a qualsiasi modello semplice, e usare glms a scopo illustrativo sarebbe bene anche). Ora ho un enorme squilibrio …
La versione tl; dr Quali strategie di successo utilizzate per insegnare la distribuzione del campionamento (ad esempio una media campionaria) a livello introduttivo universitario? Lo sfondo A settembre terrò un corso di statistica introduttiva per gli studenti del secondo anno di scienze sociali (principalmente scienze politiche e sociologia) usando The …
Sto cercando di accelerare con R. Alla fine voglio usare le librerie R per fare la classificazione del testo. Mi stavo solo chiedendo quali sono le esperienze delle persone riguardo alla scalabilità di R quando si tratta di fare una classificazione del testo. Probabilmente incapperò in dati ad alta dimensione …
Esiste un modello di visualizzazione adatto per mostrare la sovrapposizione di intersezioni di molti insiemi? Sto pensando a qualcosa come i diagrammi di Venn, ma che in qualche modo potrebbe prestarsi meglio a un numero maggiore di insiemi come 10 o più. Wikipedia mostra alcuni diagrammi di Venn con un …
Mi sono imbattuto in questo simpatico tutorial: un manuale di analisi statistiche usando R. Capitolo 13. Analisi dei componenti principali: l'eptatlon olimpico su come eseguire la PCA in linguaggio R. Non capisco l'interpretazione della Figura 13.3: Quindi sto tramando il primo autovettore contro il secondo autovettore. Cosa significa? Supponiamo che …
Qual è la differenza tra il test di normalità di Shapiro-Wilk e il test di normalità di Kolmogorov-Smirnov? Quando differiranno i risultati di questi due metodi?
Ho usato il seguente codice r per stimare gli intervalli di confidenza di una proporzione binomiale perché capisco che questo sostituisce un "calcolo di potenza" quando si progettano i ricevitori che utilizzano i disegni della curva caratteristica che cercano il rilevamento di malattie in una popolazione. n è 150 e …
Se capisco correttamente un intervallo di confidenza di un parametro è un intervallo costruito con un metodo che produce intervalli contenenti il valore reale per una determinata percentuale di campioni. Quindi la "fiducia" riguarda il metodo piuttosto che l'intervallo che calcolo da un particolare campione. Come utente di statistiche mi …
Qual è la differenza nel centrare (o decifrare) i tuoi dati per PCA? Ho sentito che semplifica la matematica o che impedisce al primo PC di essere dominato dai mezzi delle variabili, ma mi sento come se non fossi ancora riuscito a cogliere fermamente il concetto. Ad esempio, la risposta …
Qual è la differenza tra rete neurale , rete bayesiana , albero decisionale e reti di Petri , anche se sono tutti modelli grafici e descrivono visivamente la relazione causa-effetto.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.