Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Le statistiche sono ovunque; l'uso comune di termini statistici è, tuttavia, spesso poco chiaro. I termini probabilità e probabilità sono usati in modo intercambiabile nell'inglese laico, nonostante le loro espressioni matematiche ben definite e diverse. Non separare il termine verosimiglianza dalla probabilità confonde sistematicamente i medici che cercano di quantificare …
Vorrei che i tuoi pensieri sulle differenze tra validazione incrociata e bootstrap per stimare l'errore di previsione. Uno funziona meglio per set di dati di piccole dimensioni o set di dati di grandi dimensioni?
Di recente ho posto una domanda relativa ai principi generali relativi alla revisione delle statistiche nei documenti . Quello che vorrei ora chiederti è ciò che ti irrita particolarmente quando rivedi un articolo, ovvero qual è il modo migliore per infastidire davvero un arbitro statistico! Un esempio per risposta, per …
In un modello lineare semplice con una singola variabile esplicativa, αi=β0+β1δi+ϵiαi=β0+β1δi+ϵi\alpha_i = \beta_0 + \beta_1 \delta_i + \epsilon_i Trovo che la rimozione del termine di intercettazione migliora notevolmente l'adattamento (il valore di va da 0,3 a 0,9). Tuttavia, il termine di intercettazione sembra essere statisticamente significativo.R2R2R^2 Con intercetta: Call: lm(formula …
Supponiamo di avere un set di addestramento per . Supponiamo inoltre di eseguire un qualche tipo di algoritmo di apprendimento supervisionato sul set di addestramento. Le ipotesi sono rappresentate come . Dobbiamo trovare i parametri che minimizzano la "distanza" tra e . Sia(x(i),y(i))(x(i),y(i))(x_{(i)}, y_{(i)})i=1,…,mi=1,…,mi = 1, \dots, mhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nhθ(x(i))=θ0+θ1x(i)1+⋯+θnx(i)nh_{\theta}(x_{(i)}) = \theta_0+\theta_{1}x_{(i)1} …
Abbiamo già più thread etichettati come valori-p che rivelano molti fraintendimenti su di essi. Dieci mesi fa avevamo un thread sul diario psicologico che "bandiva" i valoripppp , ora l' American Statistical Association (2016) afferma che con la nostra analisi "non dovremmo concludere con il calcolo di un valore ".ppp …
Ho iniziato con l'analisi delle serie storiche di Hamilton, ma mi sono perso senza speranza. Questo libro è davvero troppo teorico per me da imparare da solo. Qualcuno ha una raccomandazione per un libro di testo sull'analisi delle serie temporali che è adatto per l'autoapprendimento?
Ho lavorato su un nuovo metodo per analizzare e analizzare set di dati per identificare e isolare sottogruppi di una popolazione senza conoscere in anticipo le caratteristiche di alcun sottogruppo. Mentre il metodo funziona abbastanza bene con campioni di dati artificiali (ovvero set di dati creati appositamente allo scopo di …
Sono molto nuovo nelle statistiche e sto solo imparando a capire le basi, compresi i valori . Ma in questo momento c'è un enorme punto interrogativo nella mia mente e spero che la mia comprensione sia sbagliata. Ecco il mio processo di pensiero:ppp Tutte le ricerche nel mondo non sono …
Molti classificatori di machine learning (ad es. Supportano macchine vettoriali) consentono di specificare un kernel. Quale sarebbe un modo intuitivo per spiegare cos'è un kernel? Un aspetto a cui ho pensato è la distinzione tra kernel lineari e non lineari. In termini semplici, potrei parlare di "funzioni di decisione lineari" …
Qualcuno può spiegare le differenze principali tra gli alberi di inferenza condizionale ( ctreedal partypacchetto in R) rispetto agli algoritmi dell'albero delle decisioni più tradizionali (come rpartin R)? Cosa rende gli alberi CI diversi? Punti di forza e di debolezza? Aggiornamento: ho esaminato il documento di Horthorn e altri a …
Il coefficiente di correlazione di Pearson di xey è lo stesso, sia che si calcoli pearson (x, y) o pearson (y, x). Ciò suggerisce che fare una regressione lineare di y dato x o x dato y dovrebbe essere lo stesso, ma non penso che sia il caso. Qualcuno può …
Sto leggendo i libri sulla regressione lineare. Ci sono alcune frasi sulla norma L1 e L2. Li conosco, ma non capisco perché la norma L1 per i modelli sparsi. Qualcuno può dare una spiegazione semplice?
Come spiegheresti intuitivamente cos'è una radice unitaria, nel contesto del test radice dell'unità? Sto pensando in un modo di spiegare molto come ho fondato in questa domanda . Il caso con l'unità radice è che so (poco, a proposito) che il test dell'unità radice è usato per verificare la stazionarietà …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.