Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho esaminato numerose domande su questo sito per quanto riguarda il bootstrap e gli intervalli di confidenza, ma sono ancora confuso. Parte del motivo della mia confusione è probabilmente che non sono abbastanza avanzato nelle mie conoscenze statistiche per capire molte delle risposte. Sono a metà del corso di statistica …
Per la stampa con R, dovrei imparare ggplot2 o ggvis? Non voglio necessariamente imparare entrambi se uno di loro è superiore sotto tutti gli aspetti. Perché la comunità R continua a creare nuovi pacchetti con funzionalità sovrapposte? Il post sul blog di introduzione non menziona una parola per cui ggvis …
Se la regressione polinomiale modella relazioni non lineari, come può essere considerato un caso speciale di regressione lineare multipla? Wikipedia osserva che "Sebbene la regressione polinomiale si adatti a un modello non lineare ai dati, come problema di stima statistica è lineare, nel senso che la funzione di regressione è …
Qual è la relazione tra e nella trama seguente? Dal mio punto di vista esiste una relazione lineare negativa, ma poiché abbiamo molti valori anomali, la relazione è molto debole. Ho ragione? Voglio imparare come possiamo spiegare i grafici a dispersione.XYYYXXX
Lo stimatore di regressione quantile condizionale di Koenker e Basset (1978) per il quantile è definito come dove \ rho_ \ tau = u_i \ cdot (\ tau - 1 (u_i <0)) è una funzione di ripesatura (chiamata funzione "check") dei residui u_i .τthτth\tau^{th} βˆQR=minb∑i=1nρτ(yi−X′ibτ)β^QR=minb∑i=1nρτ(yi−Xi′bτ) \widehat{\beta}_{QR} = \min_{b} \sum^{n}_{i=1} \rho_\tau …
Sto facendo una regressione multivariata di Cox, ho le mie significative variabili indipendenti e valori beta. Il modello si adatta molto bene ai miei dati. Ora, vorrei usare il mio modello e prevedere la sopravvivenza di una nuova osservazione. Non sono chiaro come farlo con un modello Cox. In una …
I classificatori Naive Bayes sono una scelta popolare per i problemi di classificazione. Ci sono molte ragioni per questo, tra cui: "Zeitgeist" - consapevolezza diffusa dopo il successo dei filtri antispam di circa dieci anni fa Facile da scrivere Il modello di classificatore è veloce da costruire Il modello può …
So che con un modello non identificabile si può dire che i dati sono generati da più assegnazioni diverse ai parametri del modello. So che a volte è possibile vincolare i parametri in modo che tutti siano identificabili, come nell'esempio in Cassella & Berger 2nd ed, sezione 11.2. Dato un …
Nelle statistiche del frequentista, esiste una stretta connessione tra intervalli di confidenza e test. Usando l'inferenza su nella distribuzione come esempio, l' intervallo di confidenza contiene tutti i valori di che non sono rifiutati dal test al livello di significatività .μμ\muN ( μ , σ2)N(μ,σ2)\rm N(\mu,\sigma^2)1 - α1−α1-\alphaX¯± tα / …
Voglio sfogliare un file .rda (set di dati R). Conosco il View(datasetname)comando. Il R.app predefinito fornito per Mac non ha un ottimo browser per i dati (apre una finestra in X11). Mi piace il browser dati RStudio che si apre con il Viewcomando. Tuttavia, mostra solo 1000 righe e omette …
Sto tentando di eseguire una regressione OLS: DV: variazione di peso nell'arco di un anno (peso iniziale - peso finale) IV: se ti alleni o meno. Tuttavia, sembra ragionevole che le persone più pesanti perderanno più peso per unità di esercizio rispetto alle persone più magre. Pertanto, volevo includere una …
Ho un insieme di dati di serie storiche. Ogni serie copre lo stesso periodo, anche se le date effettive di ciascuna serie temporale potrebbero non "allinearsi" esattamente. Vale a dire, se le serie temporali fossero lette in una matrice 2D, sarebbe simile a questa: date T1 T2 T3 .... TN …
YYYXiXiX_ipipip_iY=∑XiY=∑XiY=\sum X_iPr(Xi=1)=piPr(Xi=1)=pi\Pr(X_i=1)=p_iPr(Xi=0)=1−piPr(Xi=0)=1−pi\Pr(X_i=0)=1-p_i Sono interessato a rispondere rapidamente a domande come (dove viene fornito ).Pr(Y<=k)Pr(Y<=k)\Pr(Y<=k)kkk Attualmente utilizzo simulazioni casuali per rispondere a tali domande. Traccio casualmente ogni X_i inXiXiX_i base alla sua pipip_i , quindi somma tutti i valori XiXiX_i per ottenere Y′Y′Y' . Ripeto questo processo alcune migliaia di volte …
Vorrei essere in grado di generare in modo efficiente matrici di correlazione semidefinite positiva (PSD). Il mio metodo rallenta notevolmente man mano che aumento le dimensioni delle matrici da generare. Potresti suggerire soluzioni efficaci? Se siete a conoscenza di esempi in Matlab, sarei molto grato. Quando generi una matrice di …
Come funziona l'approssimazione del punto di sella? Per quale tipo di problema è utile? (Sentiti libero di usare un esempio o esempi particolari a titolo illustrativo) Ci sono svantaggi, difficoltà, cose a cui fare attenzione o trappole per gli incauti?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.