Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Se ho due valori A e B che sono entrambi espressi come percentuale di C e voglio esprimere la differenza di grandezza tra A e B come percentuale D, è più corretto esprimere D come percentuale di C, oppure in percentuale di B (o effettivamente A)? 50 disoccupati sono ovviamente …
Versione breve: Sappiamo che la regressione logistica e la regressione probit possono essere interpretate come implicanti una variabile latente continua che viene discretizzata in base a una soglia fissa prima dell'osservazione. È disponibile una simile interpretazione variabile latente per, per esempio, la regressione di Poisson? Che ne dici della regressione …
Considera la regressione della cresta con un vincolo aggiuntivo che richiede che abbia la somma unitaria dei quadrati (equivalentemente, varianza unitaria); se necessario, si può presumere che abbia anche la somma unitaria dei quadrati:y^y^\hat{\mathbf y}yy\mathbf y β^∗λ=argmin{∥y−Xβ∥2+λ∥β∥2}s.t.∥Xβ∥2=1.β^λ∗=argmin{‖y−Xβ‖2+λ‖β‖2}s.t.‖Xβ‖2=1.\hat{\boldsymbol\beta}_\lambda^* = \arg\min\Big\{\|\mathbf y - \mathbf X \boldsymbol \beta\|^2+\lambda\|\boldsymbol\beta\|^2\Big\} \:\:\text{s.t.}\:\: \|\mathbf X \boldsymbol\beta\|^2=1. Qual …
Durante una conferenza ho sentito la seguente dichiarazione: 100 misurazioni per 5 soggetti forniscono molte meno informazioni rispetto a 5 misurazioni per 100 soggetti. È abbastanza ovvio che questo è vero, ma mi chiedevo come si potesse dimostrarlo matematicamente ... Penso che si possa usare un modello misto lineare. Tuttavia, …
Recentemente ho letto alcune domande su t-SNE ( t-Distributed Stochastic Neighbor Embedding ) e ho anche visitato alcune domande su MDS ( Multidimensional Scaling ). Sono spesso usati in modo analogo, quindi mi è sembrata una buona idea fare questa domanda visto che qui ci sono molte domande su entrambi …
In statistica, indipendente e casuale descrivono le stesse caratteristiche? Qual è la differenza tra loro? Spesso ci imbattiamo nella descrizione come "due variabili casuali indipendenti" o "campionamento casuale". Mi chiedo quale sia la differenza esatta tra loro. Qualcuno può spiegare questo e dare alcuni esempi? per esempio processo non indipendente …
Quando dovremmo discretizzare / binare variabili / caratteristiche indipendenti e quando no? I miei tentativi di rispondere alla domanda: In generale, non dovremmo fare il bin, perché il binning perderà informazioni. Il binning sta effettivamente aumentando il grado di libertà del modello, quindi è possibile causare un eccesso di adattamento …
Sulla base della scarsa conoscenza che ho dei metodi MCMC (Markov chain Monte Carlo), capisco che il campionamento è una parte cruciale della tecnica di cui sopra. I metodi di campionamento più comunemente usati sono Hamiltoniano e Metropolis. Esiste un modo per utilizzare l'apprendimento automatico o anche l'apprendimento profondo per …
Sfondo: Sì, è possibile utilizzare la macchina Boltzmann con restrizioni (RBM) per avviare i pesi di una rete neurale. Inoltre PUO 'essere usato in modo "strato per strato" per costruire una rete di credenze profonde (cioè per addestrare un -esimo strato sulla parte superiore di ( n - 1 ) …
La mia comprensione è che anche quando si seguono le corrette procedure di convalida incrociata e selezione dei modelli, si verificherà un overfitting se si cerca un modello abbastanza duramente , a meno che non si impongano restrizioni sulla complessità del modello, sul periodo. Inoltre, spesso le persone tentano di …
La mia domanda è nata da una discussione con @whuber nei commenti di un'altra domanda . Nello specifico, il commento di @whuber è stato il seguente: Uno dei motivi per cui potrebbe sorprenderti è che le ipotesi alla base di un test di correlazione e di un test di pendenza …
Di recente, stavo lavorando all'apprendimento di algoritmi di potenziamento, come adaboost, boost gradiente, e ho saputo che lo studente debole più usato è l'albero. Voglio davvero sapere ci sono alcuni esempi recenti di successo (intendo alcuni documenti o articoli) per l'utilizzo di reti neurali come studente di base.
Che cosa è "logistico" sulla distribuzione logistica, in senso comune? Qual è l'etimologia e la logica lessicale del nome, non solo la pura definizione matematica?
EDIT: Poiché questa domanda è stata gonfiata, un riassunto: trovare diversi set di dati significativi e interpretabili con le stesse statistiche miste (media, mediana, media e le loro dispersioni associate e regressione). Il quartetto Anscombe (vedi Scopo della visualizzazione di dati ad alta dimensione? ) È un famoso esempio di …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.