Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho analizzato i miei dati così come sono. Ora voglio guardare le mie analisi dopo aver preso il registro di tutte le variabili. Molte variabili contengono molti zeri. Pertanto aggiungo una piccola quantità per evitare di prendere il registro di zero. Finora ho aggiunto 10 ^ -10, senza alcuna motivazione, …
Trovo incredibilmente utili risorse come il ricettario di probabilità e statistica e la scheda di riferimento R per il data mining . Ovviamente servono anche come riferimenti, ma mi aiutano anche a organizzare i miei pensieri su un argomento e ottenere la disposizione della terra. D: Esiste qualcosa come queste …
Nel rispondere a questa domanda su dati discreti e continui ho asserito con disinvoltura che raramente ha senso trattare i dati categorici come continui. A prima vista sembra evidente, ma l'intuizione è spesso una cattiva guida per le statistiche, o almeno lo è la mia. Quindi ora mi chiedo: è …
Ho alcune domande sulla regressione bayesiana: Data una regressione standard come . Se voglio trasformarlo in una regressione bayesiana, ho bisogno di distribuzioni precedenti sia per che (o non funziona in questo modo)?β 0 β 1y= β0+ β1x + εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 Nella regressione standard …
Ho letto che l'uso di scale di log quando la creazione di grafici / grafici è appropriato in determinate circostanze, come l'asse y in un grafico di serie temporali. Tuttavia, non sono stato in grado di trovare una spiegazione definitiva sul perché sia così o quando altrimenti sarebbe appropriato. Tieni …
In quali circostanze vorresti o non vuoi ridimensionare o standardizzare una variabile prima del fitting del modello? E quali sono i vantaggi / gli svantaggi del ridimensionamento di una variabile?
Secondo l'articolo di Wikipedia sulla stima imparziale della deviazione standard il campione SD s=1n−1∑i=1n(xi−x¯¯¯)2−−−−−−−−−−−−−−−√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} è uno stimatore distorto della DS della popolazione. Indica che .E(s2−−√)≠E(s2)−−−−−√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} NB. Le variabili casuali sono indipendenti e ognixi∼N(μ,σ2)xi∼N(μ,σ2)x_{i} \sim N(\mu,\sigma^{2}) La mia domanda è duplice: Qual è …
Dichiarazione 1 (S1): "Una morte su 80 è causata da un incidente d'auto". Dichiarazione due (S2): "Una persona su 80 muore a causa di un incidente d'auto". Ora, personalmente non vedo molta differenza tra queste due affermazioni. Quando scrivo, li considererei intercambiabili con un pubblico laico. Tuttavia, ora sono stato …
Spero che il titolo sia autoesplicativo. In Kaggle, la maggior parte dei vincitori usa lo stacking con a volte centinaia di modelli base, per spremere un po 'di% in più di MSE, precisione ... In generale, nella tua esperienza, quanto è importante la modellazione fantasia come lo stacking rispetto alla …
Continuo a leggere questo e intuitivamente posso vederlo, ma come si passa dalla regolarizzazione L2 a dire che si tratta analiticamente di un priore gaussiano? Lo stesso vale per dire che L1 equivale a un precedente lappone. Ogni ulteriore riferimento sarebbe fantastico.
Sto cercando di prevedere un risultato binario usando 50 variabili esplicative continue (l'intervallo della maggior parte delle variabili va da a ∞ ). Il mio set di dati ha quasi 24.000 righe. Quando corro in R, ottengo:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically …
Mi chiedevo se ci sono buone librerie R là fuori per le reti neurali di apprendimento profondo? So che c'è il nnet, neuralnete RSNNS, ma nessuno di questi sembra implementare metodi di apprendimento profondo. Sono particolarmente interessato a un apprendimento non supervisionato seguito da un apprendimento supervisionato e all'utilizzo del …
Ho trovato informazioni discordanti sulla domanda: " Se si costruisce un intervallo di confidenza (CI) del 95% di una differenza nelle medie o una differenza nelle proporzioni, tutti i valori all'interno dell'IC sono ugualmente probabili? Oppure, la stima puntuale è la più probabile , con valori vicini alle "code" dell'IC …
Esiste una certa scuola di pensiero secondo la quale l'approccio più diffuso ai test statistici è un "ibrido" tra due approcci: quello di Fisher e quello di Neyman-Pearson; questi due approcci, afferma la rivendicazione, sono "incompatibili" e quindi il "ibrido" risultante è un "miscuglio incoerente". Fornirò una bibliografia e alcune …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.