Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
L'apprendimento automatico è una materia importante per qualsiasi statistico da conoscere? Sembra che l'apprendimento automatico sia statistico. Perché i programmi di statistica (universitari e laureati) non richiedono l'apprendimento automatico?
Per la varianza non ponderata esiste la varianza del campione corretta per il bias, quando la media è stata stimata dagli stessi dati: Var(X):=1n∑i(xi−μ)2Var(X):=1n∑i(xi−μ)2\text{Var}(X):=\frac{1}{n}\sum_i(x_i - \mu)^2Var(X):=1n−1∑i(xi−E[X])2Var(X):=1n−1∑i(xi−E[X])2\text{Var}(X):=\frac{1}{n-1}\sum_i(x_i - E[X])^2 Sto esaminando la media ponderata e la varianza e mi chiedo quale sia la correzione del bias appropriata per la varianza ponderata. …
Il pacchetto randomForest di R non può gestire il fattore con più di 32 livelli. Quando riceve più di 32 livelli, emette un messaggio di errore: Impossibile gestire i predittori categorici con più di 32 categorie. Ma i dati che ho hanno diversi fattori. Alcuni di essi hanno più di …
A parte alcune circostanze uniche in cui dobbiamo assolutamente comprendere la relazione media condizionale, quali sono le situazioni in cui un ricercatore dovrebbe scegliere OLS rispetto alla regressione quantistica? Non voglio che la risposta sia "se non serve a capire le relazioni di coda", dato che potremmo semplicemente usare la …
Sono un ingegnere del software che sta cercando di costruire uno strumento di test A / B. Non ho una solida base di statistiche ma negli ultimi giorni ho letto parecchio. Sto seguendo la metodologia descritta qui e riassumerò i punti pertinenti, di seguito. Lo strumento consentirà ai progettisti e …
Vorrei adattare un modello lineare (lm) in cui la varianza dei residui dipende chiaramente dalla variabile esplicativa. Il modo in cui so di fare questo è usando glm con la famiglia Gamma per modellare la varianza e quindi mettere il suo inverso nei pesi nella funzione lm (esempio: http://nitro.biosci.arizona.edu/r/chapter31 .pdf …
La seconda domanda è che ho trovato in una discussione da qualche parte sul web parlare di "clustering supervisionato", per quanto ne so, il clustering non è supervisionato, quindi qual è esattamente il significato dietro "clustering supervisionato"? Qual è la differenza rispetto alla "classificazione"? Ci sono molti link che ne …
Conosco con costanti, quindi dato , è facile da risolvere. So anche che non puoi applicarlo quando è una funzione non lineare, come in questo caso , e per risolverlo devo fare un'approssimazione con quello di Taylor. Quindi la mia domanda è come posso risolvere ?? faccio anche approssimazione con …
La coerenza è ovviamente uno stimatore di proprietà naturale e importante, ma ci sono situazioni in cui potrebbe essere meglio usare uno stimatore incoerente piuttosto che coerente? Più specificamente, ci sono esempi di uno stimatore incoerente che supera un ragionevole stimatore coerente per tutte le finite (rispetto ad alcune funzioni …
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Esiste un modo semplice in R per creare una regressione lineare su un modello con 100 parametri in R? Diciamo che …
Dato un output da optim con una matrice hessiana, come calcolare gli intervalli di confidenza dei parametri usando la matrice hessian? fit<-optim(..., hessian=T) hessian<-fit$hessian Sono principalmente interessato al contesto della massima verosimiglianza, ma sono curioso di sapere se il metodo può essere esteso oltre.
Ho una serie temporale che contiene doppi componenti stagionali e vorrei scomporre la serie nei seguenti componenti della serie temporale (tendenza, componente stagionale 1, componente stagionale 2 e componente irregolare). Per quanto ne so, la procedura STL per decomporre una serie in R consente solo un componente stagionale, quindi ho …
Diciamo, diciamo, i seguenti dati: 8232302 684531 116857 89724 82267 75988 63871 23718 1696 436 439 248 235 Desideri un modo semplice per adattare questo (e molti altri set di dati) a una distribuzione Pareto. Idealmente produrrebbe i valori teorici corrispondenti, meno idealmente i parametri.
Intro: Ho un set di dati con un classico "grande problema p, piccolo problema". Il numero di campioni disponibili n = 150 mentre il numero di possibili predittori p = 400. Il risultato è una variabile continua. Voglio trovare i descrittori più "importanti", cioè quelli che sono i migliori candidati …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.