Attualmente sto imparando la regressione della cresta ed ero un po 'confuso riguardo alla penalizzazione di modelli più complessi (o alla definizione di un modello più complesso). Da quanto ho capito, la complessità del modello non è necessariamente correlata all'ordine polinomiale. Quindi: 2 + 3 + 4 x2+ 5 x3+ …
Nella scikit apprendono i documenti sulla calibrazione della probabilità che confrontano la regressione logistica con altri metodi e osservano che la foresta casuale è meno ben calibrata della regressione logistica. Perché la regressione logistica è ben calibrata? Come si potrebbe rovinare la calibrazione di una regressione logistica (non quella che …
Con la regressione OLS applicata alla risposta continua, si può costruire l'equazione di regressione multipla eseguendo sequenzialmente le regressioni dei residui su ciascuna covariata. La mia domanda è: c'è un modo per farlo con la regressione logistica tramite i residui della regressione logistica ? Cioè, se voglio stimare usando l'approccio …
Sto studiando la differenza tra regolarizzazione nella regressione RKHS e regressione lineare, ma faccio fatica a capire la differenza cruciale tra i due. ( xio, yio)(xi,yi)(x_i,y_i)f( ⋅ )f(⋅)f(\cdot)f( x ) ≈ u ( x ) = ∑i = 1mαioK( x , xio) ,f(x)≈u(x)=∑i=1mαiK(x,xi),\begin{equation}f(x)\approx u(x)=\sum_{i=1}^m \alpha_i K(x,x_i),\end{equation}K( ⋅ , ⋅ )K(⋅,⋅)K(\cdot,\cdot)αmαm\alpha_mminα …
In 'Gli elementi di apprendimento statistico', l'espressione di bias-varianza decomposizione lineare modello figura come dove è la funzione target effettiva,Er r ( x0) = σ2ε+ E[ f( x0) - Ef^( x0) ]2+ | | h (x0) | |2σ2ε,Err(X0)=σε2+E[f(X0)-Ef^(X0)]2+||h(X0)||2σε2,Err(x_0)=\sigma_\epsilon^2+E[f(x_0)-E\hat f(x_0)]^2+||h(x_0)||^2\sigma_\epsilon^2,f( x0)f(X0)f(x_0)σ2εσε2 \sigma_\epsilon^2 è la varianza dell'errore casuale nel modello e è …
Vorrei classificare i punti dati come che necessitano di un modello più complesso o che non necessitano di un modello più complesso. Il mio pensiero attuale è di adattare tutti i dati a un semplice modello lineare e osservare la dimensione dei residui per fare questa classificazione. Ho quindi fatto …
Considera la trama sotto in cui ho simulato i dati come segue. Osserviamo un risultato binario per il quale la vera probabilità di essere 1 è indicata dalla linea nera. La relazione funzionale tra covariata e è 3 ° polinomio di ordine con il collegamento logistico (in modo che non …
Attualmente sto lavorando a un modo per trasformare due diversi valori di test del fosforo l'uno nell'altro. sfondo Esistono molti metodi (di estrazione) per misurare il fosforo disponibile nel suolo nel terreno. Paesi diversi applicano metodi diversi, quindi per confrontare la fertilità P tra paesi è necessario calcolare il valore …
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
Supponiamo che io abbia un sacco di città con diverse dimensioni della popolazione e che volessi vedere se ci fosse una relazione lineare positiva tra il numero di negozi di liquori in una città e il numero di DUI. Dove sto determinando se questa relazione è significativa o meno sulla …
Come si interpreta una curva di sopravvivenza dal modello di rischio proporzionale cox? In questo esempio di giocattolo, supponiamo di avere un modello di rischio proporzionale cox su agevariabile nei kidneydati e generare la curva di sopravvivenza. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Ad esempio, al momento …
A seguito della mia breve esperienza in statistica, sembra che il tipo di somme di quadrati (tipo I, II, III, IV ...) utilizzate per ottenere i risultati ANOVA potrebbe fare una differenza drammatica nei risultati dei test (in particolare dei modelli con interazioni e mancanti dati). Tuttavia non ho ancora …
Questo post fa riferimento a un modello di regressione lineare bivariata, . Ho sempre preso il partizionamento della somma totale dei quadrati (SSTO) in somma dei quadrati per errore (SSE) e somma dei quadrati per il modello (SSR) sulla fede, ma una volta che ho iniziato davvero a pensarci, non …
Hastie e Tibshirani menzionano nella sezione 4.3.2 del loro libro che nell'impostazione della regressione lineare, l'approccio dei minimi quadrati è in realtà un caso speciale di massima probabilità. Come possiamo dimostrare questo risultato? PS: non risparmia dettagli matematici.
y=β0+β1x1+ε0y=β0+β1x1+ε0y = \beta_{0} + \beta_{1}x_{1} + \varepsilon_{0} Il linguaggio per descrivere i modelli di regressione, come la regressione lineare molto semplice sopra specificata, spesso varia e tali variazioni comportano spesso sottili cambiamenti di significato. Ad esempio, la parte del modello sul lato sinistro dell'equazione può essere definita (tra le altre …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.