Domande taggate «predictive-models»

I modelli predittivi sono modelli statistici il cui scopo principale è prevedere in modo ottimale altre osservazioni di un sistema, al contrario dei modelli il cui scopo è testare una particolare ipotesi o spiegare meccanicamente un fenomeno. Pertanto, i modelli predittivi pongono meno enfasi sull'interpretazione e maggiore enfasi sulle prestazioni.


1
Quando si crea un modello di regressione utilizzando set di modellazione / convalida separati, è appropriato "ricircolare" i dati di convalida?
Supponiamo di avere una divisione 80/20 tra osservazioni di modellazione / validazione. Ho adattato un modello al set di dati di modellazione e mi sento a mio agio con l'errore visualizzato sul set di dati di convalida. Prima di implementare il mio modello per calcolare il punteggio delle osservazioni future, …

2
Quando registrare / espandere le variabili quando si utilizzano modelli a foresta casuale?
Sto facendo regressione utilizzando le foreste casuali per prevedere i prezzi in base a diversi attributi. Il codice è scritto in Python usando Scikit-learn. Come decidete se trasformare le variabili usando exp/ logprima di usarle per adattarsi al modello di regressione? È necessario quando si utilizza un approccio Ensemble come …



2
Previsione di regressione quantile
Sono interessato a utilizzare la regressione quantile per alcuni dei miei modelli, ma vorrei avere alcuni chiarimenti su cosa posso ottenere utilizzando questa metodologia. Capisco di poter ottenere un'analisi più solida della relazione IV / DV , soprattutto di fronte a valori anomali ed eteroscedasticità, ma nel mio caso l'attenzione …

2
Che cos'è il restringimento?
La parola restringimento viene lanciata molto in alcuni ambienti. Ma cos'è il restringimento, non sembra esserci una definizione chiara. Se ho una serie temporale (o una raccolta di osservazioni di un certo processo) quali sono i diversi modi in cui posso misurare un qualche tipo di contrazione empirica sulla serie? …

2
Come scegliere la larghezza ottimale del contenitore durante la calibrazione dei modelli di probabilità?
Sfondo: ci sono alcune grandi domande / risposte qui su come calibrare i modelli che prevedono le probabilità che si verifichi un risultato. Per esempio Punteggio di Brier e sua scomposizione in risoluzione, incertezza e affidabilità . Grafici di calibrazione e regressione isotonica . Questi metodi spesso richiedono l'uso di …

1
Test di bontà di adattamento nella regressione logistica; quale 'misura' vogliamo testare?
Mi riferisco alla domanda e alle sue risposte: come confrontare l'abilità di previsione (probabilità) dei modelli sviluppati dalla regressione logistica? di @Clark Chong e risposte / commenti di @Frank Harrell. e alla domanda Gradi di libertà di nel test di Hosmer-Lemeshowχ2χ2\chi^2 e commenti. Ho letto l'articolo DW Hosmer, T. Hosmer, …

1
C'è un problema con la multicollinearità e per la regressione delle spline?
Quando si utilizzano spline cubiche naturali (cioè limitate), le funzioni di base create sono altamente collineari e quando utilizzate in una regressione sembrano produrre statistiche VIF (fattore di inflazione della varianza) molto elevate, segnalando multicollinearità. Quando si considera il caso di un modello ai fini della previsione, si tratta di …

1
Differenze tra PROC Mixed e lme / lmer in R - gradi di libertà
Nota: questa domanda è una risposta, poiché la mia domanda precedente doveva essere cancellata per motivi legali. Confrontando PROC MIXED da SAS con la funzione lmedel nlmepacchetto in R, mi sono imbattuto in alcune differenze piuttosto confuse. Più specificamente, i gradi di libertà nei diversi test differiscono tra PROC MIXEDe …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Ingegnerizzazione di caratteristiche indipendenti dal dominio che conserva un significato semantico?
L'ingegnerizzazione delle funzionalità è spesso un componente importante dell'apprendimento automatico (è stato utilizzato pesantemente per vincere la Coppa KDD nel 2010 ). Tuttavia, trovo che anche la maggior parte delle tecniche di ingegneria delle caratteristiche distruggere qualsiasi significato intuitivo delle funzionalità sottostanti o sono molto specifici per un determinato dominio …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.