Domande taggate «classification»

La classificazione statistica è il problema di identificare la sottopopolazione a cui appartengono le nuove osservazioni, in cui l'identità della sottopopolazione è sconosciuta, sulla base di una serie di dati di formazione contenenti osservazioni di cui è nota la sottopopolazione. Pertanto queste classificazioni mostreranno un comportamento variabile che può essere studiato dalle statistiche.





1
Le reti neurali di solito impiegano un po 'di tempo a "calciare" durante l'allenamento?
Sto cercando di formare una rete neurale profonda per la classificazione, usando la propagazione posteriore. In particolare, sto usando una rete neurale convoluzionale per la classificazione delle immagini, usando la libreria Tensor Flow. Durante l'allenamento, sto sperimentando uno strano comportamento e mi chiedo solo se questo è tipico o se …


4
Sovrapposizione con classificatori lineari
Oggi il nostro professore ha dichiarato in classe che "non è possibile un overfitting con classificatori lineari". Ritengo che sia sbagliato, dal momento che anche i classificatori lineari possono essere sensibili agli outlier nel set di training - prendiamo ad esempio un margine duro. Support Vector Machine: un singolo punto …


1
Curve ROC per set di dati non bilanciati
Considera una matrice di input e un'uscita binaria .XXXyyy Un modo comune per misurare le prestazioni di un classificatore è utilizzare le curve ROC. In un diagramma ROC la diagonale è il risultato che verrebbe ottenuto da un classificatore casuale. In caso di uscita sbilanciata possibile migliorare le prestazioni di …


3
Come visualizzare la bontà bayesiana di adattamento per la regressione logistica
Per un problema di regressione logistica bayesiana, ho creato una distribuzione predittiva posteriore. Prendo un campione dalla distribuzione predittiva e ricevo migliaia di campioni di (0,1) per ogni osservazione che ho. Visualizzare la bontà di adattamento è poco interessante, ad esempio: Questo diagramma mostra i 10.000 campioni + il punto …

1
Perché Anova () e drop1 () hanno fornito risposte diverse per i GLMM?
Ho un GLMM del modulo: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), ottengo risultati diversi rispetto a quelli che utilizzo Anova(model, type="III")dal pacchetto auto o summary(model). Questi ultimi due danno le stesse risposte. Usando un mucchio di dati fabbricati, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
Da dove viene il termine "impara un modello"
Ho sentito spesso che i minatori di dati qui usano questo termine. Come statistico che ha lavorato su problemi di classificazione, ho familiarità con il termine "formare un classificatore" e presumo che "apprendere un modello" significhi la stessa cosa. Non mi dispiace il termine "addestrare un classificatore". Ciò sembra rappresentare …

1
Sulla correlazione copenica per il clustering di dendrogrammi
Considera il contesto di un cluster di dendrogrammi. Chiamiamo differenze originali tra le distanze degli individui. Dopo aver costruito il dendrogramma definiamo la dissomiglianza cophenetic tra due individui come la distanza tra i cluster a cui questi individui appartengono. Alcune persone ritengono che la correlazione tra le differenze originarie e …

3
Come confrontare l'accuratezza di due diversi modelli usando un significato statistico
Sto lavorando alla previsione di serie storiche. Ho due insiemi di dati D1={x1,x2,....xn}D1={x1,x2,....xn}D1=\{x_1, x_2,....x_n\} e D2={xn+1,xn+2,xn+3,....,xn+k}D2={xn+1,xn+2,xn+3,....,xn+k}D2=\{x_n+1, x_n+2, x_n+3,...., x_n+k\} . Ho tre modelli di previsione: M1,M2,M3M1,M2,M3M1, M2, M3 . Tutti questi modelli sono addestrati usando campioni nel set di datiD1D1D1 e le loro prestazioni sono misurate usando i campioni nel …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.