I test di permutazione (chiamati anche test di randomizzazione, test di ri-randomizzazione o test esatto) sono molto utili e sono utili quando l'assunzione della distribuzione normale richiesta da per esempio t-testnon è soddisfatta e quando la trasformazione dei valori per classifica del test non parametrici come Mann-Whitney-U-testquesto porterebbero alla perdita …
Devo affrontare un problema di classificazione del testo. Un crawler Web esegue la scansione delle pagine Web di un determinato dominio e per ogni pagina Web voglio scoprire se appartiene a una sola classe specifica o meno. Cioè, se chiamo questa classe positiva , ogni pagina web sottoposta a scansione …
Ho alcuni dati dicotomici, solo variabili binarie, e il mio capo mi ha chiesto di eseguire un'analisi fattoriale usando la matrice delle correlazioni tetrachoriche. In precedenza sono stato in grado di insegnare a me stesso come eseguire diverse analisi basate sugli esempi qui e sul sito stat dell'UCLA e altri …
Sto analizzando i dati su 300.000 alunni in 175 scuole con un modello logistico lineare a effetti misti (intercettazioni casuali). Ogni alunno si verifica esattamente una volta e i dati durano 6 anni. Come dividere la varianza tra la scuola e il livello degli alunni, in modo simile al VPC …
Il bildpacchetto sembra essere un pacchetto eccellente per le risposte binarie seriali. Ma è per tempo discreto. Vorrei specificare una funzione regolare del tempo per la connessione del rapporto di probabilità della risposta corrente Y con risposte binarie misurate in tempi precedenti, o almeno una versione Markov del primo ordine …
Quali sono i pro e i contro dell'utilizzo di LARS [1] rispetto all'utilizzo della discesa delle coordinate per l'adattamento della regressione lineare regolarizzata L1? Sono principalmente interessato agli aspetti prestazionali (i miei problemi tendono ad avere Ntra le centinaia di migliaia e p<20). Tuttavia, anche altre intuizioni sarebbero apprezzate. modifica: …
Sfondo: ci sono alcune grandi domande / risposte qui su come calibrare i modelli che prevedono le probabilità che si verifichi un risultato. Per esempio Punteggio di Brier e sua scomposizione in risoluzione, incertezza e affidabilità . Grafici di calibrazione e regressione isotonica . Questi metodi spesso richiedono l'uso di …
Ho una serie temporale binaria con 1 quando l'auto non si muove e 0 quando l'auto si muove. Voglio fare una previsione per un orizzonte temporale fino a 36 ore in anticipo e per ogni ora. Il mio primo approccio è stato quello di utilizzare un Naive Bayes utilizzando i …
Sto eseguendo un'attività di classificazione binaria in cui la probabilità di risultato è abbastanza bassa (intorno al 3%). Sto cercando di decidere se ottimizzare tramite AUC o perdita di log. Per quanto ho capito, l'AUC massimizza la capacità del modello di discriminare tra le classi mentre il logloss penalizza la …
Mi è stato detto che è possibile eseguire una regressione IV a due stadi in cui il primo è un probit e il secondo è un OLS. È possibile utilizzare 2SLS se il primo stadio è un probit ma il secondo è un modello probit / poisson?
Sto facendo analisi del carrello della spesa il mio set di dati è un insieme di vettori di transazione, con gli articoli che i prodotti vengono acquistati. Quando si applicano i mezzi k sulle transazioni, otterrò sempre dei risultati. Una matrice casuale mostrerebbe probabilmente anche alcuni cluster. C'è un modo …
Abbiamo dati con esito binario e alcune covariate. Ho usato la regressione logistica per modellare i dati. Solo una semplice analisi, niente di straordinario. L'output finale dovrebbe essere una curva dose-risposta in cui mostriamo come cambia la probabilità per una specifica covariata. Qualcosa come questo: Abbiamo ricevuto alcune critiche da …
Il mgcvpacchetto per Rha due funzioni per adattare le interazioni del prodotto tensore: te()e ti(). Comprendo la divisione di base del lavoro tra i due (adattamento di un'interazione non lineare rispetto alla scomposizione di questa interazione in effetti principali e un'interazione). Quello che non capisco è perché te(x1, x2)e ti(x1) …
Ho una grande matrice (650K righe * 62 colonne) di dati binari (solo voci 0-1). La matrice è prevalentemente sparsa: circa l'8% è riempito. Vorrei raggrupparlo in 5 gruppi - diciamo chiamato da 1 a 5. Ho provato il clustering gerarchico e non sono stato in grado di gestire le …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.