Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Ho visto questa trama nel supplemento di un recente articolo e mi piacerebbe essere in grado di riprodurla usando R. È …
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Devo calcolare la funzione di distribuzione cumulativa di un campione di dati. C'è qualcosa di simile a hist () in R …
Recentemente c'è stata una domanda simile a ML su cstheory stackexchange e ho pubblicato una risposta raccomandando il metodo di Powell, la discesa del gradiente, gli algoritmi genetici o altri "algoritmi di approssimazione". In un commento qualcuno mi ha detto che questi metodi erano "euristica" e non "algoritmi di approssimazione" …
Supponiamo che io abbia un modello predittivo che produce, per ogni istanza, una probabilità per ogni classe. Ora riconosco che ci sono molti modi per valutare un tale modello se voglio usare quelle probabilità per la classificazione (precisione, richiamo, ecc.). Riconosco anche che una curva ROC e l'area sottostante possono …
Stamattina mi sono svegliato chiedendomi (ciò potrebbe essere dovuto al fatto che ieri sera non ho dormito molto): poiché la convalida incrociata sembra essere la pietra angolare della corretta previsione delle serie storiche, quali sono i modelli che dovrei "normalmente" "convalida incrociata contro? Ne ho inventati alcuni (facili), ma presto …
Sto usando JMP per esaminare le differenze nella copertura vegetale nei gruppi di forme di crescita (alberi, arbusti, alberi, ecc.) Prima e dopo tre trattamenti con un controllo. La mia dimensione del campione è piccola (n = 5) e la maggior parte delle mie distribuzioni non sono normalmente distribuite. Per …
Se ho un normale multivariato nel campione e definisco (che è una specie di distanza di Mahalanobis [al quadrato] da un punto campione al vettore a usando la matrice A per la ponderazione), qual è la distribuzione di d_i ^ 2 (\ bar X, S) (distanza di Mahalanobis al media …
Mi chiedo se esiste sempre un massimizzatore per qualsiasi problema di stima della massima verosimiglianza? In altre parole, esiste una distribuzione e alcuni dei suoi parametri, per i quali il problema MLE non ha un massimizzatore? La mia domanda deriva da una dichiarazione di un ingegnere secondo cui la funzione …
Ho una matrice con due colonne che hanno molti prezzi (750). Nell'immagine qui sotto ho tracciato i residui della seguente regressione lineare: lm(prices[,1] ~ prices[,2]) Guardando l'immagine, sembra essere una forte autocorrelazione dei residui. Tuttavia, come posso verificare se l'autocorrelazione di tali residui è forte? Quale metodo dovrei usare? Grazie!
Partecipo a gare di modellazione predittiva su Kaggle , TunedIt e CrowdAnalytix . Trovo che questi siti siano un buon modo per "allenarsi" per le statistiche / l'apprendimento automatico. Ci sono altri siti che dovrei conoscere? Come ti senti riguardo alle competizioni in cui l'host intende trarre profitto dalle proposte …
Voglio generare due variabili. Uno è una variabile di risultato binario (dire successo / fallimento) e l'altro è l'età in anni. Voglio che l'età sia correlata positivamente con il successo. Ad esempio, dovrebbero esserci più successi nei segmenti di età superiore rispetto a quelli inferiori. Idealmente, dovrei essere in grado …
Sto eseguendo analisi di regressione multipla e non sono sicuro che i valori anomali nei miei dati debbano essere eliminati. I dati di cui mi preoccupo appaiono come "cerchi" sui grafici a scatola SPSS, tuttavia non ci sono asterischi (il che mi fa pensare che non siano "così cattivi"). I …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso l'anno scorso . Sto cercando input su come gli altri organizzano il loro codice R e output. La mia pratica attuale …
Durante la ricerca di serie temporali in R, ho scoperto che arima fornisce solo i valori dei coefficienti e i loro errori standard del modello montato. Tuttavia, voglio anche ottenere il valore p dei coefficienti. Non ho trovato alcuna funzione che fornisca il significato di coef. Quindi desidero calcolarlo da …
Poiché la scienza deve essere riproducibile, per definizione, vi è un crescente riconoscimento del fatto che dati e codice sono una componente essenziale della riproducibilità, come discusso dalla tavola rotonda di Yale per la condivisione di dati e codice . Nel riesaminare un manoscritto per un giornale che non richiede …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.