Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Come addestrare e validare un modello di rete neurale in R?
Sono nuovo a modellare con le reti neurali, ma sono riuscito a stabilire una rete neurale con tutti i punti di dati disponibili che si adattano bene ai dati osservati. La rete neurale è stata realizzata in R con il pacchetto nnet: require(nnet) ##33.8 is the highest value mynnet.fit <- …






3
Qual è il modo più preciso per determinare il colore di un oggetto?
Ho scritto un programma per computer in grado di rilevare monete in un'immagine statica (.jpeg, .png, ecc.) Usando alcune tecniche standard per la visione computerizzata (sfocatura gaussiana, soglia, trasformazione di Hough ecc.). Utilizzando i rapporti delle monete prelevate da una determinata immagine, posso stabilire con certezza quali sono le monete. …


3
Come montare un modello ARIMAX con R?
Ho quattro diverse serie temporali di misurazioni orarie: Il consumo di calore all'interno di una casa La temperatura fuori casa La radiazione solare La velocità del vento Voglio essere in grado di prevedere il consumo di calore all'interno della casa. C'è una chiara tendenza stagionale, sia su base annuale, sia …


10
Come insegnare agli studenti che temono le statistiche?
Sto per aiutare a insegnare le statistiche agli studenti di medicina questo semestre. Ho sentito molte storie dell'orrore sulla paura di questi studenti dall'apprendimento delle statistiche. Qualcuno può suggerire cosa fare con questa paura? (O collegamenti a persone che stanno discutendo di questo, o offrono suggerimenti della tua esperienza)
33 teaching 

2
Varianza di una funzione di una variabile casuale
Diciamo che abbiamo una variabile casuale XXX con varianza e media note. La domanda è: qual è la varianza di f(X)f(X)f(X) per una determinata funzione f. L'unico metodo generale di cui sono a conoscenza è il metodo delta, ma fornisce solo approssimazione. Ora sono interessato a f(x)=x−−√f(x)=xf(x)=\sqrt{x} , ma sarebbe …

4
Clustering di errori standard in R (manualmente o in plm)
Sto cercando di capire l'errore standard "clustering" e come eseguire in R (è banale in Stata). Nel RI non hanno avuto successo usando plmo scrivendo la mia funzione. Userò i diamondsdati dalggplot2 pacchetto. Posso fare effetti fissi con entrambe le variabili fittizie > library(plyr) > library(ggplot2) > library(lmtest) > library(sandwich) …

6
Come valutare la somiglianza di due istogrammi?
Dati due istogrammi, come possiamo valutare se sono simili o no? È sufficiente guardare semplicemente i due istogrammi? Il semplice mapping uno a uno ha il problema che se un istogramma è leggermente diverso e leggermente spostato, non otterremo il risultato desiderato. Eventuali suggerimenti?

1
Differenze matematiche tra GBM, XGBoost, LightGBM, CatBoost?
Esistono diverse implementazioni della famiglia di modelli GBDT come: GBM XGBoost LightGBM Catboost. Quali sono le differenze matematiche tra queste diverse implementazioni? Catboost sembra sovraperformare le altre implementazioni anche usando solo i suoi parametri predefiniti secondo questo punto di riferimento , ma è ancora molto lento. La mia ipotesi è …
33 boosting  xgboost 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.