Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


4
Intuizione dietro la deviazione standard
Sto cercando di ottenere una migliore comprensione intuitiva della deviazione standard. Da quello che ho capito, è rappresentativo della media delle differenze di un insieme di osservazioni in un insieme di dati dalla media di tale insieme di dati. Tuttavia NON è in realtà uguale alle medie delle differenze in …

2
Ho specificato correttamente il mio modello in lmer?
Ho analizzato molti siti di aiuto e sono ancora confuso su come specificare termini nidificati più complicati anche in un modello misto. Sono anche confuso come l'uso di :e /e |nello specificare le interazioni e la nidificazione con fattori casuali utilizzando lmer()nel lme4pacchetto in R. Ai fini di questa domanda, …


2
Cosa significa effettivamente il valore di logit?
Ho un modello logit che presenta un numero compreso tra 0 e 1 per molti casi, ma come possiamo interpretarlo? Consente di prendere un caso con un logit di 0.20 Possiamo affermare che esiste una probabilità del 20% che un caso appartenga al gruppo B rispetto al gruppo A? è …



2
In caret qual è la vera differenza tra cv e repeatcv?
Ciò è simile ai metodi di ricampionamento di Caret , sebbene in realtà non abbia mai risposto a questa parte della domanda in modo concordato. la funzione di treno del guardiano offre cve repeatedcv. Qual è la differenza nel dire di fare: MyTrainControl=trainControl( method = "cv", number=5, repeats=5 ) vs …

6
Esiste un "ciao, mondo" per la grafica statistica?
Nella programmazione informatica, esiste un primo programma classico per l'apprendimento / insegnamento di una nuova lingua o sistema, chiamato "ciao, mondo". http://en.wikipedia.org/wiki/Hello_world_program Esiste una classica prima visualizzazione dei dati per l'utilizzo di un pacchetto grafico? Se è così, che cosa è? E se no, quali sarebbero i buoni candidati?


4
Previsione con caratteristiche sia continue che categoriche
Alcune tecniche di modellazione predittiva sono più progettate per gestire predittori continui, mentre altre sono migliori per gestire variabili categoriche o discrete. Naturalmente esistono tecniche per trasformare un tipo in un altro (discretizzazione, variabili fittizie, ecc.). Tuttavia, esistono delle tecniche di modellazione predittiva progettate per gestire entrambi i tipi di …


6
Stima dello stesso modello su più serie temporali
Ho un background da principiante in serie temporali (alcune stime / previsioni ARIMA) e sto affrontando un problema che non capisco perfettamente. Qualsiasi aiuto sarebbe molto apprezzato. Sto analizzando più serie temporali, tutte nello stesso intervallo di tempo e tutte della stessa frequenza, descrivendo tutti un tipo simile di dati. …


4
Numero di caratteristiche vs. numero di osservazioni
Ci sono articoli / libri / idee sulla relazione tra il numero di caratteristiche e il numero di osservazioni che uno deve avere per formare un classificatore "robusto"? Ad esempio, supponiamo che io abbia 1000 funzioni e 10 osservazioni da due classi come set di addestramento e 10 altre osservazioni …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.