Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



7
Quali sono i "grandi problemi" nelle statistiche?
La matematica ha i suoi famosi problemi del millennio (e, storicamente, il 23 di Hilbert ), domande che hanno contribuito a modellare la direzione del campo. Ho poca idea, tuttavia, quali sarebbero le ipotesi di Riemann e le statistiche P vs. NP. Quindi, quali sono le domande aperte generali nelle …
77 history 





3
Selezione delle funzionalità e convalida incrociata
Recentemente ho letto molto su questo sito (@Aniko, @Dikran Marsupial, @Erik) e altrove sul problema del sovradimensionamento che si verifica con convalida incrociata - (Smialowski et al 2010 Bioinformatica, Hastie, Elementi di apprendimento statistico). Il suggerimento è che qualsiasi selezione di funzionalità supervisionata (utilizzando la correlazione con le etichette di …

1
Aiutami a capire Support Vector Machines
Comprendo le basi di quale sia l'obiettivo di Support Vector Machines in termini di classificazione di un set di input in diverse classi, ma ciò che non capisco sono alcuni dettagli chiacchieroni. Per cominciare, sono un po 'confuso dall'uso di Slack Variables. Qual è il loro scopo? Sto riscontrando un …

6
Selezione delle funzioni per il modello "finale" quando si esegue la validazione incrociata nell'apprendimento automatico
Mi sto confondendo un po 'sulla selezione delle funzionalità e sull'apprendimento automatico e mi chiedevo se potevi aiutarmi. Ho un set di dati di microarray che è classificato in due gruppi e ha migliaia di funzionalità. Il mio obiettivo è quello di ottenere un piccolo numero di geni (le mie …



5
Per favore, spiega il paradosso in attesa
Alcuni anni fa ho progettato un rilevatore di radiazioni che funziona misurando l'intervallo tra gli eventi anziché contarli. La mia ipotesi era che, quando si misuravano campioni non contigui, in media avrei misurato metà dell'intervallo effettivo. Tuttavia, quando ho testato il circuito con una sorgente calibrata, la lettura era un …


2
Metodi di ricampionamento / simulazione: monte carlo, bootstrap, jackknifing, cross-validation, test di randomizzazione e test di permutazione
Sto cercando di comprendere la differenza tra i diversi metodi di ricampionamento (simulazione Monte Carlo, bootstrap parametrico, bootstrap non parametrico, jackknifing, cross-validation, test di randomizzazione e test di permutazione) e la loro implementazione nel mio contesto usando R. Supponiamo che io abbia la seguente situazione: voglio eseguire ANOVA con una …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.