Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


13
Qual è l'intuizione dietro la formula della probabilità condizionale?
La formula per la probabilità condizionale di accadendo dato che è successo è:AA\text{A}BB\text{B}P(A | B)=P(A∩B)P(B).P(A | B)=P(A∩B)P(B). P\left(\text{A}~\middle|~\text{B}\right)=\frac{P\left(\text{A} \cap \text{B}\right)}{P\left(\text{B}\right)}. Il mio libro di testo spiega l'intuizione dietro questo in termini di diagramma di Venn. Dato che si è verificato , l'unico modo in cui si verifica è che l'evento …

2
Qual è la differenza tra censura e troncamento?
Nel libro Statistical Models and Methods for Lifetime Data , è scritto: Censura: quando un'osservazione è incompleta a causa di una causa casuale. Troncamento: quando la natura incompleta dell'osservazione è dovuta a un processo di selezione sistematico inerente al disegno dello studio. Cosa si intende per "processo di selezione sistematica …

2
Esiste un intervallo di confidenza non parametrico affidabile per la media di una distribuzione distorta?
Le distribuzioni molto distorte come il log-normal non determinano intervalli di confidenza bootstrap accurati. Ecco un esempio che mostra che le aree di coda sinistra e destra sono lontane dall'ideale 0,025, indipendentemente dal metodo bootstrap che si prova in R: require(boot) n <- 25 B <- 1000 nsim <- 1000 …


2
Apprendimento supervisionato, apprendimento non supervisionato e apprendimento di rinforzo: nozioni di base sul flusso di lavoro
Apprendimento supervisionato 1) Un essere umano crea un classificatore basato su dati di input e output 2) Quel classificatore è addestrato con un set di dati di addestramento 3) Quel classificatore viene testato con un set di dati di test 4) Distribuzione se l' output è soddisfacente Da utilizzare quando, …


7
Inferenza vs. stima?
Quali sono le differenze tra "inferenza" e "stima" nel contesto dell'apprendimento automatico ? Come principiante, sento che inferiamo variabili casuali e stimiamo i parametri del modello. Questa mia comprensione è giusta? In caso contrario, quali sono esattamente le differenze e quando dovrei usare quali? Inoltre, qual è il sinonimo di …







6
Se la "correlazione non implica la causalità", se trovo una correlazione statisticamente significativa, come posso provare la causalità?
Capisco che la correlazione non è causalità . Supponiamo di avere un'alta correlazione tra due variabili. Come controllate se questa correlazione è effettivamente dovuta alla causalità? Oppure, a quali condizioni, esattamente, possiamo usare i dati sperimentali per dedurre una relazione causale tra due o più variabili?

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.