Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

8
Libro da leggere prima di Elements of Statistical Learning?
Sulla base di questo post , desidero digerire Elements of Statistical Learning. Fortunatamente è disponibile gratuitamente e ho iniziato a leggerlo. Non ho abbastanza conoscenze per capirlo. Puoi consigliarmi un libro che è una migliore introduzione agli argomenti del libro? Eventualmente qualcosa che mi darà le conoscenze necessarie per capirlo? …



3
Come definiamo la "ricerca riproducibile"?
Questo è emerso in alcune domande ora, e mi chiedevo qualcosa. Il campo nel suo insieme si è spostato verso la "riproducibilità" concentrandosi sulla disponibilità dei dati originali e sul codice in questione? Mi è stato sempre insegnato che il nucleo della riproducibilità non era necessariamente, come ho fatto riferimento …



6
La regressione della cresta è inutile in dimensioni elevate (
Considera un buon vecchio problema di regressione con predittori e dimensione del campione . La solita saggezza è che lo stimatore OLS si sovraccaricherà e sarà generalmente sovraperformato dallo stimatore della regressione della cresta:È standard utilizzare la convalida incrociata per trovare un parametro di regolarizzazione ottimale . Qui uso un …


3
Qual è l'intuizione dietro SVD?
Ho letto della decomposizione a valore singolare (SVD). In quasi tutti i libri di testo viene menzionato il fatto che fattorizza la matrice in tre matrici con specifiche specificate. Ma qual è l'intuizione dietro la divisione della matrice in tale forma? PCA e altri algoritmi per la riduzione della dimensionalità …



1
Ottenere valori previsti (Y = 1 o 0) da un adattamento del modello di regressione logistica
Diciamo che ho un oggetto di classe glm(corrispondente a un modello di regressione logistica) e vorrei trasformare le probabilità previste fornite predict.glmutilizzando l'argomento type="response"in risposte binarie, ovvero o . Qual è il modo più rapido e canonico per farlo in R?Y=1Y=1Y=1Y=0Y=0Y=0 Mentre, ancora una volta, ne sono a conoscenza predict.glm, …

4
Perché preoccuparsi del doppio problema quando si adatta SVM?
Dati i punti dati e le etichette , il problema principale SVM del margine rigido èx1,…,xn∈Rdx1,…,xn∈Rdx_1, \ldots, x_n \in \mathbb{R}^dy1,…,yn∈{−1,1}y1,…,yn∈{−1,1}y_1, \ldots, y_n \in \left \{-1, 1 \right\} minimizew,w012wTwminimizew,w012wTw \text{minimize}_{w, w_0} \quad \frac{1}{2} w^T w s.t.∀i:yi(wTxi+w0)≥1s.t.∀i:yi(wTxi+w0)≥1 \text{s.t.} \quad \forall i: y_i (w^T x_i + w_0) \ge 1 che è un programma …
50 svm 

16
Libri consigliati sulla progettazione di esperimenti?
Quali sono i consigli del panel per i libri sulla progettazione di esperimenti? Idealmente, i libri dovrebbero essere ancora in stampa o disponibili elettronicamente, anche se ciò potrebbe non essere sempre fattibile. Se ti senti commosso per aggiungere qualche parola su ciò che è così bello del libro, sarebbe fantastico. …

4
Perché ANOVA equivale alla regressione lineare?
Ho letto che ANOVA e regressione lineare sono la stessa cosa. Come può essere, considerando che l'output di ANOVA è un valore e un valore base ai quali si conclude se il campione significa che i diversi campioni sono uguali o diversi.pFFFppp Ma supponendo che i mezzi non siano uguali …
50 regression  anova 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.