Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Nel febbraio 2016, l'American Statistical Association ha rilasciato una dichiarazione formale sul significato statistico e sui valori p. Il nostro thread al riguardo discute ampiamente di questi problemi. Tuttavia, nessuna autorità è emersa per offrire un'alternativa efficace universalmente riconosciuta - fino ad ora. L'American Statistical Society (ASS) ha pubblicato la …
Sono nuovo di Independent Component Analysis (ICA) e ho solo una comprensione rudimentale del metodo. Mi sembra che l'ICA sia simile all'analisi fattoriale (FA) con una sola eccezione: l'ICA presume che le variabili casuali osservate siano una combinazione lineare di componenti / fattori indipendenti non gaussiani, mentre il modello FA …
Su Wikipedia dice che: la matematica [della probabilità] è ampiamente indipendente da qualsiasi interpretazione della probabilità. Domanda: Quindi se vogliamo essere matematicamente corretti, non dovremmo impedire qualsiasi interpretazione della probabilità? Vale a dire, sia il bayesiano che il frequentismo sono matematicamente errati? Non mi piace la filosofia, ma mi piace …
Le reti neurali ricorrenti differiscono da quelle "normali" per il fatto che hanno un livello di "memoria". A causa di questo livello, le NN ricorrenti dovrebbero essere utili nella modellazione di serie temporali. Tuttavia, non sono sicuro di aver capito correttamente come usarli. Diciamo che ho le seguenti serie temporali …
Non ho mai veramente criticato la differenza tra queste due misure di convergenza. (O, in effetti, uno qualsiasi dei diversi tipi di convergenza, ma menziono questi due in particolare a causa delle leggi deboli e forti dei grandi numeri.) Certo, posso citare la definizione di ciascuno e dare un esempio …
Ho ottenuto alcuni dati ordinali dalle domande del sondaggio. Nel mio caso sono risposte in stile Likert (Fortemente in disaccordo, in disaccordo, neutrale, d'accordo, fortemente d'accordo). Nei miei dati sono codificati come 1-5. Non credo che significherebbe molto qui, quindi quali statistiche di riepilogo di base sono considerate utili?
La formula per la varianza informatica ha nel denominatore:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} Mi sono sempre chiesto perché. Tuttavia, leggere e guardare alcuni buoni video sul "perché" è, a quanto pare, è un buon stimatore imparziale della varianza della popolazione. Considerando che sottovaluta e sopravvaluta la varianza della …
Nell'analisi dei componenti principali (PCA), otteniamo autovettori (vettori di unità) ed autovalori. Ora, definiamo i caricamenti come Carichi = autovettori ⋅ autovalori----------√.carichi=autovettori⋅autovalori.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. So che gli autovettori sono solo direzioni e i caricamenti (come definiti sopra) includono anche la varianza lungo queste direzioni. Ma per una mia …
Stavo leggendo del kernel PCA ( 1 , 2 , 3 ) con kernel gaussiani e polinomiali. In che modo il kernel gaussiano separa apparentemente eccezionalmente bene qualsiasi tipo di dati non lineari? Si prega di fornire un'analisi intuitiva, oltre a una matematicamente coinvolta, se possibile. Qual è una proprietà …
Sto facendo alcuni calcoli su matrici diverse (principalmente nella regressione logistica) e comunemente ottengo l'errore "Matrix is singular", dove devo tornare indietro e rimuovere le variabili correlate. La mia domanda qui è cosa considereresti una matrice "altamente" correlata? Esiste un valore soglia di correlazione per rappresentare questa parola? Come se …
Vedo che questa immagine è passata molto in giro. Ho la sensazione che le informazioni fornite in questo modo siano in qualche modo incomplete o addirittura errate, ma non sono abbastanza esperto nelle statistiche per rispondere. Mi viene in mente questo fumetto di xkcd , che anche con solidi dati …
Ho diverse centinaia di misurazioni. Ora sto pensando di utilizzare un qualche tipo di software per correlare ogni misura con ogni misura. Ciò significa che ci sono migliaia di correlazioni. Tra questi ci dovrebbe essere (statisticamente) un'alta correlazione, anche se i dati sono completamente casuali (ogni misura ha solo circa …
Questa non è una domanda di lavoro a domicilio ma un vero problema affrontato dalla nostra azienda. Molto recentemente (2 giorni fa) abbiamo ordinato a un rivenditore la produzione di 10000 etichette di prodotti. Il rivenditore è persona indipendente. Riceve le etichette prodotte dall'esterno e l'azienda effettua il pagamento al …
Nella maggior parte delle attività di apprendimento automatico in cui è possibile formulare alcune probabilità ppp che dovrebbero essere massimizzate, si dovrebbe effettivamente ottimizzare il registro probabilità logplogp\log p invece della probabilità per alcuni parametri θθ\theta . Ad esempio, nella formazione di massima verosimiglianza, di solito è la verosimiglianza. Quando …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.