Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

3
Diagnostica per la regressione logistica?
Per la regressione lineare, possiamo verificare i grafici diagnostici (grafici dei residui, grafici QQ normali, ecc.) Per verificare se le ipotesi di regressione lineare sono violate. Per la regressione logistica, ho difficoltà a trovare risorse che spiegano come diagnosticare il modello di regressione logistica adatto. Scavando alcune note del corso …

29
Esempi di insegnamento: la correlazione non significa causalità
C'è un vecchio detto: "La correlazione non significa causalità". Quando insegno, tendo a usare i seguenti esempi standard per illustrare questo punto: numero di cicogne e tasso di natalità in Danimarca; numero di sacerdoti in America e alcolismo; all'inizio del XX secolo è stato osservato che esisteva una forte correlazione …


5
Che cos'è la regolarizzazione in inglese?
A differenza di altri articoli, ho trovato la voce di Wikipedia per questo argomento illeggibile per una persona non matematica (come me). Ho capito l'idea di base, secondo cui preferisci modelli con meno regole. Quello che non capisco è come si passa da un insieme di regole a un "punteggio …

4
Una rivista di psicologia ha vietato i valori p e gli intervalli di confidenza; è davvero saggio smettere di usarli?
Il 25 febbraio 2015 la rivista Basic and Applied Social Psychology ha pubblicato un editoriale che vieta i valori e gli intervalli di confidenza di tutti gli articoli futuri.ppp In particolare, dicono (la formattazione e l'enfasi sono mie): [...] prima della pubblicazione, gli autori dovranno rimuovere tutte le tracce dell'NHSTP …





11
Avere un lavoro nel data mining senza dottorato
Sono stato molto interessato al data mining e all'apprendimento automatico per un po ', in parte perché mi sono laureato in quell'area a scuola, ma anche perché sono davvero molto più entusiasta nel cercare di risolvere problemi che richiedono un po' più di pensiero rispetto alla semplice programmazione conoscenza e …


6
Scelta di un metodo di clustering
Quando si utilizza l'analisi dei cluster su un set di dati per raggruppare casi simili, è necessario scegliere tra un gran numero di metodi di clustering e misure di distanza. A volte, una scelta potrebbe influenzare l'altra, ma ci sono molte possibili combinazioni di metodi. Qualcuno ha qualche consiglio su …


6
C'è qualche buona ragione per usare PCA invece di EFA? Inoltre, PCA può essere un sostituto dell'analisi fattoriale?
In alcune discipline, PCA (analisi dei componenti principali) viene sistematicamente utilizzato senza alcuna giustificazione e PCA ed EFA (analisi dei fattori esplorativi) sono considerati sinonimi. Di recente ho quindi utilizzato PCA per analizzare i risultati di uno studio di validazione della scala (21 articoli su scala Likert a 7 punti, …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.