Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
In conclusione , più imparo sulle statistiche, meno mi fido degli articoli pubblicati nel mio campo; Credo semplicemente che i ricercatori non stiano facendo abbastanza bene le loro statistiche. Sono un laico, per così dire. Sono addestrato in biologia ma non ho un'istruzione formale in statistica o matematica. Mi piace …
Sono nuovo nella selezione delle funzionalità e mi chiedevo come avresti usato PCA per eseguire la selezione delle funzionalità. PCA calcola un punteggio relativo per ciascuna variabile di input che è possibile utilizzare per filtrare le variabili di input non informative? Fondamentalmente, voglio essere in grado di ordinare le caratteristiche …
O più così "sarà"? I Big Data rendono le statistiche e le conoscenze pertinenti ancora più importanti, ma sembrano sottovalutare la teoria del campionamento. Ho visto questo clamore intorno a "Big Data" e non posso fare a meno di chiedermi che "perché" dovrei analizzare tutto ? Non c'era un motivo …
Ho lavorato per un po 'in R e mi sono trovato di fronte a cose come PCA, SVD, decomposizioni QR e molti di questi risultati di algebra lineare (durante l'ispezione della stima di regressioni ponderate e simili), quindi volevo sapere se qualcuno ha una raccomandazione su un buon libro di …
Troviamo i centri del cluster e assegniamo punti a k diversi bin del cluster nel clustering k-mean che è un algoritmo molto noto e si trova quasi in ogni pacchetto di machine learning in rete. Ma la parte mancante e più importante secondo me è la scelta di un k …
Ho spesso sentito che i test post hoc dopo un ANOVA possono essere utilizzati solo se l'ANOVA stesso era significativo. Tuttavia, i test post hoc regolano i valori per mantenere il tasso di errore globale di tipo I al 5%, vero?ppp Quindi perché abbiamo bisogno prima del test globale? Se …
Qual è una buona introduzione alla statistica per un matematico che è già esperto di probabilità? Ho due motivazioni distinte per chiedere, che possono portare a diversi suggerimenti: Mi piacerebbe capire meglio la motivazione statistica alla base di molti problemi considerati dai probabilisti. Mi piacerebbe sapere come interpretare meglio i …
Supponiamo che tu sia un ricercatore / econometrico di scienze sociali che cerca di trovare predittori rilevanti della domanda di un servizio. Sono disponibili 2 variabili risultato / dipendente che descrivono la domanda (utilizzando il servizio sì / no e il numero di occasioni). Hai 10 variabili predittive / indipendenti …
In precedenza l'ho chiesto su StackOverflow, ma sembra che qui potrebbe essere più appropriato, dato che non ha ricevuto risposte su SO. È una specie di incrocio tra statistica e programmazione. Ho bisogno di scrivere un po 'di codice per fare PCA (Analisi dei componenti principali). Ho sfogliato i noti …
In precedenza una domanda cercava raccomandazioni per i libri di testo sulle statistiche matematiche Qualcuno conosce qualche buona lezione di video online sulle statistiche matematiche ? I più vicini che ho trovato sono: Apprendimento automatico Econometria AGGIORNAMENTO: Alcuni dei suggerimenti menzionati di seguito sono buoni video statistici di tipo 101. …
Sembra che sia possibile ottenere risultati simili a una rete neurale con una regressione lineare multivariata in alcuni casi e la regressione lineare multivariata è super veloce e facile. In quali circostanze le reti neurali possono dare risultati migliori della regressione lineare multivariata?
Ho letto molto su PCA, compresi vari tutorial e domande (come questo , questo , questo e questo ). Il problema geometrico che PCA sta cercando di ottimizzare è chiaro per me: PCA cerca di trovare il primo componente principale minimizzando l'errore di ricostruzione (proiezione), che massimizza simultaneamente la varianza …
Per me, sembra che la convalida dell'aggancio sia inutile. Cioè, dividere il set di dati originale in due parti (formazione e test) e usare il punteggio del test come misura di generalizzazione, è alquanto inutile. La convalida incrociata di K-fold sembra fornire migliori approssimazioni di generalizzazione (in quanto si allena …
Ho letto dal mio libro di testo che non garantisce che X e Y siano indipendenti. Ma se sono indipendenti, la loro covarianza deve essere 0. Non potrei ancora pensare a nessun esempio adeguato; qualcuno potrebbe fornire uno?cov ( X, Y) = 0cov(X,Y)=0\text{cov}(X,Y)=0
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.