Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Oltre a evidenti caratteristiche classificatore come costo computazionale, tipi di dati previsti di caratteristiche / etichette e idoneità per determinate dimensioni e dimensioni dei set di dati, quali sono i primi cinque (o 10, 20?) classificatori da provare prima su un nuovo set di dati di cui non si conosce …
Supponiamo che farò una regressione logistica univariata su diverse variabili indipendenti, come questa: mod.a <- glm(x ~ a, data=z, family=binominal("logistic")) mod.b <- glm(x ~ b, data=z, family=binominal("logistic")) Ho fatto un confronto tra i modelli (test del rapporto di verosimiglianza) per vedere se il modello è migliore del modello null con …
Oggi uno studente mi ha chiesto: "Come fanno a sapere quante persone hanno partecipato a un grande evento di gruppo, ad esempio il" Rally to Restore Sanity "di Stewart / Colbert a Washington DC?" Le agenzie di stampa riportano stime in decine di migliaia, ma quali metodi vengono utilizzati per …
DOMANDA: Ho dati binari su domande d'esame (corretto / errato). Alcune persone potrebbero aver avuto accesso preliminare a un sottoinsieme di domande e alle loro risposte corrette. Non so chi, quanti o quali. Se non ci fossero imbrogli, supponiamo che modellerei la probabilità di una risposta corretta per l'elemento come …
Mi è stata posta questa domanda durante un'intervista per una posizione commerciale con una società commerciale proprietaria. Mi piacerebbe molto conoscere la risposta a questa domanda e l'intuizione alla base. Domanda dell'ameba: una popolazione di amebe inizia con 1. Dopo 1 periodo in cui l'ameba può dividersi in 1, 2, …
Quali metodi di affidabilità inter-rater sono più appropriati per i dati ordinali o di intervallo? Credo che "Probabilità congiunta di accordo" o "Kappa" siano progettati per dati nominali. Mentre "Pearson" e "Spearman" possono essere usati, sono usati principalmente per due raters (sebbene possano essere usati per più di due raters). …
Quali sono i buoni modi per visualizzare l'insieme delle risposte di Likert? Ad esempio, un insieme di elementi che chiedono l'importanza di X per le proprie decisioni su A, B, C, D, E, F & G? C'è qualcosa di meglio dei grafici a barre in pila? Cosa si dovrebbe fare …
L'analisi dei dati esplorativi (EDA) spesso porta ad esplorare altre "tracce" che non appartengono necessariamente alla serie iniziale di ipotesi. Devo affrontare una situazione del genere nel caso di studi con una dimensione del campione limitata e molti dati raccolti attraverso diversi questionari (dati socio-demografici, scale neuropsicologiche o mediche - …
Sto cercando di implementare la discesa gradiente di base e la sto testando con una funzione di perdita della cerniera, ad esempio . Tuttavia, sono confuso sul gradiente della perdita della cerniera. Ho l'impressione che lo sialhinge=max(0,1−y x⋅w)lhinge=max(0,1−y x⋅w)l_{\text{hinge}} = \max(0,1-y\ \boldsymbol{x}\cdot\boldsymbol{w}) ∂∂wlcerniera= { - y X0se y x ⋅ …
Supponiamo che abbia mangiato hamburger ogni martedì per anni. Si potrebbe dire che mangio hamburger il 14% delle volte, o che la probabilità che io mangi un hamburger in una determinata settimana è del 14%. Quali sono le principali differenze tra probabilità e proporzioni? Una probabilità è una proporzione prevista? …
Ho iniziato a lavorare attraverso i tutorial statistici sull'estrazione dei dati di Andrew Moore (altamente raccomandato a chiunque si avventura per la prima volta in questo campo). Ho iniziato leggendo questo PDF estremamente interessante intitolato "Panoramica introduttiva degli algoritmi di rilevamento delle anomalie basati su serie temporali" in cui Moore …
Questo può essere difficile da trovare, ma mi piacerebbe leggere un ben spiegato ARIMA esempio che usa matematica minima estende la discussione oltre la costruzione di un modello nell'uso di quel modello per prevedere casi specifici utilizza sia la grafica che i risultati numerici per caratterizzare l'adattamento tra i valori …
Nel leggere il test KS a 2 campioni, capisco esattamente cosa sta facendo, ma non capisco perché funzioni . In altre parole, posso seguire tutti i passaggi per calcolare le funzioni di distribuzione empirica, trovare la massima differenza tra i due per trovare la statistica D, calcolare i valori critici, …
Il titolo è la domanda. Mi è stato detto che rapporti e inversioni di variabili casuali sono spesso problematici. Ciò che si intende è che le aspettative spesso non esistono. C'è una semplice spiegazione generale di ciò?
Data una funzione di costo convesso, usando SGD per l'ottimizzazione, avremo un gradiente (vettore) ad un certo punto durante il processo di ottimizzazione. La mia domanda è, dato il punto sul convesso, il gradiente punta solo nella direzione in cui la funzione aumenta / diminuisce più velocemente, oppure il gradiente …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.