Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho 2 serie temporali (entrambe fluide) che vorrei mettere in correlazione incrociata per vedere quanto sono correlate. Intendo utilizzare il coefficiente di correlazione di Pearson. È appropriato? La mia seconda domanda è che posso scegliere di campionare le 2 serie storiche nel modo che preferisco. cioè posso scegliere quanti punti …
Come interpretare la deviazione nulla e residua in GLM in R? Diciamo che AIC più piccolo è meglio. C'è qualche interpretazione simile e rapida anche per le deviazioni? Deviazione nulla: 1146,1 su 1077 gradi di libertà Devianza residua: 4589,4 su 1099 gradi di libertà AIC: 11089
Da StatSoft, Inc. (2013), Manuale di statistica elettronica , "Naive Bayes Classifier" : Per dimostrare il concetto di classificazione Naïve Bayes, si consideri l'esempio mostrato nell'illustrazione sopra. Come indicato, gli oggetti possono essere classificati come VERDI o ROSSI. Il mio compito è classificare i nuovi casi al loro arrivo, ovvero …
Immagina di dover fare una relazione sul numero di candidati che ogni anno effettuano un determinato test. Sembra piuttosto difficile dedurre la percentuale osservata di successo, ad esempio, su una popolazione più ampia a causa della specificità della popolazione target. Quindi puoi considerare che questi dati rappresentano l'intera popolazione. I …
Sono sicuro di averlo completamente avvolto intorno alla testa, ma non riesco proprio a capirlo. Il test t confronta due distribuzioni normali usando la distribuzione Z. Ecco perché c'è un'ipotesi di normalità nei DATI. ANOVA equivale alla regressione lineare con variabili fittizie e utilizza somme di quadrati, proprio come OLS. …
Questa domanda mi ha lasciato perplesso per molto tempo. Capisco l'uso di "log" per massimizzare la probabilità, quindi non sto chiedendo di "log". La mia domanda è, poiché massimizzare la verosimiglianza dei log equivale a minimizzare la "verosimiglianza dei log negativi" (NLL), perché abbiamo inventato questo NLL? Perché non utilizziamo …
La Discesa a Gradiente ha il problema di rimanere bloccati nei Minimi Locali. Dobbiamo eseguire tempi esponenziali di discesa gradiente per trovare minimi globali. Qualcuno può parlarmi di qualsiasi alternativa alla discesa gradiente applicata nell'apprendimento della rete neurale, insieme ai suoi pro e contro.
Negli ultimi anni, le reti neurali convoluzionali (CNN) sono diventate lo stato dell'arte per il riconoscimento degli oggetti nella visione artificiale. In genere, una CNN è composta da diversi livelli convoluzionali, seguiti da due livelli completamente collegati. Un'intuizione alla base di ciò è che i livelli convoluzionali apprendono una migliore …
Ho visto "residui" definiti in modo diverso come "previsti meno valori effettivi" o "effettivi meno valori previsti". A scopo illustrativo, per dimostrare che entrambe le formule sono ampiamente utilizzate, confrontare le seguenti ricerche Web: residuo "previsto meno effettivo" residuo "meno effettivo previsto" In pratica, non fa quasi mai differenza, dal …
Stavo leggendo questo articolo sul fattore Bayes per un problema completamente estraneo quando mi sono imbattuto in questo passaggio Il test di ipotesi con i fattori di Bayes è più solido del test di ipotesi del frequentista, poiché la forma bayesiana evita la distorsione del modello, valuta l'evidenza a favore …
Nell'articolo "Discussione: gli ecologisti dovrebbero diventare bayesiani?" Brian Dennis offre una visione sorprendentemente equilibrata e positiva delle statistiche bayesiane quando il suo obiettivo sembra essere quello di avvertire la gente al riguardo. Tuttavia, in un paragrafo, senza citazioni o giustificazioni, afferma: I bayesiani, vedete, non sono autorizzati a guardare i …
Sono curioso della natura di . Qualcuno può dire qualcosa di intuitivo su "Cosa dice sui dati?"Σ−1Σ−1\Sigma^{-1}Σ−1Σ−1\Sigma^{-1} Modificare: Grazie per le risposte Dopo aver seguito alcuni ottimi corsi, vorrei aggiungere alcuni punti: È una misura di informazione, cioè è la quantità di informazioni lungo la direzione .xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx Dualità: poiché è …
Ho completato la mia analisi dei dati e ottenuto "risultati statisticamente significativi", il che è coerente con la mia ipotesi. Tuttavia, uno studente di statistica mi ha detto che questa è una conclusione prematura. Perché? C'è qualcos'altro da includere nel mio rapporto?
Qualcuno può spiegare perché abbiamo bisogno di un gran numero di alberi nella foresta casuale quando il numero di predittori è grande? Come possiamo determinare il numero ottimale di alberi?
In questo documento intitolato "SCEGLIERE TRA MODELLI LINEARI GENERALIZZATI APPLICATI AI DATI MEDICI" gli autori scrivono: In un modello lineare generalizzato, la media viene trasformata dalla funzione di collegamento, invece di trasformare la risposta stessa. I due metodi di trasformazione possono portare a risultati abbastanza diversi; ad esempio, la media …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.