Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Qualcuno può dare una buona panoramica delle differenze tra l'approccio bayesiano e quello frequentista alla probabilità? Da quello che ho capito: L'opinione dei frequentatori è che i dati sono un campione casuale ripetibile (variabile casuale) con una frequenza / probabilità specifica (che è definita come la frequenza relativa di un …
Oggi, al Cross Validated Journal Club (perché non eri lì?), @Mbq ha chiesto: Pensi che noi (moderni data scientist) sappiamo cosa significa significato? E come si collega alla nostra fiducia nei nostri risultati? @Michelle ha risposto come alcuni (incluso me) di solito fanno: Sto trovando il concetto di significato (basato …
Quando si fa ricerca in Economia, è spesso necessario verificare le conclusioni teoriche su dati reali. Quali sono le fonti di dati affidabili da utilizzare e citare? Sono principalmente interessato a fonti che forniscono vari dati statistici come PIL, popolazione, CPI, PPI ecc. EDIT: Ecco un'aggregazione dei collegamenti che appaiono …
Supponiamo che sia una variabile casuale con pdf . Quindi la variabile casuale ha il pdfXXXfX(x)fX(x)f_X(x)Y=X2Y=X2Y=X^2 fY(y)={12y√(fX(y√)+fX(−y√))0y≥0y<0fY(y)={12y(fX(y)+fX(−y))y≥00y<0f_Y(y)=\begin{cases}\frac{1}{2\sqrt{y}}\left(f_X(\sqrt{y})+f_X(-\sqrt{y})\right) & y \ge 0 \\ 0 & y \lt 0\end{cases} Capisco il calcolo dietro questo. Ma sto cercando di pensare a un modo per spiegarlo a qualcuno che non conosce il calcolo. In …
Le reti neurali sono spesso trattate come "scatole nere" a causa della loro struttura complessa. Questo non è l'ideale, in quanto è spesso utile avere una comprensione intuitiva del funzionamento interno di un modello. Quali sono i metodi per visualizzare il funzionamento di una rete neurale addestrata? In alternativa, come …
Sto cercando alcune disuguaglianze di probabilità per somme di variabili casuali illimitate. Lo apprezzerei davvero se qualcuno potesse darmi qualche pensiero. Il mio problema è trovare un limite esponenziale superiore alla probabilità che la somma delle variabili casuali iid illimitate, che sono in realtà la moltiplicazione di due iid gaussiane, …
Ho un corso di Machine Learning questo semestre e il professore ci ha chiesto di trovare un problema del mondo reale e risolverlo con uno dei metodi di machine learning introdotti in classe, come: Alberi decisionali Reti neurali artificiali Supportare macchine vettoriali Apprendimento basato sull'istanza ( kNN , LWL ) …
Spero che qualcuno possa spiegare, in parole povere, quale sia una funzione caratteristica e come venga utilizzata nella pratica. Ho letto che è la trasformata di Fourier del pdf, quindi credo di sapere cosa si tratta, ma ancora non capisco il suo scopo. Se qualcuno potesse fornire una descrizione intuitiva …
Vedo che ci sono molte differenze formali tra le misure di distanza Kullback – Leibler vs Kolmogorov-Smirnov. Tuttavia, entrambi vengono utilizzati per misurare la distanza tra le distribuzioni. Esiste una situazione tipica in cui uno dovrebbe essere usato anziché l'altro? Qual è la logica per farlo?
Ho 2 semplici domande sulla regressione lineare: Quando si consiglia di standardizzare le variabili esplicative? Una volta effettuata la stima con valori standardizzati, come si può prevedere con nuovi valori (come si dovrebbero standardizzare i nuovi valori)? Alcuni riferimenti sarebbero utili.
Come afferma la domanda: è possibile provare l'ipotesi nulla? Dalla mia (limitata) comprensione dell'ipotesi, la risposta è no ma non riesco a trovare una spiegazione rigorosa per questo. La domanda ha una risposta definitiva?
In tutti i contesti che conosco la convalida incrociata, viene utilizzato esclusivamente con l'obiettivo di aumentare la precisione predittiva. È possibile estendere la logica della convalida incrociata nella stima delle relazioni imparziali tra variabili? Mentre questo articolo di Richard Berk dimostra l'uso di un campione di prova per la selezione …
Come estraneo, sembra che ci siano due punti di vista in competizione su come si dovrebbe eseguire l'inferenza statistica. I due diversi metodi sono entrambi considerati validi dagli statistici che lavorano? Scegliere uno è considerato più una domanda filosofica? Oppure la situazione attuale è considerata problematica e si stanno tentando …
Ci sono state alcune domande sui libri di testo statistici , come la domanda Libri di testo statistici gratuiti . Tuttavia, sto cercando libri di testo che sono Open Source, ad esempio, con una licenza Creative Commons . Il motivo è che nel materiale del corso in altri domini, vuoi …
Un problema che ho visto spesso sollevato nel contesto delle reti neurali in generale, e delle reti neurali profonde in particolare, è che sono "affamati di dati", ovvero che non funzionano bene se non disponiamo di un set di dati di grandi dimensioni con cui addestrare la rete. La mia …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.