Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ho notato che l'intervallo di confidenza per i valori previsti in una regressione lineare tende ad essere stretto intorno alla media del predittore e al grasso attorno ai valori minimo e massimo del predittore. Questo può essere visto nei grafici di queste 4 regressioni lineari: Inizialmente pensavo che ciò avvenisse …
Mi sarei aspettato che il coefficiente di correlazione fosse lo stesso di una pendenza di regressione (beta), tuttavia avendo appena confrontato i due, sono diversi. In che modo differiscono: quali informazioni diverse forniscono?
In quali casi si dovrebbe preferire l'uno all'altro? Ho trovato qualcuno che rivendica un vantaggio per Kendall, per motivi pedagogici , ci sono altri motivi?
Quali sono alcuni preziosi progetti open source di analisi statistica disponibili in questo momento? Modifica: come sottolineato da Sharpie, prezioso potrebbe significare aiutarti a fare le cose più velocemente o in modo più economico.
Ho una classe di dati sbilanciati e voglio sintonizzare gli iperparametri della treccia potenziata usando xgboost. Domande Esiste un equivalente di gridsearchcv o randomsearchcv per xgboost? In caso contrario, qual è l'approccio raccomandato per ottimizzare i parametri di xgboost?
Sto attualmente recensendo un manoscritto in cui gli autori confrontano i modelli di regressione 5-6 logit con AIC. Tuttavia, alcuni dei modelli hanno termini di interazione senza includere i singoli termini di covariata. Ha mai senso farlo? Ad esempio (non specifico per i modelli logit): M1: Y = X1 + …
Ho appena sentito che è una buona idea scegliere i pesi iniziali di una rete neurale dall'intervallo , dove è il numero di input per un dato neurone. Si presume che gli insiemi siano normalizzati - media 0, varianza 1 (non so se questo è importante).(−1d√,1d√)(−1d,1d)(\frac{-1}{\sqrt d} , \frac{1}{\sqrt d})ddd …
Ricordo di aver frequentato i corsi di statistica come un'audizione sui perché l'estrapolazione fosse una cattiva idea. Inoltre, ci sono una varietà di fonti online che commentano questo. C'è anche una menzione qui . Qualcuno può aiutarmi a capire perché l'estrapolazione è una cattiva idea? Se lo è, come mai …
Ho 2 variabili dipendenti (DV) ciascuna delle quali può essere influenzata dall'insieme di 7 variabili indipendenti (IV). I DV sono continui, mentre l'insieme di IV è costituito da un mix di variabili continue e binarie. (Nel codice sotto le variabili continue sono scritte in lettere maiuscole e variabili binarie in …
Ho una media mensile per un valore e una deviazione standard corrispondente a quella media. Ora sto calcolando la media annuale come la somma delle medie mensili, come posso rappresentare la deviazione standard per la media sommata? Ad esempio, considerando l'output di un parco eolico: Month MWh StdDev January 927 …
Mi chiedo come generare punti distribuiti uniformemente sulla superficie della sfera dell'unità 3D? Inoltre, dopo aver generato quei punti, qual è il modo migliore per visualizzare e verificare se sono veramente uniformi sulla superficie ?x2+y2+z2=1x2+y2+z2=1x^2+y^2+z^2=1
Modifiche: ho aggiunto un semplice esempio: inferenza della media di . Ho anche chiarito leggermente perché gli intervalli credibili che non corrispondono agli intervalli di confidenza sono cattivi.XiXiX_i Io, un bayesiano abbastanza devoto, sono nel mezzo di una sorta di crisi di fede. Il mio problema è il seguente. Supponiamo …
Questa domanda è stata posta sul CV alcuni anni fa, sembra ripubblicare alla luce di 1) ordine di grandezza migliore tecnologia informatica (ad es. Calcolo parallelo, HPC ecc.) E 2) tecniche più recenti, ad es. [3]. Innanzitutto, un po 'di contesto. Supponiamo che l'obiettivo non sia il test delle ipotesi, …
Ho visto questo articolo sull'Economist su un documento apparentemente devastante [1] che mise in dubbio "qualcosa come 40.000 studi pubblicati [fMRI]". L'errore, dicono, è a causa di "ipotesi statistiche errate". Ho letto il documento e vedo che è in parte un problema con più correzioni di confronto, ma non sono …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.