Sto lavorando a una regressione logistica multipla in R utilizzando glm. Le variabili predittive sono continue e categoriche. Un estratto del riepilogo del modello mostra quanto segue: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 …
Conosco il concetto di variabili categoriche e la rispettiva codifica delle variabili fittizie che ci consente di adattarci a un livello come base per evitare collinearità. Conosco anche come interpretare le stime dei parametri da tali modelli: il cambiamento previsto nel risultato per un dato livello adattato del predittore categorico, …
Sto usando il RandomForestpacchetto R e sono confuso su come interpretare i valori dell'asse Y nei loro grafici di dipendenza parziale. I documenti di aiuto affermano che la trama è una "rappresentazione grafica dell'effetto marginale di una variabile sulla probabilità della classe". Tuttavia, sono ancora confuso su ciò che rappresenta …
Mi sto familiarizzando con le statistiche bayesiane leggendo il libro Doing Bayesian Data Analysis , di John K. Kruschke noto anche come "libro dei cuccioli". Nel capitolo 9, i modelli gerarchici sono introdotti con questo semplice esempio: e le osservazioni di Bernoulli sono 3 monete, ciascuna da 10 lanci. Uno …
Per parte di una domanda a casa, mi è stato chiesto di calcolare la media tagliata per un set di dati eliminando l'osservazione più piccola e più grande e di interpretare il risultato. La media tagliata era inferiore alla media non tagliata. La mia interpretazione era che ciò era dovuto …
Supponiamo di avere un modello lineare Model1e vcov(Model1)dare la seguente matrice: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 Per questo esempio, cosa mostra effettivamente questa matrice? Quali ipotesi possiamo fare in modo sicuro …
Una breve voce sul sito web del NY Times fornisce i fatti e le cifre sul consumo di pizza negli Stati Uniti. Ho un interesse casuale nel modo in cui le statistiche vengono utilizzate (o abusate) per fornire informazioni al pubblico generale e sono sorte alcune domande in base alle …
Mi confonde / sbalordisce che il binomio abbia una varianza proporzionale a . Allo stesso modo, le informazioni di Fisher sono proporzionali a . Qual è la ragione di ciò? Perché le informazioni Fisher sono ridotte al minimo a ? Cioè, perché l'inferenza è più difficile a ?1p ( 1 …
In una regressione logistica solo con termini lineari e quadratici, se ho un coefficiente lineare e un coefficiente quadratico , posso dire che esiste un punto di svolta della probabilità in ?β 2 - β 1 / ( 2 β 2 )β1β1\beta_1β2β2\beta_2−β1/(2β2)−β1/(2β2)-\beta_1 / (2\beta_2)
Attualmente sto lavorando alla costruzione di un modello predittivo per un risultato binario su un set di dati con ~ 300 variabili e 800 osservazioni. Ho letto molto su questo sito sui problemi associati alla regressione graduale e sul perché non usarlo. Ho letto la regressione di LASSO e la …
Stavo usando le kmeansistruzioni di R per eseguire l'algoritmo k-mean sul set di dati dell'iride di Anderson. Ho una domanda su alcuni parametri che ho ottenuto. I risultati sono: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 In questo caso, cosa significa "Cluster significa"? È la media …
Qualcuno può spiegare come calcolare l'effetto marginale del modello Probit e Logit in parole povere? Sono nuovo nelle statistiche e sono confuso su questi due modelli.
Ho un modello di regressione lineare in cui viene registrata la variabile dipendente e una variabile indipendente è lineare. Il coefficiente di pendenza per una variabile indipendente dalla chiave è negativo: . Non sono sicuro di come interpretare.- .0564−.0564-.0564 Uso il valore assoluto e poi lo trasformo in negativo in …
Considera il seguente codice e output: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Sembra che quel diagramma QQ per log-normal sia quasi uguale …
Ecco un diagramma QQ per il mio campione (notare l'asse Y logaritmico); :n = 1000n=1000n = 1000 Come sottolineato da whuber, questo indica che la distribuzione sottostante è inclinata a sinistra (la coda destra è più corta). Usando shapiro.test(sui dati trasformati in log) in R, ottengo una statistica di test …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.