Questo è solo un esempio che ho riscontrato più volte, quindi non ho dati di esempio. Esecuzione di un modello di regressione lineare in R: a.lm = lm(Y ~ x1 + x2) x1è una variabile continua. x2è categorico e ha tre valori, ad esempio "Basso", "Medio" e "Alto". Tuttavia, l'output …
Esempi: ho una frase nella descrizione del lavoro: "Ingegnere senior Java nel Regno Unito". Voglio usare un modello di apprendimento profondo per prevederlo in 2 categorie: English e IT jobs. Se uso il modello di classificazione tradizionale, posso solo prevedere 1 etichetta con la softmaxfunzione all'ultimo livello. Quindi, posso usare …
Quali sono alcune alternative al test chi-quadrato per variabili categoriali con tabelle più grandi di 2 x 2 e celle con un numero inferiore a 5, se non voglio unire le classi?
Ho un set di dati con variabile continua e una variabile di destinazione binaria (0 e 1). Devo discretizzare le variabili continue (per la regressione logistica) rispetto alla variabile target e con il vincolo che la frequenza di osservazione in ciascun intervallo dovrebbe essere bilanciata. Ho provato algoritmi di machine …
Sto guardando un foglio Excel che afferma di calcolare il , ma non riconosco questo modo di farlo, e mi chiedevo se mi mancasse qualcosa.χ2χ2\chi^2 Ecco i dati che sta analizzando: +------------------+----------+----------+ | Total Population | Observed | Expected | +------------------+----------+----------+ | 2000 | 42 | 32.5 | | 2000 …
Mi piacerebbe capire l'uso della simulazione Monte Carlo nella chisq.test()funzione in R. Ho una variabile qualitativa che ha 128 livelli / classi. La mia dimensione del campione è 26 (non sono stato in grado di campionare più "individui"). Quindi, ovviamente, avrò alcuni livelli con 0 "individui". Ma il fatto è …
Ho un set di dati in cui collaudo differenze significative tra tre popolazioni rispetto a circa 50 variabili diverse. Lo faccio usando i test di Kruskal-Wallis, da un lato, e dai test del rapporto di verosimiglianza degli adattamenti del modello GLM nidificato (con e senza popolazione come variabile indipendente), dall'altro. …
Supponiamo di avere un campione di frequenze di 4 possibili eventi: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 e ho le probabilità attese dei miei eventi: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Con la somma delle frequenze osservate dei …
Il mio set di dati comprende la mortalità totale o la sopravvivenza di un organismo in tre tipi di siti: costiera, midchannel e offshore. I numeri nella tabella seguente rappresentano il numero di siti. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Vorrei sapere se …
Quindi, ho 16 prove in cui sto cercando di autenticare una persona da un tratto biometrico usando Hamming Distance. La mia soglia è impostata su 3,5. I miei dati sono di seguito e solo la versione di prova 1 è un vero positivo: Trial Hamming Distance 1 0.34 2 0.37 …
Vorrei raccogliere input da persone sul campo sulla correzione della continuità di Yates per 2 x 2 tabelle di contingenza. L'articolo di Wikipedia menziona che potrebbe adattarsi troppo lontano e viene quindi utilizzato solo in senso limitato. Il post correlato qui non offre ulteriori approfondimenti. Quindi, per le persone che …
La procedura Marascuilo come qui descritta sembra essere un test che affronta il problema di confronti multipli per le proporzioni quando si desidera verificare quali proporzioni specifiche sono diverse l'una dall'altra dopo aver rifiutato il valore nullo in un test chi-quadro complessivo. Tuttavia, non ho molta familiarità con questo test. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.