Voglio misurare l'entropia / la densità di informazioni / la somiglianza del modello di una matrice binaria bidimensionale. Vorrei mostrare alcune immagini per chiarimenti: Questo display dovrebbe avere un'entropia piuttosto elevata: UN) Questo dovrebbe avere entropia media: B) Queste immagini, infine, dovrebbero avere tutte un'entropia quasi zero: C) D) E) …
Ho un set di dati sotto forma di (funzionalità, output binario 0 o 1), ma 1 si verifica abbastanza raramente, quindi solo prevedendo sempre 0, ottengo una precisione tra il 70% e il 90% (a seconda dei dati particolari che guardo ). I metodi ML mi danno la stessa accuratezza, …
Ho una domanda sulla classificazione in generale. Sia f un classificatore, che genera un insieme di probabilità dati alcuni dati D. Normalmente, si direbbe: beh, se P (c | D)> 0,5, assegneremo una classe 1, altrimenti 0 (sia un binario classificazione). La mia domanda è: cosa succede se scopro che …
Voglio ridurre la dimensionalità dei sistemi di ordine superiore e catturare la maggior parte della covarianza su un campo preferibilmente bidimensionale o monodimensionale. Capisco che ciò può essere fatto tramite l'analisi dei componenti principali e ho usato PCA in molti scenari. Tuttavia, non l'ho mai usato con tipi di dati …
Ho un set di dati con un gran numero di risposte Sì / No. Posso utilizzare i componenti principali (PCA) o altre analisi di riduzione dei dati (come l'analisi dei fattori) per questo tipo di dati? Si prega di avvisare come faccio a fare questo usando SPSS.
Ho completato l'analisi dei componenti principali (PCA), l'analisi dei fattori esplorativi (EFA) e l'analisi dei fattori di conferma (CFA), trattando i dati con una scala di likert (risposte a 5 livelli: nessuna, un po ', alcune, ..) come continua variabile. Quindi, usando Lavaan, ho ripetuto il CFA definendo le variabili …
Devo usare variabili binarie (valori 0 e 1) in k-medie. Ma k-mean funziona solo con variabili continue. So che alcune persone usano ancora queste variabili binarie in k-means ignorando il fatto che k-mean è progettato solo per variabili continue. Questo è inaccettabile per me. Domande: Quindi qual è il modo …
Comprendo la logica della codifica per l'analisi dei dati. La mia domanda che segue è sull'uso di un codice specifico. C'è un motivo per cui il genere è spesso codificato come 0 per la femmina e 1 per il maschio? Perché questa codifica è considerata "standard"? Confronta questo con Female …
Ho un set di dati con un set di funzionalità. Alcuni di essi sono binari attivo o attivato, inattivo o inattivo) e il resto ha un valore reale, ad esempio .( 1 =(1=(1=0 =0=0=4564.3424564.3424564.342 Voglio fornire questi dati a un algoritmo di apprendimento automatico, quindi ho eseguito il punteggio tutte …
Supponiamo che io abbia un modello predittivo che produce, per ogni istanza, una probabilità per ogni classe. Ora riconosco che ci sono molti modi per valutare un tale modello se voglio usare quelle probabilità per la classificazione (precisione, richiamo, ecc.). Riconosco anche che una curva ROC e l'area sottostante possono …
Voglio generare due variabili. Uno è una variabile di risultato binario (dire successo / fallimento) e l'altro è l'età in anni. Voglio che l'età sia correlata positivamente con il successo. Ad esempio, dovrebbero esserci più successi nei segmenti di età superiore rispetto a quelli inferiori. Idealmente, dovrei essere in grado …
Ho una matrice semi-piccola di caratteristiche binarie di dimensione 250k x 100. Ogni riga è un utente e le colonne sono "tag" binari di alcuni comportamenti dell'utente, ad esempio "like_cats". user 1 2 3 4 5 ... ------------------------- A 1 0 1 0 1 B 0 1 0 1 0 …
Da Encyclopedia of Statistical Sciences ho capito che dati gli attributi (dicotomici (binari: 1 = presenti; 0 = assenti) (variabili), possiamo formare una tabella di contingenza per due oggetti i e j di un campione:ppp j 1 0 ------- 1 | a | b | i ------- 0 | c …
Sto sperimentando l'algoritmo della macchina per aumentare il gradiente tramite il caretpacchetto in R. Utilizzando un piccolo set di dati di ammissione al college, ho eseguito il seguente codice: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.