Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Sono sicuro di essermi imbattuto in una funzione come questa in un pacchetto R in precedenza, ma dopo un esteso googling non riesco a trovarla da nessuna parte. La funzione a cui sto pensando ha prodotto un riepilogo grafico per una variabile assegnatagli, producendo un output con alcuni grafici (un …
Nella mia mente, la divergenza di KL dalla distribuzione del campione alla distribuzione vera è semplicemente la differenza tra entropia incrociata ed entropia. Perché utilizziamo l'entropia incrociata come funzione di costo in molti modelli di apprendimento automatico, ma utilizziamo la divergenza di Kullback-Leibler in t-sne? C'è qualche differenza nella velocità …
Quando eseguiamo la regressione lineare per adattare un gruppo di punti dati , l'approccio classico minimizza l'errore al quadrato. Sono stato a lungo perplesso da una domanda che minimizzando l'errore al quadrato produrrà lo stesso risultato di minimizzare l'errore assoluto ? In caso contrario, perché è meglio ridurre al minimo …
Sto cercando di capire cos'è la somiglianza tra Allocazione latente di Dirichlet e word2vec per calcolare la somiglianza delle parole. A quanto ho capito, LDA associa le parole a un vettore di probabilità di argomenti latenti , mentre word2vec le associa a un vettore di numeri reali (relativi alla scomposizione …
Ho cercato di replicare i risultati dell'opzione Stata robustin R. Ho usato il rlmcomando dal pacchetto MASS e anche il comando lmrobdal pacchetto "robustbase". In entrambi i casi i risultati sono abbastanza diversi dall'opzione "robusta" di Stata. Qualcuno può suggerire qualcosa in questo contesto? Ecco i risultati che ho ottenuto …
La mia domanda è: dobbiamo standardizzare il set di dati per assicurarci che tutte le variabili abbiano la stessa scala, tra [0,1], prima di adattare la regressione logistica. La formula è: Xio- min ( xio)max ( xio) - min ( xio)Xio-min(Xio)max(Xio)-min(Xio)\frac{x_i-\min(x_i)}{\max(x_i)-\min(x_i)} Il mio set di dati ha 2 variabili, descrivono …
Esistono formule ben note per le statistiche degli ordini di determinate distribuzioni casuali? Soprattutto le statistiche del primo e dell'ultimo ordine di una normale variabile casuale, ma sarebbe apprezzata anche una risposta più generale. Modificare: per chiarire, sto cercando formule approssimative che possono essere valutate più o meno esplicitamente, non …
Sto cercando di classificare i dati che, in alcuni casi, il valore più grande ha il rango di 1. Sono relativamente nuovo su R, ma non vedo come posso regolare questa impostazione nella funzione di rango. x <- c(23,45,12,67,34,89) rank(x) genera: [1] 2 4 1 5 3 6 quando voglio …
Ho calcolato AIC e AICc per confrontare due modelli misti lineari generali; Gli AIC sono positivi con il modello 1 con un AIC inferiore rispetto al modello 2. Tuttavia, i valori per AICc sono entrambi negativi (il modello 1 è ancora <modello 2). È valido utilizzare e confrontare valori AICc …
Supponiamo che io abbia due distribuzioni normali A e B con mezzi e e varianze e . Voglio prendere una miscela ponderata di questi due distribuzioni utilizzando pesi e dove e . So che la media di questa miscela sarebbe .μAμA\mu_AμBμB\mu_BσAσA\sigma_AσBσB\sigma_Bpppqqq0≤p≤10≤p≤10\le p \le 1q=1−pq=1−pq = 1-pμAB=(p×μA)+(q×μB)μAB=(p×μA)+(q×μB)\mu_{AB} = (p\times\mu_A) + (q\times\mu_B) …
Esistono studi empirici che giustificano l'uso dell'unica regola di errore standard a favore della parsimonia? Ovviamente dipende dal processo di generazione dei dati, ma tutto ciò che analizza un ampio corpus di set di dati sarebbe una lettura molto interessante. La "regola dell'errore standard" viene applicata quando si selezionano i …
Qual è la differenza tra una popolazione e un campione? Quali variabili e statistiche comuni vengono utilizzate per ognuna e in che modo si relazionano tra loro?
In An Introduction to Statistical Learning with Applications in R , gli autori scrivono che il montaggio di un albero decisionale è molto veloce, ma questo non ha senso per me. L'algoritmo deve passare attraverso ogni funzione e partizionarla in ogni modo possibile per trovare la divisione ottimale. Per le …
Sto ottenendo una precisione del 100% per il mio albero decisionale. Che cosa sto facendo di sbagliato? Questo è il mio codice: import pandas as pd import json import numpy as np import sklearn import matplotlib.pyplot as plt data = np.loadtxt("/Users/Nadjla/Downloads/allInteractionsnum.csv", delimiter=',') x = data[0:14] y = data[-1] from sklearn.cross_validation …
È ovvio molte volte perché si preferisce uno stimatore imparziale. Ma ci sono circostanze in cui potremmo effettivamente preferire uno stimatore distorto rispetto a uno imparziale?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.