Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

1
Regressione: trasformazione delle variabili
Quando si trasformano le variabili, è necessario utilizzare tutta la stessa trasformazione? Ad esempio, posso scegliere e scegliere variabili trasformate diversamente, come in: Sia età, la durata dell'impiego, la durata del soggiorno e il reddito.X1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Oppure, devi essere coerente con le …



4
Quali riferimenti devono essere citati per supportare l'utilizzo di 30 come una dimensione del campione abbastanza grande?
Ho letto / sentito molte volte che la dimensione del campione di almeno 30 unità è considerata come "campione grande" (ipotesi di normalità dei mezzi di solito approssimativamente a causa del CLT, ...). Pertanto, nei miei esperimenti, di solito generi campioni di 30 unità. Potete per favore darmi qualche riferimento …


13
Perché l'età media è una statistica migliore dell'età media?
Se guardi Wolfram Alpha O questa pagina di Wikipedia Elenco dei paesi per età media Chiaramente la mediana sembra essere la statistica di scelta quando si tratta di età. Non sono in grado di spiegarmi perché la media aritmetica sarebbe una statistica peggiore. Perché è così? Originariamente pubblicato qui perché …
41 mean  median 



1
Come interpretare le misure di errore?
Sto eseguendo la classificazione in Weka per un determinato set di dati e ho notato che se sto cercando di prevedere un valore nominale, l'output mostra in modo specifico i valori previsti correttamente e in modo errato. Tuttavia, ora lo sto eseguendo per un attributo numerico e l'output è: Correlation …


5
Come derivare la soluzione di regressione della cresta?
Sto riscontrando alcuni problemi con la derivazione della soluzione per la regressione della cresta. Conosco la soluzione di regressione senza il termine di regolarizzazione: β= ( XTX)- 1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Ma dopo aver aggiunto il termine L2 alla funzione di costo, come mai la soluzione diventaλ ∥ β∥22λ‖β‖22\lambda\|\beta\|_2^2 β= ( …

3
Come posso calcolare
Supponiamo che e siano funzione di densità e funzione di distribuzione della distribuzione normale standard.Φ ( ⋅ )ϕ(⋅)ϕ(⋅)\phi(\cdot)Φ(⋅)Φ(⋅)\Phi(\cdot) Come si può calcolare l'integrale: ∫∞−∞Φ(w−ab)ϕ(w)dw∫−∞∞Φ(w−ab)ϕ(w)dw\int^{\infty}_{-\infty}\Phi\left(\frac{w-a}{b}\right)\phi(w)\,\mathrm dw

9
Come interpretare i valori di misura F?
Vorrei sapere come interpretare una differenza di valori di f-measure. So che la misura f è una media equilibrata tra precisione e richiamo, ma sto chiedendo il significato pratico di una differenza nelle misure F. Ad esempio, se un classificatore C1 ha un'accuratezza di 0,4 e un altro classificatore C2 …

5
In che modo i punteggi di propensione sono diversi dall'aggiunta di covariate in una regressione e quando sono preferiti a quest'ultima?
Ammetto di essere relativamente nuovo ai punteggi di propensione e all'analisi causale. Una cosa che non è ovvio per me come nuovo arrivato è come il "bilanciamento" usando i punteggi di propensione sia matematicamente diverso da quello che succede quando aggiungiamo covariate in una regressione? Cosa c'è di diverso nell'operazione, …

1
In cosa differisce softmax_cross_entropy_with_logits da softmax_cross_entropy_with_logits_v2?
In particolare, suppongo di chiedermi questa affermazione: Le versioni principali future di TensorFlow consentiranno ai gradienti di fluire nelle etichette immesse sul backprop per impostazione predefinita. Che è mostrato quando uso tf.nn.softmax_cross_entropy_with_logits. Nello stesso messaggio mi spinge a dare un'occhiata tf.nn.softmax_cross_entropy_with_logits_v2. Ho consultato la documentazione ma afferma solo che per …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.