Statistiche e Big Data loss-functions

2

Perché esistono due diverse formule / notazioni di perdita logistica?

Ho visto due tipi di formulazioni logistiche di perdita. Possiamo facilmente dimostrare che sono identici, l'unica differenza è la definizione dell'etichetta yyy . Formulazione / notazione 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) dove p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)} , in cui la funzione logistica associa un numero realeβTxβTx\beta^T xa intervalli …

23 logistic generalized-linear-model notation loss-functions

2

Qual è la funzione di perdita di SVM a margine duro?

La gente dice che il margine debole SVM usa la funzione di perdita della cerniera: . Tuttavia, la funzione oggettiva effettiva che SVM del margine debole cerca di minimizzare è \ frac {1} {2} \ | w \ | ^ 2 + C \ sum_i \ max (0,1-y_i (w ^ …

23 svm loss-functions

1

Perché la funzione di costo delle reti neurali non è convessa?

C'è un thread simile qui (la funzione di costo della rete neurale non è convessa? ) Ma non sono stato in grado di capire i punti nelle risposte lì e il mio motivo per chiedere di nuovo sperando che questo chiarisca alcuni problemi: Se utilizzo somma di funzione di costo …

22 machine-learning neural-networks optimization loss-functions convex

5

Come controllare il costo dell'errata classificazione nelle foreste casuali?

È possibile controllare il costo dell'errata classificazione nel pacchetto R randomForest ? Nel mio lavoro, i falsi negativi (ad esempio, la mancanza di errori che una persona potrebbe avere una malattia) sono molto più costosi dei falsi positivi. Il pacchetto rpart consente all'utente di controllare i costi di classificazione errata …

21 r classification random-forest loss-functions metric

3

La perdita di allenamento aumenta con il tempo [duplicato]

Questa domanda ha già risposte qui : In che modo la modifica della funzione di costo può essere positiva? (1 risposta) Cosa devo fare quando la mia rete neurale non impara? (5 risposte) Chiuso il mese scorso . Sto addestrando un modello (rete neurale ricorrente) per classificare 4 tipi di …

21 machine-learning neural-networks loss-functions rnn training-error

6

Qual è l'idea "fondamentale" dell'apprendimento automatico per la stima dei parametri?

L'idea "fondamentale" delle statistiche per la stima dei parametri è la massima probabilità . Mi chiedo quale sia l'idea corrispondente nell'apprendimento automatico. Qn 1. Sarebbe corretto affermare che l'idea "fondamentale" dell'apprendimento automatico per la stima dei parametri è: "Funzioni di perdita" [Nota: la mia impressione è che gli algoritmi di …

19 machine-learning maximum-likelihood loss-functions pac-learning

3

0-1 Spiegazione della funzione di perdita

Sto cercando di capire qual è lo scopo della funzione di perdita e non riesco proprio a capirlo. Quindi, per quanto ho capito, la funzione di perdita è per introdurre un qualche tipo di metrica con cui possiamo misurare il "costo" di una decisione errata. Quindi supponiamo di avere un …

19 machine-learning loss-functions

1

Scelta tra le funzioni di perdita per la classificazione binaria

Lavoro in un settore problematico in cui le persone segnalano spesso ROC-AUC o AveP (precisione media). Tuttavia, recentemente ho trovato documenti che ottimizzano invece la perdita di log , mentre altri ancora riportano la perdita di cerniera . Mentre capisco come vengono calcolate queste metriche, sto facendo fatica a capire …

18 loss-functions

4

In quali condizioni coincidono gli stimatori dei punti bayesiani e frequentisti?

Con un precedente piatto, gli stimatori ML (frequentista - massima probabilità) e MAP (bayesiano - massimo a posteriori) coincidono. Più in generale, tuttavia, sto parlando di stimatori puntuali derivati come ottimizzatori di alcune funzioni di perdita. ie (Bayesiana) x (x^(.)=argminE(L(X−x^(y))|y) (Bayesian) x^(.)=argminE(L(X−x^(y))|y) (Bayesian) \hat x(\,. ) = \text{argmin} \; \mathbb{E} …

17 bayesian estimation loss-functions frequentist decision-theory

2

Cosa sta succedendo qui, quando utilizzo la perdita quadrata nell'impostazione della regressione logistica?

Sto cercando di usare la perdita quadrata per fare la classificazione binaria su un set di dati giocattolo. Sto usando il mtcarsset di dati, uso il miglio per gallone e il peso per prevedere il tipo di trasmissione. Il diagramma seguente mostra i due tipi di dati del tipo di …

16 r machine-learning logistic optimization loss-functions

4

Qual è considerata una buona perdita di registro?

Sto cercando di capire meglio la perdita di registro e come funziona, ma una cosa che non riesco a trovare è inserire il numero di perdita di registro in una sorta di contesto. Se il mio modello ha una perdita di registro di 0,5, va bene? Qual è considerato un …

16 machine-learning loss-functions log-loss

4

Panoramica completa delle funzioni di perdita?

Sto cercando di ottenere una prospettiva globale su alcune delle idee essenziali nell'apprendimento automatico e mi chiedevo se esiste un trattamento completo delle diverse nozioni di perdita (quadrato, log, cardine, proxy, ecc.). Stavo pensando a qualcosa sulla falsariga di una presentazione più completa e formale dell'eccellente post di John Langford …

16 references loss-functions

5

Spiegazione della funzione di perdita Yolo

Sto cercando di capire la funzione di perdita di Yolo v2: λcoord∑i=0S2∑j=0B1objij[(xi−x^i)2+(yi−y^i)2]+λcoord∑i=0S2∑j=0B1objij[(wi−−√−w^i−−√)2+(hi−−√−h^i−−√)2]+∑i=0S2∑j=0B1objij(Ci−C^i)2+λnoobj∑i=0S2∑j=0B1noobjij(Ci−C^i)2+∑i=0S21obji∑c∈classes(pi(c)−p^i(c))2λcoord∑i=0S2∑j=0B1ijobj[(xi−x^i)2+(yi−y^i)2]+λcoord∑i=0S2∑j=0B1ijobj[(wi−w^i)2+(hi−h^i)2]+∑i=0S2∑j=0B1ijobj(Ci−C^i)2+λnoobj∑i=0S2∑j=0B1ijnoobj(Ci−C^i)2+∑i=0S21iobj∑c∈classes(pi(c)−p^i(c))2\begin{align} &\lambda_{coord} \sum_{i=0}^{S^2}\sum_{j=0}^B \mathbb{1}_{ij}^{obj}[(x_i-\hat{x}_i)^2 + (y_i-\hat{y}_i)^2 ] \\&+ \lambda_{coord} \sum_{i=0}^{S^2}\sum_{j=0}^B \mathbb{1}_{ij}^{obj}[(\sqrt{w_i}-\sqrt{\hat{w}_i})^2 +(\sqrt{h_i}-\sqrt{\hat{h}_i})^2 ]\\ &+ \sum_{i=0}^{S^2}\sum_{j=0}^B \mathbb{1}_{ij}^{obj}(C_i - \hat{C}_i)^2 + \lambda_{noobj}\sum_{i=0}^{S^2}\sum_{j=0}^B \mathbb{1}_{ij}^{noobj}(C_i - \hat{C}_i)^2 \\ &+ \sum_{i=0}^{S^2} \mathbb{1}_{i}^{obj}\sum_{c \in classes}(p_i(c) - \hat{p}_i(c))^2 \\ \end{align} Se qualcuno può dettagliare la funzione.

16 neural-networks loss-functions object-detection yolo

2

È pratica comune ridurre al minimo la perdita media sui lotti anziché sulla somma?

Tensorflow ha un tutorial di esempio sulla classificazione di CIFAR-10 . Nell'esercitazione viene minimizzata la perdita media di entropia trasversale nel lotto. def loss(logits, labels): """Add L2Loss to all the trainable variables. Add summary for for "Loss" and "Loss/avg". Args: logits: Logits from inference(). labels: Labels from distorted_inputs or inputs(). …

15 neural-networks loss-functions tensorflow

3

perdita della cerniera rispetto alla perdita logistica vantaggi e svantaggi / limitazioni

La perdita della cerniera può essere definita usando e la perdita del log può essere definita come log ( 1 + exp ( - y i w T x i ) )max ( 0 , 1 - yiowTXio)max(0,1-yiowTXio)\text{max}(0, 1-y_i\mathbf{w}^T\mathbf{x}_i)log ( 1 + exp( - yiowTXio) )log(1+exp⁡(-yiowTXio))\text{log}(1 + \exp(-y_i\mathbf{w}^T\mathbf{x}_i)) Ho le …

14 machine-learning svm loss-functions computer-vision

Domande taggate «loss-functions»