La regolarizzazione di Tikhonov e la regressione della cresta sono termini spesso usati come se fossero identici. È possibile specificare esattamente qual è la differenza?
Per molto tempo non ho capito perché la "somma" di due variabili casuali sia la loro convoluzione , mentre una somma della funzione di densità della miscela di e èf( x )f(x)f(x)g( x )g(x)g(x)pf( x ) + ( 1 - p ) g( x )pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x)n; la somma aritmetica e non …
Vedo spesso sia l'ortografia "eteroschedastica" che "eteroscedastica", e allo stesso modo per "omoscedastico" e "omoschedastico". Non sembra esserci alcuna differenza di significato tra le varianti "c" e "k", semplicemente una differenza ortografica correlata all'etimologia greca della parola. Quali sono le origini delle due distinte ortografie? Un utilizzo è più comune …
Ho studiato LSTM per un po '. Capisco ad alto livello come funziona tutto. Tuttavia, andando a implementarli usando Tensorflow, ho notato che BasicLSTMCell richiede un numero di unità (es. num_units) Parametro. Da questa spiegazione molto approfondita degli LSTM, ho scoperto che una singola unità LSTM è una delle seguenti …
Capisco come otteniamo 3,5 come valore atteso per tirare un dado a 6 facce. Ma intuitivamente, posso aspettarmi che ogni faccia abbia pari probabilità di 1/6. Quindi il valore atteso di tirare un dado non dovrebbe essere uno dei numeri tra 1-6 con uguale probabilità? In altre parole, quando viene …
Quali sono le differenze tra "inferenza" e "stima" nel contesto dell'apprendimento automatico ? Come principiante, sento che inferiamo variabili casuali e stimiamo i parametri del modello. Questa mia comprensione è giusta? In caso contrario, quali sono esattamente le differenze e quando dovrei usare quali? Inoltre, qual è il sinonimo di …
Ho imparato che una statistica è un attributo che puoi ottenere dai campioni. Prendendo molti campioni della stessa dimensione, calcolando questo attributo per tutti loro e tramando il pdf, otteniamo la distribuzione dell'attributo corrispondente o la distribuzione delle statistiche corrispondenti. Ho anche sentito che le statistiche sono fatte per essere …
Stavo leggendo il documento ImageNet Classification con Deep Convolutional Neural Networks e nella sezione 3 dove spiegavano l'architettura della loro Convolutional Neural Network spiegavano come preferivano usare: non linearità non saturataf( x ) = m a x ( 0 , x ) .f(X)=mun'X(0,X).f(x) = max(0, x). perché era più veloce …
Nella tecnica di riduzione della dimensionalità come Analisi dei componenti principali, LDA ecc. Viene spesso utilizzato il termine collettore. Che cos'è una varietà in termini non tecnici? Se un punto appartiene ad una sfera il cui voglio ridurre, e se v'è un rumore dimensione ed ed sono incorrelati, allora i …
Qual è la differenza tra estrapolazione e interpolazione e qual è il modo più preciso di usare questi termini? Ad esempio, ho visto una dichiarazione in un documento usando l'interpolazione come: "La procedura interpola la forma della funzione stimata tra i punti bin" Una frase che utilizza sia l'estrapolazione che …
Sto cercando una buona terminologia per descrivere ciò che sto cercando di fare, per rendere più semplice la ricerca di risorse. Quindi, supponiamo di avere due gruppi di punti A e B, ciascuno associato a due valori, X e Y, e voglio misurare la "distanza" tra A e B, ovvero …
Le risposte (definizioni) definite su Wikipedia sono probabilmente un po 'criptiche per coloro che non hanno familiarità con matematica / statistiche superiori. In termini matematici, un modello statistico viene generalmente considerato come una coppia ( ), dove è l'insieme di possibili osservazioni, ovvero lo spazio campione, e è un insieme …
Quando introduco concetti ai miei studenti, trovo spesso divertente dire loro dove ha origine la terminologia ("regressione", ad esempio, è un termine con un'origine interessante). Non sono stato in grado di evidenziare la storia / il background del termine "regolarizzazione" in apprendimento statistico / automatico. Quindi, qual è l'origine del …
Ho letto spesso di una funzione "altamente non lineare". Nella mia comprensione, c'è "lineare" e "non lineare", quindi di cosa si tratta "altamente"? C'è una differenza formale da non lineare? Come viene definito?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.