Domande taggate «deep-learning»

Il Deep Learning è un'area del machine learning il cui obiettivo è apprendere funzioni complesse utilizzando speciali architetture di reti neurali "profonde" (costituite da molti livelli). Questo tag deve essere utilizzato per domande sull'implementazione di architetture di deep learning. Le domande generali sull'apprendimento automatico devono essere contrassegnate come "apprendimento automatico". È utile includere un tag per la libreria software pertinente (ad esempio, "keras", "tensorflow", "pytorch", "fast.ai" e così via.


3
Comprensione degli KST LSTM
Sto cercando di conciliare la mia comprensione degli LSTM e sottolineato qui in questo post di Christopher Olah implementato a Keras. Sto seguendo il blog scritto da Jason Brownlee per il tutorial di Keras. Ciò di cui sono principalmente confuso è Il rimodellamento della serie di dati in [samples, time …


2
Spiegazione dell'input di Keras: input_shape, unità, batch_size, dim, ecc
Per qualsiasi livello Keras ( Layerclasse), qualcuno può spiegare come capire la differenza tra input_shape, units, dim, ecc? Ad esempio, il documento afferma di unitsspecificare la forma di output di un livello. Nell'immagine della rete neurale di seguito hidden layer1ha 4 unità. Questo si traduce direttamente unitsnell'attributo Layerdell'oggetto? Oppure unitsin …




11
Perché binary_crossentropy e categorical_crossentropy offrono prestazioni diverse per lo stesso problema?
Sto cercando di formare una CNN per classificare il testo per argomento. Quando utilizzo l'entropia incrociata binaria ottengo un'accuratezza dell'80% circa, con un'entropia incrociata categorica un'accuratezza del 50% circa. Non capisco perché questo sia. È un problema multiclasse, non significa che devo usare l'entropia incrociata categorica e che i risultati …

8
Cosa fa la funzione tf.nn.embedding_lookup?
tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) Non riesco a capire il dovere di questa funzione. È come una tabella di ricerca? Che cosa significa restituire i parametri corrispondenti a ciascun id (in id)? Ad esempio, nel skip-grammodello se utilizziamo tf.nn.embedding_lookup(embeddings, train_inputs), allora per ognuno train_inputtrova l'incorporamento corrispondente?

10
Keras, Come ottenere l'output di ogni livello?
Ho addestrato un modello di classificazione binaria con la CNN, ed ecco il mio codice model = Sequential() model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1], border_mode='valid', input_shape=input_shape)) model.add(Activation('relu')) model.add(Convolution2D(nb_filters, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (16, 16, 32) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(Convolution2D(nb_filters*2, kernel_size[0], kernel_size[1])) model.add(Activation('relu')) model.add(MaxPooling2D(pool_size=pool_size)) # (8, 8, 64) = (2048) model.add(Flatten()) model.add(Dense(1024)) …

12
Perché una funzione di attivazione non lineare deve essere utilizzata in una rete neurale di backpropagation?
Ho letto alcune cose sulle reti neurali e capisco il principio generale di una rete neurale a singolo strato. Comprendo la necessità di livelli aggiuntivi, ma perché vengono utilizzate le funzioni di attivazione non lineari? Questa domanda è seguita da questa: che cos'è un derivato della funzione di attivazione utilizzata …



5
Qual è il ruolo di "Flatten" in Keras?
Sto cercando di capire il ruolo della Flattenfunzione in Keras. Di seguito è riportato il mio codice, che è una semplice rete a due strati. Accetta dati bidimensionali di forma (3, 2) e genera dati monodimensionali di forma (1, 4): model = Sequential() model.add(Dense(16, input_shape=(3, 2))) model.add(Activation('relu')) model.add(Flatten()) model.add(Dense(4)) model.compile(loss='mean_squared_error', …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.