La Computer Vision è un sottocampo dell'informatica che si occupa di analizzare e comprendere le immagini. Ciò include il rilevamento di oggetti come i volti nelle immagini o la segmentazione delle immagini.
Come calcolare il mAP (media precisione media) per l'attività di rilevamento per le classifiche Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Ci ha detto - a pagina 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Precisione media (AP). Per la sfida VOC2007, la precisione media interpolata (Salton e Mcgill 1986) è stata utilizzata per valutare sia la classificazione che …
L'articolo che approfondisce le convoluzioni descrive GoogleNet che contiene i moduli di inizio originali: La modifica a Inception v2 è stata che hanno sostituito le convoluzioni 5x5 con due successive convoluzioni 3x3 e applicato il pool: Qual è la differenza tra Inception v2 e Inception v3?
Per il rilevamento, un modo comune per determinare se una proposta di oggetto era corretta è Intersection over Union (IoU, IU). Questo prende l'insieme UNUNA dei pixel dell'oggetto proposti e l'insieme dei pixel dell'oggetto reale e calcola:BBB ioo U( A , B ) = A ∩ BA ∪ BiooU(UN,B)=UN∩BUN∪BIoU(A, B) …
Se diamo uno sguardo al 90-99% dei lavori pubblicati utilizzando una CNN (ConvNet). La stragrande maggioranza di essi utilizza le dimensioni del filtro per i numeri dispari : {1, 3, 5, 7} per i più utilizzati. Questa situazione può comportare alcuni problemi: con queste dimensioni di filtro, di solito l'operazione …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Queste due operazioni di convoluzione sono molto comuni nell'apprendimento profondo in questo momento. Ho letto dello strato convoluzionale dilatato in questo documento: WAVENET: UN MODELLO GENERATIVO PER AUDIO RAW e De-convoluzione è in questo documento: reti completamente convoluzionali per la segmentazione semantica Entrambi sembrano sottoporre a campionamento l'immagine, ma qual …
Sto provando a implementare un algoritmo in cui data un'immagine con diversi oggetti su una tabella piana, desiderato è l'output di maschere di segmentazione per ogni oggetto. A differenza della CNN, l'obiettivo qui è quello di rilevare oggetti in un ambiente sconosciuto. Quali sono gli approcci migliori a questo problema? …
Vorrei controllare i file JPG se sono stati manipolati per modificare il contenuto. Quello che considero NON photoshopped: ritaglio rotante (Scaling) Risoluzione dell'immagine Le modifiche automatiche potrebbero essere apportate dagli smartphone Cosa considero photoshopping: Aggiunta di una nuova immagine sopra parti della vecchia immagine Modifica del testo di una parte …
In questo articolo molto citato , gli autori danno la seguente discussione sul numero di parametri di peso. Non sono molto chiaro il motivo per cui ha parametri . Penso che dovrebbe essere poiché ciascuno dei canali di input condivide lo stesso filtro, che ha parametri. 49 C C 4949 …
Sono stati pubblicati articoli che mostrano differenze nei metodi di regolarizzazione delle reti neurali, preferibilmente su domini diversi (o almeno set di dati diversi)? Lo sto chiedendo perché al momento ho la sensazione che la maggior parte delle persone sembri usare solo il dropout per la regolarizzazione nella visione artificiale. …
Voglio estrarre i parametri da un'immagine usando una rete neurale. Esempio: Data un'immagine di un muro di mattoni, NN dovrebbe estrarre la larghezza e l'altezza dei mattoni, il colore e la rugosità. Posso generare immagini per determinati parametri per addestrare l'NN e voglio usarlo per estrarre i parametri da un'immagine …
Sto usando un descrittore HOG, associato a un classificatore SVM, per riconoscere gli umani nelle immagini. Sto usando i wrapper Python per OpenCV. Ho usato l'eccellente tutorial su pymagesearch , che spiega cosa fa l'algoritmo e fornisce suggerimenti su come impostare i parametri del metodo detectMultiScale . In particolare, lo …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.