Quali topologie sono in gran parte inesplorate nell'apprendimento automatico? [chiuso]


12

Geometria e AI

Matrici, cubi, strati, pile e gerarchie sono ciò che potremmo definire con precisione topologie . Considerare la topologia in questo contesto la progettazione geometrica di livello superiore di un sistema di apprendimento.

Con l'aumentare della complessità, è spesso utile rappresentare queste topologie come strutture grafiche dirette. I diagrammi di stato e il lavoro di Markov sulla teoria dei giochi sono due luoghi in cui i grafici diretti sono comunemente usati. I grafici diretti hanno vertici (spesso visualizzati come forme chiuse) e bordi spesso visualizzati come frecce che collegano le forme.

Possiamo anche rappresentare i GAN come un grafico diretto, in cui l'output di ciascuna rete guida la formazione dell'altro in modo contraddittorio. I GAN assomigliano topologicamente a una striscia di Möbius.

Non possiamo scoprire nuovi progetti e architetture senza comprendere non solo la matematica della convergenza su una soluzione ottimale o il monitoraggio di una, ma anche topologie di connessioni di rete in grado di supportare tale convergenza. È come prima sviluppare un processore immaginando di cosa avrebbe bisogno un sistema operativo prima di scrivere il sistema operativo.

Per intravedere quali topologie NON ABBIAMO ANCORA preso in considerazione, diamo prima un'occhiata a quali sono state.

Step One - Estrusione in una seconda dimensione

Negli anni '80, il successo fu raggiunto con l'estensione del design originale del percettrone. I ricercatori hanno aggiunto una seconda dimensione per creare una rete neurale a più livelli. La ragionevole convergenza è stata ottenuta attraverso la retro-propagazione del gradiente di una funzione di errore attraverso i gradienti delle funzioni di attivazione attenuati dai tassi di apprendimento e smorzati con altri meta-parametri.

Fase due: aggiunta di dimensioni al segnale di ingresso discreto

Vediamo l'emergere di reti convoluzionali basate su tecniche di convoluzione dell'immagine sintonizzate manualmente che introducono dimensioni nell'input di rete: posizione verticale, componenti di colore e cornice. Quest'ultima dimensione è fondamentale per la CGI, la sostituzione del viso e altre tecniche morfologiche nella produzione cinematografica contemporanea. Senza di essa, abbiamo la generazione di immagini, la categorizzazione e la rimozione del rumore.

Passaggio tre: pile di reti

Vediamo emergere pile di reti neurali alla fine degli anni '90, dove l'addestramento di una rete è supervisionato da un'altra. Questa è l'introduzione di strati concettuali, né nel senso di strati sequenziali di neuroni né nel senso di strati di colore in un'immagine. Anche questo tipo di stratificazione non è ricorsione. È più simile al mondo naturale in cui una struttura è un organo all'interno di un altro tipo di struttura completamente diversa.

Quarto passaggio - Gerarchie di reti

Vediamo gerarchie di reti neurali che compaiono frequentemente nella ricerca che risale agli anni 2000 e all'inizio del 2010 (Laplaciano e altri), che continua l'interazione tra reti neurali e continua l'analogia del cervello dei mammiferi. Ora vediamo la meta-struttura, in cui intere reti diventano vertici in un grafico diretto che rappresenta una topologia.

Step 5% mdash; Partenze dall'orientamento cartesiano

In letteratura hanno cominciato a emergere sistematicamente ripetizioni non cartesiane di cellule e connessioni tra loro. Ad esempio, Gauge Equivariant Convolutional Networks e Icosahedral CNN (Taco S. Cohen, Maurice Weiler, Berkay Kicanaoglu, Max Welling, 2019) esaminano l'uso di una disposizione basata su un icosaedro regolare convesso.

Riassumendo

I livelli hanno funzioni di attivazione valutate normalmente per vertici e matrici di attenuazione mappati su un insieme esaustivo di bordi diretti tra strati adiacenti [1]. Gli strati di convoluzione dell'immagine sono spesso disposti in vertici bidimensionali con cubi di attenuazione mappati su una serie ridotta di bordi diretti tra strati adiacenti [2]. Le pile hanno intere reti stratificate come vertici in un meta-grafico e questi meta-vertici sono collegati in una sequenza con ogni bordo che può essere un meta-parametro di allenamento, un segnale di rinforzo (feedback in tempo reale) o qualche altro controllo di apprendimento . Le gerarchie di reti riflettono l'idea che più controlli possono essere aggregati e dirigono l'apprendimento di livello inferiore o il caso inverso in cui più elementi di apprendimento possono essere controllati da una rete di supervisori di livello superiore.

Analisi dell'andamento delle topologie di apprendimento

Siamo in grado di analizzare le tendenze nell'architettura di apprendimento automatico. Abbiamo tre tendenze topologiche.

  • Profondità nella dimensione di causalità - Livelli per l'elaborazione del segnale in cui l'uscita di uno strato di attivazioni viene alimentata attraverso una matrice di parametri attenuanti (pesi) all'ingresso del livello successivo. Man mano che vengono stabiliti controlli maggiori, solo a partire dalla discesa gradiente di base nella propatagione posteriore, è possibile ottenere una profondità maggiore.

  • Dimensionalità del segnale di input: dall'input scalare agli ipercubi (il video ha una profondità di colore orizzontale, verticale, compresa la trasparenza e il frame). Notare che questo non è lo stesso del numero di input in senso perctron.

  • Sviluppo topologico - I due precedenti sono di natura cartesiana. Le quote vengono aggiunte ad angolo retto rispetto alla dimensione esistente. Poiché le reti sono cablate in gerarchie (come nelle Gerarchie Laplaciane) e Möbius si spogliano come cerchi (come nelle GAN), le tendenze sono topografiche e sono meglio rappresentate da grafici diretti in cui i vertici non sono neuroni ma reti più piccole di essi.

Quali topologie mancano?

Questa sezione espande il significato della domanda del titolo.

  • C'è qualche motivo per cui più meta-vertici, ognuno dei quali rappresenta una rete neurale, possono essere organizzati in modo tale che più meta-vertici di supervisore possano, congiuntamente, supervisionare più meta-vertici di dipendenti?
  • Perché la retro-propagazione di un segnale di errore è l'unico equivalente non lineare del feedback negativo?
  • Non è possibile utilizzare la collaborazione tra meta-vertici anziché supervisione, in cui vi sono due fronti reciproci che rappresentano i controlli?
  • Poiché le reti neurali sono utilizzate principalmente per l'apprendimento di fenomeni non lineari, perché proibisce altri tipi di percorsi chiusi nella progettazione delle reti o della loro interconnessione?
  • C'è qualche motivo per cui il suono non può essere aggiunto all'immagine in modo che i video clip possano essere classificati automaticamente? In tal caso, una sceneggiatura è una possibile estrazione di funzionalità di un film e un'architettura contraddittoria può essere utilizzata per generare sceneggiature e produrre film senza il sistema di studio cinematografico? Come sarebbe quella topologia come un grafico diretto?
  • Sebbene le celle disposte ortogonalmente possano simulare una disposizione arbitraria di impaccamento regolare di vertici e bordi non ortogonali, è efficace farlo in visione artificiale dove l'inclinazione della videocamera diversa da più o meno di 90 gradi è comune?
  • È efficiente organizzare singole cellule in reti o reti di cellule nei sistemi di intelligenza artificiale ortogonalmente in sistemi di apprendimento che mirano alla comprensione e all'assemblaggio del linguaggio naturale o alla cognizione artificiale?

Appunti

  1. Le cellule artificiali nelle MLP usano funzioni di trasferimento aritmetico a virgola mobile o fissa piuttosto che trasmissioni di impulsi elettrochimici basate sull'ampiezza e sulla soglia basata sulla prossimità. Non sono simulazioni realistiche di neuroni, quindi chiamare i vertici neuroni sarebbe un termine improprio per questo tipo di analisi.

  2. La correlazione delle caratteristiche dell'immagine e i relativi cambiamenti tra i pixel nelle immediate vicinanze è molto più elevata di quella dei pixel distanti.


ho letto questa domanda una o due volte e devo ammettere che non ho idea di cosa venga chiesto. in particolare la "topologia" non fa riferimento a nessuno dei concetti citati. forse intendi "architettura"? ma neanche questo sembra avere un senso ...... penso che questa domanda rientri esattamente nella categoria "nemmeno".
kc sayz 'kc sayz'

Risposte:


0

La topologia è lo studio di forme geometriche differenziate per intersezione e biforcazione. Il termine è usato per gli aspetti grafici delle architetture di rete. È opportuno usarlo per considerare l'estensione dell'analogia della rete neurale, con la consapevolezza che le ANN non sono molto simili ai neuroni biologici nel modo in cui si attivano. Per questo motivo, è difficile limitare la discussione alle preoccupazioni topologiche quando si considera ciò che è in gran parte inesplorato.

Il paradigma del dipendente supervisore è ciò che usano le pile e le gerarchie lappone, mentre il paradigma del collaboratore è quello che usano le reti contraddittorie. Sebbene il feedback sia negativo, il modello generativo (G) e il modello discriminativo (D) sono effettivamente in collaborazione per raggiungere un obiettivo, poiché un avvocato dei diavoli viene usato nel discorso per convergere sulle verità. Certamente altri progetti in cui i vertici non sono neuroni artificiali ma sono in arrivo interi ANN o elementi della CNN.

I paradigmi insegnante-studente e supervisore-impiegato sono probabilmente solo due dei molti. Per simulare la plasticità neurale, i paradigmi di pianta da giardiniere, riparatore di elettrodomestici e ingegnere-prodotto hanno bisogno di essere investigati.

La propagazione retroattiva di un segnale di errore non è l'unico equivalente non lineare del feedback negativo. Anche la topologia circolare dei GAN ha un feedback negativo, come indicato nell'uso dell'analogia della striscia Möbius. Tuttavia, ci dovrebbe essere più pensiero in tal senso.

La collaborazione tra meta-vertici è interessante. La collaborazione deve essere di tipo pretendente avversario? Il feedback positivo può essere utile nelle topologie di intelligenza artificiale? I proprietari di fattorie e i camionisti di distribuzione di generi alimentari acquistano alimenti nei supermercati che si trovano alla fine di una catena di processi di cui il loro ruolo è solo una parte. Cicli più ampi nelle rappresentazioni grafiche dirette di topologie e progetti possono probabilmente utilizzare utilmente feedback positivi o negativi.

La produzione artificiale di film potrebbe derivare da ricerche come il lavoro di Cornell U su Generazione video da testo: Li, Min, Shen, Carlson e Carin .


0

Edge of Chaos and Machine Learning; e vantaggi nel processo decisionale


Risposta diretta alla tua domanda : -

Edge of Chaos


Spiegazione dei laici : -

( https://www.lucd.ai/post/the-edge-of-chaos# !)


Di cosa tratta questa risposta : -

The Edge of Chaos nella teoria del caos potrebbe essere un argomento importante di ricerca sull'intelligenza artificiale.

Qual è il limite del caos? Si ipotizza che questo campo esista in un'ampia varietà di sistemi. Ha molte applicazioni in tali campi. Questo campo è una zona di transizione tra l'interazione tra ordine e disordine.

Sono interessato all'intersezione tra intelligenza artificiale e teoria del caos. Il limite del caos funge da potenziale topologia che è in gran parte inesplorata nell'apprendimento automatico.

Questo è un campo ricco che offre molto potenziale. È, in gran parte, sconosciuto e sottovalutato.

Esplorerò i vantaggi dell'analisi di tale campo in questa risposta. I vantaggi si manifestano nel processo decisionale, ad esempio il modo ottimale di investire e gestire la forza lavoro in un'organizzazione.


Spiegazione tecnica : -

"Le matrici, i cubi, i livelli, le pile e le gerarchie sono ciò che potremmo definire con precisione topologie. Considerare la topologia in questo contesto la progettazione geometrica di livello superiore di un sistema di apprendimento." ~ Douglas Daseeco, Poster di apertura

Confrontalo con questo estratto dall'estratto della carta qui sotto: -

"... Attraverso un'analisi dinamica della stabilità su vari modelli di visione artificiale, troviamo prove dirette che si verificano prestazioni ottimali della rete neurale profonda vicino al punto di transizione che separa attrattori stabili e caotici. ..." Feng, Ling e Choy Heng Lai. - "Intelligence Machine ottimale vicino al limite del caos". arXiv prestampa arXiv: 1909.05176 (2019).

-

"Il limite del caos è uno spazio di transizione tra ordine e disordine che si ipotizza esista all'interno di un'ampia varietà di sistemi. Questa zona di transizione è una regione di instabilità limitata che genera una costante interazione dinamica tra ordine e disordine.

Sebbene l'idea del limite del caos sia astratta e non intuitiva, ha molte applicazioni in campi come l'ecologia, la gestione aziendale, la psicologia, le scienze politiche e altri settori della scienza sociale. I fisici hanno dimostrato che l'adattamento al limite del caos si verifica in quasi tutti i sistemi con feedback "contributori di Wikipedia". - "Edge of caos". Wikipedia, l'enciclopedia libera . Wikipedia, l'enciclopedia libera, 10 settembre 2019. Web. 22 settembre 2019.


I vantaggi di studiare un tale campo : -

"[...] Strategia, protocollo, team, dipartimenti, gerarchie. Tutto meticolosamente organizzato per prestazioni ottimali.

O almeno, è così che dovrebbe essere. Ma quando applichiamo l'obiettivo di un teorico della complessità al business che facciamo, vediamo che le cose sono piuttosto complesse. Non consideriamo più le organizzazioni come organizzazioni o reparti come reparti, ma come sistemi adattivi complessi, comprensibilmente utili nelle tre parti:

OCCUPAZIONE

Usare modelli mentali per prendere decisioni migliori sul lavoro La vita professionale è piena di scelte difficili. Sono pronto per questa promozione? Quale dei miei manager dovrei scegliere come mentore? Cosa dovrei mangiare a pranzo? Non esiste un metodo infallibile per intraprendere costantemente la migliore linea d'azione - anche il migliore di noi commette errori - ma, con gli strumenti giusti, è possibile massimizzare le possibilità di successo.

Innanzitutto, i dipendenti (in termini di complessità parlano: agenti eterogenei). Ogni dipendente ha regole decisionali diverse e in evoluzione che riflettono sia l'ambiente che tentano di anticipare il cambiamento in esso. In secondo luogo, i dipendenti che interagiscono tra loro e le strutture create da queste interazioni - gli scienziati chiamano questa emergenza. Infine, emerge la struttura generale che si comporta come un sistema di livello superiore con proprietà e caratteristiche distinte da quelle dei suoi agenti sottostanti. Quest'ultima parte è la ragione per cui spesso diciamo "il tutto è maggiore della somma delle sue parti".

Dato il desiderio di controllo da parte dei manager, la complessità è lungi dall'essere una realtà conveniente. Piuttosto che affrontare la brutale realtà del sistema che stanno lavorando per sostenere, i manager spesso lavorano in silos, creando modelli e meccanismi che impongono un rivestimento di certezza. In tal modo, aiutano se stessi e i loro colleghi a prendere decisioni con meno variabili. Il raggiungimento degli obiettivi stabiliti da questi modelli genera prove di successo, ma si tratta di un successo semplificato che potrebbe non essere nell'interesse del sistema nel suo insieme.

Ad esempio, porre una rigida priorità sulla massimizzazione dei rendimenti degli azionisti rende le cose chiare ai lavoratori: in caso di un compromesso difficile, l'opzione che si presta alla redditività immediata è l'opzione preferibile. Ma, naturalmente, siamo tutti consapevoli che la riduzione delle spese e degli investimenti per aumentare i margini a breve termine può essere dannosa per la salute a lungo termine di un'azienda. Solo abbracciando la complessità possiamo efficacemente bilanciare i valori e le priorità concorrenti (e gli effetti delle decisioni su tutti loro). [...] "- Fresno, Blanca González del." Ordine dal caos: come applicare la teoria della complessità al lavoro: BBVA. " NOVITÀ BBVA , BBVA, 4 dicembre 2017, < www.bbva.com/en/order-from-chaos-how-to-apply-complexity-theory-at-work/ >.


Ulteriori letture : -


Fonti e riferimenti : -


-1

Questo potrebbe essere fuori tema. In tal caso, eliminalo.

Nei circuiti elettronici abbiamo blocchi logici: generatori, trigger, celle di memoria, selettori, alus, fpus, bus e molti altri chip. E da questo abbiamo computer, e dal livello successivo abbiamo reti di computer ...

Per l'apprendimento automatico dobbiamo avere un'organizzazione simile delle cose, ma se abbiamo computer a 64 bit, le nostre reti neurali potrebbero avere input / output più complessi E più funzioni logiche di quelle definite in qualsiasi linguaggio di programmazione.

Quindi, per i bit di input X abbiamo gli stati X ^ (2 ^ 2) per un bit di output e 2 ^ X bit per la scelta di una funzione logica necessaria.

Quindi, dobbiamo costantemente studiare queste funzioni, mettendo in evidenza i necessari, come primi filtri a cielo aperto come per gli esempi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.