Quali sono gli ultimi metodi per addestrare un bot di chat?


11

Vorrei addestrare un bot che utilizza l'immissione di testo, memorizza alcune categorie e risponde alle domande di conseguenza. Oltre alla versione 2.0, voglio che anche il bot risponda agli input vocali. Quali sono gli ultimi algoritmi di machine learning / AI disponibili per lo stesso? Per favore mi faccia sapere.


controlla reti di memoria dinamica-neurale
riemann77

Prendi in considerazione l'utilizzo della mappatura matematica-matematica .
Sergei,

Risposte:


1

La tua domanda è incredibilmente ampia - quindi in risposta, due ampi quadri che ti incoraggio a guardare sono:

  1. Per lo sviluppo di conversazioni chatbot all'avanguardia, http://rasa.ai è un framework open source più adattabile rispetto ai più tradizionali sistemi basati su regole
  2. Per il riconoscimento vocale consulta https://discourse.mozilla.org/c/deep-speech che è anche open source.

0

Se il tuo bot "ricorda" alcune categorie e poi risponde alle domande, allora è abbastanza inutile nello scenario attuale. perché in tal caso si comporta in modo molto scarso su un set di dati diverso (set di test). nella terminologia statistica si chiama "overfitting". e arrivando a rispondere alle domande, non esiste una regola empirica per definire algoritmi "all'avanguardia". sebbene sia possibile controllare alcuni modelli che hanno funzionato bene su babi o set di dati simili come le reti di memoria dinamica o modelli seQ2seQ. per avere un'idea di base di questo campo, ti suggerirei di imparare un gergo di apprendimento automatico di base e poi passare a un corso di elaborazione del linguaggio avanzato-naturale (Stanford offre CS224N).


0

AbuShawar e Atwell dichiarano:

Un chatbot è un agente conversazionale che interagisce con gli utenti a turno usando il linguaggio naturale. Diversi chatbot o sistemi di dialogo uomo-computer sono stati sviluppati utilizzando la comunicazione vocale o testuale e sono stati applicati in diversi settori come: ricerca linguistica, educazione linguistica, servizio clienti, guida del sito Web e per divertimento.

I loro e altri documenti trasmettono alcuni dei molti approcci contemporanei alla formazione di chatbot al momento della stesura di questo articolo.

Estrazione automatica dei dati di allenamento di Chatbot da Natural Dialogue Corpora , Bayan AbuShawar, Eric Atwell, 2016

Tuttavia, la maggior parte dei chatbot è limitata alla conoscenza che è manualmente nei loro file e ad un linguaggio naturale specifico che è scritto o parlato. Questo documento presenta il programma che abbiamo sviluppato per convertire un testo leggibile dalla macchina (corpus) in un formato chatbot specifico, che viene quindi utilizzato per riqualificare un chatbot e generare una chat più vicina al linguaggio umano. Furono usati diversi corpora: corpora dialoghi come il British National Corpus of English (BNC); il libro sacro dell'Islam Corano che è un corpus monologo in cui il verso e il verso successivo sono rivolti; e le FAQ in cui domande e risposte sono una coppia di turni. L'obiettivo principale di questo processo di automazione è la capacità di generare diversi prototipi di chatbot che parlavano lingue diverse in base al corpus.

Selezione dell'azione Chatbot consapevole del contesto e dell'incertezza tramite l'apprendimento del rinforzo ausiliario con parametri , Chuandong Yin, Rui Zhang, Jianzhong Qi, Yu Sun e Tenglun Tan, 2018

Proponiamo un chatbot consapevole dell'incertezza del contesto e un modello di apprendimento di rinforzo (RL) per addestrare il chatbot. Il modello proposto è denominato Parameterized Ausiliare Asynchronous Advantage Actor Critic (PA4C). Utilizziamo un simulatore utente per simulare l'incertezza della fiducia degli utenti in un contesto di conversazione. Rispetto agli approcci ingenui basati su regole, il nostro chatbot addestrato tramite il modello PA4C evita la selezione delle azioni fatte a mano ed è più robusto per la varianza dell'espressione dell'utente. Il modello PA4C ottimizza i modelli RL convenzionali con la parametrizzazione dell'azione e le attività ausiliarie per l'addestramento del chatbot, che affrontano i problemi di un ampio spazio d'azione e di stati a ricompensa zero. Valutiamo il modello PA4C durante l'addestramento di un chatbot per le attività di creazione di eventi di calendario.

Formazione sul sistema di apprendimento supervisionato tramite Chatbot Interaction , Pubblicazione della domanda di brevetto degli Stati Uniti 0034828 A1, International Business Machines Corporation, Armonk, NY, USA, 2019

Un metodo implementato dal computer che comprende la ricezione e l'analisi di un punto dati per determinare i parametri del punto dati, generare un ticket di avviso basato sull'analisi del punto dati, comunicando, tramite un chatbot, almeno alcune informazioni contenute nel ticket di avviso a uno o più utenti e categorizzare, tramite il chatbot, il punto dati che ha generato il ticket di avviso in base al comportamento di un dispositivo che ha generato il punto dati. Jonathan A. Cagadas, Alexander D. Lewitt, Simon D. Mikulcik, Karan Shukla, Leigh A. Williamson

Formazione in due passaggi e codifica-decodifica mista per l'implementazione di un chatbot generativo con un corpus di piccolo dialogo , Jintae Kim, Hyeon-Gu Lee, Harksoo Kim, Yeonsoo Lee, Young-Gil Kim, 2016

I modelli generativi di chatbot basati su reti da sequenza a sequenza possono generare interazioni di conversazione naturali se un enorme corpus di dialoghi viene utilizzato come dati di allenamento. Tuttavia, ad eccezione di poche lingue come l'inglese e il cinese, rimane difficile raccogliere un vasto corpus di dialoghi. Per risolvere questo problema, proponiamo un modello di chatbot usando una combinazione di parole e sillabe come unità di codifica-decodifica. Inoltre, proponiamo un metodo di formazione in due fasi, che prevede la pre-formazione mediante un corpus non dialogico di grandi dimensioni e la riqualificazione mediante un corpus di dialoghi di piccole dimensioni. Nei nostri esperimenti, le unità di miscelazione hanno dimostrato di aiutare a ridurre i problemi fuori dal vocabolario (OOV). Inoltre, il metodo di allenamento in due fasi è stato efficace nel ridurre gli errori grammaticali e semantici nelle risposte quando il chatbot è stato addestrato utilizzando un piccolo corpus dialogico (533,

Selezione dei dati ispirata alla sottomodularità per l'addestramento Chatbot orientato all'obiettivo basato su frasi incorporate , Mladen Dimovski, Claudiu Musat, Vladimir Ilievski, Andreea Hossmann, Michael Baeriswyl, 2018

I sistemi di comprensione del linguaggio parlato (SLU), come chatbot orientati agli obiettivi o assistenti personali, si basano su un modulo iniziale di comprensione del linguaggio naturale (NLU) per determinare l'intento ed estrarre le informazioni pertinenti dalle query degli utenti che prendono come input. I sistemi SLU di solito aiutano gli utenti a risolvere i problemi in domini relativamente stretti e richiedono una grande quantità di dati di addestramento all'interno del dominio. Ciò porta a significativi problemi di disponibilità dei dati che inibiscono lo sviluppo di sistemi di successo. Per alleviare questo problema, proponiamo una tecnica di selezione dei dati nel regime a basso dato che ci consente di allenarci con meno frasi etichettate, riducendo così i costi di etichettatura. Proponiamo una funzione di classificazione dei dati ispirata alla sottomodularità, il guadagno marginale rapporto-penalità, per selezionare i punti dati da etichettare in base solo alle informazioni estratte dallo spazio di incorporamento testuale. Mostriamo che le distanze nello spazio di incorporamento sono una fonte valida di informazioni che possono essere utilizzate per la selezione dei dati. Il nostro metodo supera due note tecniche di apprendimento attivo e consente una formazione economica dell'unità NLU. Inoltre, la nostra tecnica di selezione proposta non ha bisogno di riqualificare il modello tra le fasi di selezione, rendendolo anche efficiente in termini di tempo.


-1

Puoi lavorare con le reti neurali ricorrenti con LSTM o GRU come celle di memoria e incorporamenti di parole come Word2vec. La ricerca del raggio e i modelli di attenzione possono anche essere utilizzati con gli RNN per maggiore robustezza e minore distorsione. Ma i risultati di questi sono apprezzabili fino a un certo punto solo perché la ricerca in questo campo è ancora calda e molte cose da svelare.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.