Sto sviluppando un chatbot basato sulla voce che può chiamare una persona e conversare. Attualmente, il chatbot utilizza il microfono e l'altoparlante del mio PC per l'audio in ingresso e in uscita. Sto cercando di integrarlo sulla rete mobile in modo da sostituire il microfono e l'altoparlante del mio PC con il cellulare. Vedi diagramma a blocchi nel link per la comprensione
stesso schema a blocchi ma nuvola diversa
Sto prendendo input dal microfono e lo sto dando a un convertitore da parlato a testo (S2TC) e la risposta data da chatbot dandogli un convertitore da testo a parlato (T2S).
import speech_recognition as sr
from speechtotext import convert_speech_to_text
r = sr.Recognizer()
with sr.Microphone() as source:
# in_audio is the mic input
in_audio = r.listen(source)
# bot give response based on input audio
bot_response = chatbot(convert_speech_to_text(in_audio))
out_audio = convert_text_to_speech(bot_response)
Ora sto cercando di utilizzare l'asterisco per connettermi alla rete e integrare mobile e il mio chatbot. Per questo, ho bisogno che tutto ciò che viene detto in mobile sia ricevuto come 'in_audio' e 'out_audio' debba essere inviato sulla rete.
Qui il bot avvia la chiamata, ho appena ricevuto un link per effettuare una chiamata , ma come posso ricevere o acquisire in_audio sulla rete per inviarlo al mio programma o ai miei convertitori e inviare out_audio a un utente. Ci sono funzioni di asterisco per farlo? Se non è possibile configurare l'asterisco, è possibile integrare la rete mobile con i robot vocali?
Sto costruendo l'applicazione usando Python e il convertitore da bing speech a text in Windows.
Nota: sono un nuovo asterisco.