Sono abbastanza nuovo per l'apprendimento profondo, ma penso di aver trovato la giusta situazione nel mondo reale per iniziare ad usarlo. Il problema è che ho usato tali algoritmi solo per prevedere i risultati. Per il mio nuovo progetto, ho bisogno di informazioni per alimentare una macchina per ottimizzare i risultati. Qualcuno potrebbe spiegare brevemente come dovrei procedere? Sono bloccato.
Ecco la situazione:
Ho una macchina che prende assi di legno con diversi gradi di legno disponibili per tutta la sua lunghezza e deve tagliarlo in blocchi forniti in una lista di taglio. Questa macchina sceglierà sempre il punteggio più alto che può ottenere da una determinata tavola. Il punteggio si ottiene moltiplicando l' area di ciascun blocco per il suo moltiplicatore . L'algoritmo che voglio costruire deve dare a quella macchina un moltiplicatore per ogni blocco elencato in una lista di taglio. Tutta la produzione fisica di questa macchina sarà immagazzinata da un robot sugli scaffali fino a quando non sarà necessaria. La macchina da taglio è autorizzata a declassare parti di una tavola se aiuta a raggiungere un punteggio più alto.
Il valore deve fungere da incentivo per la macchina a darmi il blocco di cui ho bisogno di più senza declassare troppo legno.
OBIETTIVI DI OTTIMIZZAZIONE
- Assicurati che ogni blocco sia disponibile nel momento in cui è necessario, ma non troppo presto senza motivo
- Declassare il minor spazio possibile di legno (alcune specie sono molto costose)
NODI DI INGRESSO
- Quantità di tempo prima che questo blocco sia necessario
- Grado di legno per questo blocco
- Quantità di questo blocco necessaria
- L'area del blocco (forse?)
RISPOSTE FORNITE ALL'ALGORITMO
- Tempo in anticipo che il blocco era pronto (deve essere il più basso possibile)
- Area del legno declassata * numero di voti saltati
DATI DI RITORNO PREVISTO
- Un moltiplicatore che darà a quel blocco un'ottima priorità rispetto agli altri
INFORMAZIONI CHE NON HO MAI POTREBBE RACCOLTO
- Rapporto medio di ogni grado per ogni specie di legno
Ciò che ho capito finora è che potrei aver bisogno che il mio feedback venga suddiviso in un solo valore per renderlo il nodo di output. Il problema è che non riesco a capire come realizzare questo algoritmo per determinare un moltiplicatore . Sbaglio nel cercare di risolvere questo problema attraverso l'apprendimento profondo?