È saggio considerare non solo la correlazione dell'impegno delle risorse con il costo, ma anche il ritorno sul costo dell'impegno delle risorse. La sfida tipica è che tali rendimenti sono quasi sempre cumulativi o ritardati. Un caso di accumulo è quando la risorsa è la messa a punto continua o il miglioramento di un processo la cui assenza rallenta la generazione di entrate. Un caso di ritardo è quando le risorse di ricerca comportano costi senza impatto sulle entrate per un periodo di tempo, ma la generazione di entrate che inizia se la ricerca produce risultati produttivi può essere un fattore sostanziale al di sopra del costo totale dei risultati forniti.
Il motivo per cui i dati di spesa di per sé possono portare all'apprendimento disadattato della rete è perché una rete che è addestrata per ridurre, ad esempio, le spese di marketing li azzererà. Ciò di solito causerebbe una tendenza al ribasso delle vendite fino a quando il business non si chiuderà. Senza includere i ritorni nelle informazioni sulla formazione, non può verificarsi alcun apprendimento utile.
Un MLP di base (percettrone multistrato) non apprenderà le caratteristiche temporali dei dati, gli aspetti di accumulo e ritardo. Avrai bisogno di una rete stateful. Il tipo di rete di maggior successo per questo tipo di apprendimento al momento della stesura è il tipo di rete LSTM (memoria a breve termine) o una delle sue varianti derivate. I dati sui ricavi e sul saldo devono essere utilizzati insieme ai dati sulle spese per formare la rete al fine di prevedere i risultati aziendali per una determinata sequenza di impegni di risorse proposti (piano di bilancio completamente dettagliato).
La funzione di perdita deve bilanciare adeguatamente i termini di selezione con gli obiettivi finanziari a medio e lungo termine. La liquidità disponibile negativa dovrebbe produrre un forte aumento della funzione di perdita in modo tale da apprendere tale evitamento dei rischi di base per la reputazione e il costo del credito.
Quali colonne nei tuoi dati hanno forti correlazioni con il ritorno sull'investimento è difficile da determinare in anticipo. È possibile escludere immediatamente le colonne conformi a uno dei seguenti criteri.
- Sempre vuoto
- Altre costanti, quelle che hanno lo stesso valore per ogni riga
- Quelli che possono sempre essere derivati da altre colonne
I dati possono essere ridotti in altri modi
- Descrivere completamente i dati caratterizzando le tendenze in modo semplice
- Utilizzo degli indici per specificare stringhe lunghe con un'accuratezza del 100% assegnando un numero a ciascuna stringa
- Compressione
- Altrimenti ridurre la ridondanza nei dati
Gli RBM (macchine Boltzmann riservate) possono estrarre funzionalità dai dati e gli APC possono illuminare le colonne a basso contenuto di informazioni, ma il significato delle colonne in termini di correlazione con le entrate non verrà identificato utilizzando questi dispositivi nella loro forma di base.