In realtà mi sono imbattuto in questa domanda perché stavo cercando se questo è già stato fatto. L'unica cosa che ho ancora trovato è l'app mycarmakesnoise, ma dovrai confrontare i suoni da solo. Non sono un meccanico, quindi non so molto sui suoni di un difetto in una macchina.
Sto comunque iniziando a conoscere l'apprendimento profondo. A me sembra totalmente possibile usare lo spettrogramma di una registrazione audio di un difetto per identificare i problemi usando una rete neurale convoluzionale. Forse anche meglio degli umani, poiché le immagini possono già essere classificate in modo più accurato da un computer rispetto a un essere umano (~ 94% per gli umani contro ~ 95% per i computer). Tuttavia, ci sono grandi problemi da superare.
Prima di tutto, hai bisogno di un set di dati molto grande. Ciò significa raccogliere (almeno) centinaia di registrazioni audio dello stesso difetto nello stesso veicolo. Migliaia di registrazioni sarebbero ancora migliori (set di dati più grande = risultati migliori). Diciamo che vogliamo identificare dieci diversi difetti e ci sono (ipotesi totali) 300 tipi di auto. Avresti bisogno di 300 * 10 * 100 = 300.000 registrazioni per soli dieci difetti. Inoltre, non è possibile utilizzare più volte la stessa macchina. Ciò significa che per ottenere i migliori risultati avrai bisogno di 100 auto dello stesso tipo per difetto. Riunire queste registrazioni sarebbe un'operazione massiccia. Un modo per contrastare questo problema sarebbe quello di iniziare con una marca e un tipo di auto, immagino.
Il prossimo problema è la differenza di suono per tipo di auto con lo stesso difetto. Una Volvo con freni rotti suonerà diversa da una Ford con lo stesso problema. Questo problema può probabilmente essere superato avendo un set di dati davvero grandi, come accennato in precedenza.
Inoltre, il rumore di fondo sarà sempre diverso. Una persona potrebbe essere seduta in una vera macchina silenziosa, ascoltando solo i suoi pensieri. L'altra persona farà esplodere il metallo in un'auto di merda con roba scricchiolante e roba nel bagagliaio che fa molto rumore. La stessa cosa conta qui. È necessario un set di dati di grandi dimensioni, quindi il rumore di fondo può essere il più casuale possibile.
L'ultimo problema che mi viene in mente ora è il potere computazionale necessario. Le reti neurali devono essere addestrate utilizzando il set di big data che abbiamo raccolto. Questo richiede molta potenza computazionale. Senza l'accesso a un supercomputer o almeno a un vero buon videocard, la formazione richiederebbe giorni o settimane.
In breve: Sì, probabilmente è possibile rilevare difetti nelle auto usando il suono che produce, ma probabilmente è davvero difficile da fare.
[modifica]
Un'opzione potrebbe essere quella di formare una rete neurale per marca e modello di auto, ma comunque. Posso immaginare ad esempio che una rottura di una parte possa produrre suoni molto diversi a seconda di dove si è rotta. Ancora una volta, non sono un meccanico, quindi potrei essere pieno di merda quando si tratta di automobili.
Non credo che uno strumento generico di rilevamento dei problemi sia quasi impossibile. Penso che sia molto plausibile che uno strumento come questo possa essere costruito utilizzando una rete neurale. Raccogliere abbastanza dati audio per addestrare la rete sarebbe un lavoro infernale.
Inoltre, se stiamo lavorando con auto più recenti, possiamo aggiungere tutti i tipi di informazioni dal sistema OBD ai tensori di input della rete neurale. Queste informazioni extra potrebbero essere molto utili per la rete neurale per capire cosa sta succedendo.