Ho un corso di Machine Learning questo semestre e il professore ci ha chiesto di trovare un problema del mondo reale e risolverlo con uno dei metodi di machine learning introdotti in classe, come:
- Alberi decisionali
- Reti neurali artificiali
- Supportare macchine vettoriali
- Apprendimento basato sull'istanza ( kNN , LWL )
- Reti bayesiane
- Insegnamento rafforzativo
Sono uno dei fan di StackOverflow e StackExchange e so che i dump del database di questi siti Web sono forniti al pubblico perché sono fantastici! Spero di poter trovare una buona sfida di apprendimento automatico su questi database e risolverlo.
La mia idea
Mi è venuta in mente un'idea di prevedere i tag per le domande in base alle parole inserite nel corpo della domanda. Penso che la rete bayesiana sia lo strumento giusto per l'apprendimento dei tag per una domanda, ma necessita di ulteriori ricerche. Ad ogni modo, dopo la fase di apprendimento quando l'utente termina di inserire la domanda, è necessario suggerirgli alcuni tag.
Per favore dimmi :
Voglio porre alla comunità delle statistiche come persone esperte le domande ML due:
Pensi che il suggerimento del tag sia almeno un problema che ha qualche possibilità di risolvere? Hai qualche consiglio a riguardo? Sono un po 'preoccupato perché stackexchange non implementa ancora tale funzionalità.
Hai qualche altra idea migliore per il progetto ML basato sul database stackexchange? Trovo davvero difficile trovare qualcosa da imparare dai database di stackexchange.
Considerazione sugli errori del database: vorrei sottolineare che sebbene i database siano enormi e abbiano molti casi, non sono perfetti e sono privi di errori. Quello ovvio è l'età degli utenti che non è affidabile. Anche i tag selezionati per la domanda non sono corretti al 100%. Comunque, dovremmo considerare la percentuale di correttezza dei dati nella selezione di un problema.
Considerazione del problema stesso: il mio progetto non dovrebbe riguardare data-mining
o qualcosa del genere. Dovrebbe essere un'applicazione dei metodi ML nel mondo reale.