La struttura di questa domanda è la seguente: inizialmente fornisco il concetto di apprendimento d' insieme , poi fornisco un elenco di compiti di riconoscimento dei modelli , quindi fornisco esempi di algoritmi di apprendimento degli ensemble e, infine, introduco la mia domanda. Coloro che non hanno bisogno di tutte le informazioni supplementari potrebbero semplicemente guardare i titoli e andare direttamente alla mia domanda.
Che cos'è l'apprendimento d'insieme?
Secondo l' articolo di Wikipedia :
In statistica e apprendimento automatico, i metodi di ensemble utilizzano algoritmi di apprendimento multipli per ottenere prestazioni predittive migliori di quelle che si potrebbero ottenere da uno qualsiasi degli algoritmi di apprendimento costituente. A differenza di un insieme statistico nella meccanica statistica, che di solito è infinito, un insieme di apprendimento automatico si riferisce solo a un insieme finito di modelli alternativi concreti, ma in genere consente l'esistenza di una struttura molto più flessibile tra quelle alternative.
Esempi di attività di riconoscimento dei modelli:
- Riconoscimento ottico dei caratteri
- Riconoscimento di codici a barre
- Riconoscimento della targa
- Riconoscimento facciale
- Riconoscimento vocale
- Riconoscimento delle immagini
- Classificazione del documento
Esempi di algoritmi di apprendimento dell'ensemble:
I seguenti algoritmi di apprendimento dell'ensemble utilizzati per le attività di PR (secondo Wiki):
Algoritmi di apprendimento di ensemble (meta-algoritmi supervisionati per la combinazione di più algoritmi di apprendimento):
Boosting (unmeta-algoritmo diensemble di machine learningper ridurre principalmente ibias, e anche la varianza nell'apprendimentosupervisionatoe una famiglia di algoritmi di machine learning che convertono gli studenti deboli in studenti forti)
Aggregazione Bootstrap (" insaccamento ") (un meta-algoritmo di ensemble di apprendimento automatico progettato per migliorare la stabilità e l'accuratezza degli algoritmi di apprendimento automatico utilizzati nellaclassificazione statisticae nellaregressione).
Media dell'insieme (il processo di creazione di più modelli e la loro combinazione per produrre l'output desiderato, anziché creare un solo modello. Spesso un insieme di modelli si comporta meglio di qualsiasi singolo modello, perché i vari errori dei modelli "si estinguono". )
- Miscela di esperti, miscela gerarchica di esperti
Diverse implementazioni
- Insiemi di reti neurali (un insieme di modelli di reti neurali che prendono una decisione calcolando la media dei risultati dei singoli modelli).
- Foresta casuale (un metodo di apprendimento dell'ensemble per la classificazione, la regressione e altre attività, che opera costruendo una moltitudine dialberi decisionalial momento dell'allenamento e producendo la classe che è lamodalitàdelle classi (classificazione) o la previsione media (regressione) dell'individuo alberi).
- AdaBoost (l'output degli altri algoritmi di apprendimento ("studenti deboli") è combinato in una somma ponderata che rappresenta l'output finale del classificatore potenziato).
Inoltre:
- Metodi che utilizzano una rete neurale per combinare classificatori diversi
- Metodo delle aree di competenza
La mia domanda
Quale degli algoritmi di apprendimento dell'ensemble è considerato allo stato dell'arte al giorno d'oggi ed è effettivamente utilizzato nella pratica (per il rilevamento del volto, il riconoscimento delle targhe di immatricolazione dei veicoli, il riconoscimento ottico dei caratteri, ecc.) Da parte di imprese e organizzazioni? L'uso di algoritmi di apprendimento d'insieme dovrebbe aumentare l'accuratezza del riconoscimento e portare a una migliore efficienza computazionale. Ma le cose stanno così nella realtà?
Quale metodo di ensemble, potenzialmente, può mostrare una migliore accuratezza di classificazione e prestazioni nelle attività di riconoscimento del modello? Forse, alcuni dei metodi sono obsoleti ora o hanno dimostrato di essere inefficaci. È anche possibile che i metodi di ensemble tendano ora a non essere più utilizzati sulla base di alcuni nuovi algoritmi. Coloro che hanno esperienza nel settore o hanno conoscenze sufficienti in questo campo, potete aiutarmi a chiarire le questioni?