Qual è la differenza tra "apprendimento di trasferimento" e "adattamento del dominio"?


19

C'è qualche differenza tra "apprendimento del trasferimento" e "adattamento del dominio"?

Non conosco il contesto, ma la mia comprensione è che abbiamo un set di dati 1 e ci alleniamo su di esso, dopo di che abbiamo un altro set di dati 2 per il quale vogliamo adattare il nostro modello senza riqualificarlo da zero, per il quale "trasferire l'apprendimento" e l '"adattamento del dominio" aiuta a risolvere questo problema.

Secondo il campo delle reti neurali convoluzionali:

  • Per "apprendimento del trasferimento" intendo "fine-tuning" [1]

  • In questo caso [2] non è supervisionato, ma l '"adattamento del dominio" dovrebbe essere sempre non supervisionato?


3
Un sondaggio sull'apprendimento di trasferimento di Pan et. al, 2009 fornisce alcune informazioni. Classificano l'adattamento del dominio come un tipo di apprendimento di trasferimento.
kedarps,

Risposte:


13

Sembra che ci sia un certo disaccordo tra i ricercatori su quale sia la differenza tra "apprendimento di trasferimento" e "adattamento del dominio".

Da {0}:

La nozione di adattamento del dominio è strettamente correlata all'apprendimento del trasferimento. L'apprendimento del trasferimento è un termine generale che si riferisce a una classe di problemi di apprendimento automatico che coinvolgono compiti o domini diversi. In letteratura non esiste ancora una definizione standard di apprendimento del trasferimento. In alcuni documenti è intercambiabile con l'adattamento del dominio.

Da {1}:

inserisci qui la descrizione dell'immagine


Riferimenti:


10

Dall'articolo di Hal Daume [1]:

L'impostazione di classificazione standard è una distribuzione di input p (X) e una distribuzione di etichette p (Y | X). Adattamento del dominio: quando p (X) cambia tra allenamento e test. Trasferimento di apprendimento: quando p (Y | X) cambia tra allenamento e test.

In altre parole, in DA la distribuzione di input cambia ma le etichette rimangono invariate; in TL, le distribuzioni di input rimangono invariate, ma le etichette cambiano.

  1. https://nlpers.blogspot.com/2007/11/domain-adaptation-vs-transfer-learning.html ( mirror )

Benvenuto in Cross Validated ! Per favore, prenditi un momento per vedere il nostro tour . Si preferisce che le risposte siano autosufficienti con citazioni appropriate. Se dovessi utilizzare le informazioni del tuo link per fornire una risposta ragionevole alla domanda con il link per ulteriori letture, questa sarebbe una risposta molto migliorata.
Tavrock,

1
Non credo a questa spiegazione. Non credo HAL qui. E se entrambip(Y|X) e p(X)cambiare allo stesso tempo?
cavernicolo,

Sono d'accordo con @caveman. Per molti scenari di apprendimento del trasferimento è il caso.
pir

2

In tutta la letteratura sull'apprendimento di trasferimento, vi è una serie di incoerenze terminologiche. Frasi come l'apprendimento del trasferimento e l'adattamento del dominio vengono utilizzate per fare riferimento a processi simili. L'adattamento del dominio è il processo di adattamento di uno o più domini di origine per i mezzi di trasferimento di informazioni per migliorare le prestazioni di uno studente target. Il processo di adattamento del dominio tenta di modificare un dominio di origine nel tentativo di avvicinare la distribuzione della fonte a quella della destinazione. Nell'impostazione Adattamento dominio i domini di origine e di destinazione hanno distribuzioni marginali diverse p (X). Secondo il sondaggio di Pan, Transfer Learning è un termine più ampio che può anche includere il caso in cui vi è una differenza nelle distribuzioni condizionali p (Y | X) dei domini di origine e di destinazione. In contrasto,

  1. https://nlpers.blogspot.com/2007/11/domain-adaptation-vs-transfer-learning.html

Sarebbe possibile aggiungere una citazione per "Sondaggio di Pan"? Penso che renderebbe questa risposta più utile per i futuri lettori.
Silverfish,

Pan, Sinno Jialin e Qiang Yang. "Un sondaggio sull'apprendimento di trasferimento." Transazioni IEEE su conoscenza e ingegneria dei dati 22, n. 10 (2010): 1345-1359. scholar.google.com/… ; citeseerx.ist.psu.edu/viewdoc/…
Christos Karatsalos


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.