Risposte:
Sembra che ci siano stati sicuramente progetti di ricerca che coinvolgono una qualche forma di estrazione del testo / recupero di informazioni / ecc. e siti StackExchange.
Alcuni esempi che sono stato in grado di trovare tramite google / google scholar (è improbabile che si trovino ovunque vicino a un elenco esaustivo):
Più in generale, i sistemi di risposta automatica alle domande sembrano essere ancora un'area di ricerca piuttosto attiva, non un problema banale / "risolto". StackExchange può essere una fonte di dati per tali sistemi, ma ci sono anche molte altre fonti di dati (Wikipedia, Quora, ecc.).
DuckDuckGo impara le risposte alle domande tecniche da StackExchange. Digita una domanda tecnica come "i progetti in corso utilizzano stackexchange" in DuckDuckGo e fornirà un riepilogo evidenziato della risposta sul lato destro. E la papera ha un'API aperta per molte (100) più fonti di risposta alle domande. Oppure puoi andare direttamente all'API stackexchange .
I progetti possono utilizzare i dati dall'API aperta di SE purché rispettino il loro TOU . Fondamentalmente assicurati solo che i tuoi utenti possano dire che i dati provengono da Stack Exchange. La licenza di copyright può anche limitare la tua capacità di modificare i contenuti del testo, ad esempio un riepilogo astratto appreso. Forse è per questo che Duck.com evidenzia solo le parole chiave.
La legge sui diritti dei dati è in evoluzione, soprattutto quando si tratta dei dati inviati a un sito e dei modelli di apprendimento automatico derivati da tali dati. Le nuove norme europee in materia di dati e privacy ti consentono di scaricare o eliminare tutti i dati che invii a un sito come lo scambio di stack.