Ispirato da questa domanda , mi chiedo se sia stato fatto qualche lavoro su modelli di argomenti per grandi raccolte di testi estremamente brevi. La mia intuizione è che Twitter dovrebbe essere un'ispirazione naturale per tali modelli. Tuttavia, da una sperimentazione limitata, sembra che i modelli di argomenti standard (LDA, ecc.) Funzionino piuttosto male su questo tipo di dati.
Qualcuno là fuori conosce qualche lavoro che è stato fatto in questo settore? Questo articolo parla dell'applicazione di LDA a Twitter, ma sono davvero interessato a sapere se ci sono altri algoritmi che funzionano meglio nel contesto dei documenti brevi.