Dati sul sentiment per Emoji


12

Per la sperimentazione, vorremmo usare l' emoji incorporato in molti tweet come dati di verità / allenamento di base per una semplice analisi quantitativa del senitment. I tweet di solito sono troppo destrutturati per far funzionare bene la PNL.

Ad ogni modo, ci sono 722 Emoji in Unicode 6.0 e probabilmente altri 250 verranno aggiunti in Unicode 7.0.

Esiste un database (come ad esempio SentiWordNet) che contiene annotazioni di sentimenti per loro?

(Nota che SentiWordNet tiene conto anche di significati ambigui . Considera ad esempio divertente , che non è solo positivo: "questo ha un sapore divertente" probabilmente non è positivo ... lo stesso vale ;-)per esempio. Ma non penso che sia più difficile per Emoji di quanto non lo sia per le parole normali ...)

Inoltre, se hai esperienza con il loro utilizzo per l'analisi del sentimento, sarei interessato a sentirlo.


Non credere che qualcosa del genere esista attualmente, ma mi piacerebbe se mettessi insieme qualcosa per questo!
indico,

Erich Schubert, sto cercando la stessa identica cosa! Hai avuto qualche possibilità di trovare una risorsa utile per questo?
Saeed Mehrabi,

Risposte:


4

Un totale di 972 emoji non è poi così grande da non essere in grado di etichettarle manualmente, ma dubito che funzioneranno come una buona verità di base. Fonti come Twitter sono piene di ironia, sarcasmo e altre impostazioni complicate in cui simboli emotivi (come emoji o emoticon) significano qualcosa di diverso dalla normale interpretazione. Ad esempio, qualcuno può scrivere "xxx imbrogliato i propri clienti, e ora vengono ingannati da soli! Ah ah ah!: D". Questo è sicuramente un commento negativo, ma l'autore è felice di vedere la compagnia xxx nei guai e quindi aggiunge un'emoticon positiva. Questi casi non sono così frequenti, ma sicuramente non adatti alla verità di base.

L'approccio molto più comune è quello di utilizzare l'emoticon come seme per la raccolta di set di dati reali . Ad esempio, in questo articolo gli autori usano emoticon e tag hash emotivi per afferrare il lessico di parole utili per un'ulteriore classificazione.


1
In realtà non sono d'accordo. Dal momento che all'autore piace che siano nei guai, è un sentimento positivo lì. È un commento negativo sull'azienda, ma comunque un sentimento positivo dell'autore. In questo scenario più semplice (non sto dicendo che questo è l'obiettivo completo), prevedere quali emoji un utente aggiungerebbe al suo post mi sembra un compito ragionevole. In effetti puoi costruire molti casi in cui l'emoji sarà essenziale .. Considera "Got f_cked :-)" invece di "Got f_cked. :-("
Erich Schubert,

Nel caso in cui provi a stimare l'emozione della persona in contrapposizione all'atteggiamento della persona verso un soggetto, allora sì, questo esempio non funziona. Ma ce ne sono molti altri. Il sarcasmo è un caso comune. Considera la frase "oh sì, sei un vero" maestro ";)". L'essere umano può catturare il contesto negativo, ma l'emoticon positiva indicherà un'emozione positiva. Ma non ce l'ho proprio: vuoi estrarre informazioni soggettive dai tweet o semplicemente prevedere possibili emoji? Anche se sembrano simili, il secondo compito non riguarda in realtà l'analisi dei sentimenti. Almeno non direttamente.
amico

L'emoticon "occhiolino" di solito non è considerato "positivo", ma "ironico" ... ecco perché ha senso un buon dizionario come SentiWordNet. Se cerchi divertente in SentiWordNet, ha anche più di un significato! sentiwordnet.isti.cnr.it/search.php?q=funny (Quindi non è banale annotarli manualmente, perché non è semplice come positivo / negativo; ma dovresti fare la solita convalida del contratto di interazione ecc.)
Erich Schubert,

Ora vedo la tua idea. Ma non penso davvero che funzionerà, solo perché (la maggior parte) degli emoji non mi sembra un buon predittore e tu non vuoi esplicitamente usare altre funzionalità. Comunque, questa è solo un'opinione basata sulla mia esperienza, solo i dati possono dare risposte reali. In bocca al lupo!
amico

Chi ha detto che non voglio usare altre funzionalità? Ma per questi ho visto dei database ...
Erich Schubert,

0

Ho trovato utile questo repository Github (un buon inizio): https://github.com/wooorm/emoji-emotion Elenco di emoji classificati per valenza con un numero intero compreso tra meno cinque (negativo) e più cinque (positivo).

Vedi l'elenco di emoji Unicode supportati: https://github.com/wooorm/emoji-emotion/blob/master/Support.md

Si noti che alcune emoji ricevono polarità probabilmente confuse, come stuck_out_tongue_closed_eyes (0), a causa dell'utilizzo sia per le emozioni positive che per quelle negative.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.