Come filtrare i messaggi con emoji animati nell'oggetto in Gmail?


27

Stavo navigando nella mia cartella spam (cosa che faccio raramente, perché Gmail raramente ha falsi positivi) e ho notato qualcosa di interessante:

elenco di esempio di messaggi spam

Qualcosa come circa la metà dei messaggi ha almeno un'emoji animata nell'oggetto.

Nessuno dei miei amici avrebbe usato quella merda. Nessuna compagnia valida con cui farei affari lo farebbe mai.

Come posso creare un filtro per, forse, eliminare automaticamente i messaggi con emoji animati nell'oggetto?

Utilizzando jamesmstone 's indizio di seguito, ho provato una ricerca con subject:=?UTF-8?e subject:"=?UTF-8?"e diverse altre permutazioni, ma nessuno ha funzionato.

Ecco un esempio di intestazioni da una di queste pile fumanti:

Delivered-To: [redacted]@gmail.com
Received: by 10.107.28.200 with SMTP id c191csp1104992ioc;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
X-Received: by 10.107.38.5 with SMTP id m5mr15068933iom.15.1453691236564;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Return-Path: <VivaLoan@mythirdxyz.xyz>
Received: from mythirdxyz.xyz ([2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11])
        by mx.google.com with ESMTP id o10si8722554igw.41.2016.01.24.19.07.15
        for <[redacted]@gmail.com>;
        Sun, 24 Jan 2016 19:07:16 -0800 (PST)
Received-SPF: pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) client-ip=2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11;
Authentication-Results: mx.google.com;
       spf=pass (google.com: domain of VivaLoan@mythirdxyz.xyz designates 2a04:5b00:a2d0:3d74:37fd:ee71:efe6:6e11 as permitted sender) smtp.mailfrom=VivaLoan@mythirdxyz.xyz;
       dkim=pass header.i=@mythirdxyz.xyz;
       dmarc=pass (p=REJECT dis=NONE) header.from=mythirdxyz.xyz
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=mythirdxyz.xyz; 
 i=@mythirdxyz.xyz; q=dns/txt; s=default; t=1453691229; 
 bh=GuM9JCP4yh7WfVbRBortR7UAr6DAtlgy0oTCna0iWQk=; h=MIME-Version : 
 Content-Type : Content-Transfer-Encoding : To : From : Subject : Date : 
 Message-ID : From : Subject : Date; 
 b=e/zS14UB4o5MhYlfbpsy0h2G/oZyoC5H3ouyhNh13zcSHSNXzI6uvJpIy9a+za2ng26Xe2
 NfAI7nenAMCdHJSGF4yfmtTi3+XrR2MqQPHQ1fzTXGhRy/ktCj4tEqt7DhSxnRCqkYFUNaLA
 wh3FMLr6IxPi2Z7xUXm3JBffhDcSU=
MIME-Version: 1.0
Content-Type: text/html; charset="utf-8"
Content-Transfer-Encoding: base64
To: [redacted]@gmail.com
From: "APPROVAL DEPARTMENT" <VivaLoan@mythirdxyz.xyz>
Subject: =?utf-8?q?=F3=BE=93=A0_Personal_loan_as_soon_as_tomorrow_=F3=BE=93=A0?=
Date: Sun, 24 Jan 2016 19:07:09 -0800
Message-ID: <A112ED51-1674-4902-BF73-F2EBCBA42CAF@mythirdxyz.xyz>

3
Mi chiedo se lo sono goomoji...
jamesmstone,

@jamesmstone: mi aspetto che lo siano.
Ale

Risposte:


9

Risposta breve

Invece di utilizzare i filtri di Gmail che dipendono dalla funzione di ricerca di Gmail per cercare gli emoji codificati nei messaggi originali, crea uno script utilizzando il metodo GmailMessage :: getRawContent () di Google Apps Script per elaborare i messaggi.

Domande correlate

Di seguito sono riportati collegamenti a risposte a domande simili in questo sito, inclusi script che utilizzano il metodo indicato.


2
Vale la pena ricordare che uno script non può eliminare completamente un messaggio: il massimo che può fare è spostarlo nella cartella Cestino o Spam. E se tali messaggi vanno già allo spam, lo script ha pochi benefici.

@Minestrone: in realtà, è possibile eliminare completamente un messaggio usando uno script. Dovrebbe usare l'API di Gmail. Vedi developers.google.com/gmail/api/v1/reference/users/messages/… . Per utilizzare l'API di Gmail in Google Apps Script, vedi developers.google.com/apps-script/guides/services/advanced .
Rubén,

1
Non sono molto interessato a cancellare effettivamente il messaggio quanto a trovare un modo per filtrarli. Potrei semplicemente voler mettere un'etichetta per loro.
Ale

@Ale. L'ho assunto, quindi non ho menzionato l'uso dell'API GMAIL nel corpo della risposta. D'altra parte, per fortuna non ho ricevuto e-mail con emoji nell'oggetto.
Rubén,

4

Ho creato uno script di Google Apps per tali scopi.

È su Github: https://github.com/spamzero/spamzero

Ti consente di creare tutti i tipi di regole avanzate che puoi confrontare con la tua cartella dei messaggi di spam, quindi i messaggi che sono sicuramente spam verranno ripuliti automaticamente.


1
La tua risposta sarà migliore se includi una breve descrizione della sceneggiatura che evidenzi come aiuterà a gestire i messaggi con emoji animati nell'oggetto.
Rubén

4
Sono d'accordo con @ Rubén, più informazioni sono, meglio è. Dal momento che consente ai lettori di controllare la fattibilità delle risposte senza saltare troppi cerchi.
Michelfrancis Bustillos,

Grazie per questo script! A volte le soluzioni più utili sono quelle che riducono i fastidi quotidiani come lo spam animato. Suggerirei di aggiungere a Github README questo link per l' avvio rapido di Google Apps Script in modo che gli utenti che non hanno alcuna esperienza nell'uso degli script sappiano come abilitare l'API di Gmail e visualizzare i log.
dan

1

Questo non è esattamente ciò che stai chiedendo (filtrando gli emoji stessi anziché i messaggi con gli emoji) ma potresti trovare alcuni dei contenuti utili per creare un filtro messaggi migliore.

Esiste ora un codice utente open-source Greasemonkey / Tampermonkey / Violentmonkey per sbarazzarsi di quegli irritanti scarafaggi visivi (solo i personaggi, non i messaggi stessi):

Gmail Subject Line Emoji Roach Motel

Osservando la fonte di quella sceneggiatura , vedrai che ci sono due tipi generali di scarafaggi emoji che troverai nelle e-mail di marketer abusivi (oggi tra cui eBay e Amazon, purtroppo):

  • Scarafaggi basati su immagini HTML (compresi quelli orribili animati) aka goomoji

  • Scarafaggi Unicode: ci sono ancora molte emoji (e altre sequenze Unicode che generano immagini) che gli spammer e altri ex marketer stanno iniziando a utilizzare nelle righe dell'oggetto e-mail e che Gmail non converte in immagini HTML. In alcuni browser questi appaiono audaci e colorati, il che è quasi brutto come l'animazione. I browser potrebbero anche scegliere di animarli, ma non so se ce ne siano. Queste sequenze Unicode vengono visualizzate dal browser come testo Unicode, quindi l'aspetto esatto (colore o no, animato o no, ...) dipende dal sistema di rendering del testo utilizzato dal browser. L'aspetto di una determinata emoji Unicode dipende anche da eventuali selettori di variazione Unicode e modificatori di emojiche appare accanto ad esso nella sequenza di punti di codice Unicode. A differenza dello spam emoji basato su immagini, queste sequenze possono essere copiate e incollate dal browser e in altre app come testo Unicode.

Per quest'ultimo tipo, lo script utente include un'espressione regolare progettata per catturare le sequenze Unicode che potrebbero essere abusate dai professionisti del marketing. Il regex si presenta così in ES6 Javascript (lo script utente lo traduce in regex pre-ES6 ampiamente supportato utilizzando l'incredibile Transpiler ES6 Regex ):

var re = /(\p{Emoji_Modifier_Base}\p{Emoji_Modifier}?|\p{Emoji_Presentation}|\p{Emoji}\uFE0F|[\u{2100}-\u{2BFF}\u{E000}-\u{F8FF}\u{1D000}-\u{1F5FF}\u{1F650}-\u{1FA6F}\u{F0000}-\u{FFFFF}\u{100000}-\u{10FFFF}])\s*/gu

// which includes the Unicode Emoji pattern from
//   https://github.com/tc39/proposal-regexp-unicode-property-escapes
// plus also these blocks frequently used for spammy emojis
// (see https://en.wikipedia.org/wiki/Unicode_block ):
//   U+2100..U+2BFF     Arrows, Dingbats, Box Drawing, ...
//   U+E000..U+F8FF     Private Use Area (gmail generates them for some emoji)
//   U+1D000..U+1F5FF   Musical Symbols, Playing Cards (sigh), Pictographs, ...
//   U+1F650..U+1FA6F   Ornamental Dingbats, Transport and Map symbols, ...
//   U+F0000..U+FFFFF   Supplementary Private Use Area-A
//   U+100000..U+10FFFF Supplementary Private Use Area-B
// plus any space AFTER the discovered emoji spam
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.