BETA 2099.3 - Spam, riconoscimento ed eliminazione (2/2)

Una piccola premessa
Come riconoscere un messaggio di spam da uno di informazione commerciale? Semplice: se non l'avete richiesto espressamente è spam. E non pensate di cavarvela con l'osservazione che "può sempre tornare utile ricevere informazioni commerciali su prodotti interessanti". Se sono veramente interessanti lo potete sempre sapere, con maggiore precisione, dai media come le riviste specializzate, i giornali, leggere le recensioni degli addetti ai lavori, sentire i consigli degli amici, ecc. Se siete tra coloro che si ritengono capaci di discernere una proposta commerciale interessante da un ladrocinio, aspettate di ricevere 100 "segnalazioni di prodotti interessanti" al giorno per iniziare ad avere una visione più ampia della questione.

L'uso dei filtri
   La prima cosa da fare è attivare i filtri della posta elettronica. Se sono filtri che agiscono sul server, è ovviamente molto più utile (ad esempio IMAP4 o qualsiasi protocollo di posta remota). Ma anche se agiscono quando la posta è stata già scaricata vanno bene. L'importante è che siano composti con cura e che, soprattutto, rendano verificabili (e annullabili) le cancellature. Non c'è cosa peggiore che cancellare un messaggio scambiato per spam e poi non poterlo riprendere. Molti software hanno anche la funzione di log, se ritenete opportuno avere la massima sicurezza e controllo, abilitate anche essa.
   Dei filtri di cui parlerò nel seguito dell'articolo intendo un numero definito a piacere a seconda delle esigenze e del numero di spam che si riceve (o si vuole controllare). Se volete fare un solo mega-filtro contenente tutte le metodologie probabilmente vi illudete. Ma anche fare centinaia di filtri uno per ogni spammatore è una strada poco consigliabile. L'ideale sarebbe probabilmente raggruppare i filtri a seconda magari della provenienza, o piuttosto delle categorie "merceologiche" (hardware, sesso, scemenze, catene di Sant'Antonio, ecc.), o delle proprie preferenze. Sulle varie metodologie di filtraggio offerte dai programmi di posta non c'è da soffermarsi. Ognuno avrà scelto quella più confacente alle proprie esigenze.
   Sulle strategie di smistamento ci sono due grandi categorie molto semplici. La prima strategia prevede che tutti i messaggi siano buoni tranne quelli contrassegnati come spam, mentre la seconda tratta tutti i messaggi come spam tranne quelli che vengono riconosciuti come buoni. Ogni strategia presenta vantaggi e svantaggi e sta a voi scegliere a quale affidarsi, sulla base di prove personali o esigenze specifiche. L'importante è solo che le possibilità di configurazione e controllo siano estese. Programmi completi in tal senso sono i diffusissimi Netscape Mail (4.5 consigliato), Qualcomm Eudora, Microsoft Outlook, XFMail, Pegasus, ed altri che sicuramente mi sfuggono...
   Supporrò, infine, che sappiate regolare finemente il vostro programma di email, altrimenti immagino che non stareste leggendo neanche questo articolo. Indicherò d'ora in poi un filtro "generico", avendo definito questo livello di astrazione dalle singole esigenze ed installazioni.

Tipi di spam e metodi di cancellazione

Le ripetizioni
Quelli particolarmente fastidiosi sono quelli che "ripetono", in qualche modo, il loro messaggio-spam diverse volte. Che alla fine, ovviamente, diventano centinaia e poi migliaia. Con loro la vita è facile, in quanto basta beccarli due volte che avrete capito che vi capiterà una terza, e così via, cioè che si è sulla loro "lista email". In tal caso si estrae una parola chiave dal messaggio e la si pone nel nostro filtro. La scelta deve cadere su una parola che si suppone ripetuta, altrimenti è inutile: ad esempio il nome di dominio del mittente.

Nell'esempio sopra il nome di dominio del mittente è segnalato in rosso, vicino alla freccia. Ovviamente, anche se questo non dovesse esistere in Internet (metodo sovente utilizzato per "coprirsi" con un dominio quando se ne appartiene ad un altro —vedi nei riferimenti "Come rilevare lo spammatore nelle intestazioni") a noi interessa la ripetizione, che è il dato di collimazione. Non bisogna prendere il nome di dominio del destinatario, che in generale è fittizio oppure è lo stesso del mittente. Se invece c'è il nostro indirizzo bisogna porre attenzione ad un possibile messaggio non spam. Una eccezione da inserire nel filtro, quindi, potrebbe essere per i messaggi spam che riportino un nostro indirizzo email come destinatario. Non illudiamoci troppo, comunque: gli spammatori lo sanno e mettono il vostro indirizzo email nei loro messaggi, contando sulla vostra attenzione verso di essi.
L'esempio ci fa anche soffermare su un altro aspetto dello spam: anche se vi è riportata nei messaggi la procedura di rimozione dalla lista, non dovrete usare mai questa opzione. Un metodo diffuso presso gli spammatori e le società che stilano le liste email, infatti, è di eliminare i messaggi con errori e mantenere invece in lista quelli che hanno risposto. Ci sono poi quelli che rendono "impossibile" o non funzionante la deregistrazione (più o meno volontariamente). In entrambi i casi rispondendo, o utilizzando una form di rimozione con i vostri dati, non fareste altro che "confermare" la vostra esistenza in rete e perpetuare lo spam sull'indirizzo con cui rispondete. Forse sobbalzerete nel sapere che vengono vendute addirittura le liste di rimozione, cioè proprio le liste di quelle persone che hanno richiesto di essere rimossi dalle liste stesse. Andiamo avanti...

Le parole chiave
Un altro caso di semplificazione della vita di noi utenti è dato dalle parole chiave. Molti spammatori, in grado di utilizzare quei micidiali programmi che inviano email broadcast a centinaia di migliaia di indirizzi (vedi oltre), hanno l'avvertenza (non volontaria, in realtà lo scopo è di attrarre l'attenzione...) di inserire una o più parole chiave nell'oggetto dei messaggi. Altri ancora premettono addirittura delle parole chiave specifiche, spesso indicanti la categoria dello spam, come [ADV]. Non so se è la voglia di non creare troppo disgusto nei loro confronti o qualche rimasuglio di coscienza, ma questo ci permette di eliminare una buona parte di spam.
Ecco una lista (senz'altro incompleta) di alcune parole chiave (keyword) molto usate nello spam. Per alcune parole, vale l'avvertenza di controllare possibili confusioni con oggetti (e intenzioni) molto diversi. Ad esempio per la prima della lista (ADV che sta per Advertising, pubblicità in inglese), potrebbe trattarsi di qualcuno che vuole investire sul vostro sito e non di una richiesta di soldi!

Nella lista le parole sono tutte, ovviamente, al singolare. E, altrettanto ovviamente, la categorizzazione che ho fatto è solamente indicativa. Potrete trovare benissimo "hot", ad esempio, in messaggi di richiesta soldi oppure "free" per i siti porno.

Indirizzi numerici
Vi sono messaggi di spam che sfuggono a queste regole e sono difficilmente riconoscibili. Tra questi, vanno sicuramente annoverati coloro i quali utilizzano indirizzi email numerici o con numeri.

In questo caso ci sono due vie. O estrarre l'indirizzo del mittente dal nome di uno dei servizi di free mail, che sono sempre utilizzati per questi messaggi, oppure estendere la ricerca al corpo del messaggio. Nel qual caso si ritorna al punto precedente, con le parole chiave. Se si preferisce "segnare" il nome del provider di free mail, bisogna porre attenzione a qualche amico o conoscente che usi questi indirizzi, e regolare il filtro di conseguenza. Alcuni nomi di dominio, per la maggior parte corrispondenti a provider di posta elettronica "free" - molto utilizzati per lo spam, sono:

Le altre tipologie
Per finire, vi sono messaggi spam che proprio non si possono riconoscere a priori. A meno che non siano...particolarmente grandi. Ebbene si, come metodo "ultima spiaggia" vi è proprio il più semplice da configurare: indicare al programma di posta una dimensione massima in Kbyte oltre la quale iniziare a ...preoccuparsi. In genere questa dimensione si aggira sui 15-20 Kb. Se avete incrociato due filtri di "indirizzo sconosciuto" e "dimensione massima" potete dormire sonni più tranquilli. E...come dite? Vi perdete l'ultimo interessantissimo pupazzetto elettronico inviatovi dal vostro lontano amico in USA che ha appena scoperto l'email (ma non la netiquette)... Dovreste esserne felici!
Inoltre, i programmi più avanzati discernono un file allegato di grosse dimensioni dal messaggio vero e proprio, rifiutando solo quest'ultimo se è di dimensioni generose (vedi esempio di seguito). Infatti è in genere solo il secondo caso che rappresenta spam: gli spammatori scrivono file di testo enormi, a volte superano i 40 Kb. Mentre il primo caso è il vostro amico dagli USA. :-)

Un altro metodo "ultima spiaggia" è discriminare il programma di posta del mittente. Gli spammatori utilizzano a volte speciali programmi di posta dai nomi specifici, capaci di inviare centinaia di migliaia, quando non milioni di messaggi contemporaneamente, e il cui nome viene riportato nelle intestazioni. Il campo da controllare è uno di tipo "X" (estesi, non standard), precisamente X-Mailer. Purtroppo non tutti i filtri permettono di agire su questi campi, e non tutti i programmi sono così stupidi da mettere la loro "firma" sul messaggio. Comunque si può tentare. Ecco una piccola selezione di programmi genera-spam:

Un buon metodo è mettere comunque "bulk" come parola chiave. Nessun programma di posta normale ha questa parola dentro.

La regola aurea: prevenzione

I "comandamenti"
Dunque, abbiamo visto come fare quando lo spam arriva. Ma possiamo fare molto anche per prevenire l'arrivo dello spam. Non pensate che i vostri gesti in Internet siano senza conseguenza, dovrete riflettere ogni volta che lasciate i vostri dati. Quando vi iscrivete ad un servizio e lasciate il vostro indirizzo email, quindi, siete avvisati. E l'attenzione deve aumentare di pari passo con la grandezza della società con cui state interagendo. Infatti, più grande è questa e maggiori probabilità ci sono che utilizzerà i vostri dati per futuri messaggi promozionali, magari di tipo diretto (vuoi comprare?) e senza far apparire il suo nome. Considerate che vi sono migliaia di società specializzate solo per la raccolta e il riciclaggio di email, cui si affidano le medie e grandi società.
Ecco una breve lista (personale) dei "comandamenti" per lo spam:

Sulla quarta voce vi è una considerazione supplementare da fare: quando seguite un newsgroup o conferenza Usenet di argomento specifico, alcuni partecipanti penseranno che siete interessati a ricevere messaggi di posta elettronica su quell'argomento. Il discorso è estendibile anche ad alcune mailing list pubbliche. Questi signori memorizzano il vostro email dagli interventi "in area", e invieranno pubblicità con una probabilità di pertinenza molto alta. Vi chiederete, infatti, come sia possibile che vi arrivi pubblicità non richiesta proprio sull'argomento di cui vi state occupando. Poichè, ovviamente, questa equazione è tanto sordida quanto fastidiosa, e poichè siamo nella più classica delle spammature, non ci sarà nessun problema se informerete pubblicamente i partecipanti o gli iscritti dell'operazione di spam. Con uno dei metodi di collimazione illustrati nell'articolo o spiegati nei riferimenti, non sarà difficile risalire al mittente effettivo, mentre nei casi più eclantanti sarà possibile rivolgersi direttamente al moderatore della lista (se esistente). Un piccolo accorgimento in più, necessario per mantenere la vita nelle conferenze Usenet ad un livello accettabile, e per poter intervenire senza la paura di essere invasi da pubblicità non desiderata.

Lato server
   Anche il vostro provider può fare qualcosa contro lo spam. Ad esempio è possibile programmare il server con una o più black list. Tra i sysadmin ne girano alcune che sono costantemente aggiornate, e vi sono procedure che programmano automaticamente i server in base a liste di indirizzi e domini "bollati" (vedi nei riferimenti) da cordate di ISP nel mondo.
   Un altro metodo diffuso presso alcuni provider: si può evitare che qualcuno faccia spamming con nomi di dominio fittizio non accettando posta da domini non conosciuti. Ci sono varie gradazioni per questo sistema, con una complessità crescente. Semplice ma efficace.

Contromisure estese
   La cosa importante, naturalmente, è mantenere la coscienza collettiva dello stato di fastidio e danno sociale provocato dallo spam. Lo spam, inoltre, è una piaga che va continuamente aumentando, per cui può benissimo darsi che a qualcuno provochi danni economici tali da giustificare un impegno di reazione ed attivazione, eventualmente anche legale. Se questo è il caso, si può far riferimento alla recente normativa italiana sulla privacy, la ormai nota legge 675/96. In particolare, nel trattamento dei dati personali rientra anche l'indirizzo email (ma non gli alias, secondo alcune interpretazioni. In tal caso il discorso vale per l'email definita presso il provider di posta).
   Nella rete è possibile reperire informazioni, collaborazione e testi di normativa, sentenze, ecc. a cura di diverse organizzazioni. Ad esempio, una delle più note è CAUCE (Coalition Against Unosilicted Commercial Email). Nei riferimenti ve ne sono indicate alcune.

Conclusioni

Bene, siamo proprio giunti al termine. Prima di lasciarvi ad una serie di documenti e link di riferimento, lasciatemi concludere con una considerazione che per i più suonerà ovvia, ma che è bene ricordare. Lo spam è ancora una volta frutto della maleducazione, in questo caso commerciale. Internet non è altro che un nuovo mezzo, che di fatto amplifica ed estende ciò che altrimenti sarebbe più difficile o più lento da divulgare. Niente di nuovo sotto il sole quindi: chi sa rispettare la libertà degli altri e in particolare i diritti del cittadino virtuale non fa spam. Viceversa, chi si lascia trasportare dal mezzo e crede così di dimezzare i tempi folgorando la concorrenza, in realtà folgora solo la pazienza di chi usa la posta elettronica per lavoro, per passione e per comunicare normalmente con gli amici telematici. Contribuendo, con ciò, ad alimentare le false e fittizie motivazioni di chi attualmente addita l'email come "un gioco" o addirittura un "fastidio". Non è ovviamente un gioco nè un fastidio ed anzi sarà sempre più preponderante nelle scelte e nella vita della democrazia elettronica, che è alle porte. In Italia fra poco saremo i primi ad avere un regolamento legislativo completo per l'utilizzo del documento elettronico come quello cartaceo. Cerchiamo, come si suol dire, di giocare bene le nostre carte. Internet di mazzi ne ha davvero tanti, anche senza spam.

RIFERIMENTI

Testi allegati

Realtime Blackhole List (RBL) come gli attivisti anti-spam si organizzano per combattere lo spam. Duncan Wilcox, 24/9/1998

How to Combat Bulk Unsolicited E-mail, include una lista di siti e programmi anti-spam. AA.VV., 27/5/1997 (ing.)

Come individuare uno spammer e segnalare l'abuso al suo ISP, Marco Coletti, 10/1/1997

Aggiornamenti

INTERNET: USA; IBM boicotta siti che non rispettano la privacy, ANSA, 31-3-99

Guide sulla netiquette

La Netiquette in Italiano Davide Migliavacca, Inferentia
Linee guida sulla netiquette - RFC 1855 / FYI 28 (Documento ufficiale della Internet Society), Sally Hambridge
Emily Postnews on Netiquette (versione italiana), Carlo Mario Chierotti, 21/2/1998 (a cura di V.Bertola)

Collegamenti

Postage due on junk e-mail -- Spam costs Internet millions every month, Daniel P. Dern, CMP TechWeb, 4/3/1998
Blacklist of Internet Advertisers, Axel Boldt, University of Paderborn (D)
Filter SPAM Out! A practical guide to procmail, Cameron Laird, Kathryn Soraiz, SunWorld, 02/1997 - agg. 01/1999
Direct marketing, semantica di spirito, Leonardo Glisselss
Organizzazioni
CAUCE, The Coalition Against Unsolicited Commercial Email ed EuroCAUCE
Spam Abuse.Net
The Internet Society
conferenze Usenet
news.admin.net-abuse.policy discussioni su come combattere lo spam
news.admin.net-abuse.sightings Postare lo spam qui
news.admin.net-abuse.usenet Discussioni sullo spam Usenet
news.admin.net-abuse.email Discussioni sullo spam email
news.admin.net-abuse.bulletins Annunci di spam cancellati o spammatori bloccati
news.admin.net-abuse.misc Gli altri argomenti sullo spam.

Luciano Giustini è direttore e fondatore di BETA; è raggiungibile su Internet tramite la redazione.

Copyright © 1999 Luciano Giustini, tutti i diritti sono riservati. Questo Articolo di BETA, insieme alla Rivista, è distribuibile secondo i termini e le condizioni della Licenza Pubblica Beta, come specificato nel file LPB.

Spam, riconoscimento ed eliminazione

Il cuore della procedura di "pulizia": i filtri

Tipi di spam e metodi di cancellazione

La regola aurea: prevenzione

Conclusioni