Spam, riconoscimento ed eliminazione
Luciano Giustini Direttore, BETA
Il cuore della procedura di "pulizia": i filtri
Una piccola premessa
Come riconoscere un messaggio di spam da uno di informazione commerciale?
Semplice: se non l'avete richiesto espressamente è spam. E non pensate di cavarvela
con l'osservazione che "può sempre tornare utile ricevere informazioni commerciali su prodotti interessanti".
Se sono veramente interessanti lo potete sempre sapere, con maggiore precisione,
dai media come le riviste specializzate, i giornali,
leggere le recensioni degli addetti ai lavori, sentire i consigli degli amici, ecc.
Se siete tra coloro che si ritengono capaci di discernere una proposta commerciale interessante
da un ladrocinio, aspettate di ricevere 100 "segnalazioni di prodotti interessanti" al giorno
per iniziare ad avere una visione più ampia della questione.
L'uso dei filtri
La prima cosa da fare è attivare i filtri della posta elettronica.
Se sono filtri che agiscono sul server, è ovviamente molto più utile (ad esempio IMAP4
o qualsiasi protocollo di posta remota). Ma anche se
agiscono quando la posta è stata già scaricata vanno bene. L'importante
è che siano composti con cura e che, soprattutto, rendano verificabili
(e annullabili)
le cancellature. Non c'è cosa peggiore che cancellare un messaggio
scambiato per spam e poi non poterlo riprendere. Molti software hanno anche
la funzione di log, se ritenete opportuno avere la massima sicurezza e controllo,
abilitate anche essa.
Dei filtri di cui parlerò nel seguito dell'articolo
intendo un numero definito a piacere a seconda delle esigenze e del numero
di spam che si riceve (o si vuole controllare). Se volete fare un solo mega-filtro
contenente tutte le metodologie probabilmente vi illudete. Ma anche fare
centinaia di filtri uno per ogni spammatore è una strada poco consigliabile.
L'ideale sarebbe probabilmente raggruppare i filtri a seconda magari della provenienza,
o piuttosto delle categorie "merceologiche" (hardware, sesso, scemenze, catene di Sant'Antonio, ecc.),
o delle proprie preferenze. Sulle varie metodologie di filtraggio
offerte dai programmi di posta non c'è da soffermarsi. Ognuno avrà
scelto quella più confacente alle proprie esigenze.
Sulle strategie di smistamento ci sono due grandi categorie molto semplici.
La prima strategia prevede che tutti
i messaggi siano buoni tranne quelli contrassegnati come spam, mentre la
seconda tratta tutti i messaggi come spam tranne quelli
che vengono riconosciuti come buoni.
Ogni strategia presenta vantaggi e svantaggi e
sta a voi
scegliere a quale affidarsi, sulla base di prove personali o esigenze
specifiche.
L'importante
è solo che le possibilità di configurazione e controllo siano estese. Programmi
completi in tal senso sono i diffusissimi Netscape Mail (4.5 consigliato), Qualcomm Eudora,
Microsoft Outlook, XFMail, Pegasus, ed altri che sicuramente mi sfuggono...
Supporrò, infine, che sappiate
regolare finemente il vostro programma di email, altrimenti immagino che
non stareste leggendo neanche questo articolo.
Indicherò d'ora in poi un filtro "generico",
avendo definito questo livello di astrazione dalle singole esigenze ed installazioni.
Tipi di spam e metodi di cancellazione
Le ripetizioni
Quelli particolarmente fastidiosi sono quelli che "ripetono",
in qualche modo, il loro messaggio-spam diverse volte. Che
alla fine, ovviamente, diventano centinaia e poi migliaia.
Con loro la vita è facile, in quanto basta beccarli due volte che
avrete capito che vi capiterà una terza, e così via, cioè che
si è sulla loro "lista email".
In tal caso si estrae una parola chiave dal messaggio e la si pone nel
nostro filtro. La scelta deve cadere su una parola che si suppone
ripetuta, altrimenti è inutile: ad esempio il nome di dominio del mittente.
Oggetto: Free Page Counter & Cool Graphical Visitor Log !
Data: Wed, 14 Oct 1998 06:53:45 +0200 (MET DST)
Da: webstats@ix.netcom.com <=============
A: webstats@ix.netcom.com
Want to know more about who's visiting your web site? Try Hitmeter!
(...)
[To be removed from our mailing list, please connect to
http://www.hitmeterservice.com/remove.html and click on the
"REMOVE ME" button to submit a removal request.]
|
Nell'esempio sopra il nome di
dominio del mittente è segnalato in rosso, vicino alla freccia.
Ovviamente, anche se questo non dovesse esistere in Internet (metodo sovente
utilizzato per "coprirsi" con un dominio quando se ne appartiene ad un altro vedi nei riferimenti
"Come rilevare lo spammatore nelle intestazioni")
a noi interessa la ripetizione, che è il dato di collimazione.
Non bisogna prendere il nome di dominio del destinatario, che in generale è fittizio
oppure è lo stesso del mittente. Se invece c'è il nostro indirizzo
bisogna porre attenzione ad un possibile messaggio
non spam. Una eccezione da inserire nel filtro, quindi, potrebbe essere
per i messaggi spam che riportino un nostro indirizzo email come destinatario.
Non illudiamoci troppo, comunque: gli spammatori lo sanno e mettono il
vostro indirizzo email nei loro messaggi, contando sulla vostra attenzione
verso di essi.
L'esempio ci fa anche
soffermare su un altro aspetto dello spam: anche se vi è riportata nei
messaggi la procedura di rimozione dalla lista, non dovrete usare
mai questa opzione. Un metodo diffuso presso gli spammatori e le società che
stilano le liste email, infatti, è di eliminare
i messaggi con errori e mantenere
invece in lista quelli che hanno risposto.
Ci sono poi quelli che rendono "impossibile" o non funzionante
la deregistrazione (più o meno volontariamente).
In entrambi i casi rispondendo, o utilizzando una form di rimozione con i vostri dati,
non fareste altro che "confermare" la vostra esistenza in rete e perpetuare lo spam sull'indirizzo con
cui rispondete.
Forse sobbalzerete nel sapere che vengono vendute addirittura le liste di rimozione, cioè
proprio le liste di quelle persone che hanno richiesto di essere rimossi dalle
liste stesse. Andiamo avanti...
Le parole chiave
Un altro caso di semplificazione della vita di noi utenti
è dato dalle parole chiave. Molti spammatori, in grado di
utilizzare quei micidiali programmi che inviano email broadcast
a centinaia di migliaia di indirizzi (vedi oltre), hanno l'avvertenza (non
volontaria, in realtà lo scopo è di attrarre l'attenzione...) di inserire
una o più parole chiave nell'oggetto dei messaggi.
Altri ancora premettono addirittura delle parole chiave specifiche,
spesso indicanti la categoria dello spam, come [ADV].
Non so se è la voglia di non creare troppo disgusto nei loro
confronti o qualche rimasuglio di coscienza, ma questo ci permette
di eliminare una buona parte di spam.
Ecco una lista (senz'altro incompleta) di alcune parole chiave (keyword)
molto usate nello spam. Per alcune parole, vale l'avvertenza di controllare possibili confusioni
con oggetti (e intenzioni) molto diversi. Ad esempio per la prima della lista (ADV
che sta per Advertising, pubblicità in inglese), potrebbe
trattarsi di qualcuno che vuole investire sul vostro sito e non di una richiesta di soldi!
- Pubblicità: ADV, AD (anche come AD:)
- Denaro: $, USD, million, dollar, cents, revenue, income, fee, increase, earn, extra, cash, save, win, profit, money
- Sesso: sex, porn, girl, babes, hot, adult, teen, suck, lick, dick, ...
- Servizi: free, guarantee, success, affordable, hosting, promo
- Attualità: lotto, office2000
- Varie: !!!, success, cyber, amazing, awesome, traffic, business, warez
Nella lista le parole sono tutte, ovviamente, al singolare. E, altrettanto ovviamente,
la categorizzazione che ho fatto è solamente indicativa. Potrete
trovare benissimo "hot", ad esempio, in messaggi di richiesta soldi oppure
"free" per i siti porno.
Indirizzi numerici
Vi sono messaggi di spam che sfuggono
a queste regole e sono difficilmente riconoscibili. Tra questi, vanno
sicuramente annoverati coloro i quali utilizzano indirizzi email numerici o con
numeri.
Oggetto: Now See World Actions!
Data: Mon, 27 Jul 1998 05:38:35 -0400 (EDT)
Da: rose568@hotmail.com
Attention!
Warning! Adults Only! Warning! Adults Only!
(...)
|
In questo caso ci sono due vie. O estrarre l'indirizzo del mittente dal nome di
uno dei servizi di free mail, che sono sempre utilizzati per questi
messaggi, oppure estendere la ricerca al corpo del messaggio. Nel qual
caso si ritorna al punto precedente, con le parole chiave.
Se si preferisce "segnare" il nome del provider di free mail, bisogna porre
attenzione a qualche amico o conoscente che usi questi indirizzi, e
regolare il filtro di conseguenza.
Alcuni nomi di dominio, per la maggior parte corrispondenti a provider di posta
elettronica "free" - molto utilizzati per lo spam, sono:
- aol.com
- bigfoot.com
- concentric.net
- cybermarketing.com
- juno.com
- hotmail.com
- iname.com
- infoweb.com
- mailexcite.com
- super.net
- usa.net
- yahoo.com
- webpromote.com
- webmarketing.com
- tutti i domini contenenti le stringhe: ru, 4u, 2u, ecc. (in inglese gergale si legge "are you", "for you", "to you", ecc.)
Le altre tipologie
Per finire, vi sono messaggi spam che proprio non si
possono riconoscere a priori. A meno che non siano...particolarmente grandi.
Ebbene si, come metodo "ultima spiaggia" vi è proprio il più semplice
da configurare: indicare al programma di posta una dimensione massima
in Kbyte oltre la quale iniziare a ...preoccuparsi. In genere questa dimensione si aggira
sui 15-20 Kb. Se avete incrociato due filtri di "indirizzo sconosciuto"
e "dimensione massima" potete dormire sonni più tranquilli.
E...come dite? Vi perdete l'ultimo interessantissimo pupazzetto elettronico
inviatovi dal vostro lontano amico in USA che ha appena scoperto l'email
(ma non la netiquette)...
Dovreste esserne felici!
Inoltre, i programmi più avanzati
discernono un file allegato di grosse
dimensioni dal messaggio vero e proprio, rifiutando solo quest'ultimo se è di dimensioni generose
(vedi esempio di seguito).
Infatti è in genere
solo il secondo caso che rappresenta spam: gli spammatori
scrivono file di testo enormi, a volte superano i 40 Kb. Mentre il primo caso è
il vostro amico dagli USA. :-)
Subject: FORBIDDEN KNOWLEDGE: THEORY OF FREE ISSUANCE
Date: Wed, 14 Mar 99 01:49:13 +0000
"The acceptance of truth comes in three stages."
Troncato.
Questo messaggio supera la dimensione massima per i messaggi
impostata nelle Preferenze: sono state pertanto scaricate solo le prime
righe dal server della posta.
Fare clic qui per scaricare il resto del messaggio.
|
(Netscape Messenger in Communicator 4.5)
|
Un altro metodo "ultima spiaggia" è discriminare il programma di posta
del mittente. Gli spammatori utilizzano a volte speciali programmi
di posta dai nomi specifici, capaci di
inviare centinaia di migliaia, quando non milioni di messaggi contemporaneamente,
e il cui nome viene riportato nelle
intestazioni. Il campo da controllare è
uno di tipo "X" (estesi, non standard), precisamente X-Mailer.
Purtroppo non tutti i filtri permettono di agire su questi campi,
e non tutti i programmi sono così stupidi da mettere la loro
"firma" sul messaggio. Comunque si può tentare.
Ecco una piccola selezione di programmi genera-spam:
- Endymion MailMan
- Extractor Pro Bulk E-Mail Software
- Bull's Eye Gold
- Super eMailer
- Super Harvester
Un buon metodo è mettere comunque "bulk" come parola chiave.
Nessun programma di posta normale ha questa parola dentro.
La regola aurea: prevenzione
I "comandamenti"
Dunque, abbiamo visto come fare quando lo spam arriva.
Ma possiamo fare molto anche per prevenire l'arrivo dello spam.
Non pensate che i vostri gesti in Internet siano senza conseguenza, dovrete
riflettere ogni volta che lasciate i vostri dati.
Quando vi iscrivete ad un servizio e lasciate il vostro indirizzo email,
quindi, siete avvisati. E l'attenzione deve aumentare di pari passo
con la grandezza della società con cui state interagendo. Infatti,
più grande è questa e maggiori probabilità ci sono
che utilizzerà i vostri dati per futuri messaggi promozionali, magari
di tipo diretto (vuoi comprare?) e senza far apparire il suo nome.
Considerate che vi sono migliaia di società specializzate solo
per la raccolta e il riciclaggio di email, cui si affidano le medie e grandi
società.
Ecco una breve lista (personale) dei "comandamenti" per lo spam:
1 Utilizzate indirizzi email "fai e disfai", in modo da
potervene sbarazzare quando vedete che lo spam aumenta.
Ovviamente, agli amici e colleghi fidati darete
l'indirizzo email "vero". Molti provider offrono servizi di aliasing,
oppure basta rivolgersi alla rete.
2 Utilizzate un ristretto novero di indirizzi email (sempre alias) per le form
che riempite online. Quando arriverà spam con questi indirizzi, potrete
restringere la rosa dei colpevoli. E comunque riempite poche form, giusto
i servizi che veramente vi servono. Per i download, è sconsigliato:
se ogni volta che scaricate qualcosa dovete lasciare il vostro indirizzo email
state freschi contro lo spam...Eventualmente rivolgetevi a pochi servizi selezionati,
come Volftp o Download.com, oppure ai mirror presso il vostro provider.
3 Controllate quello che viene caricato dalla rete.
Si dice che eliminando Java, Javascript, cookie, ActiveX, VBscript, e
chi più ne ha più ne metta, si
evita il rischio di spam. Non è disabilitando tutto che
si elimina il problema, e il
solo risultato sarebbe di rendere impossibile la vostra navigazione in rete.
Invece, ci sono poche regole ma sempre valide, da osservare:
state attenti prima di scaricare componenti ActiveX non sicuri (anche quelli sicuri, se potete),
e disabilitate Java se non strettamente necessario. Alcuni applet in realtà "possono"
carpirvi l'indirizzo email, ma non è questa la sede
per approfondire questo aspetto. Cookie, Javascript e script in genere non
avranno alcun effetto per lo spam.
Ovviamente, utilizzate sempre l'ultima versione del browser di navigazione (per
l'aggiornamento dei dispositivi di sicurezza verso la rete).
4 Non lasciate in giro il vostro indirizzo email "vero" su Usenet e pagine Web.
La più classica delle indicazioni è di non scrivere
sulle conferenze Usenet col vostro indirizzo email. Se scrivete
in Usenet, preferite indirizzi email fittizi oppure
alias del tipo visto sopra.
Se siete webmaster, fate attenzione a scrivere sulle pagine Web
prodotte da voi un indirizzo email diretto. Alcuni autori
evitano del tutto di scrivere l'email, mettendo magari "(a)" al posto di "@".
Il motivo di tutto ciò è la presenza di robot, agenti e
script che automaticamente setacciano il Web
alla ricerca di indirizzi email.
Sulla quarta voce vi è una considerazione supplementare
da fare: quando seguite un newsgroup o conferenza Usenet di argomento
specifico, alcuni partecipanti penseranno che siete interessati
a ricevere messaggi di posta elettronica su quell'argomento.
Il discorso è estendibile anche ad alcune mailing list pubbliche.
Questi signori memorizzano il vostro email dagli interventi
"in area", e invieranno pubblicità con una probabilità di pertinenza molto alta.
Vi chiederete, infatti, come sia possibile che
vi arrivi pubblicità non richiesta proprio sull'argomento di cui vi state occupando.
Poichè, ovviamente, questa equazione è tanto sordida quanto
fastidiosa, e poichè siamo nella più classica
delle spammature, non ci sarà nessun problema se informerete
pubblicamente i partecipanti o gli iscritti dell'operazione di spam.
Con uno dei metodi di collimazione illustrati nell'articolo o spiegati nei riferimenti,
non sarà difficile risalire al mittente effettivo, mentre
nei casi più eclantanti sarà possibile rivolgersi
direttamente al moderatore della lista (se esistente).
Un piccolo accorgimento in più, necessario
per mantenere la vita nelle conferenze Usenet ad un livello accettabile,
e per poter intervenire senza la paura di essere invasi da pubblicità
non desiderata.
Lato server
Anche il vostro provider può fare qualcosa
contro lo spam. Ad esempio è possibile programmare
il server con una o più black list. Tra i sysadmin
ne girano alcune che sono costantemente aggiornate, e vi sono
procedure che programmano automaticamente i server in base a
liste di indirizzi e domini "bollati" (vedi nei riferimenti) da cordate di ISP nel mondo.
Un altro metodo diffuso presso
alcuni provider: si può
evitare che qualcuno faccia spamming con nomi di dominio fittizio
non accettando posta da domini non conosciuti. Ci
sono varie gradazioni per questo sistema, con una complessità
crescente. Semplice ma efficace.
Contromisure estese
La cosa importante, naturalmente, è mantenere la coscienza
collettiva dello stato di fastidio e danno sociale provocato dallo spam.
Lo spam, inoltre, è una piaga che va continuamente
aumentando, per cui può benissimo darsi che a qualcuno
provochi danni economici tali da giustificare un impegno
di reazione ed attivazione, eventualmente anche legale. Se questo è il caso,
si può far riferimento alla recente normativa italiana
sulla privacy, la ormai
nota legge 675/96. In particolare, nel trattamento
dei dati personali rientra anche l'indirizzo email (ma non gli alias, secondo alcune
interpretazioni. In tal caso il discorso vale per l'email definita presso il provider di posta).
Nella rete è possibile reperire informazioni,
collaborazione e testi di normativa, sentenze, ecc. a cura
di diverse organizzazioni. Ad esempio, una delle più note
è CAUCE (Coalition Against Unosilicted Commercial Email). Nei riferimenti ve ne sono indicate alcune.
Conclusioni
Bene, siamo proprio giunti al termine.
Prima di lasciarvi ad una serie di documenti e link
di riferimento, lasciatemi concludere con una considerazione che
per i più suonerà ovvia, ma che è bene
ricordare. Lo spam è ancora una volta frutto della maleducazione,
in questo caso commerciale.
Internet non è altro che un nuovo mezzo,
che di fatto amplifica ed estende ciò che altrimenti sarebbe
più difficile o più lento da divulgare.
Niente di nuovo sotto il sole quindi:
chi sa rispettare la libertà degli altri e in particolare i diritti
del cittadino virtuale non fa spam. Viceversa,
chi si lascia trasportare dal mezzo e crede così di
dimezzare i tempi folgorando la concorrenza, in realtà folgora solo
la pazienza di chi usa la posta elettronica per lavoro, per passione e
per comunicare normalmente con gli amici telematici.
Contribuendo, con ciò, ad alimentare le false e fittizie
motivazioni di chi attualmente
addita l'email come "un gioco" o addirittura un "fastidio".
Non è ovviamente un gioco nè un fastidio ed
anzi sarà sempre più preponderante nelle scelte e nella
vita della democrazia elettronica, che è alle porte. In Italia fra poco saremo i
primi ad avere un regolamento legislativo completo per
l'utilizzo del documento elettronico come quello cartaceo.
Cerchiamo, come si suol dire, di giocare bene le nostre carte.
Internet di mazzi ne ha davvero tanti, anche senza spam.
Parte 1 | Parte 2
____________________________________
RIFERIMENTI
Testi allegati
Guide sulla netiquette
Collegamenti
Articoli
-
Postage due on junk e-mail -- Spam costs Internet millions every month,
Daniel P. Dern, CMP TechWeb, 4/3/1998
-
Blacklist of Internet Advertisers, Axel Boldt, University of Paderborn (D)
-
Filter SPAM Out! A practical guide to procmail, Cameron Laird, Kathryn Soraiz,
SunWorld, 02/1997 - agg. 01/1999
- Direct marketing,
semantica di spirito, Leonardo Glisselss
Organizzazioni
- CAUCE, The Coalition Against Unsolicited Commercial Email
ed EuroCAUCE
- Spam Abuse.Net
- The Internet Society
conferenze Usenet
- news.admin.net-abuse.policy
discussioni su come combattere lo spam
- news.admin.net-abuse.sightings
Postare lo spam qui
- news.admin.net-abuse.usenet
Discussioni sullo spam Usenet
- news.admin.net-abuse.email
Discussioni sullo spam email
- news.admin.net-abuse.bulletins
Annunci di spam cancellati o spammatori bloccati
- news.admin.net-abuse.misc
Gli altri argomenti sullo spam.
Luciano Giustini è direttore e fondatore
di BETA; è
raggiungibile su Internet tramite la redazione.
Copyright © 1999 Luciano Giustini, tutti i diritti sono
riservati. Questo Articolo di BETA, insieme alla Rivista, è
distribuibile secondo i termini e le condizioni della Licenza Pubblica
Beta, come specificato nel file LPB.
|