BETA, la rivista ipertestuale tecnica (colleg. al sito Web)
BETA
BETA, la rivista ipertestuale tecnicaBarra BETA
Barra Sito Beta.it
BETA 2099.3 - Approfondimenti: Spam, riconoscimento ed eliminazione (parte 1 | parte 2)  -  Indici | Guida

Clicca qui per maggiori informazioni

Spam, riconoscimento ed eliminazione

Luciano Giustini
Direttore, BETA

Il cuore della procedura di "pulizia": i filtri

Una piccola premessa
   Come riconoscere un messaggio di spam da uno di informazione commerciale? Semplice: se non l'avete richiesto espressamente è spam. E non pensate di cavarvela con l'osservazione che "può sempre tornare utile ricevere informazioni commerciali su prodotti interessanti". Se sono veramente interessanti lo potete sempre sapere, con maggiore precisione, dai media come le riviste specializzate, i giornali, leggere le recensioni degli addetti ai lavori, sentire i consigli degli amici, ecc. Se siete tra coloro che si ritengono capaci di discernere una proposta commerciale interessante da un ladrocinio, aspettate di ricevere 100 "segnalazioni di prodotti interessanti" al giorno per iniziare ad avere una visione più ampia della questione.

L'uso dei filtri
   La prima cosa da fare è attivare i filtri della posta elettronica. Se sono filtri che agiscono sul server, è ovviamente molto più utile (ad esempio IMAP4 o qualsiasi protocollo di posta remota). Ma anche se agiscono quando la posta è stata già scaricata vanno bene. L'importante è che siano composti con cura e che, soprattutto, rendano verificabili (e annullabili) le cancellature. Non c'è cosa peggiore che cancellare un messaggio scambiato per spam e poi non poterlo riprendere. Molti software hanno anche la funzione di log, se ritenete opportuno avere la massima sicurezza e controllo, abilitate anche essa.
   Dei filtri di cui parlerò nel seguito dell'articolo intendo un numero definito a piacere a seconda delle esigenze e del numero di spam che si riceve (o si vuole controllare). Se volete fare un solo mega-filtro contenente tutte le metodologie probabilmente vi illudete. Ma anche fare centinaia di filtri uno per ogni spammatore è una strada poco consigliabile. L'ideale sarebbe probabilmente raggruppare i filtri a seconda magari della provenienza, o piuttosto delle categorie "merceologiche" (hardware, sesso, scemenze, catene di Sant'Antonio, ecc.), o delle proprie preferenze. Sulle varie metodologie di filtraggio offerte dai programmi di posta non c'è da soffermarsi. Ognuno avrà scelto quella più confacente alle proprie esigenze.
   Sulle strategie di smistamento ci sono due grandi categorie molto semplici. La prima strategia prevede che tutti i messaggi siano buoni tranne quelli contrassegnati come spam, mentre la seconda tratta tutti i messaggi come spam tranne quelli che vengono riconosciuti come buoni. Ogni strategia presenta vantaggi e svantaggi e sta a voi scegliere a quale affidarsi, sulla base di prove personali o esigenze specifiche. L'importante è solo che le possibilità di configurazione e controllo siano estese. Programmi completi in tal senso sono i diffusissimi Netscape Mail (4.5 consigliato), Qualcomm Eudora, Microsoft Outlook, XFMail, Pegasus, ed altri che sicuramente mi sfuggono...
   Supporrò, infine, che sappiate regolare finemente il vostro programma di email, altrimenti immagino che non stareste leggendo neanche questo articolo. Indicherò d'ora in poi un filtro "generico", avendo definito questo livello di astrazione dalle singole esigenze ed installazioni.

Tipi di spam e metodi di cancellazione

Le ripetizioni
   Quelli particolarmente fastidiosi sono quelli che "ripetono", in qualche modo, il loro messaggio-spam diverse volte. Che alla fine, ovviamente, diventano centinaia e poi migliaia. Con loro la vita è facile, in quanto basta beccarli due volte che avrete capito che vi capiterà una terza, e così via, cioè che si è sulla loro "lista email". In tal caso si estrae una parola chiave dal messaggio e la si pone nel nostro filtro. La scelta deve cadere su una parola che si suppone ripetuta, altrimenti è inutile: ad esempio il nome di dominio del mittente.


Oggetto: Free Page Counter & Cool Graphical Visitor Log !
   Data: Wed, 14 Oct 1998 06:53:45 +0200 (MET DST)
     Da: webstats@ix.netcom.com <=============
      A: webstats@ix.netcom.com
	  
Want to know more about who's visiting your web site? Try Hitmeter!

(...)

[To be removed from our mailing list, please connect to 
http://www.hitmeterservice.com/remove.html and click on the 
"REMOVE ME" button to submit a removal request.]

   Nell'esempio sopra il nome di dominio del mittente è segnalato in rosso, vicino alla freccia. Ovviamente, anche se questo non dovesse esistere in Internet (metodo sovente utilizzato per "coprirsi" con un dominio quando se ne appartiene ad un altro —vedi nei riferimenti "Come rilevare lo spammatore nelle intestazioni") a noi interessa la ripetizione, che è il dato di collimazione. Non bisogna prendere il nome di dominio del destinatario, che in generale è fittizio oppure è lo stesso del mittente. Se invece c'è il nostro indirizzo bisogna porre attenzione ad un possibile messaggio non spam. Una eccezione da inserire nel filtro, quindi, potrebbe essere per i messaggi spam che riportino un nostro indirizzo email come destinatario. Non illudiamoci troppo, comunque: gli spammatori lo sanno e mettono il vostro indirizzo email nei loro messaggi, contando sulla vostra attenzione verso di essi.
   L'esempio ci fa anche soffermare su un altro aspetto dello spam: anche se vi è riportata nei messaggi la procedura di rimozione dalla lista, non dovrete usare mai questa opzione. Un metodo diffuso presso gli spammatori e le società che stilano le liste email, infatti, è di eliminare i messaggi con errori e mantenere invece in lista quelli che hanno risposto. Ci sono poi quelli che rendono "impossibile" o non funzionante la deregistrazione (più o meno volontariamente). In entrambi i casi rispondendo, o utilizzando una form di rimozione con i vostri dati, non fareste altro che "confermare" la vostra esistenza in rete e perpetuare lo spam sull'indirizzo con cui rispondete. Forse sobbalzerete nel sapere che vengono vendute addirittura le liste di rimozione, cioè proprio le liste di quelle persone che hanno richiesto di essere rimossi dalle liste stesse. Andiamo avanti...

Le parole chiave
   Un altro caso di semplificazione della vita di noi utenti è dato dalle parole chiave. Molti spammatori, in grado di utilizzare quei micidiali programmi che inviano email broadcast a centinaia di migliaia di indirizzi (vedi oltre), hanno l'avvertenza (non volontaria, in realtà lo scopo è di attrarre l'attenzione...) di inserire una o più parole chiave nell'oggetto dei messaggi. Altri ancora premettono addirittura delle parole chiave specifiche, spesso indicanti la categoria dello spam, come [ADV]. Non so se è la voglia di non creare troppo disgusto nei loro confronti o qualche rimasuglio di coscienza, ma questo ci permette di eliminare una buona parte di spam.
   Ecco una lista (senz'altro incompleta) di alcune parole chiave (keyword) molto usate nello spam. Per alcune parole, vale l'avvertenza di controllare possibili confusioni con oggetti (e intenzioni) molto diversi. Ad esempio per la prima della lista (ADV che sta per Advertising, pubblicità in inglese), potrebbe trattarsi di qualcuno che vuole investire sul vostro sito e non di una richiesta di soldi!

  • Pubblicità: ADV, AD (anche come AD:)
  • Denaro: $, USD, million, dollar, cents, revenue, income, fee, increase, earn, extra, cash, save, win, profit, money
  • Sesso: sex, porn, girl, babes, hot, adult, teen, suck, lick, dick, ...
  • Servizi: free, guarantee, success, affordable, hosting, promo
  • Attualità: lotto, office2000
  • Varie: !!!, success, cyber, amazing, awesome, traffic, business, warez

   Nella lista le parole sono tutte, ovviamente, al singolare. E, altrettanto ovviamente, la categorizzazione che ho fatto è solamente indicativa. Potrete trovare benissimo "hot", ad esempio, in messaggi di richiesta soldi oppure "free" per i siti porno.

Indirizzi numerici
   Vi sono messaggi di spam che sfuggono a queste regole e sono difficilmente riconoscibili. Tra questi, vanno sicuramente annoverati coloro i quali utilizzano indirizzi email numerici o con numeri.


Oggetto: Now See World Actions!
   Data: Mon, 27 Jul 1998 05:38:35 -0400 (EDT)
     Da: rose568@hotmail.com

Attention!
Warning! Adults Only!                    Warning! Adults Only!

(...)

In questo caso ci sono due vie. O estrarre l'indirizzo del mittente dal nome di uno dei servizi di free mail, che sono sempre utilizzati per questi messaggi, oppure estendere la ricerca al corpo del messaggio. Nel qual caso si ritorna al punto precedente, con le parole chiave. Se si preferisce "segnare" il nome del provider di free mail, bisogna porre attenzione a qualche amico o conoscente che usi questi indirizzi, e regolare il filtro di conseguenza. Alcuni nomi di dominio, per la maggior parte corrispondenti a provider di posta elettronica "free" - molto utilizzati per lo spam, sono:

  • aol.com
  • bigfoot.com
  • concentric.net
  • cybermarketing.com
  • juno.com
  • hotmail.com
  • iname.com
  • infoweb.com
  • mailexcite.com
  • super.net
  • usa.net
  • yahoo.com
  • webpromote.com
  • webmarketing.com
  • tutti i domini contenenti le stringhe: ru, 4u, 2u, ecc. (in inglese gergale si legge "are you", "for you", "to you", ecc.)

Le altre tipologie
   Per finire, vi sono messaggi spam che proprio non si possono riconoscere a priori. A meno che non siano...particolarmente grandi. Ebbene si, come metodo "ultima spiaggia" vi è proprio il più semplice da configurare: indicare al programma di posta una dimensione massima in Kbyte oltre la quale iniziare a ...preoccuparsi. In genere questa dimensione si aggira sui 15-20 Kb. Se avete incrociato due filtri di "indirizzo sconosciuto" e "dimensione massima" potete dormire sonni più tranquilli. E...come dite? Vi perdete l'ultimo interessantissimo pupazzetto elettronico inviatovi dal vostro lontano amico in USA che ha appena scoperto l'email (ma non la netiquette)... Dovreste esserne felici!
   Inoltre, i programmi più avanzati discernono un file allegato di grosse dimensioni dal messaggio vero e proprio, rifiutando solo quest'ultimo se è di dimensioni generose (vedi esempio di seguito). Infatti è in genere solo il secondo caso che rappresenta spam: gli spammatori scrivono file di testo enormi, a volte superano i 40 Kb. Mentre il primo caso è il vostro amico dagli USA. :-)


Subject: FORBIDDEN KNOWLEDGE: THEORY OF FREE ISSUANCE
Date: Wed, 14 Mar 99 01:49:13 +0000

"The acceptance of truth comes in three stages."

Troncato.

Questo messaggio supera la dimensione massima per i messaggi impostata nelle Preferenze: sono state pertanto scaricate solo le prime righe dal server della posta.

Fare clic qui per scaricare il resto del messaggio.
(Netscape Messenger in Communicator 4.5)

   Un altro metodo "ultima spiaggia" è discriminare il programma di posta del mittente. Gli spammatori utilizzano a volte speciali programmi di posta dai nomi specifici, capaci di inviare centinaia di migliaia, quando non milioni di messaggi contemporaneamente, e il cui nome viene riportato nelle intestazioni. Il campo da controllare è uno di tipo "X" (estesi, non standard), precisamente X-Mailer. Purtroppo non tutti i filtri permettono di agire su questi campi, e non tutti i programmi sono così stupidi da mettere la loro "firma" sul messaggio. Comunque si può tentare. Ecco una piccola selezione di programmi genera-spam:

  • Endymion MailMan
  • Extractor Pro Bulk E-Mail Software
  • Bull's Eye Gold
  • Super eMailer
  • Super Harvester

   Un buon metodo è mettere comunque "bulk" come parola chiave. Nessun programma di posta normale ha questa parola dentro.

La regola aurea: prevenzione

I "comandamenti"
   Dunque, abbiamo visto come fare quando lo spam arriva. Ma possiamo fare molto anche per prevenire l'arrivo dello spam. Non pensate che i vostri gesti in Internet siano senza conseguenza, dovrete riflettere ogni volta che lasciate i vostri dati. Quando vi iscrivete ad un servizio e lasciate il vostro indirizzo email, quindi, siete avvisati. E l'attenzione deve aumentare di pari passo con la grandezza della società con cui state interagendo. Infatti, più grande è questa e maggiori probabilità ci sono che utilizzerà i vostri dati per futuri messaggi promozionali, magari di tipo diretto (vuoi comprare?) e senza far apparire il suo nome. Considerate che vi sono migliaia di società specializzate solo per la raccolta e il riciclaggio di email, cui si affidano le medie e grandi società.
Ecco una breve lista (personale) dei "comandamenti" per lo spam:

    1 — Utilizzate indirizzi email "fai e disfai", in modo da potervene sbarazzare quando vedete che lo spam aumenta. Ovviamente, agli amici e colleghi fidati darete l'indirizzo email "vero". Molti provider offrono servizi di aliasing, oppure basta rivolgersi alla rete.

    2 — Utilizzate un ristretto novero di indirizzi email (sempre alias) per le form che riempite online. Quando arriverà spam con questi indirizzi, potrete restringere la rosa dei colpevoli. E comunque riempite poche form, giusto i servizi che veramente vi servono. Per i download, è sconsigliato: se ogni volta che scaricate qualcosa dovete lasciare il vostro indirizzo email state freschi contro lo spam...Eventualmente rivolgetevi a pochi servizi selezionati, come Volftp o Download.com, oppure ai mirror presso il vostro provider.

    3 — Controllate quello che viene caricato dalla rete. Si dice che eliminando Java, Javascript, cookie, ActiveX, VBscript, e chi più ne ha più ne metta, si evita il rischio di spam. Non è disabilitando tutto che si elimina il problema, e il solo risultato sarebbe di rendere impossibile la vostra navigazione in rete. Invece, ci sono poche regole ma sempre valide, da osservare: state attenti prima di scaricare componenti ActiveX non sicuri (anche quelli sicuri, se potete), e disabilitate Java se non strettamente necessario. Alcuni applet in realtà "possono" carpirvi l'indirizzo email, ma non è questa la sede per approfondire questo aspetto. Cookie, Javascript e script in genere non avranno alcun effetto per lo spam. Ovviamente, utilizzate sempre l'ultima versione del browser di navigazione (per l'aggiornamento dei dispositivi di sicurezza verso la rete).

    4 — Non lasciate in giro il vostro indirizzo email "vero" su Usenet e pagine Web. La più classica delle indicazioni è di non scrivere sulle conferenze Usenet col vostro indirizzo email. Se scrivete in Usenet, preferite indirizzi email fittizi oppure alias del tipo visto sopra. Se siete webmaster, fate attenzione a scrivere sulle pagine Web prodotte da voi un indirizzo email diretto. Alcuni autori evitano del tutto di scrivere l'email, mettendo magari "(a)" al posto di "@". Il motivo di tutto ciò è la presenza di robot, agenti e script che automaticamente setacciano il Web alla ricerca di indirizzi email.

   Sulla quarta voce vi è una considerazione supplementare da fare: quando seguite un newsgroup o conferenza Usenet di argomento specifico, alcuni partecipanti penseranno che siete interessati a ricevere messaggi di posta elettronica su quell'argomento. Il discorso è estendibile anche ad alcune mailing list pubbliche. Questi signori memorizzano il vostro email dagli interventi "in area", e invieranno pubblicità con una probabilità di pertinenza molto alta. Vi chiederete, infatti, come sia possibile che vi arrivi pubblicità non richiesta proprio sull'argomento di cui vi state occupando. Poichè, ovviamente, questa equazione è tanto sordida quanto fastidiosa, e poichè siamo nella più classica delle spammature, non ci sarà nessun problema se informerete pubblicamente i partecipanti o gli iscritti dell'operazione di spam. Con uno dei metodi di collimazione illustrati nell'articolo o spiegati nei riferimenti, non sarà difficile risalire al mittente effettivo, mentre nei casi più eclantanti sarà possibile rivolgersi direttamente al moderatore della lista (se esistente). Un piccolo accorgimento in più, necessario per mantenere la vita nelle conferenze Usenet ad un livello accettabile, e per poter intervenire senza la paura di essere invasi da pubblicità non desiderata.

Lato server
   Anche il vostro provider può fare qualcosa contro lo spam. Ad esempio è possibile programmare il server con una o più black list. Tra i sysadmin ne girano alcune che sono costantemente aggiornate, e vi sono procedure che programmano automaticamente i server in base a liste di indirizzi e domini "bollati" (vedi nei riferimenti) da cordate di ISP nel mondo.
   Un altro metodo diffuso presso alcuni provider: si può evitare che qualcuno faccia spamming con nomi di dominio fittizio non accettando posta da domini non conosciuti. Ci sono varie gradazioni per questo sistema, con una complessità crescente. Semplice ma efficace.

Contromisure estese
   La cosa importante, naturalmente, è mantenere la coscienza collettiva dello stato di fastidio e danno sociale provocato dallo spam. Lo spam, inoltre, è una piaga che va continuamente aumentando, per cui può benissimo darsi che a qualcuno provochi danni economici tali da giustificare un impegno di reazione ed attivazione, eventualmente anche legale. Se questo è il caso, si può far riferimento alla recente normativa italiana sulla privacy, la ormai nota legge 675/96. In particolare, nel trattamento dei dati personali rientra anche l'indirizzo email (ma non gli alias, secondo alcune interpretazioni. In tal caso il discorso vale per l'email definita presso il provider di posta).
   Nella rete è possibile reperire informazioni, collaborazione e testi di normativa, sentenze, ecc. a cura di diverse organizzazioni. Ad esempio, una delle più note è CAUCE (Coalition Against Unosilicted Commercial Email). Nei riferimenti ve ne sono indicate alcune.

Conclusioni

   Bene, siamo proprio giunti al termine. Prima di lasciarvi ad una serie di documenti e link di riferimento, lasciatemi concludere con una considerazione che per i più suonerà ovvia, ma che è bene ricordare. Lo spam è ancora una volta frutto della maleducazione, in questo caso commerciale. Internet non è altro che un nuovo mezzo, che di fatto amplifica ed estende ciò che altrimenti sarebbe più difficile o più lento da divulgare. Niente di nuovo sotto il sole quindi: chi sa rispettare la libertà degli altri e in particolare i diritti del cittadino virtuale non fa spam. Viceversa, chi si lascia trasportare dal mezzo e crede così di dimezzare i tempi folgorando la concorrenza, in realtà folgora solo la pazienza di chi usa la posta elettronica per lavoro, per passione e per comunicare normalmente con gli amici telematici. Contribuendo, con ciò, ad alimentare le false e fittizie motivazioni di chi attualmente addita l'email come "un gioco" o addirittura un "fastidio". Non è ovviamente un gioco nè un fastidio ed anzi sarà sempre più preponderante nelle scelte e nella vita della democrazia elettronica, che è alle porte. In Italia fra poco saremo i primi ad avere un regolamento legislativo completo per l'utilizzo del documento elettronico come quello cartaceo. Cerchiamo, come si suol dire, di giocare bene le nostre carte. Internet di mazzi ne ha davvero tanti, anche senza spam.

Parte 1 | Parte 2

____________________________________

RIFERIMENTI

Testi allegati

Guide sulla netiquette Collegamenti


Luciano Giustini è direttore e fondatore di BETA; è raggiungibile su Internet tramite la redazione.

Copyright © 1999 Luciano Giustini, tutti i diritti sono riservati. Questo Articolo di BETA, insieme alla Rivista, è distribuibile secondo i termini e le condizioni della Licenza Pubblica Beta, come specificato nel file LPB.

Clicca qui per maggiori informazioni


BETA 2099.3: Sommario | Indice Numero | Redazione | Liste/Forum | Informazioni | Indici di BETA | Installazione | Licenza Pubbl. Beta | Mirror ufficiali | Guida | Ricerche | Stampa


Beta.it (http://www.beta.it)email info@beta.it
Barra Sito Beta.it

Copyright © 1994-99 Beta, tutti i diritti sono riservati. Documento Lpb. BETA sul Web: http://www.beta.it
Sommario Internet Id Redazione Liste/Forum Informazioni Browser Mirror ufficiali Beta Home Page Beta Home Page english Beta News BETA Rivista Articoli BETA Beta Edit, pubblicazioni Beta Logo, premi Beta Lpb, Licenza Pubblica e Articoli Lpb Beta Navigatore Beta Online Beta Library Beta Info Gruppo Beta