Come prevenire il Crawler ed il Ghost Spam in Google Analytics

Una delle funzioni più utili di Google Analytics è quella di aiutare i webmaster a tracciare gli URL referenziali, da cui i visitatori arrivano alla loro pagina. Sfortunatamente gli spammer utilizzano questa funzionalità per promuovere i loro siti o addirittura per danneggiare l’immagine di compagnie, inserendo i loro domini come URL referenziali nei tuoi dati di Analytics. Vi sono principalmente due tipi di spam che possono utilizzare questa funzionalità - Spam Fantasma (Ghost) e Crawler spam.

Cos è il Ghost Spam e Come Filtrarlo

Gli spammer che utilizzano questo metodo non visitano veramente il tuo sito. Al contrario, utilizzano il Protocollo di Misura di Analytics, che permette alle persone di inviare direttamente dati a Google Analytics, inserendovi delle informazioni malevoli. Generalmente generano codici randon di tracciamento di Analytics (UA-XXXXX-1). In questo modo inseriscono dati falsi nel tuo account senza lasciare la minima traccia.

I ghost spammer non sanno da quale dominio stanno inviando dati a Google Analytics, utilizzano infatti hostname, che non ha nulla a che fare con il sito, oppure non specificano alcun dominio. Puoi facilmente ottenere una lista di hostname validi che possono inviare informazioni al tuo account. Di solito, dovrebbero essere solamente tuodominio.it più tutti i sottodomini che hai, come blog.tuodominio.it o anche www.tuodominio.it.

Per ottenere queste informazioni, vai in Google Analytics -> Network e seleziona l’opzione Hostname come Primary Dimension.

Dovrai poi creare una lista di tutti i tuoi hostname utilizzando Regular Expression come riportato di seguito:

Aggiungere tutti gli hostname che ti appartengono in quella lista e salvarli in un file di testo. Ci serviranno tra poco.

Ora clicca sull’Admin link, seleziona il tuo account, la rispettiva proprietà e visite per il sito in questione, poi clicca sul menù Filters -> Add Filter. Questo ti permetterà di creare un nuovo filtro. Nominalo, ad esempio “filtro Ghost Spam”, poi seleziona Custom come tipo di filtro. Seleziona ora Hostname e clicca sul pulsante Include. Infine, aggiungi la lista di domini validi nel campo Filter Pattern.

È buona norma cliccare sul link Verify this filter prima di attivarlo. Una volta fatto, vedrai tutte le informazioni che verranno rimosse dai tuoi dati Analytics. Clicca su Save.

Come Prevenire il Crawlers Spam

Fermare il Crawlers spam è molto più semplice in quanto questi accedono realmente al tuo sito. Puoi ottenere i loro hostname nello stesso modo in cui ottieni i tuoi hostname validi. Questa volta raccogli tutti quelli sospetti che hanno una Sorgente o Hostname diversi dal tuo. Puoi poi bloccarli inserendo la seguente regola in .htaccess:

Nota che i file .htaccess sono sensibili alla sintassi, ricorda di separare il punto con uno slash. Quindi, per esempio, se volessi bloccare spam-bot-site.net, dovrai scrivere spam-bot-site\.net nella regola.

Hai trovato utile quest'articolo?