Semalt: una guida eccellente per bloccare lo spam dei referrer in Google Analytics

Nik Chaykovskiy, l'esperto di Semalt , assicura che lo spam referral è uno dei problemi che i webmaster attualmente devono affrontare. Nel corso degli anni la situazione è peggiorata, il che significa che qualcuno da qualche parte guadagna molti soldi creando spam di riferimento.
Spam fantasma e di riferimento
Lo spam è ora arrivato ai rapporti di Google Analytics. Gli spammer cercano vulnerabilità nel sistema in modo che possano apparire nei rapporti sui dati del sito Web. Lo fanno con la speranza di suscitare abbastanza curiosità al punto che il webmaster visita il loro sito Web per capire perché si trovano nel rapporto. Il problema è che non aumentano il traffico. Non ce la fanno nemmeno perché sono robot. Usano il codice di monitoraggio JavaScrip utilizzato da Google Analytics per creare una notifica di visita. Finiscono per distorcere statistiche vitali come la frequenza di rimbalzo e altri elementi utilizzati per analizzare il coinvolgimento. È indispensabile bloccare lo spam di riferimento se si hanno bisogno di dati precisi, soprattutto se si basano su di esso per prendere decisioni di marketing.
Diventa difficile bloccare lo spam di riferimento soprattutto perché gli spammer lavorano molto velocemente, aumentando il tasso di spam e le fonti. Significa che i webmaster devono migliorare gli sforzi che fanno per eliminare e inserire nella lista nera queste fonti. È particolarmente problematico per le persone che hanno nuovi siti che non ricevono molto traffico legittimo. Un aumento dei tassi di spam su tali siti presenterebbe una maggiore asimmetria, che potrebbe persino essere superiore ai risultati giornalieri che riceve.
Quanto è facile?
Una pagina carica i record come una singola visita. Gli spammer fantasma utilizzano il codice di monitoraggio di Google Analytics e inviano i dati sul traffico direttamente ai rapporti, creando così una visita. Potrebbero essere necessari 0,001 secondi per caricare una singola pagina su un server da qualche parte. Tuttavia, potrebbero aver forzato oltre 100 di queste visite contraffatte sugli account Google di molti altri siti dappertutto. È abbastanza facile acquistare un singolo host. Finché gli spammer sono sicuri del ROI, possono subire molti danni.

Soluzioni che arrivano a breve
Alcune tecniche sono talvolta così avanzate che le soluzioni utilizzate per bloccare lo spam di riferimento non funzionano. Uno di questi è il misterioso servizio online chiamato Darodar. I seguenti metodi non lo hanno cancellato da GA.
- Il file .htaccess. Non funziona poiché lo spam fantasma non tocca il sito
- L'elenco di esclusione da referral. Manca di aggiornamenti.
- Filtri di esclusione. È un metodo obsoleto poiché si concentra solo sullo spam futuro e non retroattivo per i database spam precedenti.
Il filtro di esclusione si è quasi avvicinato all'eliminazione dello spam di riferimento di Darodar. La sua unica limitazione era che non ha un elenco di spammer di referral costante e costantemente aggiornato.
Il pezzo mancante del puzzle
Una soluzione utilizzabile per identificare e bloccare i dati di riferimento e fantasma dovrebbe essere molto aggiornata, proveniente da un database più ampio e retroattiva alle informazioni passate. Basato sui tre elementi per una soluzione ottimale, eccone uno che funziona.
Passaggio 1: utilizzo dei segmenti per escludere lo spam
È meglio utilizzare i segmenti poiché non alterano i dati in modo permanente. Se si filtrano accidentalmente veri referrer mentre si usano i filtri, non c'è modo di recuperarli. È possibile basarsi su vecchi dati utilizzando i segmenti, nonostante da quanto tempo sia lì. Si possono anche applicare retroattivamente.
Passaggio 2: Gestione dell'elenco di esclusione
Slack è uno strumento che i webmaster possono utilizzare per monitorare le fonti di referral. Informa l'utente in merito a eventuali nuovi referral e fornisce loro un prompt: se autorizzare o inserire nella blacklist una fonte di referral sospetta.
1. Slack riceve tutti i referral e
2. Utilizza un PHP per ordinare tutti i risultati per ordine di conteggio, quindi passa l'elenco finale al webmaster per vedere se qualcuno sembra familiare. Altrimenti,
3. Inoltra tutto lo spam sospetto a un canale lento che offre all'utente una scelta tra una lista bianca o una lista nera. Qualunque opzione scelgano, porta al passaggio 4,

4. Reindirizza a una pagina che verifica il verdetto come conferma della selezione.
5. Slack quindi memorizza e blocca tutti gli spammer identificati nel database
6. La visualizzazione finale dei dati puliti sarà in formato regex. Copialo e incollalo in Google Analytics.
Slack consente ai webmaster di aggiornare l'elenco di esclusione almeno cinque volte al giorno.
In realtà, possono funzionare diverse soluzioni:
Nonostante sia un metodo collaudato, funzionerebbe ancora meglio se il webmaster lo integrasse con altre tecniche, solo per assicurarsi che coprissero tutte le basi. Oltre a detta soluzione:
- Fai clic sulla casella di controllo che richiede a Google Analytics di escludere robot e ragni noti,
- Applica un "Includi filtro nome host",
- Usa i cookie
Il filtro inclusivo di cui sopra è efficace a volte, ma non è la soluzione migliore a lungo termine perché:
- Lo spoofing dei nomi host non è difficile e gli spammer di analisi lo usano sempre più come vulnerabili.
- Se l'installazione è errata, potrebbe finire per filtrare i referrer reali.