Root » Webserver » » Index SEO » Spammers » Referer
Search engine optimalisation
en de negatieve gevolgen ervan
Referer spam
Je hebt je eigen webserver (of een webserver bij je provider), waarop webalizer of een andere statistieken-programma draait. Plots verschijnt tussen je statistieken een vreemde vogel: www.e-car-loans-bad-credit.com. Waarom zou dit bedrijf naar jou linken?
-

-

Dit is ook spam

Zoals er email-spam bestaat, bestaat er ook referer-spam. De werkwijze is wat ingewikkelder, en op het eerste gezicht is het nut van dergelijke praktijken niet evident.

Werkwijze van de spammers

De spammer software loopt de SERP pagina's af (dit zijn de resultatenpagina's van bonafide zoekrobotten zoals Google, yahoo en MSN) met zoekwoorden als "usage statistics" of "total referrers" en andere woorden. Deze woorden worden gebruikt door logging software zoals Webalizer. De spammers hadden ook alle sites zelf kunnen overlopen naar tekenen dat er logging pagina's beschikbaar zijn, maar dit is teveel werk: ze laten het werk liever over aan search engines. Een tweede voordeel van het werk te laten doen door de bonafide zoekrobotten is dat de sites ook geclasseerd worden volgens hun ranking. Spammers zullen het liefst sites met een hoge ranking aanvallen, want dat brengt uiteindelijk meer op. Eenmaal dat de spammer bot een dergelijke site gevonden heeft, dan worden er fake pagina-aanvragen naar die site gestuurd, met als referer de naam van hun malafide site (in dit geval www.e-car-loans-bad-credit.com). De logging software van de "aangevallen" site zal deze gegevens keurig in zijn logs opnemen: het paard van Trooie is binnen!

Nut van een dergelijke praktijk

Als de aangevallen site in de zoekresultaten voorkomt met woorden als "usage statistics" of "total referrers", dan is de kans groot dat [1] de site in kwestie logging software draaien heeft, [2] dat de resultaten zichtbaar zijn, en [3] dat ze opgenomen zijn in de index van de zoekmachines. Als deze drie voorwaarden vervult zijn, dan heeft de spammer prijs!
Bij een volgende pass over de site zal de zoekrobot van Google de pagina opnieuw indexeren, maar nu met inbegrip van een link naar de spammer site in kwestie (de logging software heeft immers de fake pagina-aanvragen opgetekend), en daar was het om te doen: de spammer heeft een waardevolle organische link bekomen van een andere site! Hier speelt dus ook de ranking van de aangevallen site een rol: spammer bots zullen het liefst sites met een hoge ranking penetreren, want dan hebben ze meer te winnen als hun link opgenomen wordt. Zoals je uit onze cursus SEO geleerd hebt, hebben sites inkomende links nodig om als "waardevol" gezien te worden door zoekmachines. Hoe meer inkomende links, hoe waardevoller de site in kwestie wel moet zijn.

Referer-spam in de historieken-file van webalizer

Referer-spam verwijderd van de historieken

Verdediging tegen referer-spam

De enige manier om je te verdedigen tegen referer-spam is handmatig alle verwijzigen naar dergelijke sites uit je logs verwijdenen. Webalizer maakt een historische file aan (webalizer.current); dit is een gewone tekst file dat je in een text editor kan inlezen. Gewoon de spam referer vervangen door iets anders. Maak van www.e-car-loans-bad-credit.com bijvoorbeeld no.referer-spam.here, zoals op het voorbeeld hiernaast.
Een van de laatste gevallen van referer-spam is www.weindexed.com. Zij indexeren juist niets (ze lezen enkel de indexpagina meermalen achter elkaar in). Hun site is een heterogene en onbeduidende collectie links, vooral naar porno-achtige sites.

Dergelijke spammer sites vallen snel door de mand: je site is doorgans niet zo belangrijk dat je een link van de homepage van een site zou krijgen. Alle links die afkomstig zijn van de root (de index page van het domain) zijn dus verdacht. Je kan een script schrijven dat alle verwijzingen naar de root verwijderd (www.mysite.com zonder directory- of filenaam).

Om zeker te zijn dat er geen spammer door de mazen glipt, kan je altijd volgende meta-tag in de heading van je logs opnemen:
HTMLHead <meta name='robots' content='noindex, nofollow'>
HTMLHead is de Webalizer-tag dat je moet gebruiken om extra tekst in te voegen aan het begin van de pagina (de tag zit in het bestand webalizer.conf).
Met noindex, nofollow vertel je aan zoekrobotten die je site indexeren dat deze pagina (en de bijhorende links) niet in de statistieken opgenomen moeten worden. Je kan ook een robots.txt file aanmaken met de directory waar Webalizer zijn resultaten plaatst als "onbeschikbaar" gemarkeerd, of je kan de directory met een passwoord beschermen (nog beter!) indien mogelijk.

PublicitÚs - Reklame

-