Root » Webserver » » Index SEO » Spammers » Scraper sites
Search engine optimalisation
De inhoud van je site bij iemand anders
Scraper sites
De inhoud van je eigen site bij een concurrent of een scraper site

Stelen van inhoud

De uiteindelijke bedoeling van een website is bezoekers naar de site te lokken. Er bestaan talrijke manieren om het aantal bezoekers op te trekken: zorgen dat je een interessante site hebt (dan krijg je automatisch backlinks, dat wil zeggen andere sites die naar je site linken), zorgen dat je site geoptimaliseerd is voor zoekrobotten, enz. Je kan ook bezoekers aantrekken door middel van online advertenties (het meest bekende systeem zijn de Adwords van Google). Dit zijn allemaal aanvaardbare technieken, ze worden "white hat" technieken genoemd.

"Black hat" technieken

Maar er bestaan ook andere technieken die minder geoorloofd zijn. Eén van de internet-plagen zijn de scraper sites: zij halen hun tekst bij andere sites (en het resultaat trekt meestal op niets), en op hun site plaatsen ze dan zoveel mogelijke advertenties en pop-ups.
Google is ondertussen op de hoogte van dergelijke praktijken en zal geen advertenties willen plaatsen op deze sites, maar er bestaan genoeg malafide bedrijven die hun advertenties wel willen plaatsen: ringtones, smileys, "hot paris hilton videos", online casino's, verzekeringen, leningen, gratis software (vol malware zodat je computer een zombie wordt —een computer dat spamberichten de wereld rond uitstuurt).

Op de site rechts zie je tekst dat van één van mijn sites geplukt is (van de pagina over digitale fotografie en scherpstelling). De tekst heeft natuurlijk geen betekenis meer (de contekst en formatering ontbreekt), maar dit is niet de bedoeling. De bedoeling is bezoekers naar de site te lokken, om ze dan te bombarderen met talrijke advertenties (gelukkig dat ik een pop-up blokker had!). De tekst hebben ze enkel nodig om goed te scoren in de zoekmachines. Je mag op de foto klikken voor een uitvergroting, je wordt niet naar de site in kwestie gezonden!

Gezien vanop afstand lijkt de pagina heel gewoon (als de pop-ups tegengehouden worden, tenminste), maar de tekst is gewoon overgenomen van één van mijn sites. Natuurlijk gaan de spammers sites plunderen die goed scoren in de zoekrobotten (de gebruikte woorden zijn goed gekozen). Naast het stelen van de inhoud van je site gebruiken de spammers ook zoveel mogelijke "white hat" technieken, maar passen die dan zuiver mechanisch toe, zoals het overnemen van de titel in de url en het herhalen van de titel op meerdere plaatsen. Zowel de scraper robot als de google robot begrijpen de tekst niet: de scraper robot neemt tekst over van sites die goed scoren in de zoekresultaten, en de google robot bekijkt enkel de gebruikte woorden om de site te indexeren. Robotten onder elkaar...

Dat Google het niet allemaal kan overzien zie je misschien in de advertenties rechts (advertentiebalk van Google): ik had die dag niet minder dan 3 advertenties voor "scraper tools", programma's die de inhoud van andere sites overnemen. Laat dergelijke adverteerders betalen voor het leed dat ze veroorzaken en (eigenlijk mag ik het niet zeggen...) ++++ ++ ++ ++++ ++ ++++++++ zodat de adverteerders moeten betalen (pay per click systeem).

Maar niet enkel spammers nemen je teksten over, je komt regelmatig je eigen teksten tegen op het internet. Een zekere fotograaf “Rudje” heeft zomaar de inhoud van één van mijn pagina's overgenomen. Tja, als je op de eerste plaats in google zit voor bepaalde woorden is het bijna onvermijdelijk dat anderen de inhoud overnemen. Zelfs de CSS heeft ie letterlijk overgenomen, zoals je op de tekst-view van de pagina kan zien! Door de background van mijn site te halen had ik het direct door dat het een slaafse kopie van een paar pagina's van mijn site was. De meesten vergeten echter dat de inhoud van de pagina overnemen niet voldoende is. Google weet al lang wie de oorspronkelijke pagina geschreven heeft!

Links to relevant pages - Liens vers d'autres pages au contenu similaire - Links naar gelijkaardige pagina's

-