Comment éviter un SEO négatif et le black hat SEO – SMX Paris 2011

Pour le SMX de Paris de cette année, je me suis glissé dans les valises de mon ami Paul (de SEOBlackout) pour animer une conférence sur le negative SEO.
J’ai aussi réussi à boire un café au péril de ma vie aux salons Hoches, dieu m’en est témoin (au pire 512banque témoignera, mais c’est moins classe).
Vous trouverez ci-dessous la présentation, ainsi qu’une rapide présentation du black hat.

SMX Paris 2011

Qu’est ce que le black hat ?

La terme black hat vient d’une conférence sur la sécurité et désigne les hackers. On oppose souvent white hat et black hat, vous avez tous en tête l’image d’un western. Le black hat seo est le vilain référenceur, alors que le white hat est le gentil, mais cela uniquement du côté du moteur de recherche, en particulier de Google.

Le black hat n’est pas obligatoirement illégal, même si certaines actions amènent à traverser hors des clous. Google classe les pages à l’aide d’un algorithme, le black hat essaye de se positionner même s’il doit pour cela ne pas respecter les règles dictées par le moteur.
Tous les sites n’ont pas besoin d’une prestation black hat, que cela soit en interne ou en externe.
C’est pourquoi la majorité des référenceurs tentent bon gré, mal gré de faire plus ou moins avec les règles.

Le black hat seo n’est pas un hacker, du moins pas forcément et n’a certainement pas le même niveau qu’un « vrai » hacker. Le black hat est avant tout un référenceur qui a une bonne connaissance du référencement, le black hat est donc un bon « white hat ». Si ce n’est pas le cas, il n’est pas un référenceur compétent et met en danger ses sites ou ceux de ses clients.
Les actions d’un référenceur ont des conséquences, il ne faut pas confier son référencement à n’importe qui, à moins de se moquer de sa visibilité en ligne.

En quelques mots, le black hat seo connait les optimisations qui fonctionnent et qui sont autorisées par Google & co, il est curieux et teste et reteste pour pouvoir contourner les consignes et se positionner plus rapidement, plus facilement.

D’ailleurs dans certains secteurs, il est impossible de se positionner sans utiliser ce type de secteur, même les principaux acteurs trichent.

En quoi le référencement peut être négatif ?

Il est possible d’influer sur le positionnement des sites, il est normal que l’on puisse agir dans le sens inverse. Tout comme pour le référencement, il est possible d’intervenir via des facteurs internes et via des facteurs externes.

Negative SEO SMX Paris 2011

Exploiter des failles : seo négatif

Faire tomber un site est possible, hacker un site, le rendre hors service ou injecter un code malicieux est faisable, vous avez tous déjà vu ou entendu parler d’un tel acte.
D’un point de vue du référencement, les risques sont gros pour une conséquence faible sur le positionnement du site.

Le dernier exemple que j’ai en tête est le site prestashop.com qui redirigeait vers le site du FBI. La découverte de ce hack est liée à la technique utilisée : les utilisateurs ne renvoyant pas de referer (comme Google) ont été redirigé vers le FBI.
Cela peut permettre de désindexer certaines pages sans que le webmaster s’en rende compte immédiatement, mais c’est risqué et souvent provisoire.

Plus généralement, le black hat exploite des failles dues au mauvais développement : mauvais entête, erreurs 404, 500…

Il est possible de jouer sur les faiblesses d’un site :

  • DC interne.
  • Insertion de code.
  • Manque de liens.
  • Jeunesse du domaine.
  • Hebergement.

Actions classiques

  • DC interne.
  • DC externe.
  • Création d’erreurs.
  • Suppression de liens chez les partenaires.
  • Bad noise.
  • Filtre adulte.
  • Positionnement image.
  • Echange de liens biaisé.

Présentation comment éviter un SEO négatif et le black hat SEO

Negative SEO : SMX PARIS 2011

13 réflexions au sujet de “Comment éviter un SEO négatif et le black hat SEO – SMX Paris 2011”

  1. Hmm, au final tu ne dis pas comment éviter un NSEO.

    Petite erreur pour Prestashop, cela ne venait pas du non-referer des internautes mais bien d’un referer spécifique Google. En plus, ceux qui ont signalé le problème venait d’une page de résultat de Google, certains l’avaient et d’autres ne l’avaient pas (même avec referer activé).
    Par contre si l’url de Google ne possedait pas le paramètre "ie=", cela passait sans problème.
    Le responsable de Prestashop a lui même avoué qu’il s’agissait d’un filtre anti-spam mal configuré.

    En fait ils ne se sont pas fait facilement hacké, juste une erreur de config ^^

    Répondre
  2. Etrange, nous arrivions à accéder au site sans JS, ni referrer. Mauvais exemple, mais le hack avec 301 ou canonical se répand tout de même. 😉

    Comment se protéger ? Il faut éviter ce que je liste plus haut.

    Répondre
  3. Justement, le site était accessible à partir du moment où le referer ne contenait pas google.com…&ie=
    Je ne sais pas c’est quoi ce ie= mais si c’est une config de robot antispam ça m’a tout l’air d’être une url retournée aux scrapeurs…

    Répondre
  4. ça craint du boudin ces techniques. Concernant les pages 16 et 17 elles concernent un commentaire dans un forum de SPIP. J’ai des sites sous Spip et les visiteurs peuvent poser des commentaires. La validation est effectuée à priori. J’aimerais savoir lorsque la validation du commentaire est demandée l’administrateur peut voir le code malicieux avant de valider ?

    D’avance merci pour la réponse.

    Répondre
  5. L’exemple tiré du "never trust user input" est particulièrement astucieux. Merci en tout cas pour le diaporama même si je regrette que les clés pour s’en protéger ne soient que très peu développées.

    Répondre
  6. Super présentation, même si je n’adhère pas du tout aux pratiques de négative SEO, ça permet de se documenter et d’y faire face si jamais on en est victime.
    D’ailleurs j’ai appris quelques trucs notamment le hotlinking d’images provenant de sites X (c’est pas dans la prez mais j’ai lu ça sur twitter en live tweet).

    Répondre
  7. Il y a plusieurs choses à mettre en place pour éviter d’être victime de référencement négatif. En évitant de laisser les internautes poster du code HTML dans les commentaires, formulaires, en optimisant correctement son site (supprimer la duplication possible), et globalement en s’occupant du référencement de son site.

    Si tu as des cas particuliers, tu peux me contacter directement Eric.

    Répondre
  8. @Expert en sécurité informatique et web, certes on peut réduire le risque de negative SEO mais on ne peut pas restreindre entièrement ce nouveau système.
    Si tu es devant un concurrent et que celui-ci a déjà tout tenté pour passer devant toi, sur une requête spécifique, il n’hésitera pas à trouver un moyen de mettre en place une stratégie de NSEO.

    Répondre
  9. Salut, d’abord je me demande si mon site en construction est nuisible pour ta page si tu laisses le lien? Donc si tu ne me laisses pas le lien je ne t’en voudrai pas biensur 😉
    Sinon j’aime bien la morale de fin: qu’il est plus facile de pousser son reférencement plutôt que de faire tomber un concurrent, donc il vaut mieux évidemment opter pour la première option.
    @+

    Répondre

Répondre à Vincent Annuler la réponse