6 July 2009

Plugin Anti spam Wordpress : les mots des commentaires

juin 11, 2009

Nous sommes de nombreux bloggers à subir le spam des commentaires dans nos blogs Wordpress…
J’entends déjà les deux du fond qui rient en se disant “Ha! un Black Hatter qui se plaint du spam ! :D “, passons…
Mais le problème demeure… et l’on reçoit des salves de 10 ou 20 commentaires à la fois, en différentes langues, allemand, anglais et russe en majorité…
Il est intéressant de regarder le contenu de ces commentaires… On trouve même des textes de Alice au pays des merveilles avec des liens vers des sites porno ou de viagra :lol:

NO SPAM

Les plugins Wordpress antispam déjà connus

On connaît de nombreux plugins qui permettent de diminuer ce problème, mais cela diminue également la participation des lecteurs… Je pense ici aux antispams par captchas…
Les captchas c’est efficace, mais c’est aussi handicapant pour les visiteurs. C’est également un challenge que certains aiment relever : le bypass captcha, où quelques rares fanatiques du Black Hat excellent ;)

Il existe également des plugins qui font une interaction avec Javascript (qu’on ne peut pas interpréter quand on fait un bot de spam), mais le bypass est ultra simple…. il n’y qu’un petit bout de code d’une dizaine de lignes pour poster autant de commentaires que l’on souhaite…

En finir avec le spam de goret

Vous étiez en train de vous demander “quand est-ce que quelqu’un proposera une réelle alternative au spam de commentaires ?”, non ?
Et bien c’est déjà fait, si vous êtes un tant soit peu intéressé(e)s par les techniques Black Hat, vous n’aurez pas manqué ce billet : Google Language API : utilisation antispam.
Tiger propose une solution très intéressante pour confronter la langue du commentaire à une ou deux langues que vous aurez choisies. Si la langue du commentaire n’a pas récolté un indice de confiance suffisamment proche, le commentaire sera tout simplement supprimé…

Finis donc les soucis de base de données et de recherches des commentaires intéressants :P
Oui mais le code, on le met où ?

Ultimate Antispam Wordpress Plugin

Comme vous êtes un lecteur des bons blogs SEO francophones, vous avez certainement lu cet article : Ne personnalisez pas WordPress, écrivez un plugin
Vous allez donc adopter les bonnes pratiques et garder la possibilité de mettre à jour votre blog. C’est du moins ce que j’ai fait, avec la permission de Tiger. Et je dois dire que le résultat est tout à fait sympa :D
Voici donc le plugin WordPress antispam basé sur la langue du commentaire, téléchargeable ici
» WordPress Antispam Plugin

Une fois activé, rendez-vous dans la partie “Réglages” du plugin et sélectionnez les langues que vous souhaitez autoriser sur votre site pour les commentaires.
Sauvergardez vos préférences et appréciez le travail de cette extension bien sympa ;)
Pour aller plus loin, je vous recommande d’appliquer aussi le filtrage par mots-clefs, intégré à votre installation WordPress.

J’espère que ce plugin vous plaira et que vous saurez quoi en faire ;)
Vos commentaires et suggestions sont bien sûr les bienvenus !

Solutions Jeu Referencement : les solutions de jeu-referencement.com

juin 4, 2009

Comme pour toute bonne action, il y a toujours un âne qui va pourrir le bon et faire crever de l’intérieur des initiatives constructives, ludiques et enrichissantes.
Nous avons trouvé sans grande joie mais plutôt avec dégoût, un article qui dévoile étape par étape les solutions du jeu dont on parlait précédemment et pour lequel j’ai décidé d’afficher les bannières.

Trouver les solutions du jeu referencement, mais pourquoi donc ?

S’il ne s’agit pas d’une histoire d’égo, je ne vois pas bien l’intérêt ici…
Plusieurs joueurs ont trouvé les solutions sans souci, d’autres y sont encore mais n’ont pas abandonné… Quel intérêt de livrer les solutions de jeu-referencement.com alors que l’on est toujours dans l’émoi ?
Franchement, je ne comprends pas et n’arrive pas à l’accepter.

jeu-referencement.com les solutions n’enchantent pas tout le monde

Je ne suis pas le seul à être dérangé par de tels actes. Que Tiger et Aurélien soient lésés de l’honneur de révéler les solutions pas un blogueur qui n’a que 2 encarts AD42 sur la droite de son post est très triste…
Si encore il y avait un peu d’argent à se faire, mais avec ce genre de méthodes, aucun annonceur ne voudrait poser d’encarts…. Question d’e-reputation…

Donc, certains blogueurs plus talentueux se sont élevés contre cette triste cause :

A vous de jouer maintenant !

Solutions au jeu de référencement : ne les cherchez pas sur le net, trouvez-les !

Si l’auteur du post en question ne souhaite pas retirer le billet, alors essayez simplement de l’ignorer… Evitez la tentation et élevez-vous plus haut que lui, cela vous permettra de réfléchir et de vous sortir du carcan de la pensée white hat de base…

Ne vous laissez pas pourrir pas des initiatives basses, élevez-vous !
Sinon, pour les flemmards, les vraies solutions sont là : les vraies solutions du jeu referencement mais aussi sur le site de l’un des créateurs : jeu referenceur les solutions et surtout là : solutions epreuve jeu-referencement.com

SEO Black Hat : le jeu

juin 2, 2009

Je sais, je sais, je suis en retard pour en parler, mais tout de même, il fallait que j’écrive quelque chose dessus, c’est tellement rare et précieux ce genre de sites, que l’on ne peut pas le laisser passer comme ça

Seoblackout - Blog SEO Black Hat Oseox - Portail webmarketing

Un jeu pour les SEO

Vous connaissez déjà les organisateurs si vous lisez régulièrement les actualités et billets SEO francophones. Il s’agit de Tiger, éditeur du blog SEOblackout et d’Aurélien Bardon, le créateur du portail OSEOX.
On ne les présente plus dans le milieu, et aujourd’hui je leur rend hommage pour leur initiative.

On commençait à s’ennuyer un peu dans le référencement francophone… Plus beaucoup de nouveautés, Kumo qui se faisait attendre, même Google nous a fait une Dance anticipée pour continuer de nous motiver… Il était temps d’agir !
Pour en finir avec la monotonie et la grisaille du SEO, ils ont mis en place ce jeu à destination des référenceurs, et notamment pour les référenceurs Black Hat.
Tout le monde est convié bien entendu, et les plus ferrus comme les plus novices pourront tenter de percer les secrets et astuces présentées au fil des épreuves.

Comment on joue ?

Facile, vous vous rendez à la première épreuve du jeu pour référenceur, et vous cliquez sur le lien qui mène à la première épreuve ;)
Toutes les épreuves ont un lien direct avec le référencement, et vous disposez systématiquement d’un indice plus ou moins obscur pour vous aider à trouver la solution.
Et n’oubliez pas cette phrase :

Que tu sois un novice de la balise title ou un véritable SEO Rockstar, ce jeu est fait pour toi.

Cela résume bien l’esprit du jeu :)

Jeu référencement

Qu’est-ce qu’on gagne ?

Comme dans tout jeu, il y a un but, mais ici il y a en plus une récompense pour les premiers :D Un joli BL sur la page d’accueil du site. Tout est expliqué sur le site, alors tentez votre chance et confrontez-vous aux tests de ce jeu très prenant !
Le site : http://www.jeu-referencement.com/

Et vous, jusqu’où êtes-vous arrivés ? :D

Et j’ai crié, crié, Alexa pour qu’elle me rank

mai 15, 2009

Booster son Alexa Rank… pas toujours facile…
Aujourd’hui, cet indicateur a de plus en plus de poids dans les évaluations d’un domaine, et il n’est pas toujours facile de l’augmenter car on ne sait pas exactement sur quoi son évaluation est basée.
Enfin, plutôt, on ne savait pas car après quelques tests et retours d’expériences, j’en suis arrivé à quelques conclusions plutôt sympathiques….

Alexa Rank

Alexa Rank, c’est quoi ?

Voici une petite définition de cet indice de popularité, extraite du site, dans la langue de Shakespear.

A measure of a website’s popularity.
The rank is calculated using a combination of average daily visitors and pageviews over the past 3 months. The site with the highest combination of visitors and pageviews is ranked #1.

Pour ceux qui ne savent pas, l’Alexa Rank est un indice de popularité d’un site Internet. Plus son rang s’approche de 1 plus le site est populaire. En d’autre termes, ne vous extasiez pas si votre Alexa Rank est de plusieurs millions…. Si c’est le cas, mettez-vous sérieusement au travail !

Où trouver son Alexa Rank ?

Quelle question ! Sur le site d’Alexa bien sûr ! :P
Voici le lien vers la page de détails de mon blog BlackMelvyn’s Rank. Un ranking pas trop mal pour un petit blog black hat :D : 500 000 !

Alors comment on augmente l’Alexa Rank ?

Je ne vais pas vous donner l’astuce toute chaude dans la bouche, mais je vais vous donner la clé…
Après avoir cherché quelques temps à augmenter artificiellement mon indice, il m’est apparu évident que le moteur Alexa devait utiliser des sources de données qu’il maîtrisait.

Premier essai, j’ai utilisé des widgets Alexa sur quelques sites tests et j’ai regardé leur effet sur mon rank… Assez décevant :( Très peu d’amélioration…
Les résultats étaient davantage dûs à mon travail qu’à ce widget (on aurait pu en effet ajouter tout une série de widgets à intervalles réguliers pour booster les résultats, mais c’est peine perdu, dommage :) )

Finalement, j’en suis revenu à la bonne vieille méthode… J’ai regardé le code de la toolbar d’Alexa pour Firefox…. Et là, tout est apparu plus clair :D
Avec cette toolbar, Alexa reçoit un nombre important d’informations sur les sites visités par les internautes détenteurs de la barre d’outils, et donc, après quelques tests, en fonction des populations de visiteurs, l’Alexa Rank augmente fortement !

Vous avez donc la clé pour augmenter votre Alexa Rank artificiellement : proxies, cookies, Alexa Toolbar (Sparky) et AUTOMATISATION alors à vos ranks !

Outil pour vérifier ses échanges de liens

mars 18, 2009

Tout le monde connaît l’importance des backlinks en référencement. C’est un ingrédient indispensable à la visibilité de son site internet dans les pages de résultats des moteurs de recherche.
On peut se procurer des backlinks de plusieurs manières :

  • en rédigeant des articles et des communiqués de presse
  • en s’inscrivant à des annuaires (annuaire généraliste ou annuaire thématique)
  • en achetant des liens (pas bien, evil)
  • en réalisant des échanges de liens

C’est sur ces 2 derniers points que j’aimerais intervenir dans cet article.

Les échanges de liens

Pour un site traitant d’une thématique particulière, il est important d’obtenir des liens provenant d’autres sites situés dans une niche identique ou proche. Cela permet aux moteurs de recherche d’accorder de la pertinence au site en question puisqu’il est “recommandé” par ses pairs.

La technique consistant à échanger des liens est donc très profitable lorsque c’est bien fait.
On distingue différents schémas de linking. Il est effectivement déconseillé de faire des échanges bilatéraux à outrance. On préférera, dans le cadre de nombreux échanges de liens, des schémas dits A B C.
Il s’agit d’un accord entre webmasters où le propriétaire du site A fait un lien vers le site B qui fera un lien vers le site C.
On peut trouver des schémas bien plus complexes et qui sont tout aussi, voire plus fructueux.

Acheter des liens

Tous les SEO vous le diront, acheter des liens, c’est mal. Google pénalise sévèrement les sites qui vendent leurs liens pour accroître artificiellement la popularité des sites qui en ont acheté. C’est un fait :lol: .

Les sites se font griller à cause de traces laissées par les régies, par exemple. Mais la technique reste utile lorsque la vente est négociée en direct avec les webmasters ciblés.

Inconvénients de ces méthodes de linking

L’inconvénient principal de ces méthodes est qu’il faut sans cesse vérifier la présence de ses liens sur les pages de ses partenaires.
C’est un travail fastidieux et l’on pourrait tout à fait utiliser son temps bien plus profitablement plutôt que de le passer à vérifier chaque page chaque jour.

Surveiller ses échanges de liens automatiquement

Il existe aujourd’hui un script qui permet de vérifier ses échanges de liens automatiquement.
Avec ce type d’outils, vous recevez un rapport détaillé de l’état de vos échanges ou achats de liens.

Exemple de rapport détaillé
Rapport de vérification de la présence des liens

Je vous invite à découvrir cet outil de vérification de liens qui en plus d’être utile à tous les SEO qui pratiquent les échanges de liens, permet également aux black hatters de vérifier la présence de leurs liens cachés :D
Si c’est pas une bonne nouvelle ça ! :lol:

Plugin pour supprimer les doublons dans les autoblogs WordPress

février 27, 2009

Aaahhh les flemmards ces webmasters, ils ne veulent pas écrire d’articles pour faire du contenu…. Alors comment font-ils ?
La réponse est simple et tient en un mot : autoblog. Un autoblog, c’est un blog qui fonctionne en mode automatique, c’est à dire que vous n’avez qu’à le mettre en place et il ne requerra plus aucune action de votre part pour fonctionner.
Le contenu est ajouté automatiquement grâce à quelques plugins (que vous adorerez chercher sur internet, j’en suis sûr :P ) qui scrapent le contenu de flux RSS et les implémentent comme des posts normaux.

Voilà ce qu’on appelle un autoblog. Mais alors, quels sont les facteurs qui vont griller ces machines à contenu ?
Il en existe un petit paquet, mais les éléments majeurs sont pour les moteurs de recherche :

  • Contenu dupliqué
  • Titres identiques
  • Liens retour vers les sites scrapés
  • etc…

Mais les moteurs servent à envoyer du trafic, et le trafic peut s’acquérir via d’autres sources… Alors quels sont les points qui vont faire que notre autoblog sera grillé par les visiteurs cette fois ?

  • Des articles incomplets
  • Et surtout des posts dupliqués !!

En effet, c’est sur ce dernier élément que j’insiste car il existe tout un tas de solutions habiles pour corriger les autres points, mais pour supprimer les posts dupliqués, j’ai eu beau chercher longtemps, je n’ai pas trouvé…Jusqu’à il y a quelques jours…
On n’a effectivement pas l’air super crédible quand notre blog contient 3 à 7 fois le même article en home page :lol: Les visiteurs vous grillent et partent sans cliquer sur les pubs :(
C’est alors qu’un de mes amis Black Hatter dont je tairai le nom mais qui se reconnaîtra, m’a fait passé un lien très intéressant d’un blogueur US qui avait trouvé une parade intelligente. Le mérite leur revient donc, moi, je n’ai fait qu’implémenter ce code dans un plugin WordPress que vous pouvez télécharger ci-dessous.

Le principe est simple, le plugin va rechercher lors de la publication d’un nouveau post, tous les articles dont le titre est identique et ne va conserver qu’une seule version. De cette manière, on élimine tous les billets dupliqués et l’on ne garde qu’un billet unique à chaque fois, ce qui permet d’avoir un blog crédible.
Cela ne vous évitera pas de vous faire avoir lors d’une évaluation manuelle de votre compte, mais cela aura au moins le mérite de pallier à certains petits soucis…

Je vous ai donné la réponse à l’un des facteurs “red flag” des autoblogs, à vous maintenant de trouver les autres ;)

Pour télécharge le plugin, ça se passe ici :
» clearDuplicatePosts_v0.1.zip

Failles XSS : encoder les urls

février 2, 2009

Nombreux sont ceux qui ont lu les articles sur les failles XSS, si précieuses pour récupérer des liens de sites .gov et autres .edu, et qui perdent parfois un temps fou à les transcoder pour les faire indexer rapidement.

Pour rappel, les failles XSS (Cross Site Scripting) permettent d’injecter du code dans une page donnée mal sécurisée, via un paramètre de l’url.
Dans le cas présent, nous ne cherchons qu’à déposer un lien qui sera invisible pour l’administrateur du site qui ne regarde pas ses logs. Cependant, les applications peuvent être tout à fait meurtrières pour les sites visés. Attention donc à veiller à sécuriser vos sites ;)

On connaît plusieurs techniques pour faire indexer ces liens : les caching proxies, les liens cachés dans les sites qui ne nous appartiennent pas, les pages “satellites” (qu’elles servent encore à quelque chose :D ) etc…

Mais la problématique demeure… Comment aller plus vite pour encoder les urls et les balancer sur le web ?
Aujourd’hui c’est un petit outil très simple que je vous propose, et qui fera gagner du temps à ceux qui ne l’ont pas déjà développé.

Il s’agit d’un script PHP simplissime qui vous présente un formulaire à trois champs dans lesquels il vous suffit d’entrer l’url de la page à scripter avec le paramètre qui nous intéresse laissé vide et en dernier (cf. exemple), l’url de la page que vous souhaitez linker et l’ancre du lien.
Le résultat sera le code source du lien à ajouter (ou plutôt à injecter) dans les pages que l’on vise.

Le script d’encodage est en téléchargement libre ici : XSS encoding script
et en démo sur cette page : Démo XSS encoding script

A vous maintenant de linker les pages que vous avez indexées pour les populariser :D

Les applications du cloaking : cloaking sur referer et IP delivery

janvier 29, 2009

Nous voici à nouveau sur cette technique du cloaking. Après avoir lu avec conscience et sérieux le premier volet introductif aux techniques de cloaking, vous devez être impatient(e)s de connaître ou confirmer ces techniques en environnement réel.

Je présenterai ici une petite collection des applications du cloaking, qui bien sûr n’est pas limitative et encore moins une référence. Le cloaking peut être amélioré, affiné, et chacun aura sa recette (plus ou moins bonne).

Le cloaking sur referer et IP delivery qu’est-ce que c’est ?

Le cloaking sur referer : “dis-moi d’où tu viens et je te montrerai ce que tu aimes”

Le cloaking sur referer est une technique visant à présenter un contenu différent en fonction de la provenance du visiteur (humain ou robot). En PHP, on se servira de la variable super globale $_SERVER pour le récupérer et l’utiliser à nos fins.

$referer = $_SERVER['HTTP_REFERER'];

IP delivery : “dis-moi qui tu es et je te montrerai ce que tu cherches”

L’IP delivery consiste à “délivrer” un contenu en fonction de l’ip du visiteur. C’est simplement du cloaking sur IP, mais avec la différence que ce n’est pas destiné forcément aux robots.

Un exemple plus parlant et concret est le fait d’utiliser l’IP delivery pour cibler les publicités que l’on diffuse en fonction de la zone géographique du visiteur.

Cloaking sur referer et IP delivery en action

Voici une technique assez puissante qui vous permet d’obtenir des liens sans que l’échange soit complètement réciproque.
Je m’explique. Vous avez passé votre pause déjeuner à vous concocter une armada de MFAs pour financer vos prochaines vacances. Pas peu fier de la somme de contenu que vous avez réussi à amonceler, vous vous dites “Voici de quoi nourrir un bot !”.
Mais pour que le bot trouve votre mine de contenu, il faut faire connaître les sites… Donc, vous commencez votre référencement sur des annuaires plus ou moins populaires, ou à validation automatique qui forcément vont vous demander des liens retour (s’ils ne vérifient pas le contenu du site, ils vérifieront la présence du lien).
Pour cela, 2 solutions : soit ils lancent un script de vérification, soit ils y vont manuellement. C’est là que l’on applique notre script…

Dans une base de données, on enregistre le domaine du site (tld, pas de sous-domaine hein), on insère aussi l’ip du serveur et finalement, le code source du lien qui sera vérifié.

 CREATE TABLE `seo`.`partenaire` (
`partenaire_id` INT NOT NULL AUTO_INCREMENT ,
`partenaire_domaine` VARCHAR( 30 ) NOT NULL ,
`partenaire_ip` VARCHAR( 16 ) NOT NULL ,
`partenaire_code` TINYTEXT NOT NULL ,
PRIMARY KEY ( `partenaire_id` )
) ENGINE = MYISAM

Maintenant, on va détecter de manière assez simple si le visiteur (humain ou script) vient du serveur sur lequel on a soumis un lien. Pour cela, on utilisera la fonction suivante.

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
<?php
//  Vérifier que le referer n'appartient pas à un annuaire auquel on a soumis, sinon, on affiche le lien
function bad_referer($referer, $ip){
  $buffer = '';
  $value = null;
 
  //  Isolation du domaine
  $uri = parse_url($referer, PHP_URL_HOST);
 
  //  Récupération du TLD
  if (preg_match('#www\.#U', $uri)){
    preg_match('#www\.(.*?)\.?(.[a-z]{2,3})#Usi', $uri, $match);
    $value = $match[1].$match[2];
  }
  else{
    preg_match('#.*\.(.*?)(.[a-z]{2,3})#U', $uri, $match);
    $value = $match[1].$match[2];
  }
 
  //  Affichage de tous les codes des partenaires pour ce domaine
  $q = mysql_query("SELECT * FROM partenaire WHERE partenaire_domaine='".$value."' OR partenaire_ip='".$ip."'");
  if(@mysql_num_rows($q) != false && @mysql_num_rows($q) > 0){
    while(@$r = mysql_fetch_object($q)){
      $buffer.= ' '.stripslashes($r->partenaire_code);
    }
  }
 
  echo $buffer;
 
  return;
}
?>

L’utilisation est très simple, à l’endroit où vous souhaitez afficher les liens des partenaires, il suffit d’appeler la fonction comme cela :

<?php bad_referer($_SERVER['HTTP_REFERER'], $_SERVER['REMOTE_ADDR']);?>

Comme les admins d’annuaire sont tous presque tous des flemmards ( :D ), ils ne vont pas masquer le referer s’ils font une vérification manuelle de la présence du lien. C’est là qu’on agit. Sinon, ils utilisent un script de vérification automatique et on grille l’adresse IP du serveur.

Grâce à cette technique, vos sites ne ressembleront pas à des guirlandes de Noël et vous pourrez toujours être référencés.
La technique ultime consiste à faire un cloaking sur les robots en plus afin que les liens s’affichent pour eux. Cela vous permet d’y insérer également vos propres liens :D

Il est possible de conserver en session la visite depuis le referer traqué pour que le lien apparaisse toujours sur les autres pages dans le cas d’un lien en footer.

J’espère que vous en avez appris un peu et que vous suivrez le prochain épisode avec autant d’attention, en attendant, ne soyez pas evil hein ;)

Cloaking : panorama des techniques

janvier 13, 2009

Pour commencer ce nouvel article, je tiens tout d’abord à préciser que le cloaking c’est mal !

A quoi sert le cloaking ?

Le cloaking est une technique qui consiste à présenter aux moteurs de recherche un contenu différent de celui que l’on affichera pour les visiteurs. On détecte la présence du crawler, et on se débrouille pour lui envoyer les meilleurs morceaux de la page qu’il recherche, en augmentant la densité, en lui déroulant la collection d’expressions clés que vous avez sélectionnée avec amour, en insérant les liens vers les pages que vous avez choisies pour arriver en tête des résultats.

Jan a fait un article il y a un paquet de temps, mais cela reste une référence pertinente pour les débutants cloakers, vous pouvez y jeter un œil si vous n’êtes pas à l’aise avec ces techniques Black Hat.
L’un des avantages de cet article est qu’il présente les utilisations diverses et variées du cloaking.

Ca a l’air simple comme ça, c’est vrai, mais dans la pratique, il existe un certain nombre de techniques, plus ou moins compliquées, plus ou moins fiables et qui vous laisseront passer des nuits plus ou moins tranquilles :lol:

Pour cet article, j’ai choisi de procéder par langage, puis par type de cloaking. Je ne présenterai pas de script, mais seulement les manières de procéder possibles. Les scripts feront l’objet d’un billet à part.

Le cloaking avec Javascript

C’est ce qu’on utilisait dans les bonnes vieilles pages satellites :D Maintenant c’est vraiment grillé, mais ça marche pour les affiliations (j’y reviendrai plus tard ;) ). Je vous déconseille formellement de jouer avec ça sous peine de déclassement ultra rapide !

Sachant que les robots n’interprètent pas le JS (attention, il peuvent le lire, c’est pour cela qu’ils grillent les pages satellites), les redirections faites en JS ne fonctionnent pas, et l’on peut cloaker comme des porcs.
Il y a deux manières de procéder : soit on fait une redirection en JS de manière à renvoyer le visiteur humain vers la page ayant un contenu tout joli, tout bien intéressant, et le robot reste sur la page et indexe tous les bons mots-clefs choisis rien que pour lui, soit on utilise une balise noscript qui contiendra le contenu spécifique aux bots. Cette dernière technique est beaucoup plus risquée car les bots sont suspicieux sur les balises noscript, mais en plus vous risquez le spam report puisque les tricks sont visibles dans la source.
On préfèrera donc la méthode suivante :

<script type="text/javascript">
<!--//
  window.location = 'http://pagepourhumain.tld';
//-->
</script>

à celle-ci

<script type="text/javascript">
<!--//
  //on met un peu de code pour être moins suspect;
//-->
</script>
<noscript>Contenu optimisé pour les robots</noscript>

beaucoup trop dangereuse.

PHP et les langages serveurs : la solution optimale pour le cloaking

PHP, comme ASP, Perl ou Java, est un langage serveur-side, c’est à dire qu’il est interprété par le serveur web et qu’il envoie les résultats générés au navigateur à la fin du script.

Vous comprenez ainsi pourquoi il est avantageux d’utiliser un langage côté serveur pour faire du cloaking : il ne laisse pas de traces de traitement dans la source !

Je ne vais pas m’attarder longtemps sur PHP car on retrouvera de nombreux exemples dans le second volet de mon chapitre sur le cloaking, donc on passe à l’action tout de suite !
Deux axes différents peuvent être donnés au cloaking en PHP : la redirection, ou la génération de contenu selon le profil du visiteur. Je m’explique, si votre visiteur est humain, vous pouvez le rediriger vers une autre page de votre site (ou un autre site) et laisser le robot indexer la page en cours, ou vous pouvez, et c’est conseillé, afficher conditionnellement un contenu la page différent pour le bot ou l’humain.
Exemple :

<?php 
$visiteurType = getVisiteur();
if($visiteurType == 'robot'){
  //  on génère un code juste pour le robot
}
else{
  //  on affiche la page normale pour les visiteurs, ou on redirige vers le site choisi
}
?>

L’avantage de telles techniques est que l’on peut générer du contenu à la volée pour rassasier l’appétit des crawlers sans que ce texte soit parfaitement compréhensible pour un humain… De la bouillie pour robot quoi ;)

On reviendra sur PHP dans quelques temps avec des techniques plus poussées pour servir des objectifs bien clairs, mais pour le moment, nous ne nous intéressons qu’à la technique simple.

Les fichiers .htaccess pour cloaker avec Apache

Dans le genre indétectable, il existe aussi le cloaking par htaccess qui permet d’employer deux techniques différentes : IP et User Agent.
Le principe est le même que pour PHP, à la différence que cette technique est beaucoup moins souple et que l’on utilisera la réécriture d’url (url-rewriting) pour servir des pages spécifiques aux robots et aux utilisateurs. Ainsi, les robots ne verront pas certaines pages mais référenceront le site tout de même. Les pages destinées aux utilisateurs seront elles servies normalement, en toute transparence.
On utilisera un code tel que celui-ci pour le cloaking sur User Agent (dangereux)

RewriteCond %{HTTP_USER_AGENT} Googlebot
RewriteRule .* http://www.page_pour_google.com [R=301,L]

et un code de ce genre pour le cloaking sur IP (exemple emprunté à l’auteur de ce blog)

RewriteCond %{REMOTE_ADDR} ^216\.239\.(3[2-9]¦[4-5][0-9]¦6[0-3])\.([0-9]¦[1-9][0-9]¦1([0-9][0-9])¦2([0-4][0-9]¦5[0-5]))$¦^64\.233\.(1([6-8][0-9]¦9[0-1]))\.([0-9]¦[1-9][0-9]¦1([0-9][0-9])¦2([0-4][0-9]¦5[0-5]))$
RewriteRule .* http://www.page_pour_google.com [R=301,L]

L’intérêt est donc de présenter deux contenus différents, mais sur deux urls différentes… A chacun de drainer le trafic comme il faut… Il faut ensuite faire une règle de réécriture inverse pour servir les pages correctes aux visiteurs si ceux-ci suivent les résultats d’indexation de Google.

Conclusion

On a maintenant trois techniques de cloaking disponibles. Je ne présenterai pas la technique des meta refresh car j’en parlerai dans un autre billet, plus…. adapté dirons-nous :D !
A chacun d’entre vous de les utiliser si le cœur vous en dit et que vous pensez passer de bonnes nuits toute de même… Je ne vous le conseille pas, mais à vous de faire le choix !

Le prochain volet vous présentera l’application de ces techniques en fonction d’objectifs précis, et nous pourrons imaginer des exemples concrets.
A très vite !

Freeglobes : améliorer la lisibilité des descriptions longues

janvier 12, 2009

Je continue sur Freeglobes car il y a du potentiel avec ce script.

Vous savez, comme nombre de référenceurs et webmasters, que le contenu est très important pour ressortir sur les moteurs de recherche… et surtout le contenu unique.
Quand on a un annuaire de qualité, où le duplicate content est traqué et éliminé, on ne veut pas perdre ses places (ni son PR) dans les pages de résultats. Du coup, on demande des descriptions longues aux personnes qui inscrivent leur site afin d’obtenir du contenu et de pouvoir donner suffisamment à manger à nos amis les crawlers.

Mais au-delà de ça, on ne veut pas perdre non plus nos visiteurs qui sont des cliqueurs potentiels !
En effet, on fait des annuaires pour obtenir du lien, mais si on peut en tirer des profits, alors why not !
Alors comment faire pour conjuguer un texte de plus de 1500 caractères avec une lisibilité suffisante pour les visiteurs quand on sait que Freeglobes vous sort les descriptions de sites telles quelles, sans balisages HTML ?

C’est là qu’intervient la petite modification… Les codeurs PHP connaissent tous la fonction magique de 5 caractères qui fait les retours à la ligne automatiquement : nl2br() :D

Il suffit d’utiliser cette petite fonction à un endroit stratégique pour permettre d’afficher le texte des catégories de manière bien plus claire et lisible. Finis les pavés de mots indigestes !

Comment procéder ?
Recherchez le fichier /include/common.php et parcourez-le jusqu’à trouver la fonction

function affichage_liens($links, $url_r=true, $fil=false, $display_feeds=false, $display_tags=false)

Une fois la fonction trouvée, recherchez dedans la ligne

'description' => $link->getVar('description'),

et remplacez par

'description' => nl2br($link->getVar('description')),

et vos utilisateurs seront un peu plus heureux !

Voilà, ce n’est pas grand chose, 5 caractères et 2 parenthèses pour permettre aux robots et aux humains de se sentir mieux en visitant votre annuaire Freeglobes !
La démo est en ligne sur mon annuaire des sites pour enfants, vous pouvez regarder la catégorie Culture qui s’est fait bombardée de texte par un artiste !

Bon courage à vous !