Déréférencement et non référencement

 

Vous avez passé des nuits blanches à tenter de référencer de manière optimale votre site et à présent vous voudriez l'enlever des outils de recherche. Pourquoi ? Dans certains cas, pour positionner efficacement un site internet, votre pire ennemi ne sera pas forcément un concurrent mais peut-être votre site lui-même.

En effet, un site composé de dizaines de pages statiques (sans asp, cgi ,etc.) sera indexable dans son intégralité par les moteurs de recherche si rien ne bloque leurs robots sur la page d'accueil. Il n'est pas nécessaire de donner plus d'une URL à un robot pour qu'il indexe un site de plusieurs milliers de pages, du moment qu'en parcourant l'arborescence il pourra accéder à chacune. Une page isolée ne sera pas automatiquement référencée par les moteurs de recherche si aucun autre page déjà connue du moteur n'a pas établi de lien vers elle.

Cela a pour effet de rendre toutes les pages du site potentiellement réactives sur des mots clés et vous risquez alors de voir des pages secondaires passer devant la page d'accueil lors du retour de requête des moteurs de recherche. Imagineriez-vous faire entrer vos invités par la salle de bain lorsque vous les accueillez à la maison ? Alors pourquoi leur permettre d'arriver sur votre site par la page " contactez-nous " ou bien sur une confirmation de formulaire alors que c'est par l'accueil ou bien une rubrique majeure qu'ils doivent passer ?

Il est donc nécessaire de correctement maîtriser ce que vous souhaitez voir oui ou non indexé au sein des moteurs afin de ne pas parasiter les pages par lesquelles les internautes doivent arriver en premier.
Avec les annuaires de recherche type Yahoo, vous n'aurez pas ce genre de problème car ils n'indexent généralement que la page d'accueil des sites.

Les techniques à notre disposition pour empêcher tout ou partie d'un site d'être référencé ?

  • Si votre problème est essentiellement que les pages secondaires de votre site ne viennent pas parasiter les principales, le plus simple est de ne pas placer de balise meta keywords, description et de mettre dans la zone TITLE un titre du genre " page de présentation " pour que vous ne puissiez pas être réactif sur des mots clés importants. Ces pages seront référencées, présentes dans la base des moteurs de recherche, mais elles ne seront pas réactives. Vous réserverez l'optimisation TITLE/META pour la page d'accueil et les rubriques importantes.
  • Vous pouvez aussi placer une balise NOINDEX dans l'en-tête de vos pages. Les moteurs repéreront cette commande comme étant une demande de non-indexation.
  • Il est possible de créer un fichier robots.txt, à placer dans le répertoire principal de votre site (là où se trouve la page index), et de détailler par son contenu les zones à référencer et celles qui faudra ignorer. Ce fichier peut-être créé avec un simple éditeur de texte. La syntaxe est très simple : " user-agent : moteur " où 'moteur' sera le nom d'un moteur ou bien * pour désigner qu'il les concerne tous, " disallow : /chemin " où 'chemin' est le répertoire qui ne doit pas être indexé. L'intérêt de ce fichier est de pouvoir paramétrer en une seule fois l'indexation globale de votre site. Vous lirez avec intérêt une page de Webcrawler à ce propos.
  • Si des pages étaient déjà référencées et que vous souhaitez les voir disparaître de l'index du moteur, le plus simple est encore de leur changer de nom, supprimer les anciennes et référencer ces dernières. En effet, le moteur ne trouvant plus les pages, il les supprimera.
  • Si votre problème est surtout la confidentialité, le plus efficace reste encore de placer un système de login + mot de passe pour accéder aux pages concernées.
  • Quant aux annuaires, seules les pages d'accueils seront référencées, très rarement certaines rubriques. Dans tous les cas, si vous ne faites pas vous-même la démarche d'une demande d'indexation, votre site à très peu de chances d'être spontanément référencé. Les choses deviennent par contre très difficiles lorsque vous souhaitez enlever un site de leur index ou bien dans modifier le titre, la description ou bien l'url. Souvent, vous devrez envoyer un e-mail au webmaster du site car ce cas est rarement pris en compte.

Anthony Alberti