Le référencement est pour beaucoup de webeux une sorte de religion. Il suffit de se plier aux 10 commandements, aux pratiques et d'avoir la foi pour que son site soit premier sur Google. Les religions apparaissent pour répondre à des questions sans réponse. Ce qui est étonnant c'est quelles restent actives lorsque l'homme a trouvé la réponse. Je dois reconnaitre que les pratiques prônées par la religion du SEO étaient réellement efficaces. Je dis bien "étais", car aujourd'hui, elles le sont de moins en moins.

Le référencement vit ses derniers jours

Google personnalise de plus en plus les SERP. Les résultats sont ou seront réordonnés selon la langue, l'historique du compte, la géolocalisation...de l'utilisateur. Est-ce que "être bien référencé" a toujours du sens ?

De plus, les moteurs de recherche améliorent sans cesse leurs algorithmes. Ils rendent inutiles, une par une, toutes les techniques d'optimisation du référencement. Leur but est que les sites réellement pertinents apparaissent en premier dans les SERP. Si Google sert à l'utilisateur des sites qui l'intéressent alors il continuera à utiliser ce moteur et restera plus longtemps sur les sites qu'on lui propose, sites où il y a probablement des publicités Google Adsense ! La boucle est bouclée : plus les résultats sont pertinents plus Google gagne d'argent.

Encore plus fort, il y a quelques mois, Google a mis en ligne une expérimentation : SearchWiki. Ce projet consiste à ajouter un système de vote au SERP pour que les utilisateurs eux-mêmes puissent collaborer afin d'améliorer encore la pertinence des résultats de recherches. De ce fait, nous allons contribuer à améliorer notre propre satisfaction et donc indirectement faire gagner encore plus d'argent à Google en travaillant pour lui gratuitement... Le plus important c'est que si l'homme participe à l'élaboration des résultats, cela va réduire de manière drastique les quelques possibilités de "tricher" qu'il reste.

Google Search Wiki

Tout ceci a pour unique but : donner la meilleure réponse possible à l'utilisateur et en même temps, rendre le référencement inutile. De plus en plus pour qu'un site apparaisse dans les premiers résultats, il "suffira" de le rendre plus intéressant que les autres pour les internautes. Le référencement se résumera à quelques règles SEO de base pour que les moteurs de recherche puissent faire leur travail : pas de texte pertinent dans les images et les applications Flash, des URL propres, le contenu important mis en avant, ...

Quand le web sémantique débarque dans les SERP

Logo Web Semantique W3C

En parallèle de l'amélioration des algorithmes des moteurs de recherches, on voit apparaître une autre tendance : l'exploitation de données sémantiques. Le web sémantique est un concept assez large qui n'a pas vraiment de définition précise aujourd'hui. Pour cet article, je vais uniquement m'intéresser aux formats de données structurés et typés (RDF, RDFa ...) que cette nouvelle génération du web apporte.

Tout a commencé avec l'émergence de moteurs de recherches 100% sémantiques comme Powerset ou Hakia. Les données sémantiques étant encore rares, ces moteurs ont du être couplés à des parsers de langage naturel. Ensuite, Powerset a été racheté par Microsoft et a été intégré dans LiveSearch. Dans le même temps, des bases de données sémantiques communautaires ont vu le jour (ex: Freebase). On peut à présent voir ce type de résultat dans les SERP:

Résultats sémantiques sur Live Search

de même chez Google...

Résultats sémantiques sur Google

Coïncidence, Google XXL, un site que je suis régulièrement, a publié aujourd'hui une étude sur la capacité des moteurs de recherches à répondre à des questions posées en langage naturel. Je vous invite à le lire si ce sujet vous intéresse.

Yahoo a tenté une autre utilisation du web sémantique avec SearchMonkey. L'idée est d'utiliser des données structurées et typées (RFD, RDFa, RSS...) pour améliorer l'affichage des résultats de recherche.

Yahoo SearchMonkey Nice

Comment anticiper?

Pour résumer, le référencement tend à devenir inefficace et en même temps, la vague sémantique arrive à grands pas. Il est important de réfléchir dès maintenant à comment profiter au mieux de ce changement. Pour moi, il y a deux choses à faire actuellement :

Étudier le fonctionnement des moteurs de recherches avec le web sémantique

La mécanique est très peu connue. Il faudra en quelque sorte recommencer tout le travail qui a été fait pour l'optimisation du référencement des sites web. Il y a de nombreuses questions sans réponse pour le moment :

  • Comment les moteurs de recherches choisissent-ils la source de l'information ?
  • Comment est-il possible de vérifier la fiabilité de l'information ?
  • Comment faire pour que mon site qui serve de source ?
  • Quels formats sont-ils capable de comprendre ? RDF ? RDFa ? Microformats ? Langage naturel ?
  • ...

Utiliser dès maintenant les standards du web sémantique

On l'a vu le web sémantique arrive à grande vitesse chez M. "Tout le monde" et il faut s'y préparer. Les applications sont encore minces mais ne vont pas le rester très longtemps. Les données structurées et typées apportées par le web sémantique ouvrent des possibilités gigantesques dont beaucoup restent encore à découvrir. Elles vont permettent de mieux les traiter, mieux les trier, mieux les vérifier. Elles vont aussi faciliter l'accès à l'information et la création de mashup.

Je pense que l'on va rapidement voir arriver tout un marché lié à la "sémantisation des données" tellement l'intérêt est important. Il ne serait pas étonnant qu'il s'agisse d'une reconversion des référenceurs, même si cela va demander de plus grandes connaissances techniques.

Dans quelques temps, un site sans données structurées sera un site dont il sera difficile d'exploiter les données et donc moins intéressant. Il est important de ne pas rater le coche!