Le web sémantique ou comment sauver le web

Filed under Moteur de recherche, Web 2.0

Le web ne cesse de croître, au point que beaucoup de moteurs de recherche, Google en tête, ne communiquent plus sur le nombre de pages indexées… Comprenons bien comment fonctionne un moteur de recherche: pour faire simple des robots parcourent le web en suivant les liens hypertextes qu’ils rencontrent et renseignent un index à chaque nouvelle page web rencontrée. La recherche s’opère à l’interieur de cet index grâce à un algorithme propre à chaque moteur qui utilise différents parametres : titre de la page, mots clés, url, etc… Cette recherche est du type “plain text”, ie que le moteur de recherche n’analyse généralement pas le sens de votre requête mais juxtapose les termes recherchés et regarde s’il les trouve associés dans son index.

Biensûr, des moteurs comme Google, Yahoo ou Live commencent à intégrer les synonymes et ont vocation à interpreter le sens des phrases ce que fait déjà Baidu, l’ogre chinois. Ce qu’il faut comprendre c’est que plus votre index est gros, plus vous obtenez des résultats pertinents. Mais passée une taille critique, l’index est pollué par un trop plein d’informations. D’où un manque de pertinence passée une certaine taille, et un déficit de productivité côté utilisateur.

Nova Spivack, de radarnetwoks, explique que le web est aujourd’hui en pleine explosion en terme de volume d’informations. Il sera de plus en plus dur d’accéder à l’information que vous recherchez. Comme lui, je crois très fort au web sémantique et à l’avénement de nouveau modes de recherche basés sur les microformats. A partir du moment où votre contenu, et à fortiori votre code, est structuré, alors les applications informatiques pourront les interpréter et les comprendre. Nous parviendrons ainsi à un accés pertinent à l’information que l’on recherche. C’est pourquoi j’en appelle à tous les développeurs et à tous les producteurs de contenus, allez lire ceci et commencez à intégrer les microformats. J’attends également celui qui saura pondre une version de Wordpress intégrants ces balises…

Articles sur le même sujet :

Tags : , , ,

11 Comments

  1. Posted 26 mars 2007 at 14:41 | Permalink

    Il existe un plugin wordpress pour structurer le contenu des articles.
    http://structuredblogging.org/

  2. Posted 26 mars 2007 at 20:50 | Permalink

    Merci pour cet aperçu du concept de “web sémantique”, je me demandais depuis quelques temps ce que s’était, à forcer d’en entendre parler !

  3. francois
    Posted 27 mars 2007 at 8:21 | Permalink

    Merci Claude, super ce plugin, j’adopte tout de suite!

  4. Posted 27 mars 2007 at 18:52 | Permalink

    Merci Claude de ton enthousiasme. N’hésite pas à nous rejoindre avec tes amis pour aider amorcer la communauté francophone des microformats. Les travaux ont commencé sur le wiki et tout prêt à ouvrir une branche francophone et collaborative d’un blog. Nous avons beaucoup de travail notamment en traduction pour localiser les travaux de nos compères sur la côte ouest.

  5. Posted 19 décembre 2007 at 10:59 | Permalink

    Cool.

  6. Posted 19 décembre 2007 at 15:41 | Permalink

    Nice…

  7. Posted 7 janvier 2008 at 16:37 | Permalink

    Cool…

  8. Posted 12 février 2008 at 23:09 | Permalink

    Interesting…

  9. Posted 13 février 2008 at 2:00 | Permalink

    Nice

  10. Posted 13 février 2008 at 8:02 | Permalink

    Interesting…

  11. Posted 13 février 2008 at 14:20 | Permalink

    Nice…

Post a Comment

Your email is never published nor shared. Required fields are marked *

*
*