De plus en plus présents sur le net (Ziki.com vient de les intégrer), bientôt gérés par les navigateurs (Firefox3, IE8 …) les microformats semblent bien faire parti du futur paysage Web.
Comment fonctionnent donc ces microformats, et quel est leur intéret ?
Les microformats servent à rendre le web plus sémantique. Si vous ne connaissez pas ce nom barbare, ne paniquez pas. Le web sémantique, c’est en fait un web de sens.
Je m’explique, à l’heure actuelle la majorité des sites sont conçus sur un principe simple : du contenu, et un code qui gère là façon dont ce contenu est affiché. C’est un peu simplifié, mais en gros c’est ça.
Maintenant mettez vous à la place d’un moteur de recherche par exemple. Avec l’augmentation du nombre de sites et du contenu, trouver une information pertinente est de plus en plus fastidieux, et les algorithmes, aussi complexes soient-ils, ont leurs limites.
C’est là qu’intervient le web sémantique. Son principe est d’organiser les données non pas en fonction de leur disposition sur une page, mais de ce qu’elles signifient.
Prenons un exemple. Admettons que les auteurs des blogs utilisent le web sémantique dans une partie où ils se présentent, on aurait alors un code qui indiquerait que “Marcel Dupont” (original!) est le nom de l’auteur. On peu alors concevoir en parallèle un moteur de recherche spécialisé qui ne fouinerait que dans les noms des auteurs. L’information retournée par le moteur en question aurait alors une pertinence bien plus élevée que si l’on avait par exemple tapé “Marcel Dupont” dans Google.
Bien sur cet exemple est réducteur et les possibilités offertes par le web sémantiques sont bien plus puissantes comme on le verra par la suite.
En effet sur le site microformats.org, on peut trouver de nombreux standards de microformats plus ou moins spécifiques comme par exemple un microformat définissant les CV, un autre pour la geolocalisation (pratique pour décrire par exemple vos sorties de mountain-biking et les rendre exploitables sous Google Maps), ou encore un pour les vCard.
En parlant des vCard justement, voilà un très bel exemple d’application des microformats. Ce format de carte de visite est beaucoup utilisé, notamment dans des logiciels comme Outlook. On peut donc facilement imaginer que les navigateurs à venir identifient les pages possédant ces microformats, et proposent de les enregistrer dans le gestionnaire de contact par défaut sur l’ordinateur (Outlook par exemple). Les auteurs de sites ou de blogs pourraient alors insérer une mini carte de visite sur leur page afin que les visiteurs l’enregistre d’un simple click.
C’est d’ailleurs une bonne idée de widget à développer pour Dotclear ou Wordpress. Si toi, lecteur de ce blog, tu es motivé, ou si tu connais déjà ce widget, fais moi signe.
Bien d’autres choses sont encore possibles je vous laisse trouver des idées de génie pour exploiter ces microformats.
Pour ceux que ces microformats intéresse, sachez que le plugin Operator pour Firefox 2 viens de sortir du Mozila Lab. Il détecte les microformats dans une page et vous permet quelques interactions avec ces derniers. Plus d’informations ici, ici et ici.
Skwi
PS : Pendant mes recherches j’ai remarqué que Fred Cavazza en avait déjà parlé en 2005, du coup je me sent un peu à la traine.



Un complément intéressant sous forme de podcast vu chez Guim :
http://www.guim.fr/blog/2007/10/christophe-duca.html
Quelques réfléxions en vrac à la lecture de ce billet:
- IE8? hahahaha… voilà c’est tout
- très très bon article, accessible mais pas seulement, des bons liens si on veut aller plus loin, franchement tu commences à devenir très bon (j’avais pensé un moment te concurrencer mais là c’est mort :S)
- en même temps pour etre en avance sur Fred Cavazza, il faut etre très costaud…
Hé oui je sais j’suis trop fort et un jour je dépasserai Fred Cavazza (on peut toujours rêver c’est un bon moyen d’avancer =D )
Sinon pour IE8 moi aussi j’ai rit sur le coup mais il ne faut pas oublier que c’est encore Microsoft le leader du navigateur web. Et avec un peu de chance il respectera les standards dans les versions futures, ou alors il se fera peut-être écraser.
Wait & See
Reste que l’un des gros challenge du web sémantique est la recherche d’images et de vidéos … Actuellement, la recherche est textuelle. C’est un (ou plusieurs) mot clé associé à l’image qui permet la recherche. Je tape chien sous google image, et je reçoit tout les images dont le titre (par exemple) contient “chien”. Mais mon image, elle ne contient peut être pas réellement un chien …
Maintenant, si le concept chien pouvait être défini par des caractéristiques simple (couleur forme, texture …), donc lui associé une sémantique, alors la recherche pourrait être carrément plus efficace. Le hic, c’est que :
-le mot arbre regroupe une quantité de chose (un dalmatien et Yorkshire sont loin de se ressembler)
-certains concepts sont très subjectifs : on ne voit pas tous le monde de la même façon et un mot peut signifier qqch pour qqn et un autre pour qqn d’autre.
-Isoler un chien dans une image nécessite une grande performance au niveau de la découpe de l’image en région. Le cerveau humain le fait très bien, car il possède un énorme quantité de concepts en mémoire, acquis par l’expérience et l’apprentissage. Un ordinateur, lui, gère bcp moins bien cela, car il n’a pas de connaissances a priori de ces concepts…
Bref un gros challenge
Mais la recherche avance …
On voit déjà apparaître qq ptit truc à droite à gauche concernant cela, notamment en ce qui concerne la detection de visage qui est devenu trè performante.
Un bon exemple avec cette article :
http://www.neteco.com/72647-exalead...
Entièrement d’accord mais la technologie n’est pas encore présente pour les images. On compte sur vous les spécialistes de l’image pour nous trouver des bons algos
Les microformats eux sont à base de simple texte, leur mise en place est donc relativement simple avec les technos actuelles, il suffit juste que ça rentre dans les mœurs des développeurs.