Folksonomy : les tags en délire

Les services basés sur des tags (balises, ou plus précisément ici, descripteurs) censés correspondre à une indexation thématique du contenu ont fleuri sur le web. Fausse bonne idée ou évolution majeure ? Deux services américains, del.icio.us et Flickr ont donné le ton, en permettant aux utilisateurs detaguereux-mêmes le contenu quils proposent ou souhaitent partager en ligne. Dans un cas, il sagit de mettre en commun des signets, sous la forme dadresses de site web repérées par chacun des utilisateurs. Dans lautre, chacun peut partager ses photos numériques sur la toile. Pour les deux services, lestagssont une composante essentielle, bien que dapparence rudimentaire : de simples mots-clés qui définissent ou tentent de décrire le contenu concerné. Dès lors, on assiste sur le web à une déferlante, dans la foulée deslogiciels sociauxet autres services de partage. On ne compte plus les clones de del.icio.us, quil sagisse de services similaires en français (BlogMarks), en OpenSource (de.lirio.us) ou dédiés à des thématiques précises (Connotea dans le monde de la science, par exemple). On peut également visualiser en temps réel les nouveautés publiées sur del.icio.us (LiveMarks) et il existe desagrégateurs de tagsmontrant la popularité des mots utilisés comme descripteurs sur plusieurs autres services (Guten Tag), ainsi que des plug-ins permettant dajouter la gestion des tags à une application existante, quelle quelle soit (Freetag pour PHP/MySQL, par exemple). Les acteurs historiques de linternet semblent eux aussi séduits, à linstar du très récent annuaire de podcasts de Yahoo, qui intègre également des tags, tendant à démontrer que tout nouveau service se doit désormais dintégrer ce principe de navigation. (Yahoo a par ailleurs absorbé Flickr en mars 2005). Dans un nombre incalculable dapplications et de services en ligne, la plupart récentes et se référant auWeb 2.0″, ces mots-clés jouent désormais un rôle central. Hors du tag, point de salut sur le web daujourdhui et de demain ? On peut être tenté de le croire, à en juger par la ferveur avec laquelle internautes, développeurs et entrepreneurs semblent sêtre approprié le principe des tags. Technorati, lun des plus gros moteur dindexation de blogs, propose depuis janvier 2005 aux blogueurs dindiquer dans leurs billets des tags représentatifs du contenu. Cesétiquettespeuvent être de simples catégories thématiques déjà présentes sur les blogs ou des expression beaucoup plus spécifiques correspondant par exemple à des événements ponctuels. En août dernier, on recensait 25 millions de billetstagués”. Et le moteur suit quotidiennement lindexation de plus de deux millions de descripteurs distincts, dans de nombreuses langues différentes. Les 250 tags les plus populaires sont affichés en permanence et chaque jour, ce sont quelques 12 000 nouveaux tags qui font leur apparition dans la blogosphère. Un succès édifiant. Tags & Folks Il est pourtant facile dentrevoir combien le principe même des tags est limité et leur généralisation problématique. La principale nouveauté de tous ces services provient du fait que ce sont les utilisateurs qui proposent et choisissent leurs tags. Dès lors, cest bel et bien une fortenon-organisation”, voiredésorganisation”, qui préside à lévolution du contenu tagué. Il ny a en général aucune hiérarchie entre les différents tags qui constituent dans leur globalité une simple liste de mots et dexpressions de même niveau. En outre, le principe ne permet pas réellement de gérer la synonymie. Un billet comportant le tagjavaest-il relatif à lune des principales îles indonésiennes, à une ville du Wyoming, au langage de programmation inventé par Sun Microsystems, ou au café ? Et à cela sajoute la problématique de la langue. Technorati a choisi de mélanger tous les mots-clés, affichant en permanence une liste digne dun manifeste de la tour de Babel, sur laquelle des caractères asiatiques ou arabes côtoient une multitude de termes anglais. Outre la lisibilité de lensemble, la sémantique nest pas épargnée : le mot-clépainfait-il référence à des articles sur la boulangerie française, ou plutôt sur la douleur, pain en anglais ? Et les internautes francophones, constatant la prédominance de termes anglais dans les index, ne seront-ils pas tentés dutiliser des tags anglophones pour marquer leur contenu, renforçant la prédominance des descripteurs en langue anglaise ? Enfin, lindexation par tags prédispose à lemploi de termes génériques qui napportent que peu déléments sémantiques. Que penser du tagchiens” ? Sagit-il de contenu de nature médicale provenant de vétérinaires, de textes dorigine marketing émanant dune boutique en ligne proposant des croquettes, ou de simples photos amateurs échangées par des propriétaires de chiens ? Du reste, malgré une apparente uniformité, tous les tags ne sont pas identiques. Sur Technorati, les tags indexés sont ceux choisis par les blogueurs et fonction du contenu quils ont eux-mêmes publiés. Sur del.icio.us, en revanche, ce sont les internautes qui taguent le contenu des pages quils conservent dans leurs signets. Il est donc tout à fait possible (et même courant) quun même billet de blog ne soit pas tagué par les mêmes mots sur Technorati et sur del.icio.us. Sous leur forme actuelle, il paraît difficile, de prime abord, de trouver un intérêt réel aux tags. Souvent trop vagues, sujets à interprétation ou à orthographe multiples, les tags ne prennent leur sens que sur des expressions très spécifiques, notamment liées à lactualité ou à des événement précis. Le tag Flickrchicagomarathonpermet ainsi de consulter toutes les photos relatives au marathon de Chicago tandis que sur Technorati, le tagHurricane Katrinaregroupe les 8 600 billets publiés sur les blogs au sujet de louragan. Les anglo-saxons ont créé un terme pour désigner le principe : “Folksonomy”. Difficile à traduire, le mot, inventé par Thomas Vander Wal et construit à partir deFolks” (les gens) ettaxonomy” (pris ici dans le sens de classification systématique) résume bien le concept. Plutôt que de partir dontologies, organisant le contenu de façon hiérarchisée, ce sont désormais les utilisateurs qui prennent eux-mêmes en charge lindexation du web, avec pour résultat une joyeuse anarchie que personne ne cherche véritablement à optimiser ou à organiser : unesoupe de tags”, comme lappellent certains. Lappel du tag Force est néanmoins de constater que le principe nest pas non plus dénué dintérêt. Beaucoup, y voyant lexpression dune nouvelle forme de démocratisation du web, défendent les tags avec vigueur. “Je pense que cest clairement un mouvement de fond. Les folksonomies sont représentatives dun phénomène un peu paradoxal qui est que dun côté lusager, le client ou lutilisateur final veut de plus en plus être placé au coeur du système en tant quindividu et que de lautre il souhaite sinscrire dans une démarche communautaire ou de réseau”, explique Christophe Deschamps, auteur du blogOutils froids“. Pour Stéphane Lee, créateur - entre autres - du service Guten Tag, “le tag est le web sémantique du pauvre, suffisant pour créer des connexions intéressantes entre les différents contenus de la toile”. “Le principe permet de se concentrer sur ce qui est important pour la majorité des gens, sans passer des mois à délimiter le contour dune catégorie fixe pré-déterminée et qui de toute façon ne conviendra jamais pleinement”, résume-t-il. En somme la principale vertu de la folksonomy est sa souplesse et la spontanéité quelle offre aux internautes. “Les tags, en laissant aux gens déterminer ce qui compte pour eux, font apparaître de nouveaux usages. Ils permettent de faire surgir des informations qui étaient jusque masquées : mots les plus utilisés, les plus populaires, connexions entre groupes de mots ou dutilisateurs…”, souligne-t-il. “Le principal intérêt des tags vient du fait quils agissent comme un premier filtre au web. Ils constituent une cartographie du web créée collaborativement par ses utilisateurs et permettent dobtenir rapidement un ensemble de pages déjà validées par dautres”, ajoute Christophe Deschamps. Un avis partagé par Adam Mathes, auteur dun passionnant travail académique sur les folksonomies (décembre 2004, Université de lIllinois). “La première vertu de la folksonomy est lasérendipité’ [traduisible parheureux hasard”, voir notre article sur lasérendipité sociale“, NDLR]. Cest une solution qui incite à la navigation et, via un ensemble de tags liés entre eux, constitue une source fantastique pour identifier des choses inattendues quon ne trouverait pas sans cela”, écrit-il. Citant des travaux antérieurs, il explique du reste que cest précisémentlabsence de hiérarchie, de gestion des synonymes et de précision sémantique qui font que la folksonomy fonctionne”. Et de résumer que la liberté offerte par le principe des tags permet de sapprocher très près de ce que permet une véritable taxonomie, tout en étant10 fois plus simple”. “La liberté apportée par les tags encourage les utilisateurs à organiser linformation à leur manière, en ladaptant à leurs besoins et à leur vocabulaire. […] La constitution dune ensemble de meta-données, relevant jadis dune activité isolée et professionnelle, sest transformée en une démarche partagée impliquant des utilisateurs actifs et communicants entre eux. Cest une étape importante qui doit être explorée pour de futurs développements”, conclut Adam Mathes. Il reste néanmoins à admettre que sous leur forme actuelle, les tags sont en train de parvenir à leurs limites. A en juger par les chiffres provenant de Technorati, on peut facilement anticiper que tous les mots du dictionnaire deviendront des tags, si ce nest pas déjà le cas. Les tags ne risquent-il pas alors de perdre tout leur intérêt, en faisant double emploi avec les indexations traditionnelles en texte plein ? Lévolution perpétuelle Le fait est que, si le principe des tags est incroyablement populaire aujourdhui, il est également en perpétuelle évolution. Bien quil soit difficile dentrevoir une ligne directrice dans cette évolution, on constate que plusieurs services sorientent vers davantage dorganisation. Ainsi, Flickr a introduit récemment la notion degroupes (clusters) de tags”, un premier pas vers une forme de hiérarchisation des mots-clés. Par exemple, le termejaguaramène à une page proposant plusieursclusters”, dont lun regroupe des images de félins, un autre des photographies de voitures anglaises et un troisième, des photos de lavion de chasse français. On peut également citer fac.etio.us, un outil de recherche qui offre une présentation alternative du contenu disponible sur del.icio.us, organisée selon un rubricage original, plus structuré que ne lest le service dorigine. De même, le très attendu Tagsy entend proposer, sous la forme dune extension Firefox, un dispositif universel de description, basé sur une organisation hiérarchique des tags. Certains essaient de limiter le nombre de tags existants au plan global. Tagyu propose par exemple daider les utilisateurs à choisir les tags quils emploient. Sur la base dun texte ou dune adresse web, loutil suggère lesbonsdescripteurs en comparant le contenu concerné à des contenus similaires déjà tagués par dautres. Un moyen potentiel de lutter contre linflation de tags. Mais on sent bien que de nombreuses pistes restent à explorer, comme le préfigurent quelques nouveaux services innovants. On peut citer Tagalag, qui permet detaguer des individus”, repérés par leur nom, leur emplacement géographique, ou les termes qui les définissent le mieux. Bien que le principe ne soit pas radicalement nouveau, lintérêt provient de la souplesse inhérente à la folksonomy. Encore en beta, le service permettra par exemple de recherche desgeekshabitant à San Francisco. Plus ambitieux, et étonnammentmeta-conceptuel”, le service Ning, déjà très populaire, propose à chacun de créer simplement son propre servicesocial”, de type del.icio.us ou Flickr notamment. Unmeta-outilpermettant de créer de nouveaux outils de partage, au coeur desquels se trouvent les tags… “Nen doutons pas, les tags représentent un mouvement de fond, qui va chambouler toutes les bases de données dont les champs sont gravés dans le marbre et noffrent aucune souplesse, aucune dynamique”, prévient Stéphane Lee. Et dajouter : “Les tags sont aussi le graal du marketing. Ils vont permettre de définir des intérêts connexes entre différentes thématiques ou produits, tout en regroupant les utilisateurs en communautés qui partagent des affinités similaires”. “Les tags seront présents comme un moyen simple et pratique de classer ses informations et ses données personnelles sans avoir à entrer dans des systèmes complexes. Ils permettent, à un niveau personnel, de donner un peu dordre au chaos. Pour autant je ne pense pas quils pourront se substituer à des classements plusprofessionnels’, même si de nombreuses tentatives, notamment autour de del.icio.us, vont en ce sens”, explique Christophe Deschamps. En attendant leWeb 3.0La situation daujourdhui est donc pour le moins paradoxale. Les créateurs dapplications semblent ne plus pouvoir se passer des tags, encouragés par les internautes qui se sont appropriés le principe avec un enthousiasme débordant. Ce faisant, en à peine 18 mois, le web a pris des allures de web sémantique, sans que personne - et en particulier aucun organisme de normalisation - ne soit intervenu en amont pour que cela se réalise. Au contraire, le vent de renouveau insufflé par les tags symbolise en quelque sorte ce qui se passe actuellement sur linternet. Selon un processus provenant de la base (”bottom-up”) plutôt quimposé par des instances centralisées (”top down”), les utilisateurs ne sont plus passifs, mais simpliquent sur le web au point den définir lévolution, ou la transition vers un web sémantique. Ainsi, tout le monde saccorde à dire que le principe des tags est imparfait et, concrètement, difficile à utiliser, sans toutefois pouvoir se passer de lutiliser. “La folksonomy constitue une nouvelle approche, à lévolution rapide, de la classification des objets numériques. Il reste beaucoup à découvrir et à tester en la matière. Et nous navons pas encore trouvé la bonne solution, intermédiaire entre le tagging bottom-up purement démocratique et le déterminisme empirique des vocabulaires contrôlés de haut en bas”, conclut Emanuele Quintarelli, auteur dune analyse très complète sur le sujet (juin 2005, ISKO). Au delà du tag, la voie la plus prometteuse est peut-être celle desmicro-formats“, un projet de websemi-sémantique”, qui sappuie sur desmicro meta-donnéesqualifiant certaines parties du contenu des pages web, le tout lisible par des machines ou par des humains. Lun de ces micro-formats, “xFolk“, a pour but de laisser les utilisateurs définir leur tags, sans avoir à passer par un service centralisé de type Flickr ou del.icio.us pour le faire (la fonctionnalité peut être ajoutée facilement à de multiples outils de publication). [voir notre articleLes microformats, prochaine étape du web sémantique ?“] Quoi quil en soit, par certains aspects, nous avons vécu en 10 ans les deux extrémités dun mouvement de balancier, entre dun côté les annuaires ontologiques et très structurés du Yahoo initial et de lautre une folksonomy débridée dont les limites irrationnelles sont sur le point dêtre atteintes. Le juste milieu reste à trouver, et les internautes sy emploient.