Folksonomie : définition

Le terme folksonomie est né sous la plume de Thomas Vander Wal, d’un mélange entre deux termes anglais : taxinomy (taxinomie) et folk (les gens, le peuple). La folksonomie est donc une indexation de documents numériques faite par l’usager. Les termes choisis, les descripteurs sont appelés des tags.

Ce phénomène est intimement lié à l’accroissement et l’accélération de la production d’info, et donc d’un besoin des usagers d’indexer et d’organiser leurs documents.

La particularité de la folksonomie est l’utilisation d’un langage naturel : l’usager a donc une liberté dans le choix des termes. On est donc bien loin des volontés d’universalité des thésaurus et des langages documentaires. Chaque personne organise ses tags de la manière qu’elle le souhaite. Elle n’a pas de structure et d’organisation dans l’absolu, elle peut toucher tous les domaines, et est sans relation sémantique et hiérarchique.

Thomas Vander Wal a différencié deux types de folksonomie :  une dite étroite et une dite générale.

La première est utilisée de façon privée: c’est le principe des favoris de Firefox, que l’ont peut indexer pour les retrouver facilement. Le but est donc de retrouver facilement ses propres documents.

La folksonomie générale a pour but de partager l’information. Elle s’insère dans une logique collaborative qui permet de créer des communautés d’usagers qui s’intéressent au même sujet. Cet usage est ce qu’un appelle l’indexation sociale ou social bookmarking, dont un des meilleurs exemple est Delicious.

La folksonomie est enfin très vite devenue un élément primordial des réseaux sociaux avec les hashtags sur Twitter.

La folksonomie pour vendre des livres numériques ?

Non, ce n’est pas un titre généré aléatoirement ; il s’agit de l’idée de Feedbooks, libraire en ligne qui cherche à vendre des eBooks de façon originale. L’idée est de générer un nuage de tags, puis de l’organiser afin de refléter le contenu d’un livre de façon sémantique et graphique. Ça n’a pas vraiment d’utilité, c’est du marketing, mais c’est joli. Et ça montre que la folksonomie et le nuage de tags s’intègre petit à petit dans le web, au point de devenir un outil marketing.

Quelques exemples (sans les noms des livres, essayez de les retrouver !) :

bonpere Dossier-64 la-constellation-du-chien-2 meutrespourmemoire1 Snowden2 une-belle-saloperie

Consultez ici la page dédiée.

Un exemple de l’utilisation de la folksonomie : Twitter

La folksonomie est très présente sur le web depuis l’avènement du web 2.0, ou web collaboratif. En effet, les usagers des services du web qui s’inscrivent dans cette continuité sont amenés à créer, poster, diffuser du contenu ; mais aussi à l’indexer afin de retrouver ce contenu dans la masse. Tout internaute devient donc un indexeur potentiel, usant cependant du langage naturel.

Un site où cette pratique est très répandue est Twitter. En effet, le principe du hashtag (#) se trouve être de la folksonomie ; il permet à n’importe quel utilisateur d’insérer un ou plusieurs mots-clefs, issue du langage naturel, dans son tweet afin de permettre de le retrouver dans la multitude de tweets postés chaque jour. C’est donc une forme d’indexation libre, c’est à dire de folksonomie.

Cet exemple d’utilisation de la folksonomie à grande échelle nous permet d’éclairer quelques points, et surtout de relever quelques défauts de cette pratique.

Ainsi, si nous cherchons dans Twitter les tweets référencés avec #thesaurus, nous trouvons :

https://twitter.com/_homespun/status/446344469311676416

On peut donc tomber sur tout et n’importe quoi : un tweet sans contenu, mais sur lequel on va forcément tomber à cause du #thesaurus, un tweet dont le contenu n’est pas réellement pertinent, et entre les deux un tweet bien plus pertinent et qui utilise correctement le hashtag (évidemment).

Essayons avec un hashtag moins spécifique, #Londres :

Nous pouvons voir qu’avec un terme plus large, et bien plus utilisé que “thesaurus” (soyons honnête), l’indexation perd tout son intérêt : on trouve tout, et surtout n’importe quoi sur le sujet. Le terme ne servant plus à spécifier un tweet par rapport aux nombreux autres sans rapports, où est l’intérêt ?

Mise en place d’un nouveau thésaurus : Biblissima

Les thésaurus ne sont pas encore morts, la preuve.

Un nouveau thésaurus est en phase de création. Il se nomme Biblissima, du nom l’institution que le met en place, Equipex Biblissima (et qui a pour sous-titre Patrimoine écrit du Moyen-âge et de la Renaissance) ; son but est donc d’indexer ces documents patrimoniaux, anciens et précieux.

Un élément important dans l’élaboration de ce thésaurus est sa prise en compte d’une question essentielle dans le monde bibliothéconomique actuel : l’interopérabilité. L’idée est de créer un thésaurus qui puisse servir à l’indexation (évidemment) mais également de “pivot”, notamment avec les partenaires de l’Equipex Biblissima.

Pour en savoir plus concernant ce projet, un site de documentation a été mis en place. Il suffit de suivre ce lien

Mise en place d’un thésaurus : analyse des besoins et des spécifications

Analyse et éclaircissement concernant le chapitre 4  de l’ouvrage de Michelle Hudon Guide pratique pour l’élaboration d’un thésaurus documentaire, publié en janvier 2008 aux éditions ASTED ; ISBN 9782923563176.

(élaboration du diaporama : Bourez Thibault)

Les liens présent dans le diaporama sont présent pour faciliter la navigation, cependant ils ne marchent que dans le cas d’une utilisation avec un logiciel de bureautique, en lecture seule ils renvoient sur une page internet vide.

Thésaurus : définition

Selon le vocabulaire de la documentation de l’ADBS, un thésaurus (ou thesaurus) est une : « Liste organisée de termes normalisés (descripteurs et non-descripteurs) servant à l’indexation des documents et des questions dans un système documentaire. Les descripteurs sont reliés par des relations sémantiques (génériques, associatives et d’équivalence) exprimées par des signes conventionnels. Les synonymes (non-descripteurs) sont reliés aux descripteurs par la seule relation d’équivalence. On peut distinguer les thésaurus en fonction du mode de regroupement des termes (thésaurus à facettes) ; de la variété linguistique des termes (mono- ou multilingue) ; des domaines de connaissances couverts (thésaurus spécialisé ou sectoriel, thésaurus encyclopédique) ».

Wikipédia donne une seconde définition : « Un thésaurus, thésaurus de descripteurs ou thésaurus documentaire, est une liste organisée de termes contrôlés et normalisés (descripteurs et non descripteurs) représentant les concepts d’un domaine de la connaissance. C’est un langage contrôlé utilisé pour l’indexation de documents et la recherche de ressources documentaires dans des applications informatiques spécialisées. ».

Enfin, le Larousse en ligne donne une dernière définition plus concise : un thésaurus est un « Liste alphabétique de mots standards utilisés pour le classement de la documentation. ».

Un thésaurus est un donc un ensemble de termes, utilisés pour l’indexation (des descripteurs) ou non (non-descripteurs), qui sont relié entre avec des relations de synonymie, de hiérarchie, et d’association. Ces termes servent à l’indexation des documents, c’est à dire à pointer la spécificité d’un document dans un fonds documentaire ; pour cela les termes ne doivent pas être ambiguës, c’est à dire ne pas avoir plusieurs significations possibles. Pour cela, on créé des notes d’applications qui précisent cette seule et unique signification. Le sens des termes est également précisé par les relations hiérarchiques.

Un thésaurus est donc un type de langage documentaire, qui est spécialisé (souvent dans un domaine, mais cela peut être plus ou moins large) et qui se compose de termes hiérarchisés entre eux.

Pour quelques exemples de thésaurus en ligne, voir ce thésauro-annuaire.