Le projet encyclopédique

par Valentine Favel-Kapoian,
documentaliste au collège de la Dombes - Saint-André-de-Corcy-(01) [décembre 2007]

Mots clés : wikipedia

  • Google+
  • Imprimer

L'encyclopédie Wikipédia est basée sur un projet intellectuel et technique précis. Celui-ci s'articule autour d'un outil, le wiki, vit grâce à une communauté de lecteurs actifs, sortes « d'écrits-lecteurs », et fait partie d'un ensemble plus vaste, celui de la Fondation Wikimedia.

Le projet Wikipédia

1- Naissance du projet

Wikipédia est issue du projet Nupédia lancé en 2000 par Jimmy Wales (société Bomis). Larry Sanger était le rédacteur en chef de ce projet d'encyclopédie libre. Un comité scientifique garantissait la validité des articles. Cela freinait terriblement sa progression d'où l'idée, lancée en janvier 2001, de Wikipédia, une encyclopédie libre sans validation basée sur un wiki. Le succès de ce nouveau projet a entraîné la disparition de Nupédia en 2003. La version française de Wikipédia est née officiellement le 23 mars 2001.

2- Élaborer une encyclopédie universelle collaborative libre

Pour comprendre le fonctionnement de cette encyclopédie, il est nécessaire de s'arrêter quelques instants sur les termes qui définissent son projet :

  • Wikipédia vise à être une encyclopédie et, à ce titre, à refléter de manière exhaustive l'ensemble des savoirs humains. Ce n'est donc ni un dictionnaire, ni un forum de discussion, ni un annuaire de sites Web.
  • C'est un projet qui se définit comme universel : tous les domaines de la connaissance, toutes les cultures et toutes les langues (y compris régionales ou mortes) peuvent figurer dans l'encyclopédie.
  • C'est un projet collaboratif : tout internaute peut modifier les articles. Pour cela, il suffit de cliquer sur l'onglet « Modifier ». Il n'est pas nécessaire d'être connecté avec un compte. La création d'un compte utilisateur permet d'accéder à certains avantages : interface personnalisée, accès à la liste de ses propres contributions, suivi de page, mise à disposition d'une page personnelle, etc. Pour créer un compte, il faut un nom d'utilisateur (pseudonyme) et un mot de passe. Aucun renseignement personnel n'est demandé.
  • C'est une encyclopédie libre. Chacun est libre de la recopier, de la modifier et de la redistribuer. Cette notion de contenu libre s'apparente à celle des logiciels libres en Open source : puisque tout le monde peut apporter une amélioration aux logiciels, ceux-ci sont libres de droit. Avec Wikipédia, on est passé des licences de logiciels libres à celles de documentation libre. Grâce à ces licences de documentation libre (de type GFDL 1 ou Creative Commons 2, le savoir devient libre de droit et réutilisable. La seule contrainte est de conserver cette même licence et de mentionner Wikipédia comme source pour toute réutilisation des contenus

3- Une encyclopédie sans validation scientifique mais sous régulation collective

3.1. Régulation "intellectuelle"

L'anonymat des contributeurs, l'impossibilité d'évaluer leurs compétences et surtout l'absence d'un comité de validation permet à l'écrivain et journaliste Pierre Assouline d'écrire sur son Ouvre ce lien externe dans une nouvelle fenêtreblog : « Wikipédia est la seule encyclopédie au monde où n'importe qui peut écrire n'importe quoi ». Il existe pourtant quelques règles éditoriales qui « encadrent » la rédaction des articles :

  • Tout contenu doit être rédigé dans un but encyclopédique (et non commercial, polémique ou politique, par exemple).
  • Le point de vue de chacun doit être respecté et s'il y a débat (appelé dans Wikipedia « guerre d'édition » puisque celui-ci se passe à travers des écrits), celui-ci doit être le plus clair possible pour le lecteur.
  • Les droits d'auteur et les droits de la personne doivent être respectés (principes de la WikiLove)
  • En cas de litige, l'auteur est responsable légalement de ce qu'il a écrit. Suite à un dépôt de plainte pour diffamation, la justice française a dernièrement considéré que Ouvre ce lien externe dans une nouvelle fenêtreWikipédia était un hébergeur et non un éditeur.
  • Etre impartial (« décrire le débat plutôt qu’ y participer »)
  • Toute information doit être vérifiable et chaque article doit proposer ses sources. Dans le cas contraire, une bannière en haut de page invite les internautes à la prudence en précisant que « cet article ou cette section ne cite pas suffisamment ses sources. Son contenu est donc sujet à caution. Wikipédia doit être fondée sur des sources fiables et indépendantes »

La philosophie de Wikipédia est assez simple : tout contributeur est considéré comme spécialiste dans son domaine. La validation se fait a posteriori, ce sont les contributeurs eux-mêmes qui la proposent, qui peuvent modifier, améliorer et compléter les articles mis en ligne. D'où l'idée de « régulation collective » avancée par Wikipédia. Il n'y a donc pas de relecture systématique de ce qui est mis en ligne même si les dernières modifications sont listées et qu'il est recommandé aux Wikipédiens d'en prendre connaissance pour les valider et les modifier - ne serait-ce que pour des questions d'orthographe ou de syntaxe -. Mais il ne s'agit là que d'une invitation à contribuer à l'harmonisation de l'encyclopédie puisqu'il n'y a pas de « petites mains » qui corrigent la forme de façon systématique ou de comité scientifique qui valide le fonds.

3.2. Régulation technique

  • Si la syntaxe d'un wiki est relativement simple, la rédaction d'articles longs ou complexes (qui comprennent des liens hypertexte vers d'autres articles ou sites Web, des images, une table des matières, etc.) nécessite une bonne maîtrise. Pour faciliter la rédaction de nouveaux articles, des pages modèles sont mises à disposition des contributeurs : il n'y a plus qu'à remplir les champs. Cette aide technique pose problème puisqu'elle « organise » le savoir, en proposant une "coquille" vide utilisable pour tout type de savoir.
  • Afin de réduire les erreurs liées à la syntaxe particulière des wikis et à la rédaction en ligne, il existe tout un arsenal d'aides et de pages conseil dont un « accueil aux nouveaux arrivants » (il s'agit d'une communauté, donc celle ci « accueille » les nouveaux arrivants). Cette aide présente le projet et la communauté, fait le point sur les articles à compléter ou manquants et propose un « bac-à-sable 3», aire d'entraînement pour se familiariser avec le système de création et de modification d'articles dans Wikipédia. Cet entraînement est indispensable pour maîtriser la syntaxe du wiki et permet d'éviter un certain nombre d'actes de "vandalisme", provoqués d'ailleurs plus par des tentatives de rédaction infructueuses plutôt que par une réelle volonté de nuire.

Les corrections de forme comme de fond peuvent donc être faites par l'ensemble des membres de la communauté.

4- La communauté de Wikipédia

La communauté de Wikipédia comprend :

  • les internautes
    Ils consultent l'encyclopédie.
  • les contributeurs anonymes
  • les contributeurs inscrits (sous pseudonyme) appelés Wikipédiens (soit moins de 1% des contributeurs pour la version française)
  • les administrateurs
    L' administrateur (nommé aussi "admin" ou "sysop") est un Wikipédien qui a fait acte de candidature et qui est désigné par la communauté. Les administrateurs de Wikipédia France sont actuellement 165.
    Leur rôle est de garantir les grands principes de l'encyclopédie et de vérifier sa cohérence éditoriale, par exemple si les normes d'écriture sont bien respectées. Les administrateurs possèdent des outils supplémentaires pour participer à la maintenance du site, comme effacer des pages, bloquer des pages à l'écriture ou bloquer des utilisateurs. Si un utilisateur n'a pas de compte enregistré, ils peuvent bloquer son adresse IP 4.
    Mais cette sanction n'est pas totalement efficace puisqu'en France, la plupart des adresses IP ne sont pas fixes. En effet, elles sont attribuées de façon aléatoire (parmi un éventail d'adresses) par les fournisseurs d'adresse internet.
  • les bureaucrates
    Ils nomment les administrateurs (ils sont au mombre de 7 pour la version française)
  • les membres du comité d'arbitrage, élus parmi les utilisateurs ayant un compte inscrit et renouvelés par moitié tous les six mois. Ils interviennent en cas de conflit.
  • d'autres membres de la communauté, dont le rôle se développe comme les Wikipompiers (qui interviennent en cas de conflit entre utilisateurs), les WikiFourmis (qui rangent et organisent l'encyclopédie), les stewards (qui interviennent sur plusieurs projets de Wikimedia), les développeurs (qui interviennent sur les serveurs), les vérificateurs d'adresse IP.

Wikipédia étant gérée par la communauté, il n'y a pas de Ouvre ce lien externe dans une nouvelle fenêtrehiérarchie définie. Il est donc difficile de connaître le pouvoir exact des membres de la communauté et encore plus de savoir le rôle de chacun, voir d'identifier la "main mise" éventuelle de quelques-uns sur l'ensemble de la production éditoriale. Par exemple, il n'existe pas de palmarès des contributeurs les plus prolifiques. L'outil Ouvre ce lien externe dans une nouvelle fenêtreWikimedia Statistics, permet cependant de suivre le développement des articles et l'activité des contributeurs. Le côté obscur des contributions (qui contribue ? Pourquoi ? Comment ?) est intrinsèque au travail collaboratif et à l'utilisation d'un wiki : les contributions individuelles se noient dans « l'oeuvre » collective. Cet état de fait est valable pour toutes les versions linguistiques de Wikipédia et pour tous les projets de la Fondation Wikimedia.

Wikipédia aujourd'hui

1- La vitalité de Wikipédia : quelques chiffres

Le projet Wikipédia séduit beaucoup d'internautes et se développe.

  • Actuellement, Wikipédia se décline en plus de 250 langues et comporte plus de 9 millions d'articles. Seule une centaine de Ouvre ce lien externe dans une nouvelle fenêtreversions sont actives.
    • En tête du classement, on trouve la version anglaise, avec plus de 2 millions d'articles. Cette version est en phase de stabilisation : le travail porte plus sur la cohérence et la correction de l'encyclopédie que sur l'alimentation en nouveaux contenus.
    • En deuxième position, on trouve la version allemande avec plus de 673 000 articles. Créée dès mai 2001, cette version est la seule commercialisée sous forme de cédérom depuis 2004.
    • En troisième position vient la version française, avec plus de 590 000 articles.
      Les versions basque, bretonne ou latine comptent environ 10 000 articles.
    • Les versions les plus "pauvres" en contenu sont celles en langues africaines ou en dialectes.
  • Grâce aux licences de documentation libre, les articles sont traduisibles. Traduire un article existant dans une autre langue est donc une façon d'alimenter une version linguistique. Des appels à traduction sont régulièrement lancés sur les pages d'accueil des communautés.
    Le dynamisme d'une version dépend du nombre d'article disponible mais aussi du développement des outils de communication et des méta informations existantes sur celle-ci. Les Wikipédiens discutent des articles, des modifications ou améliorations a apporter (c'est l'onglet Discussion que l'on trouve pour chaque article). Il existe aussi beaucoup de pages concernant les mécanismes de gestion : aides, règles, réflexions, régulations, ... ces pages existent pour encadrer l'utilisation du wiki et organiser la collaboration. Elles sont invisibles pour l'utilisateur lamba mais essentielles pour le développement de l'encyclopédie.
  • Il y a trois ans, Wikipedia comptait parmi les 150 sites web les plus visités au monde. L'encyclopédie (dans ces différentes versions linguistiques) fait désormais partie du top 10 mondial. En octobre 2007, Wikipedia a attiré plus de 200 millions de visiteurs, dont 9,3 millions en France . C'est le Ouvre ce lien externe dans une nouvelle fenêtreneuvième site le plus visité de l'hexagone.
  • Le Ouvre ce lien externe dans une nouvelle fenêtresite Wikicharts permet de connaître les cent articles les plus consultés dans Wikipédia au cours des quatre dernières semaines. Cet outil est encore en phase de test mais les résultats permettent de confirmer que Wikipédia serait d'avantage une encyclopédie d'actualité qu'une encyclopédie universelle. Les faits d'actualité, les biographies des célébrités du show biz ou du sport, les émissions de télévisions, les nouveautés du Web sont plus consultés que les articles de littérature ou de science. D'après Frédérique Rousset, journaliste à Libération, Wikipédia serait une « encyclopédie de la culture populaire ».
  • Le Ouvre ce lien externe dans une nouvelle fenêtresite WikipédiaVision (site en phase de test actuellement) permet de suivre en temps réel les contributions apportées dans les différentes versions anglaise, allemande, française et espagnole. Si cet outil relève plus, pour l'instant, du domaine ludique que du scientifique, il n'empêche qu'il est assez révélateur de des énergies qui sont mobilisées pour Wikipédia et de l'importance des projets techniques, scientifiques et éditoriaux qui convergent vers cette encyclopédie.
  • Autre exemple : le Ouvre ce lien externe dans une nouvelle fenêtresite Wikimindmap permet de fabriquer une carte heuristique et d'intégrer des renvois à des articles de Wikipédia.
    A noter que ces réalisations ne font pas partie des projets de la Fondation Wikimedia, elles sont indépendantes.

2- La Fondation Wikimedia

  • La Ouvre ce lien externe dans une nouvelle fenêtreFondation Wikimedia (Wikimedia Foundation) encadre le projet Wikipédia, mais aussi d'autres projets, toujours basés sur la technologie wiki, du libre et du collaboratif.
    • C'est une organisation internationale à but non lucratif de droit américain. Elle a été créée en 2004 pour soutenir le développement et la diffusion de contenus gratuits et multilingues, basés sur des wikis.
    • Le 21 octobre 2006, à la suite de Jimmy Wales, devenu président d'honneur de l'organisation, Florence Nibart-Devouard, une française, est élue présidente du conseil d'administration de la Fondation pour une durée de deux ans. Les membres du conseil d'administration, réunis toutes les six semaines, sont tous bénévoles.
    • La Fondation est propriétaire des serveurs installés en Floride sur lesquels sont hébergés les projets Wikimedia. La Fondation possède les noms de domaines, les droits sur les logos et les noms de marque déposés. Elle emploie du personnel pour s'occuper des serveurs (plus de 250 en 2007). Elle organise aussi les Wikimania, rencontres internationales annuelles de tous les usagers et participants aux différents projets. Les dernières se sont déroulées à Taiwan en août 2007.
       La Fondation se décline en associations locales afin d'assurer le suivi au plus près des projets locaux. L'association française a été fondée en 2004 et se compose exclusivement de bénévoles.

3- Les projets soutenus par la Fondation

Actuellement, la Fondation soutient Ouvre ce lien externe dans une nouvelle fenêtreneuf projets

LogoNom du projetDate de créationObjectifs du projet
 Ouvre ce lien externe dans une nouvelle fenêtreWikipédia 2001Créer une encyclopédie universelle libre. Plus de 250 langues disponibles, dont le français.
 Ouvre ce lien externe dans une nouvelle fenêtreWiktionary2002Créer des dictionnaires et thésaurus libres dans chaque langue. 100 langues disponibles, dont le français.
 Ouvre ce lien externe dans une nouvelle fenêtreWikiquote 2003Constituer un répertoire de citations provenant de personnes célèbres, d’ouvrages, de discours, de films ou d’autres contenus intellectuels. Wikiquote contient également des proverbes, des moyens mnémotechniques et des slogans Disponible en 30 langues, dont le français.
 Ouvre ce lien externe dans une nouvelle fenêtreWikibooks 2003Constituer un fonds de livres électroniques visant spécifiquement un public étudiant, comme des ouvrages, des manuels ou des livres tombés dans le domaine public et annotés. Disponible en 50 langues, dont le franais.
 Ouvre ce lien externe dans une nouvelle fenêtreWikisource2003Construire un fonds de textes, distribués sous la forme de contenu libre et ouvert. C'est aussi une base de traduction de ces textes. D'un seul site pour toutes les langues, se projet se décline désormais en 55 sites, dont un en français.
 Ouvre ce lien externe dans une nouvelle fenêtreWikispecies 2007Créer un répertoire central des espèces pour la taxonomie. Wikispecies est conçue pour répondre aux besoins des scientifiques. Version anglaise uniquement.
 Ouvre ce lien externe dans une nouvelle fenêtreWikimedia Commons 2004Médiathèque en ligne qui propose un répertoire central de contenus libres (images, sons, vidéos, textes audio, etc.) pouvant être facilement utilisés par tous les projets Wikimedia. Un seul site pour toutes les langues.
 Ouvre ce lien externe dans une nouvelle fenêtreWikinews 2004Regrouper les actualités. Des contributeurs du monde entier rédigent ensemble des articles rassemblant des articles originaux et des compilations de sources externes. Toutes les nouvelles doivent être rédigées selon un point de vue neutre. 23 langues disponibles dont le français.
 Ouvre ce lien externe dans une nouvelle fenêtreWikiversity 2006Accueillir et développer des contenus pédagogiques et des communautés pédagogiques de tout niveau. Projet toujours en phase de test, entre autre, pour ce qui est de la coordination multilingue. Quatre versions disponibles, dont le français.

Si pour l'ensemble des projets et pour l'ensemble des versions, l'interface des contenus, les méta-informations sur l'activité éditoriale et les outils de communication sont les mêmes, c'est qu'ils utilisent tous le moteur de wiki MediaWiki. Ce gestionnaire de contenu est un logiciel libre développé pour le projet Wikipédia et utilisé actuellement par de nombreux sites . Tous les projets sont regroupés dans le Wikimedia Meta wiki : c'est un wiki central de développement et de coordination de tous les projets Wikimedia. Il sert de support aux discussions sur l’ensemble des projets, les nouveaux projets, les règles, les problèmes de développement et les aspects administratifs concernant tous les wikis.

Organisation et accès au savoir dans Wikipédia

L'organisation et l'accès au savoir dans Wikipédia repose sur les possibilités offertes par le wiki et les contraintes que cet outil impose.

1- Les modes de recherche

Le mode de recherche le plus développé dans Wikipédia est externalisé puisqu'il suffit désormais de lancer une requête sur un moteur de recherche pour voir s'afficher des articles de l'encyclopédie en haut de la liste de résultats. C'est le mode d'exploration le plus répandu et sans doute le plus facile. Mais l'encyclopédie possède aussi ses propres modes d'interrogation, qui s'apparentent à celles des moteurs de recherche et des encyclopédies en ligne.

  • Sur le site de l'encyclopédie il existe plusieurs façons de rechercher l'information :
    • Par la zone de saisie, puis en cliquant sur Consulter ou Chercher :
      Le bouton Consulter déclenche la recherche de l'article correspondant au(x) mot(s) saisi(s). La correspondance doit être exacte, sauf pour les majuscules/minuscules et les accents.
      Le bouton Chercher déclenche la recherche dans le texte même des articles et fournit la liste des articles concernés.
    • Par les catégories. Elles sont au nombre de douze dans la version française et recensent tous les articles existants pour chacune d'elles : art et culture, croyance, organisation sociale, vie quotidienne, sport, personnage, personnalité, sciences, sciences humaines et sociales et philosophie, sciences naturelles, techniques et sciences appliquées, événement.
    • Par les portails thématiques. Ils sont environ 400 et il existe désormais un Ouvre ce lien externe dans une nouvelle fenêtreportail des portails.
    • Par l'index alphabétique qui veut rappeler l'organisation des informations d'une encyclopédie papier.

Aucune étude n'a comparé les résultats obtenus selon le mode d'interrogation choisi. Il est donc difficile de définir une stratégie de recherche efficace même si l'encyclopédie essaie de proposer des modes d'accès équivalents à ceux trouvés dans les encyclopédies en ligne : entrée par titre (index alphabétique), par thème (les catégories) et en plein texte (les fonctions rechercher et consulter), possibilité d'utiliser les opérateurs booléens et la lexémisation [5]. En revanche, il n'y a pas de recherche en mode avancé et seule la combinaison entre les catégories et la recherche en plein texte est possible. En effet, on peut limiter la recherche à une catégorie en utilisant le préfixe « incategory: » suivi du nom exact de la catégorie. Quant au tri des résultats, il dépend d'une combinaison entre le titre, le nombre de fois où le mot demandé est cité dans la page, le nombre de « liens entrants » depuis d'autres pages avec le mot recherché et la longueur des pages.

2- Indexation et catégorisation des articles

L'analyse documentaire des articles est faite par l'auteur lui-même au moment de la rédaction de l'article. C'est l'auteur qui fait l'indexation, de manière libre, à la manière des tags.étiquette, mot-clé permettant de définir une page Internet (“Key word tagging” en anglais). Il en va de même pour les catégories, qui ne sont pas fermées. Les articles de Wikipédia sont donc bien intégrés dans des catégories hiérarchisées mais cette hiérarchisation se fait au fur et à mesure de la construction de l'encyclopédie. Le fait que ni la catégorisation, ni les mots clés ne bénéficient d'aucun thésaurus, d'aucune liste d'autorité ou d'aucun langage contrôlé génère des difficultés : doublons, ambiguïté, structuration floue des relations entre catégories et articles, etc.

Pour pallier ces dysfonctionnements, l'encyclopédie compte sur les renvois dans le corps du texte (en bleu pour les liens hypertexte actifs dans Wikipédia et en rouge pour les liens hypertexte vides). Mais face à la difficulté d'organiser à posteriori les articles, il est désormais déconseillé de créer un nouvel article. Comme pour les modes d'interrogation, le traitement documentaire de l'information est soumis à des impératifs techniques et n'a pas fait l'objet d'un travail de réflexion documentaire.
Il en va de même pour la question de l'expertise de l'information.

3- Essais d'expertise de l'information

Tout un arsenal de labels et certifications est actuellement utilisé ou en test. A terme, il y aura sans doute une façon de repérer rapidement l'évolution de la construction des articles. Les articles stabilisés et expertisés pourront être distingués de ceux en cours de création («work in progress »). Voici quelques exemples de certification en cours :

  • Le label « article de qualité (AdQ) est décerné aux articles ou portails retenus pour leur « richesse », symbolisé par une étoile jaune dans le coin supérieur droit de la page. Ce label est attribué par les Wikipidiens sur proposition d'autres Wikipédiens. Les articles proposés doivent répondre à un certain nombre de critères de forme et de fond et la procédure de validation est très précise. La liste des articles promus et de ceux qui ont été rejetés est publique. Il faut au moins 8 votes positifs pour que l'article soit promu.
  • Le label « bon article » est décerné aux articles ou portails qui n'ont pas encore reçu le label "article de qualité" mais qui néanmoins se démarquent des autres articles.
  • Les bandeaux en haut de page doivent permettent à l'internaute de prendre conscience des "déficiences" éventuelles d' un article : source non mentionnée, article pas assez développé, article sujet à polémique, etc.
  • Les pages semi-protégées repérables par un petit cadenas placé en haut à droite de la page. La semi-protection d'une page empêche les utilisateurs non enregistrés (les « adresses IP ») et ceux possédant un compte depuis moins de quattre jours de modifier cette page. La demande de semi-protection doit être faite auprès des administrateurs. Cette mesure a été prise afin de lutter contre les tentatives de "vandalisme" telles que la suppression totale du contenu d'un article, l'insertion de mots vulgaires ou d' insultes, de contenus faux, hors sujet ou partial, l'insertion abusive de liens hypertextes. Ces actes en effet décrédibilisent l'information et mettent en danger le projet dans son ensemble. Autre façon de lutter contre ce « fléau », Ouvre ce lien externe dans une nouvelle fenêtreWikiScanner. Cet outil, développé par un hacker américain et disponible depuis août 2007, permet de faire le lien entre les modifications anonymes et des adresses IP.
    A terme, Wikipédia veut mettre en place des codes qui permettent aux internautes d'identifier rapidement le degré d'expertise de l'information qu'ils consultent. Il en va de la crédibilité de l'encyclopédie : les critiques les plus courantes portent en effet sur la question de la fiabilité de l'information.