mercredi 8 juin 2011

À quoi sert Wikisource ?

On me demande souvent à quoi peut bien servir Wikisource face aux bibliothèques numériques Gallica et Google Books.

Le site de l’Élysée vient de nous fournir un très bon exemple. Ils ont décidé d'océriser un document dactylographié du 21e siècle, probablement tapé sous Word. Chacun combat l'ennui au boulot comme il veut, je ne juge pas.

Un petit coup d'OCR et hop, le résultat est envoyé sur le site web. La version avec de nombreuses coquilles est restée quelques temps avant que quelqu'un se décide à relire la lettre et corriger quelques coquilles. Il reste encore des erreurs. Il faudra probablement une deuxième relecture.

J'ai heureusement pensé à faire une copie d'écran de la première version :
 

La reconnaissance optique de caractères n'est malheureusement pas parfaite. Le logiciel a inséré des coquilles. Le logiciel rencontre généralement des problèmes sur les cas suivants : accents, ligatures, consonnes doubles, et certaines lettres comme le m.

Les contributeurs de Wikisource savent détecter rapidement ces coquilles. Nous disposons également de scripts permettant de corriger les coquilles habituelles. Et ça tombe bien, Wikisource fait relire les textes par deux personnes. Par contre, on ne s'amuse pas à numériser des lettres du 21e siècle ;)

2 commentaires:

  1. Bonsoir, Auriez-vous des ouvrages ou des articles scientifiques - ou de bonne qualité - sur Wikisources ? La littérature est moins prolixe que pour Wikioédia... ce qui n'a rien de surprenant. Bravo pour votre travail !

    RépondreSupprimer
    Réponses
    1. Je n'en connais pas. Vous devriez vous adresser au groupe Recherche

      Supprimer