dimanche 19 juin 2011

Wikipedia dans la pub

GDF SUEZ vient de lancer sa nouvelle campagne publicitaire Être utile aux hommes. Il s'agit de montrer comment GDF SUEZ va influer sur chaque personne. Rien de mieux donc d'y présenter Wikipédia qui s'est immiscée dans la vie de chacun.

La publicité montre une jeune femme consultant l'article La Révolution française, 1789 d'une encyclopédie qui ressemble étrangement à Wikipédia !

Une petite coquille s'est malheureusement glissée dans la vidéo. L'article de Wikipédia ne comportant pas d'illustration dès l'introduction, l'équipe chargée du spot de pub a dû en trouver une pour les besoins du scénario. Malheureusement, ils ont choisi La Liberté guidant le peuple de Delacroix qui représente la Révolution de 1830 et non celle de 1789. La prochaine fois, il faudra avoir le réflexe Wikipédia ;)

dimanche 12 juin 2011

Wikisource offline

Wikisource existe en langue Malayâlam, une langue officielle indienne parlée, entre autre, dans l'état du Kerala et dans le territoire de Pondichéry. Une version offline a été présenté lors de la 4e rencontre des wikimédiens Malayâlam. Elle permet de consulter sur CD ou sur un ordinateur ne disposant pas d'un accès internet les textes de http://ml.wikisource.org

L'ONG indienne KSSP (Kerala Sastra Sahitya Parishad), qui mène des projets visant à diffuser les connaissances, a déjà commandé 250 copies.



Le contenu du CD est consultable en ligne : http://www.mlwiki.in/wikisrccd/

Pour plus d'informations sur le genèse de ce projet et le logiciel libre créé pour l'occasion, consultez http://thottingal.in/blog/2011/06/11/malayalam-wikisource-offline-version/

Vous pouvez télécharger gratuitement l'image ISO sur http://mlwiki.in/

mercredi 8 juin 2011

À quoi sert Wikisource ?

On me demande souvent à quoi peut bien servir Wikisource face aux bibliothèques numériques Gallica et Google Books.

Le site de l’Élysée vient de nous fournir un très bon exemple. Ils ont décidé d'océriser un document dactylographié du 21e siècle, probablement tapé sous Word. Chacun combat l'ennui au boulot comme il veut, je ne juge pas.

Un petit coup d'OCR et hop, le résultat est envoyé sur le site web. La version avec de nombreuses coquilles est restée quelques temps avant que quelqu'un se décide à relire la lettre et corriger quelques coquilles. Il reste encore des erreurs. Il faudra probablement une deuxième relecture.

J'ai heureusement pensé à faire une copie d'écran de la première version :
 

La reconnaissance optique de caractères n'est malheureusement pas parfaite. Le logiciel a inséré des coquilles. Le logiciel rencontre généralement des problèmes sur les cas suivants : accents, ligatures, consonnes doubles, et certaines lettres comme le m.

Les contributeurs de Wikisource savent détecter rapidement ces coquilles. Nous disposons également de scripts permettant de corriger les coquilles habituelles. Et ça tombe bien, Wikisource fait relire les textes par deux personnes. Par contre, on ne s'amuse pas à numériser des lettres du 21e siècle ;)