jeudi 15 décembre 2011

Audience de Wikipédia (I)

Je commence une série de billets sur l'audience de Wikipédia. Le premier billet porte sur l'audience Internet fixe (domicile, bureau, bibliothèques, cybercafés...) à l'aide de la méthode user centric (mesure basée sur un panel d’internautes). Médiamétrie publie l'audience de Wikipédia (toutes langues confondues) ainsi que l'audience de l'ensemble des sites de Wikimedia Foundation. L'écart entre les deux étant insignifiants (160 000 visiteurs uniques en octobre 2011), je me contente d'étudier l'audience de Wikipédia.

Internet fixe

En France, Médiamétrie publie chaque mois l'audience des 30 sites Internet les plus consultés.

Wikipédia est apparu dans ce classement en janvier 2006 avec 3 056 000 visiteurs uniques (VU). Un an plus tard, le site est passé de la 28e à la 10e place avec 7 971 000 VU. Le seuil psychologiques des 10 millions de VU a été franchi en janvier 2008 et celui des 15 millions de VU en septembre 2009.
Évolution du nombre de visiteurs uniques de Wikipédia
entre janvier 2006 et octobre 2011 (source : Médiamétrie)
Depuis l'audience fluctue entre 14 et 19 millions de VU. L'audience fluctue fortement au long de l'année, avec une chute de la fréquentation durant l'été. Les français ne consultent pas Wikipédia sur la plage. Le développement de l'internet mobile viendra peut être modifier ce constat.
Évolution du nombre de visiteurs uniques de Wikipédia
sur les 24 derniers mois (source : Médiamétrie)
En octobre 2011, Wikipédia a été consulté par 18 564 000 visiteurs uniques. En décembre 2010, Médiamétrie estimait à 38,3 millions le nombre de personnes qui se sont connectées à Internet.

Un internaute sur deux consulte Wikipédia.
Un français sur quatre consulte Wikipédia.

Wikipédia est le 7e site le plus consulté en France, rivalisant avec Orange, Pages jaunes, Leboncoin...
Taux de pénétration de Wikipédia (source : Médiamétrie)


Depuis quelques mois, Médiamétrie publie également le nombre de visiteurs uniques par jour. En octobre 2011, 2 235 000 visiteurs uniques ont visité Wikipédia.

Le succès de Wikipédia prouve qu'il est possible (avec du temps et de la persévérance) d'avoir un site web non-marchand dans les 30 sites les plus consultés en France. Ce n'est pas le seul, impots.gouv.fr attire de nombreux internautes au mois de mai ;)

dimanche 11 décembre 2011

Audience des sites culturels français

Pour compléter mon récent post sur le trafic de Wikisource, je vous présente un panorama non exhaustif des principaux sites culturels publics français.

La principale source d'information est le rapport d'activité qui donne un peu d'information sur l'audience du site internet. On doit souvent se contenter d'un chiffre annuel, alors qu'on peut y apprendre le nombre de dépliants en anglais, japonais ou pour les mal-voyants distribués. Les communiqués de presse lors des refontes des sites, les appels d'offre et les présentations pdf ou ppt sont également des sources d'information. L'information est donc accessible publiquement mais demeure rare.

Consultation des bases de l'inventaire du patrimoine en 2010 (source) :
  • Mérimée : 6 207 631
  • Palissy : 3 212 106
  • Mémoire (nombre d'images consultées) : 8 731 109
Consultation des sites internet des principaux musées en 2010 :
Bibliothèques :
Divers :
  • Photothèque de la RMN : 35 millions de pages vues et 2 millions de visiteurs uniques (rapport d'activité 2010, p.97)
  • Site du ministère de la Culture : 6,6 millions de pages vues par mois (ActuaLité)
  • Culture.fr : 789 813 visites, 6 823 322 pages vues, 620 726 visiteurs uniques en septembre 2011 (stat@gouv)

mardi 6 décembre 2011

Géolocalisation d'une zone

Wikimedia Commons poursuit son effort de géolocalisation. Jusqu'à présent, les bénévoles se contentaient d'indiquer les coordonnées d'un point. Il est dorénavant possible d'indiquer les coordonnées d'une zone (la fonctionnalité existe en fait depuis 2007 mais elle est passée inaperçue). Cela peut servir à géolocaliser une commune, un cimetière, une cathédrale, etc.

Manuellement, cela demeure fastidieux car il faut indiquer plusieurs points (un outil récupérant les coordonnées d'une zone dessinée serait très utile). Pour le cimetière du Père-Lachaise, cela donne :
2.38796,48.862527,0
2.395681,48.864687,0
2.400393,48.859823,0
2.396359,48.857727,0
2.394728,48.857558,0
2.392269,48.859195,0
2.391368,48.858871,0
2.390791,48.859838,0
2.389213,48.859633,0
2.38796,48.862527,0
Et l'on obtient :



Le modèle {{GeoPolygon}} gère également OpenStreetMap. Je n'ai pas trouvé de moyen facile pour obtenir l'identifiant d'OSM.

Des discussions sont en cours pour savoir comment intégrer ce modèle aux modèles existants. GeoPolygon est dorénavant intégré au modèle {{Institution}}

Cookie, GFDL CC-BY-SA 3.0

mercredi 30 novembre 2011

Ne citez pas le site du ministère de la Culture

Pendant longtemps des sites internet ont interdit l'établissement de liens vers leur site. Je pensais qu'en 2011, on avait abandonné cette mauvaise habitude ou mis au placard les juristes qui ne comprennent rien à Internet. Que nenni !

Le site du ministère de la Culture (l'ancien culture.gouv.fr qui s'appelle dorénavant culturecommunication.gouv.fr) indique dans ses mentions légales :
L'établissement de lien vers ce site du ministère de la Culture et de la Communication est possible sous réserve d'en informer au préalable et par écrit le ministère de la Culture et de la Communication en vous reportant à la rubrique "contact" dudit site
Je ne donne donc aucun lien vers les mentions légales, car j'ai autre chose à faire que d'aller poster une lettre avant de publier ce post.

Wikipédia aime bien le site du ministère de la Culture. Combien de liens pointent vers un site du ministère de la Culture ? Pour y répondre, je consulte le classement des 1000 sites les plus cités sur Wikipédia. Par chance, le site du Ministère est cité. Il est même en très bonne position, puisqu'il est en quatrième position derrière la médiathèque de Wikipédia, la version anglaise de Wikipédia et un serveur qui entrepose des outils destinés à améliorer Wikipédia. Hors sites de la communauté Wikimedia, le site du ministère de la Culture est donc le site le plus cité sur la Wikipédia francophone.

La Wikipédia en français contenait 64 046 liens vers le site du ministère de la Culture en mai 2011. Wikipédia est un gros utilisateur des bases de données du Ministère (Mérimée, Palissy, Mémoire...).

Va falloir embaucher au service courrier du ministère de la Culture !

mardi 29 novembre 2011

Audience de Wikisource

Lin Kristensen, cc-by-2.0
La déclinaison française de Wikisource vient de fêter son 8e anniversaire. L'occasion de faire le point sur son audience.

Les statistiques concernant les contributions et les visites de Wikisource en français sont dorénavant synthétisées (lien). Il demeure possible de consulter les statistiques complètes pour chaque langue (lien) et le comparatif de l'ensemble des sites Wikisource (lien).

Le nombre de pages vues pour le mois de novembre (qui n'est pas encore terminé) est de 7,8 millions. L'ensemble des sites Wikisource totalise 46 millions de pages vues.

Les 10 wikisources les plus consultées sont : allemand, anglais, arabe, chinois, espagnol, français, hébreu, italien, polonais, russe. Ces 10 sites représentent 81% des 46 millions de pages vues.

A titre de comparaison voici quelques audiences de sites culturels français :
Gallica : 350 000 pages vues par jour, ce qui fait environ 10 millions de pages vues par mois (source : Gallica, p.6)
Portail du ministère de la Culture : 6,6 millions de pages vues par mois (source : ActuaLité)
Louvre : 11,6 millions de pages vues en 2010 (source : Rapport d'activité 2010, p.63)
Château de Versailles : 5,6 millions visiteurs uniques en 2010 (source : Rapport d'activité 2010, p.21)

jeudi 24 novembre 2011

Comment illustrer la tombe d'Oscar Wilde sans liberté de panorama ?

Dans le cadre du projet de loi sur la copié privée, un amendement introduisant la liberté de panorama y été glissé. L'amendement proposait de compléter l'article 122-4 du code de propriété intellectuelle par le texte suivant :
Toutefois est autorisée la reproduction par la peinture, le dessin, la photographie ou le cinéma des œuvres de toute nature situées de manière permanente dans l’espace public, y compris à l’intérieur des bâtiments ouverts au public, ainsi que la distribution et la communication publique de telles copies.
L'amendement a été rejeté, l'amendement a été qualifié d' « amendement Wikipédia » par Patrick Bloche et ce même député a opposé Wikipédia à l'enseignement et la recherche. Je ne pensais pas qu'on pouvait encore tenir de tels propos en 2011.

En attendant, je ne peux pas illustrer légalement l'article consacré au monument funéraire d'Oscar Wilde au cimetière du Père-Lachaise. Il fait partie des tombes les plus visitées. Le cimetière accueille tout de même deux millions de visiteurs par an.

Pour rester dans la légalité, je dois obtenir l'accord du sculpteur avant de publier une photo de son œuvre. Jacob Epstein est mort en 1959. Il me faut donc contacter ses ayants droit. L'article Wikipédia m'apprend qu'il a eu cinq enfants : Peggy Jean (1918-...), Theo (1924–1954), Kathleen (1926-...), Esther (1929–1954) et Jackie (1934-...).

Il me reste à trouver les numéro de téléphone, adresses mail ou adresses postale et les contacter. Il faut également que je me renseigne au sujet de quelques points de droit. Faut-il l'accord de tous les ayants droit ? Certains enfants sont décédés. Faut-il contacter les petits enfants d'Epstein ?

En attendant que je devienne généalogiste, juriste et jusqu'à ce que l’œuvre soit dans le domaine public, c'est-à-dire en 2030, je vous propose une photo parfaitement légale du monument prise lors des travaux de rénovation de la sépulture.


Si vous souhaitez tout de même savoir à quoi ressemble ce fameux monument classé au titre des monuments historiques, vous pouvez toujours consulter une photo sur Flickr, Google Images, ou consulter n'importe quel ouvrage (un tant soit peu récent) consacré au cimetière du Père-Lachaise. Tous ces photographes ou éditeurs ont assurément obtenu l'autorisation des ayants droit du sculpteur, ou pas.

samedi 29 octobre 2011

Le cimetière du Père-Lachaise sur Wikimedia Commons

Le projet sur lequel je bosse actuellement (le cimetière du Père-Lachaise) est un bon exemple de ce que apporter Wikimedia Commons.

Le cimetière du Père-Lachaise accueille chaque année deux millions de visiteurs. Sur les 70 000 concessions, 30 000 sont protégées au titre des monuments historiques.

En raison du patrimoine funéraire considérable dont dispose la capitale, la Mairie de Paris qui gère le Père-Lachaise ne peut mettre à disposition du public énormément d'information. La priorité est donnée à la gestion du cimetière. Le recensement, l'entretien et la surveillance pour éviter les vols souffrent d'un manque de moyens.

Le service cimetière rattaché à la direction des parcs, jardins et espace verts met très peu d'information à l'accès du public : une description sur le site de la mairie d'arrondissement, une description sur le site de la Mairie de Paris et un plan très bien fait mais forcément succinct.

Des taphophiles maintiennent des sites web. Les sites généralistes comme landrucimetières.fr ou l'association Les amis et passionnés du Père-Lachaise référencent un grand nombre de sépultures. Il y a également des sites spécialisés qui recensent les vitraux ou les statuaires féminines. Connaissant le site Clochers de France qui recense 38 494 édifices religieux en France, un blog qui met en ligne les permis de construire de Paris de 1876 à 1939 ou encore saintejeanne.fr qui recense 20 000 statues de Jeanne d'Arc dans le monde, je ne m'étonne plus des merveilles qu'on peut trouver sur internet.

Voici quelques services que je vais tâcher de proposer sur Wikimedia Commons

Géolocalisation
Jusqu'à présent, le visiteur n'a à sa disposition que le plan distribué par la mairie de Paris qui indique de manière peu précise l'emplacement de 154 sépultures ou d'acheter des livres comme celui de José de Valverde et Hervé Hughues qui propose une carte avec un peu moins de 400 tombes.

Inventaire du patrimoine funéraire
Les sites sur le Père-Lachaise proposent principalement des photographies de sépultures et des informations sur les personnes enterrées. Le patrimoine funéraire est un peu délaissé. Il me semble donc intéressant que Wikimedia Commons propose des informations sur le patrimoine funéraire, notamment à partir des ouvrages mis en ligne par les bibliothèques numériques (ex : Archives de l'art français, Gazette des Beaux-Arts) et des informations trouvées sur les monuments (signatures, épitaphes, dates, nom des personnes enterrées).

L'inventaire du patrimoine funéraire n'existe malheureusement pas. Je vais devoir le faire moi même. J'ai pour cela conçu une fiche d'inventaire à partir de la fiche réalisée par la société d'archéologie et d'histoire de la Mayenne.

Photo
Proposer des photos du monument mais également des détails (signatures, bustes, statues...), sous licence libre afin qu'elles puissent être réutilisées. Contrairement aux autres sites, les droits d'auteurs des architectes, sculpteurs, maitres verriers seront respectés. Il m'arrive fréquemment de supprimer des photos de la tombe d'Oscar Wilde publiées sur Wikimedia Commons. Cette tombe est l'œuvre de Jacob Epstein mort en 1959. Il faut donc attendre 2030 avant de pouvoir publier une photographie de la tombe sans l'accord des ayants droit d'Epstein.

Multilinguisme
Le Père-Lachaise est connu dans de nombreux pays, il faut proposer le contenu dans plusieurs langues.

mardi 2 août 2011

Des photos réutilisables réutilisées

Voici un billet inspiré par la lecture de Les licences libres, la Culture, et la réalité

J'ai publié 358 photos sur Wikimedia Commons sous une licence Creative Commons qui permet à n'importe qui de les réutiliser sans mon accord préalable. Voir la carte des différents endroits photographiés :



Agrandir le plan


Après avoir publié ses photos, que deviennent-elles ?
  • Elles peuvent servir à illustrer les projets Wikimedia. Glamorous indique que 70 photos servent à illustrer essentiellement Wikipedia. Mes photos les plus réutilisées ne sont ni mes 3 photos labellisées, ni mes photos de monuments historiques, ni mes photos de sépultures du cimetière du Père-Lachaise mais mes photo d'un bâtiment du campus de Vandoeuvre-lès-Nancy prise lors des RMLL et d'une antenne GSM...
  • En dehors de Wikimedia, uniquement mes photos d'antennes relais sont réutilisées 

Antenne-relaisAntenne-relais
    • pour illustrer des articles sur le fonctionnement des antennes-relais, les dangers éventuels, et l'actualité du secteur des télécommunications
  • Je ne désespère pas de voir mes photo apparaître dans un photomontage, tel que celui-ci
Auteurs et licence sur Wikimedia Commons

    Conclusion : pensez à photographier les objets du quotidien et les outils dont vous vous servez au travail.

      dimanche 19 juin 2011

      Wikipedia dans la pub

      GDF SUEZ vient de lancer sa nouvelle campagne publicitaire Être utile aux hommes. Il s'agit de montrer comment GDF SUEZ va influer sur chaque personne. Rien de mieux donc d'y présenter Wikipédia qui s'est immiscée dans la vie de chacun.

      La publicité montre une jeune femme consultant l'article La Révolution française, 1789 d'une encyclopédie qui ressemble étrangement à Wikipédia !

      Une petite coquille s'est malheureusement glissée dans la vidéo. L'article de Wikipédia ne comportant pas d'illustration dès l'introduction, l'équipe chargée du spot de pub a dû en trouver une pour les besoins du scénario. Malheureusement, ils ont choisi La Liberté guidant le peuple de Delacroix qui représente la Révolution de 1830 et non celle de 1789. La prochaine fois, il faudra avoir le réflexe Wikipédia ;)

      dimanche 12 juin 2011

      Wikisource offline

      Wikisource existe en langue Malayâlam, une langue officielle indienne parlée, entre autre, dans l'état du Kerala et dans le territoire de Pondichéry. Une version offline a été présenté lors de la 4e rencontre des wikimédiens Malayâlam. Elle permet de consulter sur CD ou sur un ordinateur ne disposant pas d'un accès internet les textes de http://ml.wikisource.org

      L'ONG indienne KSSP (Kerala Sastra Sahitya Parishad), qui mène des projets visant à diffuser les connaissances, a déjà commandé 250 copies.



      Le contenu du CD est consultable en ligne : http://www.mlwiki.in/wikisrccd/

      Pour plus d'informations sur le genèse de ce projet et le logiciel libre créé pour l'occasion, consultez http://thottingal.in/blog/2011/06/11/malayalam-wikisource-offline-version/

      Vous pouvez télécharger gratuitement l'image ISO sur http://mlwiki.in/

      mercredi 8 juin 2011

      À quoi sert Wikisource ?

      On me demande souvent à quoi peut bien servir Wikisource face aux bibliothèques numériques Gallica et Google Books.

      Le site de l’Élysée vient de nous fournir un très bon exemple. Ils ont décidé d'océriser un document dactylographié du 21e siècle, probablement tapé sous Word. Chacun combat l'ennui au boulot comme il veut, je ne juge pas.

      Un petit coup d'OCR et hop, le résultat est envoyé sur le site web. La version avec de nombreuses coquilles est restée quelques temps avant que quelqu'un se décide à relire la lettre et corriger quelques coquilles. Il reste encore des erreurs. Il faudra probablement une deuxième relecture.

      J'ai heureusement pensé à faire une copie d'écran de la première version :
       

      La reconnaissance optique de caractères n'est malheureusement pas parfaite. Le logiciel a inséré des coquilles. Le logiciel rencontre généralement des problèmes sur les cas suivants : accents, ligatures, consonnes doubles, et certaines lettres comme le m.

      Les contributeurs de Wikisource savent détecter rapidement ces coquilles. Nous disposons également de scripts permettant de corriger les coquilles habituelles. Et ça tombe bien, Wikisource fait relire les textes par deux personnes. Par contre, on ne s'amuse pas à numériser des lettres du 21e siècle ;)

      jeudi 24 février 2011

      De Gallica à Wikisource en un clic

      Nouvelle étape dans le partenariat BNF-Wikimédia France. Il est dorénavant possible de passer en un clic du fac-similé de Gallica à l'œuvre en mode texte de Wikisource. Une icône blanche comportant un W rouge figure désormais dans la barre d'outils de certains textes de Gallica.





      Les œuvres bénéficiant de cette fonctionnalité sont les 1400 textes fournis par la BNF (liste).

      lundi 21 février 2011

      Vous avez un nouveau template

      Les réunions de la CabaleIdF sont l'occasion de s'échanger les derniers potins et également de découvrir le dernier modèle qui s'inscrit dans la lignée des 10 modèles précédents mais comporte un petit plus. Reste à le découvrir et les comprendre puisque les nouveaux modèles ne comportent généralement pas de documentation.

      Coyau m'a parlé du modèle {{Category definition: Object}} qui rend ringard {{artwork}}.

      Appliquons ce modèle au projet d'illustration de l'art funéraire français du XVIII au XIX siècle, ou pour faire simple le projet qui consiste à photographier à tout va le Père-Lachaise.

      Jusqu'à présent la catégorie ressemblait à votre répertoire photo de votre ordinateur :


      Le nouveau modèle révolutionne l'affichage et transforme Commons d'un site qui tente de faire tout comme Flickr (en moins bien, mais en libre) en une véritable médiathèque culturelle libre.

      On peut y inclure le titre, la description, les artistes, la date de réalisation, les matériaux utilisés, la localisation de l'œuvre, ses dimensions, quelques anecdotes à son sujet, et même des références pour en faire un véritable article encyclopédique de qualité. Sans oublier la photo qui illustre le mieux l'œuvre, ici j'ai opté pour une photo de Rama oeuf corse !
















      J'en ai profité pour étendre le modèle {{Institution}} aux cimetières en créant {{Institution:Cimetière du Père-Lachaise}}.

      On peut même y insérer la boîte Mérimée (mais le créateur du modèle ne semble pas d'accord. Mieux vaut attendre avant de l'utiliser.)

      samedi 19 février 2011

      Billet n°0

      Puisqu'il ne fait pas assez beau pour aller photographier les tombes du Père-Lachaise pour Wikimedia Commons, qu'il est trop tôt pour relire 4-5 pages des œuvres diverses de Jean-Baptiste Say pour Wikisource et que je n'ai pas assez bu pour consacrer un article sur Wikipédia à un groupe de chevaliers originaires de Vaud qui se seraient vantés, lors d'une orgie, de manger des Genevois à la cuillère (et d'ailleurs était-ce à l'aide d'une petite cuillère, une cuillère à melon ou bien une cuillère à absinthe en forme de Tour Eiffel ?), et que j'ai déjà lu mon fil twitter, il ne me reste qu'une seule chose à faire : ouvrir ce blog.

      Pour paraphraser un célèbre wikipédien de la blogospère :  
      On est samedi , il est 10 heures du mat. Jusque là, tout va bien.