Le Vertigineux problème de Citogenèse d’Internet

Bienvenue dans Source Notes, une nouvelle chronique au Futur dans laquelle Stephen Harrison explore Wikipédia, les connaissances numériques et la recherche d’un monde basé sur les faits.

Publicité

Il y a deux semaines, le Dr James Heilman a découvert quelque chose d’étrange. Le médecin urgentiste canadien et contributeur passionné de Wikipédia a remarqué que DrugBank, une base de données en ligne pour l’information sur les médicaments, copiait du texte directement à partir de Wikipédia. Bien que Heilman considère que le contenu médical de Wikipédia est d’une qualité étonnamment bonne, il était préoccupé – car il n’a pas seulement trouvé que DrugBank copiait et citait Wikipédia; il avait également trouvé plusieurs exemples de Wikipédia copiant et citant également DrugBank.

Par exemple, la page de DrugBank pour le sulfate de protamine, un médicament souvent utilisé en chirurgie cardiaque, comprenait des informations tirées de la page Wikipedia du médicament. Mais la page Wikipedia du médicament a cité la page DrugBank du médicament. Ce référencement circulaire a créé un problème pour prouver la véracité des informations trouvées sur la page Wikipedia — d’où provenait vraiment le matériel source original? Peut-on lui faire confiance? Heilman a trouvé cinq autres articles de Wikipédia sur les médicaments avec des références circulaires similaires, et il a émis l’hypothèse qu’il pourrait y en avoir beaucoup plus. Il a contacté DrugBank au sujet des problèmes, et ils travaillent à les résoudre. Pendant ce temps, Heilman (connu sous le nom d’utilisateur de Wikipédia « Doc James ») a exprimé sa préoccupation sur la page de discussion sur la médecine du WikiProject — le forum où les éditeurs de Wikipédia discutent des améliorations apportées aux articles sur la médecine et la santé — que « la citogenèse est devenue une réalité. »

Publicité

L’auteur et créateur de Xkcd Randall Munroe a d’abord inventé le terme « citogenèse » pour décrire ce type de référencement circulaire dans une bande dessinée populaire de 2011. Munroe y décrit la citogenèse comme un processus en quatre étapes:

 Bande dessinée XKCD montrant les quatre étapes de la citogenèse: (1) Un utilisateur invente des faits à partir de rien et les ajoute à une page Wikipedia sans référence. (2) Un rédacteur pressé, recueillant des informations sur le site, incorpore ensuite ces fausses informations dans son résumé indépendant du sujet. (3) Un éditeur de Wikipédia diligent ajoute ensuite une référence au travail publié par cet auteur sur le sujet comme source pour cette entrée originale de Wikipédia. (4) D'autres personnes extérieures continuent de lire et de répéter ces fausses informations, ce qui entraîne une large diffusion du mensonge initial.
Publicité

Les mathématiciens et les fans d’Ashton Kutcher pourraient conceptualiser cela comme une sorte d’effet papillon de la connaissance numérique.

Il est difficile de quantifier la prévalence des incidents de citogenèse impliquant Wikipedia car la plate-forme ne nécessite pas de citations pour une nouvelle entrée d’informations, il n’y a donc pas de moyen systématique d’identifier chaque référence circulaire potentielle. Au lieu de cela, de nombreux incidents sont rencontrés par les utilisateurs eux-mêmes lorsqu’ils rencontrent une entrée qui soulève les sourcils. Les exemples incluent une série de guides d’étude qui s’appuyaient largement sur le contenu de Wikipédia et qui ont ensuite été utilisés comme source eux-mêmes, et le canular Jar’Odo Wens, dans lequel un utilisateur a publié un article Wikipédia non sourcé sur un dieu aborigène australien fictif avec un nom étonnamment similaire à « Jared Owens » (la seule autre contribution associée à l’adresse IP de l’utilisateur était une entrée pour un autre faux dieu australien, « Yohrmum »). Au moment où Jar’Edo Wens a été révélé comme un canular près de 10 ans après son entrée initiale, l’article de Wikipédia avait été vérifié dans plusieurs livres. Mais tous les incidents ne sont pas pris, ou pris tout de suite.

Publicité

Les cas les plus infâmes de citogenèse sont ceux qui ont abouti à la diffusion généralisée d’un mensonge dans les médias d’information. La liste de ces incidents confirmés de citogenèse va de l’excentrique, comme une blague sur l’inventeur du coup de papillon qui s’est retrouvé dans the Guardian, au plus significatif, comme d’importantes divergences biographiques. En décembre 2016, un utilisateur anonyme a édité la page Wikipédia du secrétaire d’État Mike Pompeo pour indiquer que Pompeo avait servi dans la guerre du Golfe. La fausse affirmation a été répétée dans des médias tels que le Wall Street Journal et le New Yorker jusqu’à ce qu’en avril 2018, la CIA confirme que Pompeo n’a en fait pas servi dans la guerre du Golfe.

Bien sûr, si un journaliste écrit un article basé sur des informations erronées de Wikipedia, il porte la responsabilité de l’inexactitude. S’appuyer sur Wikipédia en tant que source indépendante est tout simplement une mauvaise pratique journalistique. L’encyclopédie en ligne indique explicitement qu’elle ne garantit pas la validité des informations contenues sur le site, qui est maintenu par une communauté d’éditeurs bénévoles et non soumis à un processus de révision formel. Mais, en même temps, la réalité pratique est que des millions d’internautes (pas seulement de journalistes) comptent sur Wikipédia pour obtenir des informations. Et parce que la Fondation Wikimedia à but non lucratif dit qu’elle vise à ce que les projets Wikimedia deviennent l’infrastructure essentielle d’une connaissance libre et digne de confiance, il est logique que le mouvement envisage au moins des contre-mesures pour réduire le risque de diffusion de la désinformation par des rapports circulaires.

Publicité

Mais, comme je l’ai réalisé après avoir correspondu avec le Wikipédien Liam Wyatt, qui a écrit sa thèse sur la façon dont les historiens peuvent utiliser Wikipédia pour comprendre la société, la solution au problème de la citogenèse n’est peut-être pas si simple.

Comme beaucoup de Wikipédiens, Wyatt a son exemple préféré du phénomène: l’incident de la « salle de bain de Staline », qui montre à quel point le problème peut devenir collant. En février 2009, un éditeur anonyme a modifié la page Wikipédia allemande de Karl-Marx-Allee (un boulevard important de Berlin) pour affirmer qu’elle était connue sous le nom de « Salle de bain de Staline », ce qui implique qu’il s’agissait des toilettes du dictateur soviétique. Plusieurs publications ont répété cette mauvaise information. Se sentant coupable, l’éditeur de Wikipédia qui a créé le faux surnom a essayé de supprimer les mauvaises informations — cependant, lorsqu’il a essayé, d’autres éditeurs ont inversé son changement car il y avait des citations « fiables » pour cela. Il s’avère que le rédacteur en chef farceur d’origine était un journaliste, il a donc décidé de se présenter comme le rédacteur anonyme d’origine qui a exécuté le coup dans un article pour le journal pour lequel il travaillait — un geste qui lui a donné une contre-référence appropriée à utiliser pour corriger enfin l’enregistrement.

Wyatt a expliqué que, outre les cas occasionnels de journalisme bâclé, la difficulté sous-jacente derrière de tels problèmes de citogenèse est que la communauté Wikipédia n’exige pas de citations pour chaque information ajoutée au site. Par principe, tout le contenu de l’encyclopédie doit être vérifiable, mais il n’est pas nécessaire qu’il soit vérifié lors de son ajout. Cela reflète la tendance des éditeurs de Wikipédia à l’éventualité, une focalisation sur le long terme plutôt que sur la valeur immédiate du projet. Cette philosophie a tendance à se tromper sur l’inclusion de talons et d’articles de mauvaise qualité avec l’idée qu’ils seront améliorés au fil du temps plutôt que de supprimer strictement tout sauf des ajouts de haut calibre.

Publicité

Mais imposer des citations pour chaque fait n’est pas nécessairement une réponse pratique, ni souhaitable, au problème de la citogenèse. D’une part, Wikipedia respecte déjà certaines normes importantes en matière d’approvisionnement, comme l’exigence de références lors de l’ajout de nouveau contenu pour les pages biographiques pour les personnes vivantes. Mais bon nombre des exceptions existent dans un but précis. Pour des raisons stylistiques, la section principale ou introductive d’un article ne comprend généralement pas de citations, car ces ouvertures sont généralement écrites avec plus de généralité que ces dernières, des sections plus détaillées de la page. Wikipedia ne nécessite pas non plus de citations pour des connaissances communes et non controversées (c’est-à-dire que vous n’avez pas besoin de mentionner que le ciel est bleu). Et l’exagération des citations ennuyeuses est découragée.

Wyatt a expliqué par courriel que, même en mettant de côté ces conventions, exiger des citations pour toutes les formes d’information serait également un problème en raison des barrières culturelles que cela créerait. Il a écrit que, par exemple, il y a une discussion de plus en plus visible sur la façon dont les Wikipédiens peuvent mieux accueillir et intégrer des formes de connaissances qui sortent du modèle occidental traditionnel pour une source fiable. Il a déclaré que les représentants de la communauté ont discuté, sans résolution, de la manière dont il pourrait être possible d’intégrer les connaissances des sociétés avec des cultures d’histoire orale dans Wikipedia « d’une manière qui ne porte pas atteinte à nos politiques fondamentales de « sources fiables » et « aucune recherche originale ». »Mais exiger des citations traditionnelles pour chaque fait serait presque certainement un pas en arrière pour ce type d’inclusion.

Logistiquement aussi, cela devient compliqué. J’ai demandé à l’administrateur de Wikipédia connu sous le nom de « TheSandDoctor », ou TSD, d’envisager une solution technologique hypothétique au problème de la citogenèse: Que se passe-t-il si un filtre de contenu obligeait les utilisateurs à inclure une citation chaque fois qu’ils ajoutaient des informations à l’encyclopédie? TSD a expliqué que ce serait  » problématique sur plusieurs fronts. »D’une part, la seule façon pour TSD de voir un tel filtre être mis en œuvre serait d’exiger que toutes les modifications ou ajouts à une page incluent une citation. Cela signifierait, en pratique, que des modifications mineures telles que l’ajout de ponctuation ou d’un espace nécessiteraient des citations, ce qui est non seulement absurde, mais rendrait également la tâche souvent fastidieuse d’éditer Wikipedia plus frustrante.

TSD a également prédit que ce type de changement technologique forcé ne serait pas accueilli à bras ouverts par la communauté d’édition de Wikipédia, en particulier ceux qui pensent que Wikipédia est un travail en cours où la perfection n’est pas requise. Beaucoup de ces éditeurs préféreraient l’incident de citogenèse occasionnel à un contrôle technologique qui limiterait le partage des connaissances, a écrit TSD.

Publicité

Pourrait-il y avoir une solution de juste milieu qui ne nécessite pas de citations problématiques pour chaque nouvelle entrée? Peut-être. Les éditions en allemand et en polonais de Wikipédia utilisent une technologie appelée « modifications en attente », qui exige que les nouveaux utilisateurs anonymes fassent approuver leurs modifications par un autre éditeur en règle. Un utilisateur passe à l’édition libre « en direct » uniquement après avoir effectué plusieurs centaines de modifications qui ont été approuvées manuellement. Ce processus d’initiation sélectionnerait vraisemblablement les utilisateurs ayant de bonnes habitudes d’approvisionnement. Mais ce système semble également entrer en conflit avec la philosophie selon laquelle Wikipedia est l’encyclopédie libre que « tout le monde peut éditer. »Jusqu’à présent, Wikipédia en anglais n’a mis en œuvre la technologie des changements en attente que pour un petit groupe d’articles, tels que des biographies controversées qui sont fréquemment vandalisées.

Pour l’instant, c’est aux éditeurs vigilants comme Heilman d’identifier les incidents de citogenèse suspects en se fiant à leur expérience et à leur instinct. Et, bien sûr, il appartient toujours aux lecteurs de tous les jours d’appliquer une pensée critique lorsqu’ils interagissent avec de nouvelles informations, que la plate-forme soit Wikipédia ou non. Rappelez-vous que des fictions comme « La salle de bain de Staline » sentent à la fois la métaphore et le fait.

Cette page a été mise à jour avec une image du xkcd.com comique.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.