Attention au fossé !

Wiki Loves Women est un projet coordonné sur différents pays d’Afrique, qui comporte plusieurs aspects. Il vise notamment à soutenir la mise à disposition de contenus :

  • rendant hommage à des femmes africaines influentes et reconnues ;
  • reflétant les réalités auxquelles femmes et filles doivent faire face dans toute l’Afrique.

Ce projet a été conçu pour combler deux fossés majeurs sur Wikipédia et les projets Wikimedia : les femmes et l’Afrique.

Le fossé des genres

L’existence d’un fossé des genres depuis des décennies a été constaté et reconnu dans les professions liées à l’informatique. La communauté Wikimédia elle-même était consciente de ce biais dès les débuts du projet Wikipedia. La première publication internationale à avoir tenté de quantifier cet écart-là sur Wikipédia fut une enquête menée par l’Université des Nations Unies et publiée en mars 2010. Elle révéla que seules 13% de la base des contributeurs à l’encyclopédie étaient des femmes. Depuis lors, cet écart considérable entre les sexes a encore été documenté et de nombreuses initiatives ont été mises en place pour le combler. Cela s’avère complexe, car le fossé se constate à plusieurs niveaux.

Par exemple, un biais existe au niveau du pourcentage de biographies de personnalités féminines et masculines publiées sur l’encyclopédie. Un biais plus structurel quantifie les “tendances” liées au genre à favoriser les liens entre des articles de personnalités ou articles sur des sujets connexes. Un biais lexical existe également, et révèle des inégalités dans les termes utilisés pour décrire les hommes et les femmes remarquables sur Wikipédia. Enfin, un biais de visibilité est à l’œuvre sur l’encyclopédie : on trouve d’avantage d’articles sur les hommes en page d’accueil de Wikipédia que d’articles concernant des femmes…[style color=”#dddddd” ]tpotpt[/style]

Moins de 20% (de l’ensemble) des contributeurs de Wikipédia sont des femmes.

De nombreuses études attestent que les contributeurs à Wikipédia sont plus susceptibles d’être des hommes que des femmes (les pourcentages varient de 7 à 25 %, selon les langues dans lesquelles l’encyclopédie est modifiée, et selon les études). Un résumé des études et sondages réalisés sur le sujet est disponible sur le blog de la Fondation Wikimedia (post paru en avril 2015).

Seules 16% des biographies de la Wikipédia anglophone concernent des femmes.

Le projet Women in Red (“Femmes en rouge”) est un projet imaginé par les contributeurs anglophones afin de transformer les “liens rouges” (c’est-à-dire ceux qui renvoient à un article qui n’a pas encore été créé) en liens bleus (article existant). Le périmètre du projet inclut des femmes – personnalités réelles ou personnages de fiction – leurs biographies et leurs travaux, au sens large. Les participant-e-s des “Femmes en rouge” défendent l’idée que le fossé des genres liés aux contenus est un biais systémique, et veulent traiter le problème d’une manière positive et constructive. Ils ou elles le font en organisant des journées contributives sur des thématiques variées auxquelles ils donnent une visibilité via les réseaux sociaux.

Sur la Wikipédia anglophone, l’article d’une personnalité mentionnant que celle-ci a divorcé a 4,4 fois plus de chances d’être un article sur une femme que sur un homme.

Une étude a démontré qu’il existe des biais thématique et linguistique dans la façon dont les articles sur les hommes et les femmes sont catégorisés sur l’encyclopédie. Bien qu’il soit connu que de tels biais existent, on ne savait jusqu’à présent pas dans quelle mesure ces biais se manifestaient dans Wikipédia . Pour répondre à ces questions, les chercheurs ont comparé les introductions des articles biographiques sur les hommes et les femmes dans la Wikipédia anglophone .

Selon les règles d’écriture de Wikipédia, cette introduction doit “se suffire à elle-même en tant qu’aperçu du sujet de l’article. Elle doit définir le sujet, en établir le contexte, expliquer en quoi ce sujet est digne d’intérêt et résumer les éléments principaux”.

Les chercheurs se sont concentrés sur la section “Introduction” pour deux raisons . D’une part, la première partie de l’article est potentiellement lu par la plupart des gens qui regardent l’article. D’autre part , les contributeurs à Wikipédia doivent se concentrer sur ce qu’ils considèrent comme le plus important sur la personne, et les préjugés peuvent influencer ce processus de sélection.

Pour mettre en évidence les biais thématiques qui se manifestent dans le contenu de Wikipédia, les chercheurs ont ensuite analysé les trois thèmes suivants :

  • Le thème du genre contient des mots qui soulignent que quelqu’un est un homme ou une femme (par exemple : “l’homme” , “les femmes” , “madame” , “mademoiselle”, “monsieur” ), ainsi que l’identité sexuelle ( par exemple: “gay”, “lesbienne”).
  • Le thème de la relation se compose de mots sur les relations amoureuses (par exemple : “marié”, “divorcé”, “couple”, “mari”, “femme”).
  • Le thème de la famille regroupe des mots sur les relations familiales (par exemple : “enfants”, “mère”, “grand-mère”).
Wagner, Claudia; Garcia, David; et al. (26 January 2015). "It's a Man's Wikipedia? Assessing Gender Inequality in an Online Encyclopedia" (PDF). GESIS: Leibnitz Institute for the Social Sciences.
Figure 3 – Ratios de probabilité sexospécifique en anglais : Racines de mots avec le ratio de probabilité sexospécifique le plus élevé dans la Wikipédia anglophone appartement à l’une des trois catégories (Famille, relations, genre).                                                                                                                                                                 Wagner, Claudia; Garcia, David; et al. (26 January 2015). “It’s a Man’s Wikipedia? Assessing Gender Inequality in an Online Encyclopedia” (PDF). GESIS: Leibnitz Institute for the Social Sciences.

Les résultats démontrent clairement que quelque soit la langue étudiée, presque tous les mots appartenant aux catégories Famille, Relation ou Genre, ont un taux de probabilité de présence plus élevé pour les femmes. Dans la Wikipédia anglophone, un article d’une personnalité qui mentionne que la personne est divorcée est 4,4 fois plus susceptible d’être celui d’une femme plutôt que celui d’un homme. Des résultats similaires ont été observés dans six éditions linguistiques  différentes. Un biais lexical est donc bel et bien présent sur Wikipédia et peut être observé de façon uniforme dans les différentes éditions linguistiques (Source).

Le fossé africain

Le fossé “fossé africain” est d’une certaine manière plus évident à établir au niveau des contenus, mais reste complexe au niveau de la contribution. Dans tous les cas, il est très peu documenté par la recherche académique.

Néanmoins, quelques chiffres sont intéressants à garder à l’esprit…

Chaque trimestre, davantage de contributions proviennent de Hong-Kong que du continent africain tout entier.

Source : http://www.zerogeography.net/2012/02/where-do-wikipedia-edits-come-from.html
Source : http://www.zerogeography.net/2012/02/where-do-wikipedia-edits-come-from.html

Ce chiffre s’explique en réalité en grande partie par le nombre d’internautes dans ces territoires. Cependant, bien que tenant compte de leur faible taux d’internautes , on constate un nombre plus faible qu’attendu de contributions dans les pays d’Afrique subsaharienne (source).

En moyenne, il y a 100 fois plus d’articles géolocalisés en France qu’en Afrique.

Map of articles in English Wikipedia. Source: Graham et. al. (2014) Prof Mark Graham and Dr Christopher Foster, Oxford Internet Institute, University of Oxford

Un article géolocalisé est un article rattaché à des coordonnées géographiques, comme par exemple un bâtiment. Selon Graham et Foster (source) :

Le visuel ci-dessus montre le nombre absolu de modifications faites à l’intérieur d’une région donnée (à la fois des utilisateurs anonymes et enregistrés) aux articles géolocalisés de la Wikipédia anglophone, par région du monde. En termes de chiffres bruts, l’Amérique du Nord et l’Europe dépassent largement toutes les autres régions du monde. A l’inverse , l’Amérique latine, la région MENA (Moyen Orient et Afrique du Nord) et l’Afrique subsaharienne affichent un très petit nombre de ces même modifications. Cela signifie que même un nombre relativement restreint de modifications qui circulent de ces régions vers l’extérieur (ce que l’on appellerait des contributions “allochtones”)  pourrait facilement étouffer les “voix locales” en provenance d’endroits comme l’Afrique sub -saharienne : c’est ce que nous voyons sans aucun doute se produire.

Seules 25% des contributions à des sujets relatifs à l’Afrique subsaharienne proviennent de cette région.

Un projet de recherche a creusé cette problématique en s’intéressant à la proportion de contributions faites au sein d’une région donnée à des articles de Wikipédia.

Each region of the world is assigned a colour (North America – brown; Oceania – dark blue; Europe – light blue; Asia – grey; Latin America – yellow; Middle East – green, and Sub-Saharan Africa – red). The vertical axis focuses on the proportion of edits to articles in the region that come from that region [“received edits”] and the horizontal axis focuses on the proportion of a region’s committed edits that stay within that region [“committed edits”]. (note that The data shows anonymous edits only (+), registered edits only (×) and both edit types combined (●)) Source : The Connectivity, Inclusion, and Inequality Group Oxford Internet Institute, University of Oxford. http://cii.oii.ox.ac.uk/2014/12/04/visualising-the-locality-of-participation-and-voice-on-wikipedia/
A chaque région du monde est associée une couleur : Amérique du nord – brun; Océanie – bleu foncé; Europe – bleu clair; Asie – gris; Amérique latine – jaune; Moyen Orient – vert et Afrique subsaharienne – rouge. L’axe vertical rend compte de la proportion de contributions qui viennent de la région [“contributions reçues”] tandis que l’axe horizontal se concentre sur la proportion des modifications en provenance d’une certaine région et qui concernent cette région également [“contributions engagées”]. NB: les données montrent par ailleurs les contributions anonymes seulement (+), les contributions d’utilisateurs enregistrés seulement (x) et enfon les deux types combinés (●).
Source : The Connectivity, Inclusion, and Inequality Group, Oxford Internet Institute, University of Oxford.
http://cii.oii.ox.ac.uk/2014/12/04/visualising-the-locality-of-participation-and-voice-on-wikipedia/

Sur l’axe vertical de ce graphique, on constate une division nette entre des régions qui sont capables de se définir elles-mêmes et des régions qui sont en grande majorités définies par d’autres.

Selon Graham, l’Afrique subsaharienne, le Moyen-Orient et l’Afrique du nord, l’Amérique latine et les Caraïbes reçoivent comparativement moins de contributions en provenance de leurs territoires (environ 25%).  L’Europe, l’Océanie et l’Amérique du nord, au contraire, reçoivent des contributions en premier lieu de leurs propres territoires (environ 75%). L’Asie est documentée de manière quasi-égale par des personnes résidant en Asie et par l’extérieur. En d’autres termes, de vastes régions du monde ne sont pas documentées “en local”.

Des résultats plus détaillés par pays sont disponibles ici . Ces résultats suggèrent également que les chiffres relatifs à l’Afrique subsaharienne sont stimulés par des résultats relativement élevés en Afrique du sud, en Ouganda, à Maurice, au Rwanda et au Zimbabwe. Les chiffres de l’Afrique subsaharienne seraient plus faibles en réalité sans les effets conjugués de ces cinq pays.

http://geonet.oii.ox.ac.uk/blog/explaining-locally-contributed-content-in-wikipedia-about-sub-saharan-africa/ © Oxford Internet Institute 2014
http://geonet.oii.ox.ac.uk/blog/explaining-locally-contributed-content-in-wikipedia-about-sub-saharan-africa/
© Oxford Internet Institute 2014

D’autre part, 37% des contributions faites par des contributeurs habitant l’Afrique subsaharienne concernent l’Afrique subsaharienne. Mais même lorsque les contributeurs d’Afrique subsaharienne contribuent au sein de leur région, leur faible nombre signifie que la plupart du contenu vient d’ailleurs…

Les petits fossés font les grands abysses…

Seuls 12% des biographies de personnalités d’Afrique sub-saharienne sont des biographies de femmes.

WIGI (Wikipedia Gender Indicators – les indicateurs de genre de Wikipédia) est un projet qui a pour objectif de produire des jeux de données ouvertes sur le genre, les dates et lieux de naissance, l’ethnicité, l’activité professionnelle et les langues d’articles biographiques sur toutes les Wikipédias.   Dans l’étude de biographies sexospécifiques de femmes et d’hommes dans Wikidata, par “culture”, la culture est déterminée en utilisant la traduction de l’ethnicité, du lieu de naissance, et de la nationalité dans l’une des neuf cultures du monde, en croisant la carte du monde d’Ingelhart-Welzel avec Mechanical Turk. Cela permet plus ou moins de cartographier l’Afrique subsaharienne.

WIGI Index by Culture http://wigi.wmflabs.org/gender-by-culture.html
WIGI Index by Culture
http://wigi.wmflabs.org/gender-by-culture.html

Pour aller plus loin :

  • http://wigi.wmflabs.org
  • https://meta.wikimedia.org/wiki/Address_the_gender_gap
  • http://arxiv.org/pdf/1502.02341v1.pdf
  • https://en.wikipedia.org/wiki/User:Sphilbrick/Gender_Gap_resources
  • http://www.vox.com/2014/9/14/6140145/wikipedia-geography