Je publie, tu publies, nous polluons

D’après le site planetoscope, en moyenne chaque seconde, 29.000 gigaoctets d’informations sont publiés dans le monde. Soit 2,5 exaoctets par jour. Soit 912,5 exaoctets par an. De son côté, le site statista annonce pour 2018 près de 33 zettaoctets (1Zo = 10^12 Go) et une prévision de 2 142 zettaoctets pour 2035. Nous assistons ici à une véritable explosion des données produites.

Au-delà des chiffres, la facilité que nous offre tant l’augmentation des débits (et le passage de la 4G à la 5G ne devrait pas améliorer les choses) que l’amélioration constante tant des capacités de traitement que de stockage nous incite à produire/consommer toujours plus de data. Que nous soyons particuliers ou professionnels, personne n’échappe à la règle ! Des 1000 selfies quotidiens dans le monde aux 293 milliards de mails en 2019 (hors spam, qui représentent à eux-seuls entre 55 et 95% du trafic total suivant les estimations), les chiffres donnent rapidement le tournis… Et pourtant, toute cette production exponentielle de données nous est totalement indolore (par exemple, la plupart des spams sont stoppés par les filtre anti-spams et ne nous arrivent jamais), à commencer sur notre porte feuille. Le fait que nos données soient conservées dans des lieux totalement virtuels à nos yeux facilite grandement ce manque de sensation. Et il est fort à parier que si nous avions un datacenter au beau milieu de notre salon et branché directement sur notre compteur électrique, nous serions à peu près tout aussi attentif à sa bonne utilisation qu’au fait de laisser la porte du frigo ouverte. Sans vouloir jouer les rabajois ou les “c’était mieux avant”, force est de constater que prendre une photo argentique ou consommer quinze minutes de connexion internet avec un forfait limité n’avait pas du tout le même effet sur notre capacité/envie de production numérique.

Pour autant, cette infobésité est-elle si indolore que ça pour le système cardiovasculaire de notre planète ?

Il y a encore assez peu de publications sur le sujet, la mode du tout IA et du tout Big Data l’emportant largement sur un quelconque intérêt pour les conséquences écologiques d’un tel emballement – au moins à court terme. En fait, nous commençons tout juste à nous intéresser aux questions éthiques et sociales liées à l’utilisation des données massives et personnelles suite notamment aux excès révélés par les affaires liées entre autres à FaceBook et consorts. Or, au-delà de ces considérations ô combien importantes, il est un autre versant du problème qui devrait également nous inquiéter, à commencer par l’impact en termes de besoin énergétique de ces technologies. Les data centers consommaient en 2017 près de 20% de l’énergie, selon une synthèse publiée par l’association négaWatt et reprise par le site GreenIT. “En France, la consommation de ces data centers s’élevait à environ 3 TWh en 2015, soit davantage que la consommation électrique de la ville de Lyon, selon l’Union française de l’électricité (UFE)” (50% de l’énergie sert uniquement à la climatisation) selon un article dans Sciences et Avenir. Et ce dernier de préciser que “en 2015, les terminaux consommaient déjà deux fois plus que les serveurs et centres de données. Et alors que ces derniers gagnent en efficacité, l’électricité consommée par le dernier kilomètre numérique explose : la 4G consommerait jusqu’à 23 fois plus que le WIFI“. Il est de même estimé que le bitcoin à lui seul a le même impact environnemental qu’environ 2,358 millions de voitures par an en termes d’émissions de CO2.

Selon le chercheur Gerhard Fettweis, relayé par le site fournisseur-energie.com, la consommation électrique du web atteindrait en 2030 la consommation mondiale de 2008 tous secteurs confondus. Dans un futur proche, Internet deviendrait ainsi la première source mondiale de pollution. L’équipement en dispositifs mobiles (smartphones, tablettes, objets connectés…) explose et conjointement la consommation/production de données. Et c’est sans évoquer l’obsolescence programmée des dispositifs ou l’utilisation abondante de métaux rares (avec les conséquences géopolitiques, économiques et écologiques engendrées) nécessaires à la conception de cs derniers. Sans parler de l’absence en parallèle d’une véritable filière de recyclage – même si on trouve de plus en plus de matériels reconditionnés. Ainsi les sources de pollution et de soucis écologiques (au sens large, social compris) conséquents sont nombreuses mais hélas, pour le moment, totalement indolores pour la plupart d’entre nous – tout au moins en Occident.

Du droit à l’oubli au devoir d’oublier ?

Il ne s’agit pas de revenir en arrière, à l’aire du tout papier et de la machine à vapeur sous peine de tomber dans une aire aux accents steampunk tout aussi dévastatrice pour la planète. Lors de l’avènement de la machine à vapeur ou de la voiture, personne n’imaginait (et il y a peu encore) devoir réduire son utilisation en raison d’un effet néfaste sur l’environnement de par ses rejets ou la raréfaction des ressources nécessaires à leur utilisation. La comparaison avec ce qui se passe aujourd’hui dans le numérique est sans doute facile. Mais, au même titre que nous développons une agriculture raisonnée après des années de productivisme – avec en même temps la nécessité de devoir nourrir plusieurs milliards d’individus – ne pourrions nous pas dores-et-déjà envisager la question des données (et toutes les questions connexes liées au numérique de manière plus générale) d’une façon également raisonnée avec en même temps la nécessité de devoir connecter plusieurs milliards d’individus.

Des solutions existent assurément mais sont plus faciles à écrire qu’à faire ; elles ne sont en aucun cas à envisager dans un paradigme manichéen, ne serait-ce que par la multitude des variables à prendre en compte. Il y a certes l’aspect technique avec, par exemple, la diminution de la consommation énergétique des serveurs ou encore l’utilisation moindre de matériaux rares. Il y a l’aspect développement avec, par exemple, une optimisation plus poussée des codes (qui a une conséquence sur la consommation énergétique ou sur le stockage). Et puis il y a l’aspect production raisonnable de données sur lequel nous nous concentrons dans cet article.

Sur ce point, le Règlement Général sur la Protection des Données Personnelles (RGPD), instituée au niveau européen en 2016 – et appliquée en France en 2018 – donne déjà des pistes intéressantes même s’il ne concerne que les données à caractère personnel.

  1. En premier lieu, ne collecter/produire que les données dont on (ou les autres) a (ont) réellement besoin (et accessoirement pouvoir le justifier ou tout au moins se poser la question, ce qui est toujours constructif). C’est beaucoup plus facile à dire qu’à faire, surtout au niveau personnel. La notion de privacy by design, imposée par le RGPD, oblige tout responsable de traitement à réfléchir à cette récupération raisonnée de données. Pourquoi ne pas l’étendre aux autres données (produites ou collectées) ? Au niveau personnel, diminuer son nombre de selfies, de tweets ou de posts sur son réseau social favori, de mails, bref diminuer tout ce qui fait que l’on (a la sensation d’) existe(r) sur le Web, est loin d’être évident… A tel point que l’on pourrait peut-être envisager de placer cela dans les programmes éducatifs, au même titre que la nécessité de s’alimenter sainement. Au même titre que savoir gérer son identité numérique, cette question fat partie d’une certaine hygiène numérique à développer. On n’est nullement obligé de se bâfrer sur son clavier.
  2. En second lieu, faire le ménage dans ses données. Le web est devenu une mémoire immense, immatérielle et intemporelle de notre monde privé comme public. Avec la précédente notion, c’est d’ailleurs ce qui fait le bonheur du Big Data et des algorithmes d’apprentissage qui ont besoin de volume pour se développer et être de plus en plus efficace. Or le RGPD instaure désormais aux données personnelles collectées une durée de vie limitée, durée variable suivant leur nature. Alors pourquoi ne pas faire le ménage dans ses données et supprimer définitivement celles qui sont devenues inutiles et qui sont inutilement conservées sur des serveurs. Ne pas conserver tous ses mails, toutes les photos ratées ou sans intérêt… c’est bon pour la planète. Rien de tel qu’un bon nettoyage de printemps dans le Cloud ! Notre mémoire individuelle et naturelle ne retient pas tout ce que l’on perçoit et a besoin de faire le ménage. Il en est de même de notre mémoire individuelle et virtuelle. Le droit à l’oubli pourrait devenir un devoir. Ce pourrait être également un élément à inclure dans l’éducation numérique de nos enfants et de nos futurs professionnels, car cette réflexion peut également se poser à une échelle plus large.

Et si la solution passait par une approche systémique ?

La prise de conscience sociale et éthique vis à vis de toutes les questions numériques devrait nous mener à (re)penser nos innovations technologiques également en termes d’impact écologique. En réalité, il nous faudrait adopter automatiquement une approche systémique dans tous les projets numériques que nous développons. C’est une démarche que nombre de designers (de service comme de produits) mettent en place aujourd’hui dans leurs divers projets. L’utilisateur est au centre, mais au centre de tout un (éco)système avec lequel il interagit. Et il est d’ailleurs à saluer l’ouverture de nouvelles formations dans le domaine du numérique associant à leur cursus la démarche systémique des designers, telles celles développées par l’Université de Nantes par exemple. Car c’est à la fois une question d’information et d’éducation tant des professionnels que de tout à chacun. En ce sens, les Humanités numériques au delà de leur intérêt pour les questions reliant le numérique aux sciences humaines et sociales seraient tout à fait légitimes pour embrasser cette dimension écologique, et participer ainsi à la définition d’une nouvelle approche systémique des projets numériques.

La solution passera sans doute par la formation le plus en amont possible. Mais aussi par l’éco-conception de systèmes moins énergivores, la mise en place de filières de recyclage, une innovation reposant sur plus de lowtech (ou de manière raisonnée) quand c’est nécessaire, des systèmes d’apprentissages nécessitant moins de données, des solutions visant à diminuer l’empreinte énergétique… Nous n’en sommes qu’au début de la prise de conscience. Il serait regrettable de scier aujourd’hui la branche sur laquelle nos enfants s’assierons demain, ou tout simplement l’arbre dans lequel nous vivons.

PS : 1934 réutilisations seulement des jeux de données ouvertes sur le site data.gouv.fr, soit 5,3% des jeux de données publiés.