Le Facebook récent scandale — dans lequel Cambridge Analytica a obtenu les données personnelles de 50 millions d’utilisateurs de Facebook — n’aurait vraiment pas dû être une si grosse affaire. Il ne s’agissait en aucun cas de la plus grande violation de données, ni du type de données le plus sensible. Ce n’était pas aussi salace que PRISM ni aucun des autres programmes secrets que la NSA a conçus pour siphonner les données téléphoniques et Internet (qui sont restées secrètes jusqu’à ce que le lanceur d’alerte Edward Snowden en parle au Guardian en 2013).
L’acte le plus — sinon le seul – potentiellement illégal dans cette saga a été l’accord conclu pour partager les données entre Aleksandr Kogan et Cambridge Analytica, une violation potentielle des conditions d’utilisation de l’application d’enquête créée par Kogan pour récolter les données en premier lieu. L’acte de collecte des données, bien que n’étant plus autorisé par Facebook, était parfaitement légal à l’époque.
Alors pourquoi cette violation était-elle si grave?
Tout d’abord, nous pouvons universellement convenir que Facebook a amassé une mine de données personnelles plus grande que celle de toute autre entreprise sur la planète. Compte tenu de la valeur évidente de ces données, Facebook est constamment ciblé. Lorsqu’une telle violation s’est produite sur le plus grand réseau social du monde, des millions de personnes se sont énervées, à juste titre. Facebook a été contraint d’expliquer comment cela s’est passé. Ça ne semble toujours pas être grave.
Leur explication, cependant, posait une question importante: Pourquoi Facebook a-t-il besoin de toutes ces données en premier lieu? Cela a à son tour conduit à une prise intéressante – 22: Pour expliquer la violation de données, Facebook a dû attirer l’attention sur son modèle économique, à savoir qu’il collecte des données, les anonymise et les vend — même indirectement — à leurs vrais clients. Les vrais clients ne sont pas nous, les utilisateurs de Facebook / Instagram / WhatsApp. Non Facebook est un réseau publicitaire et un annonceur, c’est-à-dire des entreprises et des personnes qui paient pour promouvoir leurs produits et services sur Facebook.
Cette » révélation » n’aurait dû surprendre personne, ou du moins quiconque y prêtait attention. Les revenus générés par la publicité personnalisée sont le modèle économique de Google, Facebook et de presque toutes les entités médiatiques opérant en ligne. L’année dernière, Facebook a déclaré que 98% de ses revenus provenaient de la publicité.
En utilisant vos données (et les miennes et celles de tous les autres), Facebook a construit une plate—forme de ciblage publicitaire incroyablement puissante, une plate-forme que nous leur avons permis de construire et de déployer lorsque nous avons accepté leurs conditions d’utilisation – tous deux (plus) milliards d’entre nous.
Il est même possible — via la plateforme publicitaire accessible au public de Facebook – de cibler un homme de 41 ans à San Francisco qui parle spanglish, qui a assisté à au moins un événement Lindyhop et qui appartient au groupe Bay Area Esk8. En d’autres termes, je peux cibler une annonce si étroitement qu’elle n’est montrée qu’à moi. (Je viens d’essayer cela, et bien que la plate-forme m’ait averti que mes paramètres de ciblage pourraient être « trop spécifiques », cela ne m’a pas empêché de configurer l’annonce.)
Voici comment Facebook utilise nos données personnelles. Avec les paywalls /abonnements (par ex. San Francisco Chronicle, Medium, New York Times) et les dons (par exemple, The Guardian, NPR, Wikipedia), la vente d’annonces ciblées sur la sensibilité personnelle des gens est la façon dont hay se fait non seulement sur Facebook, mais partout sur Internet. Si cela signifie que je peux consommer des publicités pour des camps de danse et des combinaisons de plongée au lieu de catastrophes de chirurgie plastique de célébrités, alors tout le monde y gagne. (Facebook en déduit, à juste titre, que je surfe. O’Neill paie Facebook pour annoncer la combinaison à moi et à d’autres surfeurs, nous achetons les combinaisons de O’Neill. Répéter. Cha-ching.)
D’une manière ou d’une autre, nous sommes passés de la vente de combinaisons à la tenue d’élections. Pour comprendre comment notre Internet actuel nous a échoué afin de cadrer là où le nouvel Internet doit nous emmener, cela vaut la peine de faire une plongée superficielle dans l’histoire d’Internet.
Internet n’a jamais été conçu pour être une machine à faire de l’argent. À la fin des années 60 et au début des années 70, les grandes universités ont connecté leurs ordinateurs afin de partager leurs recherches, principalement par courrier électronique (de toutes choses) sur une première version d’Internet connue sous le nom d’ARPAnet. En cours de route, le DoD a fourni un financement pour créer DARPAnet. Dans les années 80, je suis sûr que le partage de photos de chats (codées sous forme de flux de texte) a commencé à devenir une chose, si ce n’était déjà le cas. Même encore, le seul « modèle d’affaires » d’Internet était la rotation d’hélices universitaires parrainée par le gouvernement.
En 1994, avec l’avènement du navigateur Netscape, les non-universitaires ont afflué en masse sur Internet. Dix ans auparavant, j’avais mon premier compte de messagerie et j’avais accès à AppleLink. Je me suis connecté et j’ai exploré des BBSs et j’ai commencé à utiliser des protocoles comme Gopher et NNTP (Usenet). J’ai lu sur la « nétiquette », j’ai appris à garder ma touche de VERROUILLAGE des MAJUSCULES éteinte, à repérer un AOLer (indice: le VERROUILLAGE des MAJUSCULES EST GÉNÉRALEMENT ACTIVÉ) et à construire des émoticônes de base, quelque chose que nous appelions autrefois « art ASCII. »|_/] ← C’est une tasse de café juste là. Vraiment, ça l’est.
Cet Internet précoce, sur le point de devenir commercial, avait l’impression d’un ensemble de « communautés d’experts » – faute de meilleur terme — dispersées dans les salons de discussion BBSs, Usenet et AOL. (Gardez cette notion de « communautés d’experts » à l’esprit pendant que vous continuez à lire; j’y reviendrai plus tard.)
De 1994 à 2002 environ, les entreprises se sont ruées sur Internet pour expérimenter le premier modèle économique « réel » du web : le commerce électronique. Pendant quelques années, il semblait que chaque entreprise avait besoin d’une vitrine Web. Cependant, lorsque les investisseurs ont réalisé que la vente de nourriture pour chats en ligne n’était pas tout à fait ce qu’elle était, la bulle a éclaté. Les mêmes forces du marché qui ont rapidement évaporé cinq billions de dollars de valeur ont également déclaré Amazon clairement « gagnant » du commerce électronique, prouvant que l’inventaire centralisé (ainsi que l’inventaire à la demande) et la technologie centralisée et la logistique d’exécution étaient le meilleur moyen – sinon le seul moyen — de vendre de la nourriture pour chats en ligne et de réaliser un profit.
Après un bref moment de réflexion, de la deuxième vague d’internet — ce que certains appellent le Web 2.0 – est apparu un nouveau modèle d’affaires, plus indirect, emprunté aux entreprises de médias traditionnels. Comme les journaux et les magazines, « Web 2.0 » les sites et les applications diffuseraient également des publicités, mais au lieu d’embaucher des photographes et des journalistes professionnels, les utilisateurs quotidiens fourniraient les photos de chats et écrivaient les histoires de chats réconfortantes. Des sites comme ceux—ci pourraient économiser de l’argent en laissant les amateurs créer le contenu — appelé Contenu généré par l’utilisateur (ou UGC pour faire court) – alors qu’ils collectaient de l’argent pour chaque impression d’annonce de nourriture pour chats (CPM), chaque clic sur une photo de chat (CPC) et chaque action, par exemple s’inscrire au contenu marketing félin d’un site ou participer à un sondage sur les chats (CPA).
Naturellement, les sites qui comptent le plus d’utilisateurs et le plus de photos de chats (principalement Facebook et Twitter) pourraient fournir les plateformes de ciblage publicitaire les plus riches. La prétention de Facebook de rendre le monde plus connecté dément une autre mission: créer la plate-forme de ciblage publicitaire la plus riche et la plus efficace connue de l’humanité.
(Cela ne vaut rien que je passe sous silence d’énormes pans de l’industrie publicitaire, y compris les annonces de recherche / SEO / SEM et des dizaines de réseaux diffusant des annonces sur des sites tiers et des applications mobiles. Je néglige également de parler du web mobile en termes généraux, du Web sémantique, de l’Internet des objets et d’une foule d’autres sujets, juste pour que nous puissions rester concentrés sur l’UGC.)
Contenu de chat généré par les utilisateurs
Bien qu’il fasse partie de la boîte à outils technologique et du jargon depuis au moins 15 ans, beaucoup — sinon la plupart — de gens ont entendu parler d’UGC pour la première fois lors des récentes retombées du scandale Facebook / Kogan / Cambridge Analytica. Avant il y a quelques jours, les gens pensaient que Facebook était gratuit; en réalité, ce n’est pas le cas. Pour Facebook, nous échangeons nos informations personnelles en échange des fonctionnalités Facebook dont nous bénéficions.
Peut-être « utilisé pour profiter » aurait-il été mieux formulé, car ce dernier scandale a laissé des foules en colère de personnes rejoignant le mouvement #DeleteFacebook. À bien des égards, ils le font en vain, car nous aurions littéralement besoin d’arrêter d’utiliser nos smartphones et l’ensemble d’Internet, de changer nos noms, nos adresses, la couleur des cheveux / des yeux, l’historique des achats et mille autres choses pour échapper à la collecte de données personnelles qui se passe partout sur le web.
Sur Facebook et ailleurs, UGC graisse les engrenages d’une énorme machine conçue pour transformer les photos de chats en argent. Et cela fonctionne, ou du moins cela fonctionne pour quelques entreprises massives, ce qui semble être un thème pour les entreprises Internet.
En fait, au moins trois fois dans la brève histoire d’Internet, nous avons vu d’énormes oligopoles créer – et consommer – des modèles commerciaux en ligne entiers: Amazon (pour le commerce électronique), Google (pour la publicité dans la recherche) et Facebook (pour la publicité UGC).
La croissance organique et les acquisitions par Facebook à elles seules ont permis de stocker plus de deux milliards d’informations personnelles, de goûts, de préférences et d’interactions sociales stockées dans une énorme base de données.
Et cela explique enfin pourquoi ce scandale est important: parce qu’il a amené les gens à se poser de très bonnes questions, comme: Était-ce une bonne idée de permettre à des entreprises comme Facebook de donner à tout le monde un microphone gratuit en échange de la récolte, du stockage et de l’extraction de tout ce que tout le monde dit?
Ce ne sont pas les Photos de Chat; C’est la distribution Cat
Facebook est peut-être le plus grand collecteur de données, mais ils ne sont certainement pas les seuls. De plus, ils ne vont pas supprimer leurs données, car c’est la pierre angulaire de leur entreprise. Donc, au lieu de me concentrer sur Facebook, je veux poser une question plus fondamentale, qui suscitera sûrement l’ire des défenseurs de la liberté d’expression partout, mais qui doit être posée indépendamment: Était-ce même une bonne idée de donner à chacun un micro gratuit en premier lieu?
En d’autres termes, quand est-ce une bonne idée — dans le monde réel et non numérique – de dire quelque chose, instantanément, à tous ceux que nous connaissons: famille, bons amis, collègues, connaissances, personnes que nous venons de rencontrer et que nous nous sommes immédiatement liées d’amitié? Avant Facebook, cela n’était pas facilement possible. Nous cachions nos documents de lecture et nos journaux sous le matelas et n’envoyions que des choses comme des annonces de bébé à tous ceux que nous connaissons (même en sautant sélectivement des plantes grimpantes comme Oncle Charlie). Maintenant, Facebook a renversé cette notion sur sa tête. Votre photo de chat a plus de likes que mon annonce de bébé? Cela a-t-il un sens IRL? Alors pourquoi cela devrait-il être possible en ligne?
Mais qu’en est-il de la liberté d’expression ? Oui, dans ce pays, nous sommes tous libres de dire presque n’importe quoi sans crainte de répercussions. Dans un autre sens, cependant, la parole n’est pas vraiment libre du tout. Notre précieuse liberté d’expression est absolument sans valeur sans distribution. Sans distribution, nos messages sur Internet ne sont rien de plus que des arbres qui tombent dans la forêt sans personne pour écouter les sons qu’ils pourraient émettre. La distribution coûte de l’argent — et c’est pourquoi nous faisons une promesse faustienne à chaque mot et cliquons sur Facebook. Nous fournissons le contenu; ils assurent la distribution. Et nous payons la distribution, bien qu’indirectement, en permettant à Facebook de transmettre nos données aux annonceurs.
Trop souvent et trop facilement, la distribution est confondue avec la vérité. Si quelque chose est « largement rapporté », cela ne le rend pas factuel. C’est là que réside le problème de l’impressionnant pouvoir de distribution de Facebook: Il peut être utilisé pour distribuer des faits aussi efficacement que possible pour diffuser, euh, « des faits alternatifs. »En conséquence, Facebook et Twitter et d’autres sites UGC sont fortement modérés à la fois par les personnes et par les machines. L’autre jour, les robots de censure de Facebook ont empêché mon ami Tim de dire: « les arbres provoquent le réchauffement climatique. »De nombreux artistes ont vu leur travail retiré pour avoir montré un peu trop de mamelon (ou un peu trop de quelque chose). Cela introduit un tout nouvel ensemble de problèmes, dont le plus important est: Faisons-nous confiance à Facebook pour arbitrer le « bon » discours de « mauvais? » Selon quelles normes ou à qui ?
J’ai eu une expérience personnelle révélatrice en 2012 lorsque j’ai aidé Miso – une entreprise soutenue par Google conçue comme un site de médias sociaux pour les vidéos — à créer une application appelée Quips. Cette application permettrait aux gens d’utiliser leur téléphone pour prendre des images fixes d’émissions de télévision et de films et en créer des mèmes en ajoutant le texte blanc volumineux que nous en sommes venus à associer à de tels artefacts.
Pour faire court, nous n’avons pas intégré la modération (un euphémisme Internet courant pour la censure) dans la première version de la plate-forme. Nous avons plutôt donné aux gens un accès illimité aux outils qu’ils pouvaient utiliser pour créer du contenu potentiellement viral. Qu’est-ce qui pourrait mal tourner? En quelques semaines, les plaisanteries avaient dégénéré en cloaque le plus profondément haineux que je n’ai pas encore vu sur Internet — et je lis même (parfois) des commentaires vidéo sur YouTube! Qui savait que Miso était en fait l’abréviation de misogynie – et du racisme, de l’homophobie, de la xénophobie et d’un million d’autres types de discours de haine?
Il était facile pour nous de coucher du soleil et d’enterrer le tas de dreck fumant créé par les Quippers. Ce n’est pas si simple pour Facebook.
Ils ne peuvent certainement pas tout supprimer sans détruire les données vitales de leur modèle commercial. Pendant ce temps, essayer de censurer les messages est un jeu sans fin de Whack-a-Mole algorithmique certain d’offenser la sensibilité des taupes de l’extrême droite, de l’extrême gauche et de toutes les taupes entre les deux, y compris mon ami Tim (qui ne croit pas réellement que les arbres provoquent le réchauffement climatique; c’était juste une blague).
Donc la distribution sans modération / censure conduit à un cloaque. Nous, technologues, le savions tous déjà, mais cela n’a pas empêché une foule de personnes vraiment intelligentes d’essayer de créer une meilleure souricière de modération / censure. En fin de compte, ils échoueront à cause (ce que je ne peux qu’espérer, ce ne sont que quelques-uns) d’individus créatifs avec beaucoup de temps libre produisant un approvisionnement apparemment illimité de déchets. Ou l’art. Ou des blagues! Le sarcasme, quelque chose de presque impossible à détecter sur le Web, peut souvent être confondu avec un discours de haine, surtout lorsque le but du sarcasme était de sensibiliser le public au discours de haine en premier lieu.
Face à une situation insoluble comme « éliminer la désinformation sur Internet », cela aide à recadrer le problème en examinant la cause profonde réelle. La cause n’est pas les fausses nouvelles en soi, ni les réseaux publicitaires, ni Facebook, Cambridge Analytica ni même UGC. Au contraire, l’idéologie naïve d’Internet couplée aux pires traits de l’humanité formait un terrain idéal pour une tragédie des Biens communs: Si vous créez quelque chose d’ouvert et de libre, certaines personnes finiront par trouver un moyen de l’exploiter pour leur propre bénéfice et ainsi le ruiner pour tous les autres.
Sortant du Cloaque
Même s’il s’agit probablement d’un très petit segment de « mauvais acteurs » qui gâchent Internet pour tout le monde, je propose un changement radical: laissons Internet pour ce qu’il est (un cloaque) et construisons un meilleur. Et si nous pouvions recommencer avec les mêmes objectifs élevés — connecter le monde en partageant des informations – mais cette fois-ci construire un Internet avec des failles qui nous empêcheraient de créer un autre cloaque de désinformation et de discours de haine?
Je ne suggère pas de fermer Internet, mais plutôt de construire quelque chose au-dessus des protocoles existants qui aide le monde à organiser l’information, à valider les allégations et à établir les faits; en d’autres termes, nous devons construire un Internet à la hauteur de ses premières considérations de conception, qui, de toute évidence, n’incluaient pas la construction d’un cloaque de mensonges et de discours de haine.
Un article récent du NYT a vraiment conduit ce point à la maison pour moi: « Le déclassement de l’expérience et la dévalorisation de l’expertise peuvent s’expliquer en partie par Internet, qui permet aux gens de rassembler leurs propres informations préférées et leur donne l’illusion de l’omniscience. »
Notez qu’il est dit « en partie. »Internet est en partie en faute. L’humanité porte la responsabilité du reste.
Alors oui, l’humanité est une grande partie du problème. Mais c’est aussi la solution. Pour chaque mauvais acteur, il y en a des milliers et des milliers de bons.
Et si nous pouvions construire un Internet où les bons acteurs pourraient chasser les mauvais?
Et si nous pouvions créer un Internet composé uniquement d’informations factuelles? Un internet dépourvu d’intérêts corporatifs ? Un internet de personnes réelles dans lequel tout le monde ne pouvait interagir avec le système qu’en utilisant une identité prouvée?
Et si nous pouvions enfin tracer la ligne entre les communications numériques privées et non privées, de sorte que les conversations privées puissent rester vraiment privées?
Et si toutes les informations étaient organisées en silos, comme les « communautés d’experts » des débuts de l’Internet, mais codifiées en une hiérarchie méritocratique où chaque revendication devait être vérifiée par une communauté d’experts établie? Et si les experts pouvaient déléguer des privilèges à d’autres experts qui prouvent leur valeur par des contributions? Et si l’information organisée restait gratuite pour le consommateur, mais fournissait un revenu de base à ses créateurs et à ses jardiniers pour le travail qu’ils consacraient à la conservation de l’information? Et si cet Internet pouvait rester complètement en lecture seule pour tous ceux qui ne sont pas désignés comme experts dans un silo particulier?
Web X.0
Une grande partie de la technologie dont nous avons besoin pour construire quelque chose comme ça existe déjà. Signal, Keybase et des dizaines d’autres plates-formes offrent une messagerie cryptée peer-to-peer (sans serveur). StackExchange fournit déjà un modèle pour les communautés d’experts organisées, entièrement basé sur Q& A. Modélisant le nouvel Internet à partir de StackExchange (ou Quora ou WhySaurus), chaque réponse à une question pourrait être stockée sous forme de bloc dans une blockchain avec des experts des communautés appropriées recrutés pour valider les réponses, un peu comme la validation de bloc fonctionne déjà aujourd’hui pour les crypto-monnaies.
Chaque silo d’information aurait besoin d’une communauté d’experts pour le gérer. Mais à quoi servent ces experts si nous ne pouvons pas vérifier leurs références et leurs contributions pour valider qu’ils sont vraiment des experts? La pièce manquante ici est la gestion globale des identités, c’est-à-dire une façon de prouver que nous sommes ce que nous disons être. Nous avons besoin d’une clé cryptographique révocable à base de données biométriques qui nous permettrait de faire des affaires en utilisant nos identités IRL ou avec des pseudonymes dont les propriétaires peuvent prouver qu’ils sont les leurs (mais pas l’inverse). L’Identificateur Unique Humain (ou HUID) décrit par l’ambitieux projet Cicada propose une conception intelligente pour cela.
Créer un système d’identité sécurisé et non usurpable est un défi fondamental, mais ce n’est sûrement pas le seul défi. Dans la construction de ce nouvel Internet, notre plus grand ennemi est ce que nous ne savons pas — et ce que nous ne saurons pas tant que nous n’aurons pas déjà écrit des tonnes de code et de tests, comme c’est souvent le cas pour les projets logiciels.
Mais nous ne pouvons pas laisser la peur de l’inconnu nous arrêter. Le moment est venu – en fait, il est attendu depuis longtemps — de créer un nouvel Internet, un Internet qui ne peut être vaincu par les escrocs nigérians, les faux robots d’information russes ou ce gamin de 400 livres dans son lit quelque part. Laissons l’Internet existant intact, mais enseignons à nos enfants qu’ils doivent supposer que presque tout ce qu’ils lisent là-bas est soit une connerie, soit une connerie sponsorisée. S’ils sont vérifiés, ils peuvent citer des informations factuelles : ils doivent consulter le Web X.0.
Et oui, ce nouvel Internet serait en lecture seule pour 99,9999% de la population mondiale. Cela laisserait à environ 7 000 experts le contrôle de toutes les informations factuelles publiques du monde, avec la possibilité de déléguer davantage d’experts au besoin. Aucune société ne serait autorisée; aucun intérêt corporatif ne serait toléré. De cette façon, les habitants du nouvel Internet conserveraient toutes les informations du monde, tout comme les habitants des premières « communautés d’experts » Internet sur les BBSs, Usenet et les chatrooms, mais cette fois avec des HUID et une validation de bloc gardant tout le monde honnête.
Les gens pouvaient toujours interagir avec les entreprises sur le « vieil Internet », mais nous pouvions utiliser le Web X.0 HUID pour distribuer des jetons d’attention de base (ou quelque chose comme eux) pour permettre aux gens de décider eux—mêmes des informations personnelles révocables qu’ils souhaitent partager avec des entités commerciales – et d’être indemnisés avec de la crypto-monnaie en retour. En d’autres termes, les entreprises paieraient directement les consommateurs pour prêter attention à leurs messages, éliminant ainsi les couches d’intermédiaires du réseau publicitaire qui sont payés pour faire correspondre les entreprises aux consommateurs.
Le projet Cigale va plus loin en ajoutant un volet de démocratie directe sécurisée, qui permettrait aux populations petites et grandes de s’autogouverner. La démocratie directe conduit généralement à des catastrophes notoires (par exemple Athènes), mais étant donné que deux de nos trois derniers présidents ont pris leurs fonctions malgré la perte du vote populaire, c’est peut-être une idée qui mérite d’être examinée à nouveau.
Là encore, peut-être que la démocratie directe mord plus que nous ne pouvons mâcher. Peut-être devrions-nous commencer par construire et déployer le HUID sur Internet existant, puis partir de là.
Peut-être que tout cela est de la poudrière.
Mais peut-être — grâce à Facebook, Kogan et Cambridge Analytica – que nous commençons enfin à poser les bonnes questions.