Spread the love

Des données qui nous identifient …

Nos données personnelles, tout ce qui nous entoure est données : notre position GPS, les calories perdues pour aller au bureau, nos heures de sommeil accumulées… À chaque fois que nous faisons quelque chose en ligne nous générons de la donnée. Toutes ces données générées sont ce qui s’appelle le ‘’Big Data’’. Pour un certain nombre de sociétés, cela constitue une mine d’or ou plutôt une mine d’information. Nous émettons volontairement ces données, elles documentent chacune de nos activités. On estime à 50 milliards le nombre d’appareils connectés dans le monde, autant de sources de data. Ces informations sont collectées, manipulées, fusionnées et interprétées pour que n’importe qui puisse en faire n’importe quoi (cela ne vous fait pas penser à Big Brother ?). En effet, plusieurs entreprises en savent pas mal sur vous.
Les GAFAM ont très vite saisi l’enjeu du Big Data. Ainsi, entre 2004 et 2014, IBM, parmi les leaders du secteur, a investi 24 Milliards de dollars dans la seule analyse des données, rien que ça ! Allstate, compagnie américaine d’assurance, offre 25% de remise aux propriétaires de ‘’maisons intelligentes’’, des habitations dotées de capteurs qui analysent notre quotidien. Des capteurs similaires peuvent être installés dans les voitures, permettant ainsi aux assureurs d’accéder à vos statistiques et d’adapter votre contrat en conséquence. 70% des automobilistes français se disent prêts à en équiper leur véhicule en échange d’une remise sur leur contrat. AXA quant à eux offrent à certains de leurs assurés un bracelet connecté et promet 100€ à ceux effectuant plus de 10000 pas par jour. Lenddo, une banque hongkongaise, scrute les flux de Twitter et de Facebook pour déterminer si ses clients méritent ou non un crédit ; Kreditech, en Allemagne, ou encore Zestfinance font de même en analysant plus de 7000 paramètres dont votre localisation et vos achats en ligne pour analyser le risque lié à leurs clients. Autant d’entreprises qui sont prêtes à investir des sommes faramineuses pour en savoir plus sur vous. Cependant, Google se démarque de tous ceux-là par son quasi-monopole dans le domaine et les déboires auxquels il a dû faire face. Le géant du net collecte les données sur ce que nous faisons, sur ce qui fait qui on est et sur ce que nous créons :

  • les sites web et vidéos consultés
  • les publicités sur lesquelles on clique
  • notre position géographique
  • les informations de notre appareil
  • notre adresse IP et les données provenant de cookies
  • notre nom, e-mail et mot de passe
  • notre date de naissance, sexe, numéro de téléphone, et pays
  • les adresses e-mail avec lesquelles nous sommes en contact (e-mails reçus et envoyés via Gmail)
  • nos contacts
  • nos événements de calendrier
  • les photos et vidéos que l’on charge dans le cloud (parfois automatiquement)
  • les documents, feuilles de calcul, présentations envoyées sur Google Drive

Bien qu’il ne fournisse aucun chiffre, on estime qu’en 2016, Google avait collecté entre 10 et 15 exaoctets ( 1 Milliard de Go) de données … Selon eux, ces données servent 3 objectifs principaux : Rendre leurs services plus efficaces, améliorer la sécurité (exp. le filtre spam sur Gmail) et mieux cibler les publicités.
Cela étant, la collecte de donnée se faisait par des procédés pour le moins peu orthodoxes. Les caméras des Google cars ne servaient pas seulement à prendre de photos, mais à collecter des données d’ordinateurs présents dans les bâtiments alentours dont les mots de passe, les adresse mail et autres informations plus personnelles (dossiers médicaux, préférences sexuelles…)

Et qui nous font tourner l’économie numérique

Outre le fait qu’elles servent à nous identifier en ligne auprès de différents organismes ou d’entreprises commerciales, ces informations peuvent être utilisées à des fins commerciales et marketing (pour mieux cibler la publicité par exemple), partagées ou commercialisées et dans de rares cas elles peuvent être piratées et utilisées par des tiers (usurpation d’identité, arnaques, ransomware, etc.). En effet la collecte de données est à la base du développement de l’économie numérique grâce à la publicité qu’elle peut générer ainsi que la qualité des données collectées. Ces données sont utilisées par des algorithmes ultra-performants pour vous conforter dans vos idées mais peut aussi mettre en avant des objets qui vont forcément vous plaire et ainsi vous inciter à acheter. Selon la Commission Nationale Informatique et Libertés (CNIL), deux applications sur trois récupèrent déjà des données personnelles à l’insu de leurs utilisateurs et cela sans compter sur votre téléphone portable qui récupère d’autres données très personnelles qui sont stockées et éventuellement traités par des organismes privés, ou encore vos consultations de sites sur internet, où vous êtes tracés par un grand nombre de tierces-parties. Même si vous pouvez choisir de fournir volontairement certaines de vos données via des questionnaires ou des inscriptions, elles ne seront jamais d’aussi bonnes qualité que celles collectées à votre insu qui livrent des renseignements très précis sur votre comportement.

La récolte des données

Sur Internet, les outils pour nous suivre à la trace n’ont cessé de se perfectionner. Les plus traditionnels sont les cookies, de petits fichiers textes déposés sur le disque dur de l’ordinateur par le serveur d’un site visité. Ainsi, ce dernier reconnaîtra l’internaute lors d’une prochaine visite. Certains cookies, plus insidieux, viennent de sites partenaires, dits « tierce partie ». Un site d’information peut par exemple accueillir des bannières de publicité contenant elles-mêmes des cookies. L’internaute est alors espionné par des entreprises dont il ignore l’existence. Autre traqueur central : l’adresse IP de l’ordinateur. Ce numéro d’identité unique permet, lui aussi, d’agréger toutes les traces de navigation d’un même ordinateur. Mais les plus gros acteurs du Big data restent les réseaux sociaux : Les déclarations au moment de l’inscription, et surtout les informations données au cours de leur utilisation, constituent une manne. Toutefois les GAFA (Google, Amazon, Facebook, Apple) ne sont pas les seuls à rechercher vos données personnelles : la majorité des entreprises récoltent chaque donnée, ce qui n’est pas forcément très éthique ni même écologique.

Outre la pollution engendrée par la fabrication de nos terminaux numériques et du réseau numérique, le Big Data demande des infrastructures pharaoniques pour stocker cette avalanche de données, mais il faut y ajouter celles pour les traiter. L’analyse de données, provenant d’observations de l’environnement, d’expériences scientifiques ou encore de données marketing, nécessite des moyens de calcul très importants, concentrés dans des grands centres et des supercalculateurs. Ces technologies sont consommatrices d’énergie et produisent des gaz à effet de serre à toutes les étapes de leur cycle de vie : En phase d’utilisation, les éléments essentiels du Big Data peuvent se répartir en trois catégories : les équipements terminaux, les réseaux et les centres de données qui consomment chacune une puissance électrique comparable, de l’ordre de 40 gigawatts en 2013, soit une quarantaine de tranches de centrales nucléaires.

Et, dans ce paysage digital, des intermédiaires peu connus du grand public ont vu le jour. Les sociétés de reciblage publicitaire, comme le géant Criteo, en font partie. Leur métier consiste à recueillir des données de navigation personnelle – via les cookies – pour cibler les centres d’intérêt d’un individu. Encore plus opaques sont les data brokers, ou courtiers en données. Ils vendent et achètent des fichiers en masse, les agrègent et les font parler. Ainsi tout l’innovation du Big Data permet, certes, la personnalisation des traitements mais le profilage de millions d’individus sert surtout à promouvoir des publicités ciblées, à peaufiner une offre de services. Même si dans la majorité des cas nos données laissées sur la toile sont inoffensives, on peut se retrouver dans une situation où elles deviendront une source de nuisance. Préserver ses données personnelles permet donc d’éviter des dilemmes délicats où notre intimité est touchée.
Depuis l’avènement du terme Big Data, la société devient de how to clean the house in one day. Au début des années 60, des voix s’élèvent attirant l’attention sur les risques et les conséquences sociales du Big Data. Ainsi, les débats contemporains peuvent être considérés comme une nouvelle étape d’une réflexion qui a débuté il y a quelques décennies de cela.
Le terme Big Data couvre un large spectre d’activités, de méthodes et de domaines d’application de la collecte d’information : Les assurances taillant des contrats surmesure pour leurs clients ; les programmes de prévision policière promettant d’identifier les comportements potentiellement criminels et, au meilleur des cas, d’empêcher les crimes ; l’analyse des données politiques amenant le microciblage et l’analyse prédictive ; les smart-cities (villes intelligentes) prévoyant d’intégrer les masses de données et l’internet des objets afin d’améliorer l’efficacité des services urbains.

Et l’éthique dans tout ça ?

L’analyse du Big Data posent différentes problématiques sociétales aussi variées que le sont les domaines d’application. Certains modes d’analyse, par exemple la gestion du trafic, opèrent à des niveaux d’agrégation suffisamment élevés qui ne nécessitent pas le recueil de données personnelles. À contrario, différentes pratiques de suivi comportemental et de profiling remettent en cause, voire bafouent, l’idée traditionnelle de vie privée en amassant des données suffisamment personnelles permettant de remonter à des informations très sensibles et intimes telles que nos préférences sexuelles, ethnicités, points de vue politico-religieux, traits de personnalité, usage de substances addictives… De ce fait, l’hégémonie actuelle d’une poignée d’entreprises, en l’occurrence les GAFAM, sur les infrastructures digitales pose le problème du contrôle et de la législation de cette collecte de données.
D’une part, les réseaux sociaux largement utilisés, comme Facebook et Twitter, contribuent, par leurs algorithmes de filtrage, au façonnement de la communication et de la vie sociales. D’autre part, les infrastructures digitales laissent entrevoir des possibilités de plus en plus étendues d’observation puisque les profils des utilisateurs peuvent être évalués bien plus efficacement qu’avant. Ceci s’applique particulièrement aux écosystèmes des smartphones, tablettes et autres objets connectés : grâce aux murailles que bâtissent Google et Apple autour de leurs produits et appareils, la production de contenu https://www.windybankestate.com.au/ est devenue de plus en plus simple. Cependant, cette standardisation a permis de consolider le pouvoir législatif de quelques multinationales avec un contrôle inédit sur les données des utilisateurs.
Du fait des smartphones et des accessoires connectés (montres, trackes, lunettes…), les comportements individuels sont désormais ‘’informatisables’’ aussi. Plusieurs capteurs permettent à leurs utilisateurs une récolte automatique et continue de leurs données, chose qui, par le passé, demandait un grand effort. Cette pratique, le self-tracking, donne aux usagers un rôle prépondérant dans la collecte des données sensible. Il existe quatre motivations principales aux self-tracking :

  • Réflexion sur soi : face à l’incertitude grandissante dans les sociétés modernes, le self-tracking est une nouvelle source de reconnaissance sociale.
  • Optimisation : l’auto-évaluation permet une meilleure compréhension de notre corps, et donc une identification plus précise des améliorations possibles ; i.e. Un feedback instantané et donc une adaptabilité accrue.
  • Émancipation : Les self-trackers se perçoivent comme des patients compétents, surveillant leurs corps indépendamment. Cette connaissance de leurs corps réduit considérablement leur dépendance de la médecine traditionnelle.
  • Conformité : Les nouvelles normes sociales, qui remettent la responsabilité sur l’individu, promeuvent les pratiques de self-tracking et d’auto-évaluation.
    Les self-trackers ont tendance à se considérer comme seul point de référence. Inversement, les différentes applications de self-tracking offrent les moyens de partager ses statistiques et de les comparer ; ouvrant ainsi la porte à la ludification (par anglicisme gamification) où l’utilisateur reçoit des prix, des récompenses et débloque des niveaux. Tout ceci a pour but de motiver les ‘’joueurs’’ pour des tâches du quotidien. Toutes ces manipulations mènent au partage (volontaire) des données sur ces plateformes. Plus insidieusement, elles créent une pression de groupe pour participer au self-tracking et pour partager ses données.

Par conséquent, le self-tracking fournit un nouveau type de données sur des domaines pas encore documentés jusque-là. Ces pratiques restent cependant très critiquables en ce qui concerne la confidentialité des données et la surveillance.
Les données numériques de masse ne permettent pas seulement de surveiller les individus et de contrôler leur comportement. En outre, les entreprises et les autorités publiques qui gèrent des systèmes sociotechniques à grande échelle (par exemple, des systèmes de transport ou d’énergie) sont de plus en plus capables de contrôler ces systèmes en temps réel, puisqu’elles ont accès à des données instantanées provenant de capteurs, machines, utilisateurs ou clients respectifs.
Lorsqu’il conduit une voiture moderne ou utilise les transports publics, chaque utilisateur qui a accepté les conditions du service transmet de grandes quantités de données concernant sa position, sa vitesse, sa destination, etc. Ces ensembles de données sont utilisés par les centres de contrôle du trafic pour obtenir une image actualisée de l’ensemble du système et pour identifier des modèles tels que les embouteillages ou les congestions. Pourtant, la principale caractéristique est la prédiction : les systèmes de guidage routier (par exemple, Google Maps, TomTom) utilisent les modèles enregistrés pour prédire les états futurs du système et recommander des contournements ou d’autres options stratégiques. Les utilisateurs sont libres de se conformer les conseils ou de faire leurs propres choix. Ainsi, l’état du système de transport global quelques minutes plus tard apparaît comme le résultat agrégé d’un grand nombre de décisions décentralisées d’acteurs indépendants. Cependant, ces décisions sont soumises au contrôle d’une autorité centrale qui gère le système en utilisant des incitations douces. Cette autorité centrale poursuit des objectifs globaux, par exemple éviter les embouteillages ou réduire les émissions de CO2. Cela peut être en contradiction avec les objectifs individuels de se déplacer rapidement, de manière confortable et autodéterminée.
Dans les cas du transport intelligent et des réseaux intelligents, nous pouvons donc observer un nouveau mode de gouvernance : un contrôle central “doux” ou “intelligent” de systèmes décentralisés et distribués. Les acteurs individuels conservent leur autonomie pour rechercher un optimum local tout en faisant partie d’un processus plutôt global, guidé et optimisé automatiquement par des algorithmes en temps réel. Dans ce cas, les problèmes de confidentialité sont moins importants, car la plupart des systèmes sont basés sur des données anonymes. C’est plutôt l’opacité des décisions algorithmiques en temps réel qui peut créer un conflit entre les différents participants. En outre, la question reste ouverte de savoir dans quelle mesure les individus, qui se sont habitués au guidage routier ou à d’autres systèmes algorithmiques, sont encore capables de prendre leurs propres décisions, si la recommandation algorithmique est manifestement erronée et si des contraintes de temps importantes apparaissent. Alors que, par exemple, les voyages en voiture nécessitaient autrefois une planification préalable (consultation de la carte routière avant le début du voyage), les systèmes en temps réel d’aujourd’hui permettent une planification en temps réel (commencer son voyage et suivre le système de guidage routier mis à jour en permanence). Les usagers du trafic qui s’habituent à ces services risquent donc d’en devenir de plus en plus dépendants et de perdre des options.

Réguler correctement la collecte et le traitement des données

Comme indiqué précédemment, le Big Data peut entraîner des conséquences sociétales indésirables. Les critiques affirment que, sans réglementation appropriée, le Big Data menace les libertés individuelles et les principes démocratiques.
Pourtant, une affirmation courante est que le Big Data et la réglementation sont antithétiques. Certains auteurs affirment que le Big Data rend obsolète la différenciation entre les données personnellement identifiables et d’autres données, remettant ainsi en cause la réglementation actuelle. Dans le même ordre d’idées, des critiques universitaires (et des groupes de défense des droits civiques) soutiennent que de nombreuses pratiques liées au Big Data sapent les principes de protection des données, de minimisation des données et de spécification des finalités ou d’intégrité contextuelle. Une mise en œuvre stricte du règlement actuel sur la protection des données étoufferait, à terme, l’innovation basée sur le Big Data, comme le soutiennent de nombreux industriels, politiciens et chercheurs.
La tension perçue entre le Big Data et la réglementation actuelle a conduit à une multitude de suggestions réglementaires différentes :

  • Dans le domaine de la réglementation étatique, les idées les plus importantes sont d’adapter la protection des données (par exemple, en introduisant de vastes droits de portabilité des données) et d’améliorer la mise en œuvre de la protection actuelle des données, par exemple via des évaluations d’impact sur la vie privée ou de meilleures ressources pour les autorités indépendantes de protection des données. Un autre ensemble de propositions appelle à compléter la protection des données avec d’autres approches réglementaires, telles que la réglementation antitrust, et à trouver des moyens de protéger les droits de l’homme, du citoyen et des consommateurs, par exemple à travers une politique anti-discrimination.
  • Dans le domaine de l’autorégulation des entreprises, les principales propositions concernent les instruments de responsabilité sociale des entreprises (RSE) tels que les codes, les standards et les normes. Une autre approche réglementaire consiste à encourager le développement de technologies pearnkandola.com renforçant la confidentialité et l’équité: confidentialité par défaut, confidentialité dès la conception, égalité des chances dès la conception, atténuation des préjugés et autres. De plus, les entreprises peuvent participer à la réglementation du Big Data en certifiant leurs produits, pratiques et organisations via des scellés et des audits.
  • Dans le domaine de la réglementation par la société civile, les actions collectives, par exemple les actions en justice intentées par les agences de protection des consommateurs, et le soutien aux citoyens et aux consommateurs ont été recommandés pour faire face aux risques induits par le Big Data.
  • Dans le domaine de l’autorégulation professionnelle, les professions concernées, telles que les professionnels de la science des données et les délégués à la protection des données, pourraient développer de manière autonome des lignes directrices éthiques pour les pratiques et la qualification.
  • Enfin, la régulation par l’autoprotection englobe des recommandations visant à informer et sensibiliser les citoyens et les usagers afin d’activer l’autoprotection individuelle et collective.

Ainsi, cette multitude de propositions réglementaires – qui peuvent se chevaucher, se combiner et être mises en œuvre de manière très différente – révèle que le débat sur la régulation politique du Big Data n’est pas une simple recherche d’adaptations techniques aux innovations technologiques.
Il n’y a pas de réponse réglementaire rapide au changement technologique. Dans certains cas, des réponses technologiques peuvent être disponibles et utiles. Pourtant, dans de nombreux cas, le conflit entre différentes propositions est une lutte entre des idées et des acteurs différents avec des intérêts, des ressources et des visions du monde différents. Par exemple, une conception néolibérale, plaidant pour une autorégulation des entreprises par le biais de codes éthiques et de mesures améliorées pour le consentement éclairé des utilisateurs, est diamétralement opposée à une vision (socio) démocratique qui appelle à une intervention plus forte de l’État dans le Big Data. La réglementation par des interdictions, la fourniture de services Internet et de données publics et une approche de la protection des données centrée sur les collectifs et pas uniquement sur les individus. Cependant, toutes ces propositions partagent le défi d’établir un régime de réglementation efficace au niveau transnational – un domaine où les États ont une capacité de réglementation limitée.

offer swiss eta movement
Theme Designed by IndiThemes | Copyright © 2022 Safer Data. All Rights Reserved.