Données personnelles, que deviennent nos traces sur Internet ?

Internet est un formidable outil qui nous connecte au monde entier. D'abord égalitaire, collaboratif et ouvert il est devenu un acteur de l'économie mondiale. Les enjeux commerciaux sont maintenant devenus énormes, ce qui n'était que comptage de visiteurs est très vite devenu outil de ciblage des bandeaux publicitaires et il n'y pas que les renseignements américains qui épient nos habitudes, nos relations et stockent des méta-données. Alors doit-on ignorer ce qui se passe et jouer notre rôle naïvement ?

1) Ce qui laisse des traces quand nous utilisons Internet

Vocabulaire et usages :

J'utilise le terme 'machine' pour désigner l'ordinateur, le smartphone, la tablette aussi bien que les serveurs, c'est un équipement avec son système d'exploitation (Windows, GNU/Linux, Mac OS, Android).
Utiliser Internet c'est faire fonctionner un programme sur une machine en relation par le réseau Internet avec un autre programme sur une autre machine.
On appelle "clients" les programmes qu'on lance sur sa machine, ils sont à l'initiative des échanges.
On appelle "serveurs" les programmes qui leur répondent, ils sont en attente et doivent être connus ou au moins visibles.
Les protocoles associés à Internet permettent de standardiser les échanges sont nombreux mais on assiste à une concentration. En effet nous avons délaissé les clients chat, transfert de fichier et même les clients de messagerie (pour certains d'entre nous) pour nous focaliser sur les clients de navigation "web" : ont dit souvent les navigateurs.
On appelle page, ou page web, un contenu accessible en une fois à un navigateur.
Les pages sont liées entre elles par des liens hypertexte.
On appelle site, ou site web, un ensemble de pages qui partagent une adresse Internet.

Les navigateurs principaux sont Firefox, Crome, Safari, Internet Explorer. Ils sont devenus incontournables, on les trouve partout, y compris certains téléviseurs. Le protocole http (celui de la navigation sur Internet) et son partenaire HTML sont les objets de toutes les attentions.

Les traces :

Dans votre navigateur se trouve un historique des sites visités, des favoris et des cookies qui sont des données stockées là par un site pour reconnaitre un utilisateur lors des visites suivantes. Ces données sont donc locales mais en partie accessibles par les sites visités (en principe chaque site ne voit que ses propres cookies).

Dans le serveur web, qui est le programme qui vous envoie les pages à afficher, on trouve des journaux d'activités (fichiers de logs), des compteurs, voire bases de données, qui enregistrent l'activité et donc l'audience. Ces données sont locales (au serveur) et sont accessibles aux administrateurs et gestionnaires de ces sites.

Dans les réseaux se trouvent les routeurs qui en principe se contentent d'aiguiller les paquets du client vers le serveur ou vice-versa, les serveurs DNS sont chargés de traduire les noms Internet en adresse IP, ils peuvent donc se faire une idée de l'activité mais très partiellement car ils ne sont consultés que pour la première partie de l'adresse Internet.

Avant de solliciter le DNS et le serveur web, vous avez (probablement) fait appel, parfois sans même en avoir bien conscience, au moteur de recherche. Celui-ci aussi stocke chez lui des informations (et chez vous des cookies).

2) Pour mieux vous servir... on vous espionne !

Pour mesurer leur audience, les serveurs ont leurs outils de statistiques mais pour faire payer la publicité, ils doivent faire appel à un compteur externalisé. Dans la page que vous affichez se mélangent différents contenus (images, textes, feuilles de style, scripts).

Pour savoir combien de personnes affichent une page, on insère une image fournie par un serveur de statistiques indépendant du site visité. On compte le nombre de fois qu'un image est demandée.Les outils de diffusion de lettres d'information sont des programmes ou modules des serveurs web, ils envoient à chaque adresse d'une liste un message électronique. Si le contenu est globalement le même pour tous les destinataires de la lettre, les liens hypertextes des pages et des images sont individualisés. En affichant la lettre avec ses images, vous renseignez le serveur sur le fait que vous avez bien reçu la lettre et que vous l'avez ouverte (affichée). Bien sûr ces données permettent de fiabiliser les listes et de mesurer l'efficacité mais d'autres exploitations sont possibles. Ces données sont locales au serveur qui est chargé de l'envoi ; s'il est différent du site visité il y a fuite d'informations personnelles.

Le(s) moteurs de recherche font un usage massif de toutes ces traces, qui font partie intégrante de leurs bases pour améliorer leurs réponses et donner des statistiques (ou en vendre ?). Leur pouvoir est énorme car selon qu'ils proposent un site en première ou trentième position en réponse à une recherche la visibilité, donc l'audience, d'un site vont varier énormément. Officiellement, ils se contentent de suivre la tendance mais en pratique ils permettent de l'orienter dans un sens ou dans l'autres, ce qui explique ses prestations de référencement payantes (vous pouvez 'monter' dans la liste moyennant finances).

3) Quels risques pour les individus ?

Vols (collectes) de données personnelles

On est plus ou moins tous exposés à de l'espionnage, que ce soit les états, les officines privées, l'entourage, les virus. Les données stockées sur votre machine peuvent disparaitre, être copiées ou corrompues. Tout cela est vrai mais il faut se dire que de multiplier les endroits où ces informations sont présentes ne peut conduire qu'à multiplier les risques. Pire, certains endroits sont plus tentants que d'autres : les sites qui possèdent le plus de comptes clients. Il faut bien un poste client et un serveur Pourquoi assimiler la collecte de données à un vol ? Parce que la plupart des utilisateurs ne sont pas conscients de ce que l'on prélève sur leurs habitudes, leur vie privée, ils ont beau cliquer sans trop chercher, on ne fait rien pour les éclairer.

Celui qui paie les musiciens choisit la musiquevous La politique de confidentialité d'un site, d'un service en ligne peut aussi évoluer : guidée par son actionnariat, par recherche de profits, à la suite d'un rachat, une direction peut changer sa politique et livrer ces informations (vendre, valoriser comme vous voulez) les données sont hors de votre contrôle, vous n'êtes pas à l'abri de leur utilisation, droit d'accès et de rectification ? Pas facile à faire appliquer en France mais sur Internet ?

Vente des données personnelles

"Si c'est gratuit c'est toi le produit." Tout service à un coût : héberger votre site, vos courriels, vos données, engendre des coûts. Si ces services sont ceux de votre fournisseur d'accès (c'est le cas de ce site perso) ou si vous participez à une coopérative d'hébergeurs/hébergés il y a de bonnes chances que les données ne soient pas revendues. Si au contraire vous disposez de services gratuits il y a une forme (ou plusieurs) de rémunération pour le fournisseur de service : au mieux il veut se faire connaître et deviendra payant quand sa notoriété sera grande, parfois il 'offre' un service de base et se rémunère sur des services 'pro' ou des prestations sur mesure. Parfois il est payé par la publicité (compatible avec le précédent) parfois ça a l'air gratuit, dans ce cas, sans un mécène et une communauté de bénévoles comment survivre et payer ses charges ? En captant du trafic que l'on orientera chez l'un ou l'autre (moyennant finances) ou en vendant des informations ...

Concentrations des données dans les mêmes mains :

Tant que les moteurs de recherches étaient nombreux et relativement équivalents, tant que leur activité était limitée à l'indexation et à la réponse à nos recherches, je n'étais pas inquiet. Ce qui à changé c'est la performance remarquable d'un des moteurs de recherche, son succès lui donnant du pouvoir, il n'a pas tardé à collecter des sommes phénoménales qu'il met au service d'une diversification de ses activités. En particulier il fournit des adresses de courriel et un service de messagerie et de groupe d'intérêt. Il héberge aussi vos photos et sur un autre site vos vidéos. Il vous permet de créer des documents bureautiques collaboratifs en ligne. Il offre une cartographie complète de la Terre, accessible dans des pages web et comme service en ligne. Il est l'acteur majeur du nouveau système d'exploitation des smartphones. Il est à l'origine d'un des navigateur. Il propose des livres, des outils de sondage et de calendrier en ligne.En un mot il connait tout de nous, ne renforçons pas son pouvoir en multipliant les alternatives.

4) Que faire ? les bonnes et moins bonnes pratiques

  • Utiliser plusieurs adresses de courriel (ne pas tout mélanger ?)
  • Ne pas utiliser d'adresse proposée par un géant de l'Internet, préférez un acteur public comme LaPoste.net et/ou une adresse liée à votre nom de domaine.
  • Utilisez un vrai client de messagerie vous permettra de préserver un peu de vie privée, Thunderbird par exemple, n'affiche pas les contenus ajoutés dans les messages.
  • Si vous voulez proposer un simple site web au monde entier pas de précautions particulières, (votre fournisseur d'accès pourra le fermer si quelqu'un se plaint mais c'est autre débat). Si vous cherchez un hébergeur voyez du coté des coopératives (par exemple ouvaton.coop).
  • Si vous avez un accès Internet en fibre optique vous pouvez tenter l'auto-hébergement
  • Si vous voulez envoyer des courriels depuis votre site faites-le avec l'aide de votre hébergeur et sans recours à un service tiers !
  • Si vous voulez mettre une carte en ligne faites-le avec openstreetmap.org.
  • Si vous voulez mettre en ligne des photos ou partager sondages ou des documents faites-le par vous mêmes ou au moins par un système alternatif (connaissez-vous framapad.org et framadate.org ?).
Vos remarques sont les bienvenues marc arob famille-abel.fr.
retour