Le pistage utilisateur ou Web Tracking sur internet

Une page qui concerne le Web Tracking sur Internet ou le pistage utilisateur en français.
Le Web Tracking ou pistage WEB permet de suivre des internautes de manière anonyme lors de la consultation de site internet.
Cela à travers des mouchards ou traqueur dissimilés sur les sites WEB visités.
Le but est divers soit à des fins statistiques, soit à des fins mercantiles afin de constituer un profil consommateur.
Au final pour, par exemple, afficher de la publicité ciblée ou monétiser ces données à un tiers.

Le pistage utilisateur peut faire partie de la gratuité de façade qui permet d’avoir des services WEB gratuits.
A ce propos, vous pouvez lire la page La gratuité sur internet : comprendre comment des services WEB ou programmes peuvent être gratuits.

Le pistage utilisateur (ou Web Tracking) sur internet
Le pistage utilisateur (ou Web Tracking) sur internet

Que se passe-t-il lorsque vous vous connectez à un site WEB

Lorsque vous vous connectez à un site WEB, le navigateur WEB envoie des informations comme :

  • Votre Adresse IP (il faut bien votre adresse pour que la connexion se fasse).
  • La version du navigateur WEB. cela se nomme l’User-Agent et pas mal d’informations autour de ces dernières (plugins présents, résolution écran, langue, etc)
  • Éventuellement la page WEB source. Celle où vous avez cliqué pour arriver au site. Cela se nomme le Referer ou site référant)

Toute connexion à un site WEB est enregistrée.
On appelle « logguer » afin de détecter des connexions non voulues (tentatives de hack etc), les erreurs de connexions (pages introuvables etc).
D’ailleurs la loi oblige à enregistrer ces connexions et les conserver pendant un délai.
Le but étant d’être capable de fournir ces données en cas de demande de la Justice.

Un administrateur peut donc savoir, s’il connaît l’adresse IP d’une personne toutes les pages qui ont été consultées sur son site.
Plus d’informations sur la page : Adresse IP et confidentialité.

Ce que l’on peut récupérer

Voici un exemple de log et statistiques que l’on peut constituer lorsque l’on visite un site WEB.
Quelques exemples de données recueillies :

  • l’adresse IP de l’internaute,
  • la date de consultation,
  • la page visitée,
  • l’User-Agent qui donne la version du navigateur WEB utilisée. On peut aussi connaître les plugins installés, la résolution écran, etc.
  • des informations de géolocalisation

On peut aussi récupérer d’autres empreintes numériques.

Les statistiques à partir des données recueillies lors du surf

Bien entendu, lorsque vous vous connectez à une page WEB, vous vous connectez à différents sites WEB.
En effet la page internet peut afficher des images qui se trouvent sur un autre serveur WEB tiers, des publicités ou autres composants.

Ainsi ces serveurs WEB tiers peuvent aussi effectuer du pistage.

On voit aussi l’intérêt des boutons j’aime de Facebook et Google+ qui permettent de suivre les internautes.
Un peu comme un balisage des sites internet.
En effet, à chaque fois que vous vous connectez sur un site WEB avec ces boutons, Facebook et Google peuvent savoir que vous avez consulter ce site WEB.

Pistage utilisateur et Logiciels

Un petit mot sur les logiciels installés sur l’ordinateur.
Il est tout à fait possible de faire du pistage utilisateur à partir de ces logiciels puisque ces derniers en général interrogent régulièrement des serveurs.
Les produits Adobe, Java, Antivirus etc se connectent régulièrement afin de vérifier si des mises à jour sont disponibles.

Outre récupérer les même informations que lorsque vous consultez un site WEB (IP etc).

Sans aller plus loin que les programmes additionnels, depuis Windows Vista. Windows, via le service NSCI, se connecte à internet afin de vérifier la connectivité (afficher des messages d’erreur si Internet n’est pas accessible etc).
La connexion se fait vers un serveur Microsoft à l’adresse http://www.msftncsi.com/ncsi.txt au démarrage de l’ordinateur ou lors de la modification de la connexion réseau.
On parle alors de télémétrie : Télémétrie et collecte de données personnelles sur Windows

Les identifiants uniques

Ces logiciels peuvent contenir des identifiants uniques (GUID).
C’est à dire qu’il génère un identifiant unique par exemple à partir de composants matériel de votre PC.
A partir de là, les serveurs de l’application peuvent reconnaître le logiciel de manière unique.

C’est par exemple le cas de Google Chrome.
Ainsi- Si l’on se réfère à la page suivant de Wikipedia : Google Chrome and Usage Tracking

Comme tout logiciel, Google Chrome échange des informations avec des serveurs.
Si vous regardez, Google Chrome créé un RLZ identifier qui identifie votre Google Chrome.
Ensuite cet identifiant est envoyé à l’ouverture du navigateur ou lors des recherches afin de vous reconnaître.

Les données envoyés par Google Chrome aux serveurs Google

Les malwares utilisent aussi que les GUID dans le fonctionnement des botnets.
Là aussi il s’agit de reconnaître un PC de manière unique pour le contrôler plus efficacement.

Pistage utilisateur à des fins statistiques

Un webmasteur peut souhaiter connaître le taux de fréquentation sur son site ainsi que d’autres données.
Par exemple, la position géographique des visiteurs, les versions de Windows ou des navigateurs utilisées.
Cela afin d’améliorer son site.

Des services d’analyse de visites existent afin de produire des statistiques.
Cela peut aller du simple compteur à des analyses poussées.
Là aussi il s’agit de reconnaître un visiteur de manière unique.
On pourra alors déterminer le taux de retour sur le site et les nouveaux utilisateurs.

Google Analystics est un de ces services.
Pour fonctionner, l’administrateur du site ajoute un code présent sur chaque page.

script type="text/javascript">   var _gaq = _gaq || [];   _gaq.push(['_setAccount', 'UA-88499-3']);   _gaq.push(['_trackPageview']);   (function() {     var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;     ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';     var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);   })();

A chaque consultation de la page, le visiteur exécutera ce script de Google.
Ce dernier récupère des données puis les classer et produire des statistiques comme le montre par exemple les captures d’écran ci-dessous :

Les statistiques à partir des données recueillies lors du surf
Les statistiques à partir des données recueillies lors du surf
Les statistiques à partir des données recueillies lors du surf

Suivi utilisateur « Amélioration du service »

Beaucoup de services ou outils remontent aussi des informations prévenants des programmes installés afin « d’améliorer le service ».
Les antivirus sont les premiers à faire cela, à travers des remontés provenant des clients antivirus aux laboratoires ou pour nourrir les bases de données Cloud Antivirus.
Exemple avec Avast! :

Le pistage utilisateur (ou Web Tracking) sur internet

Le programme de protection contre les mouchards Ghostery fait aussi de même avec son module GhostRank.

Ad Tracking : cibler la publicité

L’utilisation qui s’est développée ces derniers années est le Ad Tracking.
Le tracking qui a pour but d’enregistrer la thématique des sites visités afin ensuite d’afficher des publicités ciblées.
En effet la rémunération des publicités se faisant au clic.
Ainsi si la publicité est intéressante pour le visiteur, il y aura plus de chance que ce dernier clic.
Et donc au final on obtient meilleure rémunération.

Exemple de pistage par la publicité

Prenons le cas de pjjoint qui utilise la régie de publicité Google Adsense.
Les publicités affichaient sur le site sont des publicités en rapport avec l’informatique.
Par exemple des pubs pour des antivirus, logiciels, société de dépannage, etc.
Google sait que pjjoint est un site avec comme thématique l’informatique et les malwares ou virus.
Il va donc avoir tendance à afficher des publicités en rapport puisque les visiteurs sont intéressés par l’informatique.

Maintenant faisons une recherche sur le mot jardin sur Google.

Le pistage des internautes pour la publicité

Tiens maintenant les publicités sur Pjjoint parlent de décoration maison…

Le pistage des internautes pour la publicité
Le pistage des internautes pour la publicité
Le pistage des internautes pour la publicité

Une recherche sur le mot guitare, quelques sites de ventes d’instruments etc

Le pistage des internautes pour la publicité

Ou encore pjjoint affichage une publicité sur les amplis..

Le pistage des internautes pour la publicité

Google fait le lien entre la recherche et les publicités.
Il pense que l’on cherche un nouvel ampli et donc vous fait des propositions.
Il est donc capable de vous reconnaître pour afficher des publicités ciblées.
C’est là toute la magie du pistage et tracking.

Facebook fait de même avec les informations et données que vous lui envoyez ou encore grâce à sa capacité à suivre votre surf sur la toile à travers les boutons Facebook.
Le paragraphe suivant en parle.

Facebook et la publicité ciblée et pistage des internautes

Les différentes méthodes

Comme vous pouvez le constater, les publicités affichées sont plus ou moins en relation avec la thématique des sites visités, comment ça marche ?

Le pistage est souvent basé sur l’utilisation de tracking Cookies.
Lorsque vous visitez un site WEB, ce dernier possède des liens vers des services de tracking ou des publicités.

Les régies de publicités connaissent alors la thématique du site visité.
Ainsi, au moment de l’affichage de la publicité, ces derniers créés un cookie sur votre ordinateur afin d’enregistrer la visite de ce site internet.
Les cookies permettent alors de savoir quels sites ont été visités avec et la thématique associée.
Cela permet donc de connaître les thématiques qui reviennent le plus souvent avec la pondération, lors de la visite d’un site internet avec cette régie de publicité, cette dernière lit le cookie et affiche la publicité en conséquence.

En général toute forme de tracking et pistage utilisateur se base sur les cookies mais aussi le Browser FingerPrinting

Vous comprenez donc pourquoi la guerre des moteurs de recherche a lieu notamment au travers des barres d’outils.
Puisque celle-ci font aussi du du pistage à des fins de ciblage publicitaire. Plus de personnes ont ces barres d’outils, plus de personnes utilisent le moteur de recherche affilié.
Enfin cela alimente le tracking et augmente les revenus publicitaires.

Google excelle dans ce système puisque tous les services gratuits piste les internautes.
Du moteur de recherche à Google Gmail en passant par Google Chrome.

Pistage utilisateur avec les barres d’outils

Les barres d’outils ou toolbars sont des extensions du navigateur WEB qui apportent des nouvelles fonctionnalités.
Cela permet aussi d’obtenir des informations sur les sites visités.
Ainsi, il est tout à fait possible de récupérer les sites visités.
Si ces applications sont gratuites, ce n’est pas pour rien.

Les barres d'outils qui collectent des données comme les recherches et sites visités

Cela permet aussi, sous divers prétexte, de modifier le moteur de recherche et page de démarrage afin de vous affilier à un moteur en particulier.
Les barres d’outils Google ou AVG font cela de manière légitime, on va dire….
Les Browser Hijacker, eux, cherchent à modifier la page de démarrage voire à verrouiller celle-ci afin de vous forcer à utiliser ce dernier.
Plus d’informations sur ces méthodes sur la page : PUPs/Adwares : guerre des moteurs de recherche

Un mot concernant les boutons like etc

Si vous avez compris le principe précédent, c’est à dire à partir de liens tiers contenus sur un site WEB, il est possible d’effectuer du tracking.
Par exemple, si vous visitez trois sites WEB sur des amplis HIFI dont un site WEB utilise Google Adsense, Google peut savoir que vous cherchez des amplis HIFI et vous afficher des publicités en conséquences.

De plus en plus de site WEB dont malekal.com utilisent les boutons Like, ces derniers permettent aussi de savoir quels sites vous visitez, si on repend les recherches de sites d’amplis HIFI, si aucun utilise Google Adsense mais on un bouton Google+1, Google saura que vous êtes allez sur un des sites et peut aussi afficher des publicités en conséquences.
Ces boutons sont extrêmement importants pour Facebook et Twitter qui contrairement a Google, n’ont aucun service autre que les sites sociaux en eux-même et donc aucune visibilité en dehors de ces derniers.
Ces boutons leurs permettent donc d’effectuer de pistage utilisateur hors des sites sociaux et leurs donnent la publicités ensuite d’afficher des publicités ciblées dessus.

Si ces boutons sont proposés par Google, Facebook, Twitter, etc, des sites proposent des packs de boutons souvent très nombreux.
Bien sûr, ces boites peuvent aussi faire à leurs tours du tracking WEB.

Un exemple des conditions d’utilisation Facebook concernant le pistage utilisateur et la vie privée.
Facebook recueille des informations (assez vague) et on ne sait pas exactement ce qu’ils en ont ensuite…

Les conditions d'utilisation de Facebook et données collectées

L’article explique tous ces mécanismes de pistages des boutons j’aime de Facebook et Google.

Les empreintes numériques du navigateur internet

Le referer ou site référant

Il s’agit du site source sur lequel vous avez cliqué pour arriver sur le site de destination.
Par exemple, vous êtes sur le site A et vous cliquez sur un lien qui mène au site B.
Le site B connaît le lien du site sur lequel vous avez cliqué.
En effet, le navigateur internet envoient ces informations lors de la connexion au site B.
Depuis les réglages du navigateur internet ou à partir d’une extension, vous pouvez masquer le site référant.

Plus d’informations sur le referer ou site référant :

Browser Fingering Printer

Notez qu’il existe d’autres systèmes de tracking sans utilisation de cookies.
Notamment par le fingerPrinting ou empreinte digitale d’appareil numérique qui consiste à identifier de manière unique un navigateur à partir de sa configuration.
Si on peut identifier un navigateur WEB, on peut identifier un ordinateur et donc son utilisateur.

L'empreinte digitale du navigateur WEB ou Browser Fingering Printer

Pour plus d’informations, vous pouvez lire notre dossier concernant cette technique.

Quelques sites où il est possible de tester le Browser FingerPrinting :

Voir aussi cette vidéo avec quelques extensions testées contre cette technologie :

Tracking cookies et HTTP Cookie

Il existe aussi deux autres techniques qui permet de créer une empreinte digitale :

Cette dernière est beaucoup plus difficile à bloquer.

WebRTC

Cette technologie permet de vous pister en établissant un identifiant unique à partir des médias audio ou vidéos.
L’article suivant donne tous les détails.

Comment se protéger du pistage sur internet

La page suivante donne toutes les recettes pour se protéger au maximum du pistage sur internet.

Notez que des techniques proches sont aussi utilisées dans les mails commerciaux et SPAM, plus d’informations : Le pistage des internautes dans les e-mails et courriels

Windows 10 et la confidentialité

Windows 10 peut activer certains fonctionnalités de tracking, notamment un identifiant unique pour effectuer de la publicité ciblée.
La confidentialité sur Windows 10 : Windows 10 : keylogger, espionnage, mouchards etc
Pour les paramètres de confidentialité sur Windows 10, rendez-vous sur la page:  Windows 10 : la Confidentialité et mouchard

Les mises à jour Windows de télémétrie pour Windows 8.1, Windows Serveur 2012 R2, Windows 7 Service pack 1 (SP1) et Windows Server 2008 R2 SP1.
Plus d’informations :

Surveiller les données recueillies par Google

Les moteurs de recherche récupèrent les recherches effectuent et les stockent afin de dresser un profil consommateur.
Pour se protéger de l’historique de position qui consiste à enregistrer vos positions géographiques avec l’horodatage, lire :  Comment ne pas être localisé par Google sur internet
Vous pouvez surveiller les données recueillies par Google, cela se passe sur ce tutoriel : Surveiller les données collectées par Google

Il existe aussi des moteurs de recherche alternatifs qui protègent la vie privée et n’enregistrent pas les recherches WEB effectuées, par exemple :

et si vous cherchez des alternatives à Google, lire notre article : Quelles sont les alternatives à Google, Gmail, etc.

Liens

Enfin voici quelques liens autour de la confidentialité.

Lire aussi : Télémétrie et collecte de données personnelles

Si vous pensez que le pistage s’arrête au WEB, vous avez tout faux.
Il existe aussi dans la vie de tous les jours.
Par exemple avec les cartes magnétique, votre smartphone, etc.
Cet article évoque celui des supermarchés : Carte de fidélité et réduction des magasins et pistage des clients

image_pdfimage_print
(Visité 10 480 fois, 23 visites ce jour)

Partager l'article

3 Comments

  1. monsieur Herve Zarka 21 mai 2013
  2. MOULON 7 septembre 2016