Le pistage utilisateur, suivi des internautes ou tracking sur internet : comment ça marche

Une page qui concerne le pistage ou suivi des internautes.
En anglais on parle de Tracking sur Internet.
Le Web Tracking ou pistage WEB permet de suivre des internautes de manière anonyme lors de la consultation de site internet.
Cela à travers des mouchards ou traqueurs dissimilés sur les sites WEB visités.
Le but est divers soit à des fins statistiques, soit à des fins mercantiles afin de constituer un profilage consommateur.
Au final pour, par exemple, afficher de la publicité ciblée (publicité comportementale) ou monétiser ces données à un tiers.

Le pistage utilisateur peut faire de la gratuité sur internet une façade.
Ce tutoriel vous explique comment on vous piste et suit sur internet.
En fin d'article, vous trouverez aussi des liens qui vous guides pour vous protéger du tracking sur internet.

Le pistage utilisateur (ou Web Tracking) sur internet

Le pistage utilisateur, suivi des internautes ou tracking sur internet

Que se passe-t-il lorsque vous vous connectez à un site WEB

Lorsque vous vous connectez à un site WEB, le navigateur WEB envoie des informations comme :

  • Votre Adresse IP (il faut bien votre adresse pour que la connexion se fasse).
  • La version du navigateur WEB. cela se nomme l'User-Agent et pas mal d'informations autour de ces dernières (plugins présents, résolution écran, langue, etc)
  • Éventuellement la page WEB source. Celle où vous avez cliqué pour arriver au site. Cela se nomme le Referer ou site référant)

Toute connexion à un site WEB est enregistrée.
On appelle "logguer" afin de détecter des connexions non voulues (tentatives de hack etc), les erreurs de connexions (pages introuvables etc).
D'ailleurs la loi oblige à enregistrer ces connexions et les conserver pendant un délai.
Le but étant d'être capable de fournir ces données en cas de demande de la Justice.

Un administrateur peut donc savoir, s'il connaît l'adresse IP d'une personne toutes les pages qui ont été consultées sur son site.
Plus d'informations sur la page : Adresse IP et confidentialité.

Ce que l'on peut savoir de vous

Voici un exemple de log et statistiques que l'on peut constituer lorsque l'on visite un site WEB.
Quelques exemples de données recueillies :

  • l'adresse IP de l'internaute,
  • la date de consultation,
  • la page visitée,
  • l'User-Agent qui donne la version du navigateur WEB utilisée. On peut aussi connaître les plugins installés, la résolution écran, etc.
  • des informations de géolocalisation

On peut aussi récupérer d'autres empreintes numériques.

Les statistiques à partir des données recueillies lors du surf

Bien entendu, lorsque vous vous connectez à une page WEB, vous vous connectez à différents sites WEB.
En effet la page internet peut afficher des images qui se trouvent sur un autre serveur WEB tiers, des publicités ou autres composants.

Ainsi ces serveurs WEB tiers peuvent aussi effectuer du pistage.

On voit aussi l’intérêt des boutons j'aime de Facebook et Google+ qui permettent de suivre les internautes.
Un peu comme un balisage des sites internet.
En effet, à chaque fois que vous vous connectez sur un site WEB avec ces boutons, Facebook et Google peuvent savoir que vous avez consulter ce site WEB.

Les identifiants uniques

Ces logiciels peuvent contenir des identifiants uniques (GUID).
C'est à dire qu'il génère un identifiant unique par exemple à partir de composants matériel de votre PC.
A partir de là, les serveurs de l'application peuvent reconnaître le logiciel de manière unique.

C'est par exemple le cas de Google Chrome.
Ainsi- Si l'on se réfère à la page suivant de Wikipedia : Google Chrome and Usage Tracking

Comme tout logiciel, Google Chrome échange des informations avec des serveurs.
Si vous regardez, Google Chrome créé un RLZ identifier qui identifie votre Google Chrome.
Ensuite cet identifiant est envoyé à l'ouverture du navigateur ou lors des recherches afin de vous reconnaître.

Les données envoyés par Google Chrome aux serveurs Google

Les malwares utilisent aussi que les GUID dans le fonctionnement des botnets.
Là aussi il s'agit de reconnaître un PC de manière unique pour le contrôler plus efficacement.

Les différents types de pistages et suivi des internautes

Pistage utilisateur à des fins statistiques

Un webmasteur peut souhaiter connaître le taux de fréquentation sur son site ainsi que d'autres données.
Par exemple, la position géographique des visiteurs, les versions de Windows ou des navigateurs utilisées.
Cela afin d'améliorer son site.

Des services d'analyse de visites existent afin de produire des statistiques.
Cela peut aller du simple compteur à des analyses poussées.
Là aussi il s'agit de reconnaître un visiteur de manière unique.
On pourra alors déterminer le taux de retour sur le site et les nouveaux utilisateurs.

Google Analytics est un de ces services.
Pour fonctionner, l'administrateur du site ajoute un code présent sur chaque page.

script type="text/javascript">   var _gaq = _gaq || [];   _gaq.push(['_setAccount', 'UA-88499-3']);   _gaq.push(['_trackPageview']);   (function() {     var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;     ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';     var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);   })();

A chaque consultation de la page, le visiteur exécutera ce script de Google.
Ce dernier récupère des données puis les classer et produire des statistiques comme le montre par exemple les captures d'écran ci-dessous :

Les statistiques à partir des données recueillies lors du surf
Les statistiques à partir des données recueillies lors du surf
Les statistiques à partir des données recueillies lors du surf

Suivi utilisateur "Amélioration du service"

Beaucoup de services ou outils remontent aussi des informations prévenants des programmes installés afin "d'améliorer le service".
Les antivirus sont les premiers à faire cela, à travers des remontés provenant des clients antivirus aux laboratoires ou pour nourrir les bases de données Cloud Antivirus.
Exemple avec Avast! :

Le pistage utilisateur (ou Web Tracking) sur internet

Le programme de protection contre les mouchards Ghostery fait aussi de même avec son module GhostRank.

Ad Tracking : cibler la publicité

Mais la forme principe de pistage est l'Ad Tracking.
C'est le type de tracking qui a pour but d'enregistrer la thématique des sites visités afin ensuite d'afficher des publicités ciblées.
En effet la rémunération des publicités se faisant au clic.
Ainsi si la publicité est intéressante pour le visiteur, il y aura plus de chance que ce dernier clic.
Et donc au final on obtient meilleure rémunération.

Exemple de pistage par la publicité

Prenons le cas de pjjoint qui utilise la régie de publicité Google Adsense.
Les publicités affichaient sur le site sont des publicités en rapport avec l'informatique.
Par exemple des pubs pour des antivirus, logiciels, société de dépannage, etc.
Google sait que pjjoint est un site avec comme thématique l'informatique et les malwares ou virus.
Il va donc avoir tendance à afficher des publicités en rapport puisque les visiteurs sont intéressés par l'informatique.

Maintenant faisons une recherche sur le mot jardin sur Google.

Le pistage des internautes pour la publicité

Tiens maintenant les publicités sur Pjjoint parlent de décoration maison...

Le pistage des internautes pour la publicité
Le pistage des internautes pour la publicité
Le pistage des internautes pour la publicité

Une recherche sur le mot guitare, quelques sites de ventes d'instruments etc

Le pistage des internautes pour la publicité

Ou encore pjjoint affichage une publicité sur les amplis..

Le pistage des internautes pour la publicité

Google fait le lien entre la recherche et les publicités.
Il pense que l'on cherche un nouvel ampli et donc vous fait des propositions.
Il est donc capable de vous reconnaître pour afficher des publicités ciblées.
C'est là toute la magie du pistage et tracking.

Facebook fait de même avec les informations et données que vous lui envoyez ou encore grâce à sa capacité à suivre votre surf sur la toile à travers les boutons Facebook.
Le paragraphe suivant en parle.

Facebook et la publicité ciblée et pistage des internautes

Les différentes méthodes de pistages et suivi

Comme vous pouvez le constater, les publicités affichées sont plus ou moins en relation avec la thématique des sites visités, comment ça marche ?

Le pistage est souvent basé sur l'utilisation de tracking Cookies.
Lorsque vous visitez un site WEB, ce dernier possède des liens vers des services de tracking ou des publicités.

Les régies de publicités connaissent alors la thématique du site visité.
Ainsi, au moment de l'affichage de la publicité, ces derniers créés un cookie sur votre ordinateur afin d'enregistrer la visite de ce site internet.
Les cookies permettent alors de savoir quels sites ont été visités avec et la thématique associée.
Cela permet donc de connaître les thématiques qui reviennent le plus souvent avec la pondération, lors de la visite d'un site internet avec cette régie de publicité, cette dernière lit le cookie et affiche la publicité en conséquence.

En général toute forme de tracking et pistage utilisateur se base sur les cookies mais aussi le Browser FingerPrinting

Vous comprenez donc pourquoi la guerre des moteurs de recherche a lieu notamment au travers des barres d'outils.
Puisque celle-ci font aussi du du pistage à des fins de ciblage publicitaire. Plus de personnes ont ces barres d'outils, plus de personnes utilisent le moteur de recherche affilié.
Enfin cela alimente le tracking et augmente les revenus publicitaires.

Google excelle dans ce système puisque tous les services gratuits piste les internautes.
Du moteur de recherche à Google Gmail en passant par Google Chrome.

Pistage utilisateur avec les barres d'outils

Les barres d'outils ou toolbars sont des extensions du navigateur WEB qui apportent des nouvelles fonctionnalités.
Cela permet aussi d'obtenir des informations sur les sites visités.
Ainsi, il est tout à fait possible de récupérer les sites visités.
Si ces applications sont gratuites, ce n'est pas pour rien.

Cela permet aussi, sous divers prétexte, de modifier le moteur de recherche et page de démarrage afin de vous affilier à un moteur en particulier.
Les barres d'outils Google ou AVG font cela de manière légitime, on va dire....
Les Browser Hijacker, eux, cherchent à modifier la page de démarrage voire à verrouiller celle-ci afin de vous forcer à utiliser ce dernier.
Plus d'informations sur ces méthodes sur la page : 

Les boutons des réseaux sociaux (bouton like, partage)

Une autre méthode de tracking sont les boutons Like et de partages.
Ces boutons sont extrêmement importants pour Facebook et Twitter.
Ils leurs permettent donc de baliser le WEB afin de pister les internautes en dehors des sites sociaux.
De plus, cela leur permet aussi de savoir vos préférences et ce que vous aimez.

Un exemple des conditions d'utilisation Facebook concernant le pistage utilisateur et la vie privée.
Facebook recueille des informations (assez vague) et on ne sait pas exactement ce qu'ils en ont ensuite...

Les conditions d'utilisation de Facebook et données collectées

L'article explique tous ces mécanismes de pistages des boutons j'aime de Facebook et Google.

Le pistage de votre navigateur internet

Le referer ou site référant

Il s'agit du site source sur lequel vous avez cliqué pour arriver sur le site de destination.
Par exemple, vous êtes sur le site A et vous cliquez sur un lien qui mène au site B.
Le site B connaît le lien du site sur lequel vous avez cliqué.
En effet, le navigateur internet envoient ces informations lors de la connexion au site B.
Depuis les réglages du navigateur internet ou à partir d'une extension, vous pouvez masquer le site référant.

Plus d'informations sur le referer ou site référant :

Browser Fingering Printer

Notez qu'il existe d'autres systèmes de tracking sans utilisation de cookies.
Notamment par le fingerPrinting ou empreinte digitale d'appareil numérique qui consiste à identifier de manière unique un navigateur à partir de sa configuration.
Si on peut identifier un navigateur WEB, on peut identifier un ordinateur et donc son utilisateur.

L'empreinte digitale du navigateur WEB ou Browser Fingering Printer

Pour plus d'informations, vous pouvez lire notre dossier concernant cette technique.

Quelques sites où il est possible de tester le Browser FingerPrinting :

Voir aussi cette vidéo avec quelques extensions testées contre cette technologie :

Il existe aussi deux autres techniques qui permet de créer une empreinte digitale :

Cette dernière est beaucoup plus difficile à bloquer.

WebRTC

Cette technologie permet de vous pister en établissant un identifiant unique à partir des médias audio ou vidéos.
L'article suivant donne tous les détails.

Comment se protéger du pistage sur internet

La page suivante donne toutes les recettes pour se protéger au maximum du pistage sur internet.

Notez que des techniques proches sont aussi utilisées dans les mails commerciaux et SPAM, plus d'informations : 

Liens et derniers mots

Windows 10 peut activer certains fonctionnalités de tracking, notamment un identifiant unique pour effectuer de la publicité ciblée.
Pour les paramètres de confidentialité sur Windows 10, rendez-vous sur la page:  Windows 10 : la Confidentialité et mouchard

Les mises à jour Windows de télémétrie pour Windows 8.1, Windows Serveur 2012 R2, Windows 7 Service pack 1 (SP1) et Windows Server 2008 R2 SP1.
Plus d'informations :

Les moteurs de recherche récupèrent les recherches effectuent et les stockent afin de dresser un profil consommateur.
Pour se protéger de l'historique de position qui consiste à enregistrer vos positions géographiques avec l'horodatage, lire :  Comment ne pas être localisé par Google sur internet
Vous pouvez surveiller les données recueillies par Google, cela se passe sur ce tutoriel : Surveiller les données collectées par Google

Il existe aussi des moteurs de recherche alternatifs qui protègent la vie privée et n'enregistrent pas les recherches WEB effectuées, par exemple :

et si vous cherchez des alternatives à Google, lire notre article : Quelles sont les alternatives à Google, Gmail, etc.

Enfin voici quelques liens autour de la confidentialité.

Lire aussi : Télémétrie et collecte de données personnelles

Si vous pensez que le pistage s'arrête au WEB, vous avez tout faux.
Il existe aussi dans la vie de tous les jours.
Par exemple avec les cartes magnétique, votre smartphone, etc.
Cet article évoque celui des supermarchés : Carte de fidélité et réduction des magasins et pistage des clients