Le 101 des données récoltées en ligne

Le 101 des données récoltées en ligne

Je me suis récemment fait poser plusieurs questions en lien avec les données récoltés en ligne, que ce soit par les médias sociaux comme Facebook, ou encore par les médias tels Bell et Québecor, ou encore par les entreprises chez qui on magazine en ligne comme Amazon et Canadian Tire.

Le 101 des données récoltées en ligneJ’ai donc décidé de rédiger ce petit guide pour vous éclairer que qui fait quoi, comment, pourquoi et que savent-ils vraiment.

Si vous avez des questions, surtout n’hésitez pas à me contacter directement, ou laissez un commentaire ici-bas.

Article mis à jour le 14 avril 2020

Qui récolte?

Premièrement, il n’y a pas d’individus ou d’entreprises dont le but premier est de récolter et revendre vos informations.

Cependant, plusieurs entreprises revendent des données de leurs usagers car elles en ont, et elles ont dédouané la possibilité légale de le faire.

Celles-ci incluent pratiquement toutes les grandes entreprises avec un site web. Vous verrez plus bas pourquoi cela se limite qu’aux grandes entreprises.,

Pourquoi récolter des données?

On récolte du data en ligne pour plusieurs raisons, mais les principales sont :

  • Faciliter la navigation des usagers en reconnaissant leurs préférences lorsqu’ils reviennent sur le site.
  • Connaître l’achalandage de notre site et le comportement de ses usagers. C’est pour toujours améliorer le site au profit des usagers, car s’ils aiment ça, ils reviendront plus souvent ou passeront plus de temps.
  • Simplifier les processus d’achat en ligne.

Remarquez que pratiquement aucune entreprise en récolte afin de les revendre.

Les données qu’une entreprise récolte lui ont de la valeur à elle, et possiblement à ses concurrents.

Comment les données sont-elles monétisées?

Les données sont principalement utilisées pour le ciblage publicitaire. Pour l’usage d’une donnée pour le ciblage publicitaire, l’entreprise se fais quelques cents. C’est à l’usage que la donnée se monétise. On parle donc des très grosses entreprises qui ont des tonnes de données sur un grand nombre de « gens » (pas des gens mais des fichiers témoins).

Que peut-on savoir d’un individu?

Mais ce ne sont pas des « gens » comme tel sur qui on a des données comme c’est qu’une partie de portrait d’un individu.

On récolte du data stocké dans une base de données sur un serveur de l’entreprise. Celles-ci peuvent-être utilisés via un fichier témoin – un cookie. C’est à dire que le témoin m’identifier comme usager 123456 qui dans la BD de l’entreprise à rapport à une fiche client avec mes données.

Par exemple, un cookie sur Google Chrome m’identifie auprès de Météomédia (exemple) pas par mon nom, adresse ou autre information, mais par ma préférence géographique enregistré.

Limitation des témoins

Les témoins ne se partagent pas entre fureteurs (browser, jamais), ni entre appareil (normalement).

  • Si tu as un compte usager avec ton fureteur et que tu es connecté (logged in) avec ton fureteur, alors là si je vais sur un autre appareil et que je me log avec le même fureteur, tous mes fichiers témoins seront alors disponibles sur cet autre appareil.
    • Chrome permet de se créer un compte afin de partager ses données et préférences de navigation d’un appareil à un autre.

Par contre, si je me connecte au même site avec Firefox, ou Safari ou un autre fureteur, il faut que j’enregistre à nouveau ma préférence.

Si je vais sur l’application sur mon téléphone ou ma tablette, il faut à nouveau que j’enregistre ma préférence car il ne me reconnaîtra pas.

C’est pareil sur un site où il faut se connecter / login. À la première visite, il ne me reconnaîtra pas car aucun témoin dans mon fureteur n’est associé à un compte sur le site. Lorsque je me log, il fait l’association. Mais passe à un autre fureteur, appareil ou application et il faut se logger à nouveau.  Lorsque connecté, là il te reconnaîtra à l’avenir.

Donc, une entreprise possède un profil partiel d’un individu, possiblement réparti sur plusieurs fichiers témoins, mais ne sais pas les connecter pour avoir un portrait plus complet.

Il ne serait quand même pas complet ce profile car les entreprises récoltent uniquement les données qui leurs sont utiles à eux. À la longue, ces données prennent de l’espace et des capacités de serveur qui coût chère. On se limite donc au nécessaire.

Aussi, il faut distinguer 2 types de données dans ce « profil ». Il y a les données « connues » et les données « assumées ».

Données connues

Les données connues sont des informations qu’on partage volontairement, ou par obligation avec un site web. Par exemple, si je commande quelque chose en ligne pour me le faire livrer, il faudra que je partage mon adresse civique complète avec mon nom et mon courriel, et possiblement mon # téléphone.

Qui plus est, si cet item est un vêtement, j’aurai aussi indiqué d’autres informations. Par exemple, ma taille, ma préférence de couleur. Aussi, le morceau en question indiquerait si je suis un homme ou une femme.

Toutes ces données ne sont pas toujours 100% vrais. Je pourrais acheter un morceau pour ma conjointe, mais les données sont valides et véridiques à 98%+.

La collecte, sauvegarde et usage de ces données connues est régie sous la Loi sur la protection des renseignements personnels et les documents électroniques du Canada, géré par le Commissariat à la protection de la vie privée du Canada.

Données Assumées

Les données assumées sont des données par lesquelles on devine quelque chose plutôt que de le savoir.  Si tu consultes un contenu automobile quelques fois par semaines, on peut assumer que tu « aimes » les autos. Ces données se définissent par leur plus bas dénominateur commun. On ne pourrait par ce comportement assumer que tu cherches à acheter une voiture.

Imagine n’importe quel comportement en ligne et on peut récolter la donnée. De ces comportements, on peut deviner plusieurs informations sans le savoir réellement :

  • sexe,
  • âge approximative,
  • géographie,
  • étape de vie,
  • niveau de vie,
  • intérêts,
  • etc…

La collecte, sauvegarde et usage de ces données assumées est régie sous l’auto-réglementation ChoixDePub.ca à laquelle les principaux éditeurs en ligne, et annonceurs au Canada, participent. C’est aussi surveillé de près par le Commissariat à la protection de la vie privée du Canada.

Médias Sociaux

Les médias sociaux sont une mine d’or en termes de données connues. Lorsqu’on utilise un média social, on soumette plusieurs de nos informations pour nous présenter. C’est aussi pour nous rendre facile à trouver par nos amis et famille. Aussi, chaque fois qu’on clique j’aime, partage ou commentaire, cela contribue à notre profil témoignant de nos intérêts.

Les très grandes entreprises font un peu d’argent avec les données

Pour me répéter un peu, il faut donc une très grande entreprise avec beaucoup de données. Il faut donc plusieurs « témoins » pour qu’on en tire un revenu moindrement intéressant. C’est à dire des milliers, voir des millions de témoins distinct. Chacun  des témoin est relié à plusieurs différentes données sur un individu (profil).

Pourquoi autant? Car pas toutes les données sont intéressantes pour toutes les entreprises autres que celles qui l’a récolté.

Les données de préférence de mode peuvent être d’intérêt aux concurrents de l’entreprise qui les a récoltés. Par conséquent, elle ne souhaitera pas vendre toutes les données qu’elle détient. C’est qu’elle ne veut pas offrir avantage à ses concurrents.

Prend n’importe quelles données qui pourrait avoir de la valeur à une entreprise et c’est sûrement un concurrent qui la détient.

Ajouter un commentaire