Facebook collecte de données: ce que vous devez savoir

Facebook tire la majeure partie de son argent de la publicité et, alors que le scandale Cambridge Analytica continue de hanter l’entreprise de Mark Zuckerberg, les utilisateurs exigent de savoir comment leurs données sont manipulées et récoltées.

Mais alors que les inquiétudes concernant la confidentialité des utilisateurs de Facebook ont augmenté, il est clair depuis la création de Facebook que son activité repose sur une surveillance généralisée des personnes, dont les données sont le produit.

Certains ont décrit les révélations du scandale Cambridge Analytica – dans lequel des données auraient été récoltées à partir de 50 millions de profils Facebook – comme une « crise existentielle », tandis que d’autres ont mis en évidence des implications potentielles pour la recherche universitaire.

En bref, les méthodes de collecte de données de Facebook sont devenues un sujet de préoccupation soudaine et généralisée.

Qu’est-ce que la collecte de données?

Les données sur la récolte, comme son nom agricole l’indique, sont similaires à la récolte des cultures, car elles impliquent la collecte et le stockage dans l’attente d’une récompense future.

Les données peuvent être récoltées de différentes manières, allant du simple copier-coller à une programmation plus compliquée. La méthode choisie est souvent contrainte par le site à récolter. À des niveaux de recherche simples, de nombreux sites combattent la récolte automatisée avec Google s et res, qui aident les sites à différencier les humains des robots.

Si vous avez déjà copié et collé du texte depuis Facebook ou enregistré une image depuis Twitter, vous avez récolté des données sur les médias sociaux. L’action de « screenshotting » est autorisée sur la plupart des sites car les utilisateurs ne peuvent généralement accéder qu’à des informations qui leur sont publiques ou visibles parce qu’ils se sont connectés. En outre, il serait impossible d’éradiquer complètement les méthodes de collecte de données les plus simples, telles que la prise de notes et la prise de photographies.

Facebook et d’autres réseaux sociaux sont davantage préoccupés par la restriction de la collecte automatisée de données, en raison des exigences des serveurs Web et du contrôle qui a accès à quelles données (et pourquoi). Les informations personnelles et le comportement sur les médias sociaux ont une valeur commerciale, politique et de recherche.

Une cire du patron de Facebook Mark Zuckerberg.

Les réseaux sociaux décident de leurs propres politiques d’utilisation, en conciliant les intérêts commerciaux avec les tiers et les préoccupations réglementaires en matière de confidentialité des utilisateurs – souvent décrites dans les documents de l’entreprise comme jonglant avec l’optimisation du « comportement client » et le respect des  » normes communautaires ».

Comment les données sont-elles récoltées ?INSTAGRAM Facebook, Twitter et d’autres sites utilisent des interfaces de programmation d’applications (API) pour restreindre l’accès des aspirants récolteurs. Les API fonctionnent comme un intermédiaire logiciel qui permet à l’ordinateur d’un chercheur ou d’un développeur d’applications de « parler » à un réseau social de manière contrôlée.

L’une des principales conditions implique des restrictions sur la manière dont les données collectées peuvent être utilisées et partagées, ce qui peut être poursuivi de manière agressive. En 2010, le programmeur informatique Pete Warden a récolté des données de 210 millions de profils Facebook publics à des fins de recherche. Mais il n’a pas d’abord demandé l’autorisation de Facebook, violant ainsi ses conditions d’utilisation. Il a ensuite fait face à la menace d’une action en justice de Facebook et a été contraint de supprimer les données – en écho au rôle présumé du chercheur universitaire Aleksandr Kogan dans le scandale Cambridge Analytica.

L’application de Kogan, baptisée « thisisyourdigitallife », développée en 2014 par le biais de sa société Global Science Research (GSR) – distincte de son travail universitaire – était un test de personnalité auquel 270 000 utilisateurs se sont connectés, acceptant d’avoir accès à certaines de leurs informations personnelles et à certaines des données de leurs amis. Cela signifiait également que ces amis n’avaient pas consenti à ce que leurs données soient utilisées de cette manière.

Facebook met régulièrement à jour son API et en 2014, la société a confirmé qu’elle cesserait d’autoriser les applications tierces à accéder aux données sur les amis des utilisateurs de l’application. Cela a désactivé la méthode de collecte de données prétendument utilisée par Kogan.

Il existe différentes façons pour les développeurs – qui doivent accepter les politiques de Facebook – de récolter des données à l’aide de l’API de l’entreprise et ils assument tous au moins des compétences de base en programmation informatique. L’un des moyens les plus simples de le faire est d’accéder à l’API à l’aide d’une boîte à outils logicielle spécialisée – Python et R ont des outils conçus spécifiquement à cet effet. Dans mes recherches, j’utilise le package Rfacebook pour récolter des données Facebook.

Autoriser mon application à l’aide du package Rfacebook dans RStudio – avec mon identifiant unique expurgé. Gráinne Nic Lochlainn

Une distinction clé entre mon application et les autres est que je n’interagis pas avec les utilisateurs, car mon application n’est pas en direct. Mon application est essentiellement un moyen automatisé de copier-coller des informations provenant de groupes Facebook publics. J’utilise l’API Facebook pour rechercher comment les pages de groupes communautaires publics ont été utilisées pour protester contre l’austérité en Irlande. Facebook, bien que cela puisse être fait en utilisant les boîtes à outils API de Facebook pour augmenter la quantité de données accessibles.

Parce que je récolte des données publiques à partir de pages publiques, je ne demande pas aux utilisateurs de se connecter et il n’y a pas d’interface frontale sur Facebook, bien que cela puisse être fait en utilisant les boîtes à outils API de Facebook pour augmenter la quantité de données accessibles. C’est une méthode qui soulève un certain nombre de questions sur les fonctionnalités, les informations utilisateur et les autorisations d’accès.

L’API de Facebook peut être utilisée pour récolter toutes sortes d’informations accessibles au public, comme certaines publications récentes de The Conversation UK ou des publications dans des groupes publics.

Messages récoltés sur la page Facebook de The Conversation UK. Gráinne Nic Lochlainn.
Publications récoltées à partir d’un groupe public sur Facebook. Gráinne Nic Lochlainn

Mais tente de dépasser les informations publiques pour récolter les données des utilisateurs de Facebook qui ne se sont pas connectés à l’application – comme Zuckerberg, par exemple – renvoient des erreurs. Les « j’aime » de Facebook ne peuvent pas être récoltés car Zuckerberg n’est pas un utilisateur de mon application et il ne lui a pas accordé l’autorisation d’accéder à ses données.

Sous les dernières mises à jour de l’API de Facebook, des autorisations d’application sont nécessaires pour récolter toute information au-delà des propriétés du profil public. Cela signifie que les utilisateurs doivent se connecter à une application et autoriser l’accès à toute autre information pour permettre aux développeurs de récolter les données.

Une tentative ratée de récolter les pages que Mark Zuckerberg a aimées. Gráinne Nic Lochlainn

La recherche sur les légumineuses menacée?

Alors que les entreprises bourrées de publicités ont clairement intérêt à « exploiter » les données, les universitaires – ces dernières semaines – ont attiré l’attention sur les chercheurs qui récoltent des données Facebook. La pratique est devenue relativement courante dans la recherche en sciences sociales.

La mesure dans laquelle les recherches futures pourraient être limitées par des modifications de l’API de Facebook est urgente. Mais il convient de noter qu’une fois les données récoltées, Facebook – qui peut légalement poursuivre les personnes qui « violent » ses conditions d’utilisation pour tenter de les forcer à supprimer des données – a un contrôle limité sur l’endroit où les données se retrouvent.

Pour les chercheurs qui s’inquiètent de l’incidence du scandale Cambridge Analytica sur leur travail, il convient de garder un œil sur les changements que Facebook implémente dans sa prochaine mise à jour de l’API. Cela peut permettre de mieux comprendre le type de recherche qui peut être autorisé par l’utilisation des données Facebook récoltées – et ce qui peut être définitivement exclu.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.