Facebook data harvesting: cosa c’è da sapere

Facebook fa la maggior parte dei suoi soldi dalla pubblicità, e-come lo scandalo Cambridge Analytica continua a perseguitare la società di Mark Zuckerberg-gli utenti chiedono di sapere come i loro dati vengono dispute e raccolte.

Ma mentre la preoccupazione per la privacy degli utenti di Facebook è aumentata, è stato chiaro fin dall’inizio di Facebook che la sua attività si basa sulla sorveglianza diffusa delle persone, i cui dati sono il prodotto.

Alcuni hanno ritratto le rivelazioni dello scandalo Cambridge Analytica – in cui i dati sono stati presumibilmente raccolti da 50 milioni di profili Facebook – come una “crisi esistenziale”, mentre altri hanno evidenziato potenziali implicazioni per la ricerca accademica.

In breve, i metodi di raccolta dei dati di Facebook sono diventati oggetto di improvvisa e diffusa preoccupazione.

Che cos’è la raccolta dei dati?

La raccolta dei dati, come suggerisce il nome agricolo, è simile alla raccolta delle colture perché comporta la raccolta e lo stoccaggio con l’aspettativa di una ricompensa futura.

I dati possono essere raccolti in diversi modi, dalla semplice copia e incolla alla programmazione più complicata. Il metodo scelto è spesso vincolato dal sito che viene raccolto. A livelli di ricerca semplici, molti siti combattono la raccolta automatica con Google s e res, che aiutano i siti a differenziare tra umani e bot.

Se hai mai copiato e incollato testo da Facebook o salvato un’immagine da Twitter, hai raccolto i dati dei social media. L’azione di “screenshotting” è consentita sulla maggior parte dei siti perché gli utenti di solito possono accedere solo alle informazioni che sono pubbliche o visibili a loro perché hanno effettuato l’accesso. Inoltre, sarebbe impossibile sradicare completamente i metodi di raccolta dei dati più semplici, come prendere appunti e scattare fotografie.

Facebook e altri social network sono più preoccupati di limitare la raccolta automatizzata dei dati, a causa delle richieste sui server Web e di controllare chi ha accesso a quali dati (e perché). Le informazioni personali e il comportamento sui social media hanno valore commerciale, politico e di ricerca.

Una cera del boss di Facebook Mark Zuckerberg.

I social network decidono le proprie politiche di utilizzo, bilanciando gli interessi commerciali con le terze parti e le preoccupazioni normative sulla privacy degli utenti – spesso descritte nei documenti aziendali come destreggiarsi tra l’ottimizzazione del “comportamento del cliente” e l’adesione agli “standard comunitari”.

Come vengono raccolti i dati?

Le API (Application Programming Interface) vengono utilizzate da Facebook, Twitter, Instagram e altri siti per limitare l’accesso degli aspiranti raccoglitori. Le API funzionano come un intermediario software che consente a un ricercatore o al computer di uno sviluppatore di app di “parlare” con un social network in modo controllato.

Una delle condizioni principali comporta restrizioni su come i dati raccolti possono essere utilizzati e condivisi, che possono essere perseguiti in modo aggressivo. Nel 2010, il programmatore di computer Pete Warden ha raccolto dati da 210 milioni di profili Facebook pubblici a scopo di ricerca. Ma non è riuscito a chiedere il permesso di Facebook prima, violando così i suoi termini di servizio. In seguito ha affrontato la minaccia di un’azione legale da parte di Facebook ed è stato costretto a cancellare i dati-in un’eco della presunta parte del ricercatore accademico Aleksandr Kogan nello scandalo Cambridge Analytica.

L’app di Kogan, soprannominata “thisisyourdigitallife”, sviluppata nel 2014 attraverso la sua azienda Global Science Research (GSR) – separata dal suo lavoro universitario – è stato un test della personalità a cui 270.000 utenti hanno effettuato l’accesso, accettando che avrebbe avuto accesso ad alcune delle loro informazioni personali e anche ad alcuni dati dei loro amici. Significava anche che quegli amici non avevano acconsentito all’utilizzo dei loro dati in questo modo.

Facebook aggiorna regolarmente la sua API e nel 2014 la società ha confermato che avrebbe smesso di consentire alle app di terze parti di avere accesso ai dati sugli amici degli utenti delle app. Ciò ha disabilitato il metodo di raccolta dei dati presumibilmente utilizzato da Kogan.

Ci sono diversi modi in cui gli sviluppatori – che sono tenuti ad accettare le politiche di Facebook-possono raccogliere dati utilizzando l’API dell’azienda e tutti assumono almeno competenze di programmazione di base. Uno dei modi più semplici per farlo è accedere all’API utilizzando un toolbox software specializzato: Python e R hanno strumenti progettati specificamente per questo scopo. Nella mia ricerca, io uso il pacchetto Rfacebook per raccogliere i dati di Facebook.

Autorizzare la mia app utilizzando il pacchetto Rfacebook in RStudio-con il mio ID univoco redatto. Gráinne Nic Lochlainn

Una distinzione chiave tra la mia app e gli altri è che non interagisco con gli utenti, perché la mia app non è live. La mia app è essenzialmente un modo automatico per copiare e incollare informazioni da gruppi pubblici di Facebook. Io uso l’API di Facebook per la ricerca come le pagine di gruppo della comunità pubblica sono stati utilizzati per protestare contro l’austerità in Irlanda.

Poiché sto raccogliendo dati pubblici da pagine pubbliche, non sto chiedendo agli utenti di accedere e non c’è un’interfaccia front-end su Facebook, anche se questo può essere fatto utilizzando i toolkit API di Facebook per espandere la quantità di dati a cui è possibile accedere. È un metodo che solleva una serie di domande su funzionalità, informazioni utente e autorizzazioni di accesso.

L’API di Facebook può essere utilizzata per raccogliere tutti i tipi di informazioni disponibili al pubblico, come alcuni post recenti di Conversation UK o post in gruppi pubblici.

Messaggi raccolti dalla pagina Facebook della Conversazione UK. Nic Lochlainn.
Messaggi raccolti da un gruppo pubblico su Facebook. Gráinne Nic Lochlainn

Ma tenta di andare oltre le informazioni pubbliche per raccogliere i dati degli utenti di Facebook che non hanno effettuato l’accesso all’app – come Zuckerberg, ad esempio – restituiscono errori. I “Mi piace” di Facebook non possono essere raccolti perché Zuckerberg non è un utente della mia app e non gli ha concesso il permesso di accedere ai suoi dati.

Sotto gli ultimi aggiornamenti API di Facebook, le autorizzazioni app sono necessari per raccogliere tutte le informazioni al di là di proprietà del profilo pubblico. Ciò significa che gli utenti devono accedere a un’app e autorizzare l’accesso a qualsiasi altra informazione per consentire agli sviluppatori di raccogliere i dati.

Un tentativo fallito di raccogliere le pagine che Mark Zuckerberg ha apprezzato. Gráinne Nic Lochlainn

La ricerca legimate è minacciata?

Mentre le aziende ad-farcite hanno chiaramente un interesse a “sfruttare” i dati, gli accademici – nelle ultime settimane – hanno attirato l’attenzione sui ricercatori che raccolgono i dati di Facebook. La pratica è diventata relativamente mainstream nella ricerca sulle scienze sociali.

La misura in cui la ricerca futura potrebbe essere limitata dalle modifiche all’API di Facebook è pressante. Ma vale la pena notare che, una volta che i dati sono stati raccolti, Facebook – che può perseguire legalmente le persone che “violano” i suoi termini di servizio per cercare di costringerli a cancellare i dati – ha un controllo limitato su dove i dati finiscono.

Per i ricercatori che si stanno preoccupando di come lo scandalo Cambridge Analytica influenzerà il loro lavoro, vale la pena tenere d’occhio ciò che cambia Facebook implementa nel suo prossimo aggiornamento API. Può fornire una migliore comprensione del tipo di ricerca che può essere consentito dall’uso dei dati raccolti di Facebook – e ciò che può essere permanentemente escluso.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.