Facebook data harvesting: hvad du behøver at vide

Facebook tjener de fleste af sine penge på reklame, og – som Cambridge Analytica – skandalen fortsætter med at hjemsøge Mark.

men mens bekymring over Facebook-brugernes privatliv er steget, har det været klart siden Facebook ‘ s start, at dets forretning er baseret på udbredt overvågning af mennesker, hvis data er produktet.

nogle har portrætteret afsløringerne af Cambridge Analytica – skandalen – hvor data angiveligt blev høstet fra 50m Facebook-profiler-som en “eksistentiel krise”, mens andre har fremhævet potentielle implikationer for akademisk forskning.

kort sagt er Facebook ‘ s datahøstningsmetoder blevet genstand for pludselig og udbredt bekymring.

hvad er datahøst?

Høstdata, som dets landbrugsnavn antyder, ligner indsamling af afgrøder, fordi det involverer indsamling og opbevaring med forventning om fremtidig belønning.

Data kan høstes på forskellige måder, lige fra simpel kopiering og indsætning til mere kompliceret programmering. Den valgte metode er ofte begrænset af det sted, der høstes. På enkle søgeniveauer, mange steder bekæmper automatiseret høst med Google s og res, som hjælper steder med at skelne mellem mennesker og bots.

hvis du nogensinde har kopieret og indsat tekst fra Facebook eller gemt et billede fra kvidre, har du høstet sociale mediedata. Handlingen med” screenshotting ” er tilladt på de fleste sider, fordi brugere normalt kun kan få adgang til oplysninger, der enten er offentlige eller synlige for dem, fordi de har logget ind. Det ville også være umuligt at udrydde de enkleste datahøstningsmetoder fuldstændigt, såsom at lave noter og tage fotografier.

Facebook og andre sociale netværk er mere optaget af at begrænse automatiseret datahøstning på grund af krav til internetservere og til at kontrollere, hvem der har adgang til hvilke data (og hvorfor). Personlige oplysninger og adfærd på sociale medier har kommerciel, politisk og forskningsværdi.

et voksværk af Facebook-chef Mark Guckerberg.

sociale netværk beslutter deres egne brugspolitikker, afbalancerer kommercielle interesser med tredjeparter og lovgivningsmæssige bekymringer for brugernes privatliv – ofte beskrevet i virksomhedsdokumenter som jonglering af optimering af “kundeadfærd” og overholdelse af “fællesskabsstandarder”.

hvordan høstes data?

API’ er (Application Programming Interfaces) bruges af Facebook, kvidre, Instagram og andre sider til at begrænse adgangen til Høstmaskiner. API ‘ er fungerer som et programmellemrum, der gør det muligt for en forsker eller appudviklers computer at “tale” til et socialt netværk på en kontrolleret måde.

en af hovedbetingelserne indebærer begrænsninger for, hvordan indsamlede data kan bruges og deles, hvilket kan forfølges aggressivt. I 2010 computerprogrammerer Pete fængselsinspektør høstede data fra 210M offentlige Facebook-profiler til forskningsformål. Men han undlod at søge tilladelse fra Facebook først og derved overtræde sine servicevilkår. Han stod senere over for truslen om retssager fra Facebook og blev tvunget til at slette dataene – i et ekko af den akademiske forsker Aleksandr Kogans påståede del i Cambridge Analytica-skandalen.

Kogans app, kaldet “thisisyourdigitallife”, udviklet i 2014 gennem hans firma Global Science Research (GSR) – adskilt fra hans universitetsarbejde – var en personlighedstest, som 270.000 brugere loggede ind og accepterede, at det også ville have adgang til nogle af deres personlige oplysninger og nogle af deres venners data. Det betød også, at disse venner ikke havde givet samtykke til, at deres data blev brugt på denne måde.

Facebook opdaterer rutinemæssigt sin API, og i 2014 bekræftede virksomheden, at det ville stoppe med at tillade tredjepartsapps at få adgang til data om appbrugernes venner. Dette deaktiverede dataindsamlingsmetoden, der angiveligt blev brugt af Kogan.

der er et par forskellige måder udviklere – som er forpligtet til at acceptere Facebook ‘ s politikker – kan høste data ved hjælp af virksomhedens API, og de antager alle mindst grundlæggende computerprogrammeringsfærdigheder. En af de nemmeste måder at gøre dette på er at få adgang til API ‘ en ved hjælp af en specialprogramværktøjskasse – Python og R har værktøjer designet specielt til dette formål. I min forskning bruger jeg rfacebook-pakken til at høste Facebook-data.

godkendelse af min app ved hjælp af rfacebook – pakken i RStudio-med mit unikke ID redigeret. Gr larsinne Nic Lochlainn

en nøgleforskel mellem min app og andre er, at jeg ikke interagerer med brugere, fordi min app ikke er live. Min app er i det væsentlige en automatiseret måde at kopiere og indsætte oplysninger fra offentlige Facebook-grupper. Jeg bruger Facebook API til at undersøge, hvordan offentlige samfundsgruppesider er blevet brugt til at protestere mod nedskæringer i Irland.

fordi jeg høster offentlige data fra offentlige sider, beder jeg ikke brugerne om at logge ind, og der er ingen front-end-grænseflade på Facebook, selvom dette kan gøres ved hjælp af Facebook ‘ s API toolkits til at udvide mængden af data, der kan fås adgang til. Det er en metode, der rejser en række spørgsmål om funktionalitet, brugeroplysninger og adgangstilladelser.

Facebook ‘s API kan bruges til at høste alle former for offentligt tilgængelige oplysninger, som nogle af Conversation UK’ s seneste indlæg eller indlæg i offentlige grupper.

indlæg høstet fra Conversation UK Facebook-side. Gr Kurrinne Nic Lochlainn.
indlæg høstet fra en offentlig gruppe på Facebook. Gr larsinne Nic Lochlainn

men forsøger at bevæge sig ud over offentlig information for at høste data fra Facebook – brugere, der ikke har logget ind på appen – f.eks. Facebook “likes” kan ikke høstes, fordi han ikke er bruger af min app, og han har ikke givet den tilladelse til at få adgang til hans data.

under Facebook ‘ s seneste API-opdateringer kræves apptilladelser for at høste alle oplysninger ud over offentlige profilegenskaber. Dette betyder, at brugerne skal logge ind på en app og give adgang til andre oplysninger for at give udviklere mulighed for at høste dataene.

et mislykket forsøg på at høste de sider, som Mark Uckerberg har ønsket. Gr larsinne Nic Lochlainn

Legimate forskning truet?

mens annoncefyldte virksomheder klart har interesse i at “udnytte” data, har akademikere-i de seneste uger – henledt opmærksomheden på forskere, der høster Facebook – data. Denne praksis er blevet relativt almindelig inden for samfundsvidenskabelig forskning.

i hvilket omfang fremtidig forskning kan begrænses af ændringer i Facebook ‘ s API er en presserende. Men det er værd at bemærke, at når data er høstet, har Facebook – som lovligt kan forfølge folk, der “overtræder” sine servicevilkår for at forsøge at tvinge dem til at slette data – begrænset kontrol over, hvor data der ender.

for forskere, der bekymrer sig om, hvordan Cambridge Analytica-skandalen vil påvirke deres arbejde, er det værd at holde øje med, hvilke ændringer Facebook implementerer i sin næste API-opdatering. Det kan give en bedre forståelse af den type forskning, der kan tillades ved brug af høstede Facebook – data-og hvad der kan udelukkes permanent.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.