Facebook data harvesting: vad du behöver veta

Facebook gör det mesta av sina pengar från reklam, och – som Cambridge Analytica – skandalen fortsätter att hemsöka Mark Zuckerbergs företag-användare kräver att veta hur deras data är wrangled och skördas.

men medan oro för Facebook-användarnas integritet har spikat, har det varit tydligt sedan Facebook startade att verksamheten bygger på utbredd övervakning av människor, vars data är produkten.

vissa har skildrat avslöjandena av Cambridge Analytica – skandalen – där data påstås skördas från 50m Facebook-profiler-som en ”existentiell kris”, medan andra har belyst potentiella konsekvenser för akademisk forskning.

kort sagt, Facebook: s metoder för datainsamling har blivit föremål för plötslig och utbredd oro.

vad är datainsamling?

Skörddata, som dess jordbruksnamn antyder, liknar insamling av grödor eftersom det innebär insamling och lagring med förväntan om framtida belöning.

Data kan skördas på olika sätt, allt från enkel kopiering och klistra till mer komplicerad programmering. Den valda metoden begränsas ofta av den plats som skördas. På enkla söknivåer bekämpar många webbplatser automatiserad skörd med Google s och res, vilket hjälper webbplatser att skilja mellan människor och bots.

om du någonsin har kopierat och klistrat in text från Facebook eller sparat en bild från Twitter har du skördat sociala mediedata. Åtgärden ”screenshotting” är tillåten på de flesta webbplatser eftersom användare vanligtvis bara kan få tillgång till information som är antingen offentlig eller synlig för dem eftersom de har loggat in. Det skulle också vara omöjligt att helt utrota de enklaste metoderna för datainsamling, som att göra anteckningar och ta fotografier.

Facebook och andra sociala nätverk är mer intresserade av att begränsa automatiserad datainsamling på grund av krav på webbservrar och att kontrollera vem som har tillgång till vilka data (och varför). Personlig information och beteende på sociala medier har kommersiellt, politiskt och forskningsvärde.

ett vaxverk av Facebook-chef Mark Zuckerberg.

sociala nätverk bestämmer sina egna användningspolicyer, balanserar kommersiella intressen med tredje part och regulatoriska användarskyddsproblem – som ofta beskrivs i företagsdokument som att jonglera optimeringen av ”kundbeteende” och följa ”community-standarder”.

hur skördas data?

API: er (Application Programming Interfaces) används av Facebook, Twitter, Instagram och andra webbplatser för att begränsa framtida skördares åtkomst. API: er fungerar som en programvara mellan som gör det möjligt för en forskare eller apputvecklares dator att ”prata” med ett socialt nätverk på ett kontrollerat sätt.

ett av de viktigaste villkoren innebär begränsningar för hur insamlade data kan användas och delas, vilket kan eftersträvas aggressivt. Under 2010 dataprogrammerare Pete Warden skördade data från 210M offentliga Facebook-profiler för forskningsändamål. Men han misslyckades med att söka tillstånd från Facebook först och därmed bryta mot användarvillkoren. Han mötte senare hotet om rättsliga åtgärder från Facebook och tvingades radera uppgifterna – i ett eko av akademisk forskare Aleksandr Kogans påstådda del i Cambridge Analytica-skandalen.

Kogans app, kallad ”thisisyourdigitallife”, utvecklad 2014 genom sitt företag Global Science Research (GSR) – separat från sitt universitetsarbete – var ett personlighetstest som 270 000 användare loggade in och accepterade att det skulle ha tillgång till en del av deras personliga information och några av deras vänners data också. Det innebar också att dessa vänner inte hade samtyckt till att deras data användes på detta sätt.

Facebook uppdaterar rutinmässigt sitt API och i 2014 bekräftade företaget att det skulle sluta låta appar från tredje part få tillgång till data om appanvändarnas vänner. Detta inaktiverade datainsamlingsmetoden som påstås användas av Kogan.

det finns några olika sätt utvecklare – som är skyldiga att godkänna Facebook: s policy – kan skörda data med hjälp av företagets API och de antar alla åtminstone grundläggande datorprogrammeringsförmåga. Ett av de enklaste sätten att göra detta är att komma åt API: n med hjälp av en specialprogramvaruverktygslåda – Python och R har verktyg som är utformade speciellt för detta ändamål. I min forskning använder jag rfacebook-paketet för att skörda Facebook-data.

Auktorisera min app med rfacebook-paketet i RStudio-med mitt unika ID redigerat. Gr bisexinne Nic Lochlainn

en viktig skillnad mellan min app och andra är att jag inte interagerar med användare, eftersom min app inte är live. Min app är i huvudsak ett automatiserat sätt att kopiera och klistra in information från offentliga Facebook-grupper. Jag använder Facebook API för att undersöka hur offentliga samhällsgruppssidor har använts för att protestera mot åtstramning i Irland.

eftersom jag skördar offentliga data från offentliga sidor ber jag inte användare att logga in och det finns inget front-end-gränssnitt på Facebook, även om detta kan göras med Facebook: s API-verktygssatser för att utöka mängden data som kan nås. Det är en metod som väcker ett antal frågor om funktionalitet, användarinformation och åtkomstbehörigheter.

Facebook: s API kan användas för att skörda alla typer av offentligt tillgänglig information, som några av konversationens senaste inlägg eller inlägg i offentliga grupper.

inlägg skördade från konversationen Storbritanniens Facebook-sida. Gr.
inlägg skördade från en offentlig grupp på Facebook. Gr ~ ~ POS = TRUNC Nic Lochlainn

men försök att gå bortom offentlig information för att skörda data från Facebook – användare som inte har loggat in på appen – till exempel Zuckerberg, till exempel-returnera fel. Facebook ”gillar” kan inte skördas eftersom Zuckerberg inte är en användare av min app och han har inte beviljat det tillstånd att komma åt hans data.

Under Facebook: s senaste API-uppdateringar krävs appbehörigheter för att skörda all information utöver offentliga profilegenskaper. Det innebär att användare måste logga in på en app och tillåta åtkomst till annan information för att tillåta utvecklare att skörda data.

ett misslyckat försök att skörda de sidor som Mark Zuckerberg har gillat. Gr brasiliinne Nic Lochlainn

Legimate forskning under hot?

medan ad-fyllda företag tydligt har intresse av att” utnyttja ” data, har akademiker – de senaste veckorna – uppmärksammat forskare som skördar Facebook-data. Övningen har blivit relativt vanlig inom samhällsvetenskaplig forskning.

i vilken utsträckning framtida forskning kan begränsas av ändringar av Facebook: s API är en pressande. Men det är värt att notera att, när data har skördats, Facebook – som lagligt kan driva människor som ”bryter mot” sina användarvillkor för att försöka tvinga dem att radera data – har begränsad kontroll över var data som hamnar.

för forskare som oroar sig för hur Cambridge Analytica-skandalen kommer att påverka deras arbete är det värt att hålla ett öga på vilka förändringar Facebook implementerar i sin nästa API-uppdatering. Det kan ge en bättre förståelse för vilken typ av forskning som kan tillåtas från användningen av skördade Facebook – data-och vad som kan uteslutas permanent.

Lämna ett svar

Din e-postadress kommer inte publiceras.