Facebook data høsting: hva du trenger å vite

Facebook gjør det meste av sine penger fra reklame, Og – Som Cambridge Analytica-skandalen fortsetter Å hjemsøke Mark Zuckerbergs selskap-brukere krever å vite hvordan deres data blir wrangled og høstet.

men mens bekymring For Facebook – brukerens personvern har spiked, har Det vært klart Siden Facebook begynte at virksomheten er basert på utbredt overvåking av mennesker, hvis data er produktet.

Noen har portrettert åpenbaringene Fra Cambridge Analytica-skandalen – der data angivelig ble høstet fra 50m Facebook-profiler-som en «eksistensiell krise», mens andre har fremhevet potensielle implikasjoner for akademisk forskning.

Kort Sagt, Facebook ‘ s data høsting metoder har blitt et emne av plutselig og utbredt bekymring.

Hva er datahøsting?

Høsting av data, som landbruksnavnet antyder, ligner på å samle avlinger fordi det innebærer innsamling og lagring med forventning om fremtidig belønning.

Data kan høstes på forskjellige måter, alt fra enkel kopiering og liming til mer komplisert programmering. Den valgte metoden er ofte begrenset av stedet som høstes. På enkle søkenivåer bekjemper mange nettsteder automatisert høsting Med Google s og res, noe som hjelper nettsteder å skille mellom mennesker og bots.

hvis du noen gang har kopiert og limt inn tekst Fra Facebook eller lagret et bilde Fra Twitter, har du høstet data fra sosiale medier. Handlingen av «screenshotting» er tillatt på de fleste nettsteder fordi brukere vanligvis bare kan få tilgang til informasjon som enten er offentlig eller synlig for dem fordi de har logget inn. Det ville også være umulig å fullstendig utrydde de enkleste datainnsamlingsmetodene, for eksempel å lage notater og ta bilder.

Facebook og andre sosiale nettverk er mer opptatt av å begrense automatisert datahøsting, på grunn av krav til webservere og å kontrollere hvem som har tilgang til hvilke data (og hvorfor). Personlig informasjon og atferd på sosiale medier har kommersiell, politisk og forskningsverdi.

et voksverk Av Facebook-sjefen Mark Zuckerberg.

Sosiale nettverk bestemmer sine egne retningslinjer for bruk, balanserer kommersielle interesser med tredjeparter og regulatoriske bekymringer om personvern for brukere – ofte beskrevet i bedriftsdokumenter som sjonglering av optimalisering av » kundeatferd «og overholder»fellesskapsstandarder».

hvordan høstes data?

Programmeringsgrensesnitt (Api-Er) brukes Av Facebook, Twitter, Instagram og andre nettsteder for å begrense tilgang til potensielle hogstmaskiner. Api-er fungerer som en programvare som gjør det mulig for en forsker eller apputviklers datamaskin å «snakke» til et sosialt nettverk på en kontrollert måte.

en av hovedbetingelsene innebærer restriksjoner på hvordan innsamlede data kan brukes og deles, som kan forfølges aggressivt. I 2010 høstet dataprogrammerer Pete Warden data fra 210m offentlige Facebook-profiler for forskningsformål. Men Han klarte ikke å søke tillatelse Fra Facebook først, og dermed bryte vilkårene for bruk. Han møtte senere trusselen om rettslige skritt Fra Facebook og ble tvunget til å slette dataene-i et ekko av akademisk forsker Aleksandr Kogans påståtte del i Cambridge Analytica-skandalen.

Kogans app, kalt» thisisyourdigitallife», utviklet i 2014 gjennom Sitt firma Global Science Research – GSR) – skilt fra sitt universitetsarbeid-var en personlighetstest som 270 000 brukere logget på, og aksepterte at det ville ha tilgang til noen av deres personlige opplysninger og noen av vennens data også. Det betydde også at disse vennene ikke hadde samtykket til at deres data ble brukt på denne måten.

facebook oppdaterer rutinemessig SIN API, og i 2014 bekreftet selskapet at det ville slutte å tillate tredjepartsapper å ha tilgang til data om venner av app-brukere. Dette deaktiverte datainnsamlingsmetoden som Angivelig ble brukt Av Kogan.

det er noen forskjellige måter utviklere-som er pålagt å godta Facebook ‘ s retningslinjer – kan høste data ved hjelp av selskapets API, og de antar alle minst grunnleggende dataprogrammeringsevner. En av de enkleste måtene å gjøre dette på er å få TILGANG TIL API ved hjelp av en spesialisert verktøykasse – Python og R har verktøy designet spesielt for dette formålet. I min forskning bruker Jeg Rfacebook-pakken til å høste Facebook-data.

Godkjenne min app ved Hjelp Av Rfacebook-pakken I RStudio – med min unike ID redacted. Grá Nic Lochlainn

et viktig skille mellom appen min og andre er at jeg ikke samhandler med brukere, fordi appen min ikke er live. Min app er egentlig en automatisert måte å kopiere og lime inn informasjon fra offentlige Facebook-grupper. Jeg bruker Facebook API for å undersøke hvordan offentlige gruppesider har blitt brukt til å protestere mot innstramminger i Irland.

Fordi jeg høster offentlige data fra offentlige sider, ber jeg ikke brukerne om å logge inn og Det er ikke noe front-end-grensesnitt På Facebook, selv om dette kan gjøres ved Hjelp Av Facebook ‘ S API-verktøy for å utvide mengden data som kan nås. Det er en metode som reiser en rekke spørsmål om funksjonalitet, brukerinformasjon og tilgangstillatelser.

Facebook API kan brukes til å høste alle slags offentlig tilgjengelig informasjon, som Noen Av Conversation STORBRITANNIAS siste innlegg eller innlegg i offentlige grupper.

Innlegg høstet fra Conversation UK Facebook-side. Grá Nic Lochlainn.
Innlegg høstet fra en offentlig gruppe På Facebook. Grá Nic Lochlainn

men forsøker å gå utover offentlig informasjon for å høste data Fra Facebook-brukere som ikke har logget inn på appen – for Eksempel Zuckerberg, for eksempel-returfeil. Facebook «liker» kan ikke høstes fordi Zuckerberg ikke er bruker av appen min, og han har ikke gitt den tillatelse til å få tilgang til dataene sine.

under Facebook nyeste API-oppdateringer, app tillatelser er nødvendig for å høste all informasjon utover offentlige profilegenskaper. Dette betyr at brukere må logge inn på en app og gi tilgang til annen informasjon for å tillate utviklere å høste dataene.

et mislykket forsøk på å høste sidene Som Mark Zuckerberg har likt. Grá Nic Lochlainn

Legimate forskning truet?

mens annonsefylte selskaper tydeligvis har interesse for å «utnytte» data, har akademikere-de siste ukene-lagt merke til forskere som høster Facebook-data. Praksisen har blitt relativt mainstream i samfunnsvitenskapelig forskning.

i hvilken grad fremtidig forskning kan begrenses av endringer I Facebook API er en presserende. Men Det er verdt å merke Seg at Når data har blitt høstet, Har Facebook-som lovlig kan forfølge folk som «bryter» vilkårene for bruk for å prøve å tvinge dem til å slette data-begrenset kontroll over hvor data som ender opp.

for forskere som er fretting om hvordan Cambridge Analytica-skandalen vil påvirke deres arbeid, er det verdt å holde øye med hvilke endringer Facebook implementerer i sin neste API-oppdatering. Det kan gi en bedre forståelse av hvilken type forskning Som kan tillates ved bruk Av høstet Facebook-data-og hva som kan utelukkes permanent.

Legg igjen en kommentar

Din e-postadresse vil ikke bli publisert.