Facebook data harvesting: wat u moet weten

Facebook verdient het grootste deel van zijn geld uit reclame, en – terwijl het Cambridge Analytica – schandaal Mark Zuckerberg ‘ s bedrijf blijft achtervolgen-gebruikers eisen om te weten hoe hun gegevens worden beheerd en geoogst.

maar hoewel de bezorgdheid over de privacy van Facebook-gebruikers is toegenomen, is het sinds de oprichting van Facebook duidelijk dat zijn bedrijf is gebaseerd op een wijdverbreide surveillance van mensen, waarvan de gegevens het product zijn.

sommigen hebben de onthullingen van het Cambridge Analytica – schandaal-waarin gegevens zouden zijn verzameld van 50 miljoen Facebook-profielen-afgeschilderd als een” existentiële crisis”, terwijl anderen de mogelijke implicaties voor academisch onderzoek hebben belicht.

kortom, Facebook ‘ s data harvesting methoden zijn een onderwerp geworden van plotselinge en wijdverbreide bezorgdheid.

Wat is data harvesting?

Oogstgegevens zijn, zoals de agrarische naam al doet vermoeden, vergelijkbaar met het verzamelen van gewassen omdat het gaat om het verzamelen en opslaan met de verwachting van toekomstige beloning.

gegevens kunnen op verschillende manieren worden verzameld, variërend van eenvoudig kopiëren en plakken tot ingewikkelder programmeren. De gekozen methode wordt vaak beperkt door de locatie die wordt geoogst. Op eenvoudige zoekniveaus bestrijden veel sites geautomatiseerd oogsten met Google s en res, die sites helpen onderscheid te maken tussen mensen en bots.

als u ooit tekst van Facebook hebt gekopieerd en geplakt of een afbeelding van Twitter hebt opgeslagen, hebt u gegevens van sociale media geoogst. De actie van “screenshotting” is toegestaan op de meeste sites, omdat gebruikers meestal alleen toegang hebben tot informatie die openbaar of zichtbaar voor hen is omdat ze ingelogd zijn. Ook zou het onmogelijk zijn om volledig uit te roeien de eenvoudigste data oogsten methoden, zoals het maken van notities en het nemen van foto ‘ s.

Facebook en andere sociale netwerken houden zich meer bezig met het beperken van het automatisch verzamelen van gegevens, vanwege eisen aan webservers en om te bepalen wie toegang heeft tot welke gegevens (en waarom). Persoonlijke informatie en gedrag op sociale media hebben commerciële, politieke en onderzoekswaarde.

een waxwork van Facebook baas Mark Zuckerberg.

sociale netwerken bepalen hun eigen gebruiksbeleid, waarbij commerciële belangen worden afgewogen tegen die van derden en de bezorgdheid over de privacy van de regelgevende gebruiker – vaak beschreven in bedrijfsdocumenten als het jongleren met de optimalisering van “klantgedrag” en het naleven van “communautaire normen”.

Hoe worden gegevens verzameld?Facebook, Twitter, Instagram en andere sites gebruiken Application Programming Interfaces (API’ s) om de toegang van potentiële harvesters te beperken. API ‘ s werken als een software-tussenpersoon waarmee de computer van een onderzoeker of app-ontwikkelaar op een gecontroleerde manier met een sociaal netwerk kan “praten”.

een van de belangrijkste voorwaarden betreft beperkingen op de manier waarop verzamelde gegevens kunnen worden gebruikt en gedeeld, die agressief kunnen worden nagestreefd. In 2010 verzamelde computerprogrammeur Pete Warden gegevens van 210m openbare Facebook-profielen voor onderzoeksdoeleinden. Maar hij slaagde er niet in om eerst toestemming te vragen van Facebook, waardoor de Servicevoorwaarden werden geschonden. Hij werd later geconfronteerd met de dreiging van juridische stappen van Facebook en werd gedwongen om de gegevens te verwijderen – in een echo van academische onderzoeker Aleksandr Kogan ‘ s vermeende deel in de Cambridge Analytica schandaal.Kogan ’s app, genaamd “thisisyourdigitallife”, ontwikkeld in 2014 door zijn bedrijf Global Science Research (GSR) – los van zijn universitaire werk – was een persoonlijkheidstest waarbij 270.000 gebruikers zich aanmeldden en accepteerden dat het toegang zou hebben tot sommige van hun persoonlijke informatie en sommige van de gegevens van hun vrienden. Het betekende ook dat die vrienden niet hadden ingestemd met het gebruik van hun gegevens op deze manier.

Facebook werkt routinematig zijn API bij en in 2014 bevestigde het bedrijf dat het zou stoppen met het toestaan van apps van derden om toegang te hebben tot gegevens over vrienden van app-gebruikers. Dit schakelde de methode voor het verzamelen van gegevens die Kogan zou hebben gebruikt, uit.

er zijn een paar verschillende manieren waarop ontwikkelaars – die verplicht zijn om Akkoord te gaan met het beleid van Facebook-gegevens kunnen oogsten met behulp van de API van het bedrijf en ze nemen allemaal ten minste elementaire computerprogrammeervaardigheden aan. Een van de makkelijkste manieren om dit te doen is om toegang te krijgen tot de API met behulp van een gespecialiseerde software toolbox – Python en R hebben tools speciaal ontworpen voor dit doel. In mijn onderzoek gebruik ik het rfacebook-pakket om Facebook-gegevens te oogsten.

autoriseren van mijn app met behulp van het rfacebook-pakket in RStudio-met mijn unieke ID geredigeerd. Gráinne Nic Lochlainn

een belangrijk onderscheid tussen mijn app en anderen is dat ik geen interactie heb met gebruikers, omdat mijn app niet live is. Mijn app is in wezen een geautomatiseerde manier om te kopiëren-en-plakken informatie van openbare Facebook-groepen. Ik gebruik de Facebook API om te onderzoeken hoe publieke community groepspagina ‘ s zijn gebruikt om te protesteren tegen bezuinigingen in Ierland.

omdat ik publieke gegevens van Openbare Pagina ‘ s oogst, vraag Ik gebruikers niet in te loggen en er is geen front-end interface op Facebook, hoewel dit kan worden gedaan met behulp van Facebook API toolkits om de hoeveelheid gegevens die toegankelijk zijn uit te breiden. Het is een methode die een aantal vragen oproept over functionaliteit, gebruikersinformatie en toegangsrechten.

de API van Facebook kan worden gebruikt om allerlei publiek beschikbare informatie te verzamelen, zoals sommige recente berichten van het gesprek in het Verenigd Koninkrijk of berichten in openbare groepen.

berichten geoogst van het gesprek UK Facebook-pagina. Gráinne Nic Lochlainn.
berichten geoogst van een openbare groep op Facebook. Gráinne Nic Lochlainn

maar probeert verder te gaan dan publieke informatie om gegevens te oogsten van Facebook-gebruikers die niet bij de app zijn ingelogd – zoals Zuckerberg, bijvoorbeeld-retourfouten. Facebook “likes” kan niet worden geoogst, omdat Zuckerberg is geen gebruiker van mijn app en hij heeft het niet toestemming gegeven om toegang te krijgen tot zijn gegevens.

onder de laatste API-updates van Facebook zijn App-machtigingen vereist om informatie te oogsten die verder gaat dan openbare profieleigenschappen. Dit betekent dat gebruikers moeten inloggen op een app en toegang verlenen tot alle andere informatie om ontwikkelaars in staat te stellen de gegevens te oogsten.

een mislukte poging om de pagina ‘ s te oogsten die Mark Zuckerberg leuk vond. Gráinne Nic Lochlainn

Legimate research under threated?Terwijl bedrijven met advertenties duidelijk belang hebben bij het” benutten ” van gegevens, hebben academici – de afgelopen weken – de aandacht gevestigd op onderzoekers die Facebook-gegevens oogsten. De praktijk is relatief mainstream geworden in sociaalwetenschappelijk onderzoek.

de mate waarin toekomstig onderzoek kan worden beperkt door wijzigingen in de API van Facebook is dringend. Maar het is vermeldenswaard dat, zodra de gegevens zijn verzameld, Facebook – die legaal kan vervolgen mensen die “schenden” haar voorwaarden van de dienst om te proberen om hen te dwingen om gegevens te verwijderen – heeft beperkte controle over waar de gegevens die eindigt.

voor onderzoekers die zich zorgen maken over hoe het Cambridge Analytica-schandaal hun werk zal beïnvloeden, is het de moeite waard om in de gaten te houden welke veranderingen Facebook implementeert in zijn volgende API-update. Het kan een beter begrip van het type onderzoek dat kan worden toegestaan van het gebruik van geoogste Facebook – gegevens te bieden-en wat kan permanent worden uitgesloten.

Geef een antwoord

Het e-mailadres wordt niet gepubliceerd.