Facebook Data Harvesting: Was Sie wissen müssen

Facebook verdient den größten Teil seines Geldes mit Werbung, und da der Cambridge Analytica–Skandal weiterhin das Unternehmen von Mark Zuckerberg heimsucht, fordern die Nutzer, zu wissen, wie ihre Daten verarbeitet und geerntet werden.Facebook-Nutzerdaten

Doch während die Sorge um die Privatsphäre der Facebook-Nutzer zugenommen hat, ist seit der Gründung von Facebook klar, dass sein Geschäft auf der weit verbreiteten Überwachung von Menschen basiert, deren Daten das Produkt sind.

Einige haben die Enthüllungen des Cambridge Analytica–Skandals – in dem angeblich Daten aus 50 Millionen Facebook-Profilen gesammelt wurden – als „existenzielle Krise“ dargestellt, während andere mögliche Auswirkungen auf die akademische Forschung hervorgehoben haben.

Kurz gesagt, Facebooks Datensammelmethoden sind zu einem Gegenstand plötzlicher und weit verbreiteter Besorgnis geworden.

Was ist Data Harvesting?

Erntedaten ähneln, wie der landwirtschaftliche Name schon sagt, dem Sammeln von Getreide, da sie gesammelt und gelagert werden, mit der Erwartung einer zukünftigen Belohnung.

Daten können auf verschiedene Arten gesammelt werden, von einfachem Kopieren und Einfügen bis hin zu komplizierterer Programmierung. Die gewählte Methode wird oft durch den zu erntenden Standort eingeschränkt. Auf einfachen Suchebenen bekämpfen viele Websites das automatisierte Ernten mit Google s und res, wodurch Websites zwischen Menschen und Bots unterscheiden können.

Wenn Sie jemals Text von Facebook kopiert und eingefügt oder ein Bild von Twitter gespeichert haben, haben Sie Social-Media-Daten gesammelt. Die Aktion „Screenshots“ ist auf den meisten Websites zulässig, da Benutzer normalerweise nur auf Informationen zugreifen können, die entweder öffentlich oder für sie sichtbar sind, weil sie sich angemeldet haben. Es wäre auch unmöglich, die einfachsten Methoden zur Datenerfassung wie Notizen machen und Fotografieren vollständig auszurotten.

Facebook und andere soziale Netzwerke befassen sich aufgrund der Anforderungen an Webserver eher mit der Einschränkung der automatisierten Datenerfassung und der Kontrolle, wer Zugriff auf welche Daten hat (und warum). Persönliche Informationen und Verhalten in sozialen Medien haben kommerziellen, politischen und Forschungswert.

Ein Wachswerk von Facebook-Chef Mark Zuckerberg.

Soziale Netzwerke entscheiden über ihre eigenen Nutzungsrichtlinien, indem sie kommerzielle Interessen mit Dritten und regulatorischen Datenschutzbedenken der Nutzer abwägen – oft in Unternehmensdokumenten als Jonglieren zwischen der Optimierung des „Kundenverhaltens“ und der Einhaltung von „Community-Standards“ beschrieben.

Wie werden Daten gesammelt?Instagram Facebook 5433 4754Application Programming Interfaces (APIs) werden von Facebook, Twitter, Instagram und anderen Websites verwendet, um den Zugriff potenzieller Erntehelfer einzuschränken. APIs arbeiten als Software-Vermittler, der es dem Computer eines Forschers oder App-Entwicklers ermöglicht, auf kontrollierte Weise mit einem sozialen Netzwerk zu „sprechen“.

Eine der Hauptbedingungen beinhaltet Einschränkungen, wie gesammelte Daten verwendet und geteilt werden können, die aggressiv verfolgt werden können. Im Jahr 2010 sammelte der Computerprogrammierer Pete Warden Daten von 210 Millionen öffentlichen Facebook-Profilen für Forschungszwecke. Aber er versäumte es, zuerst die Erlaubnis von Facebook einzuholen und damit gegen seine Nutzungsbedingungen zu verstoßen. Später drohte Facebook mit rechtlichen Schritten und musste die Daten löschen – in Anlehnung an die angebliche Rolle des akademischen Forschers Aleksandr Kogan im Cambridge Analytica-Skandal.

Kogans App mit dem Namen „thisisyourdigitallife“, die 2014 von seiner Firma Global Science Research (GSR) – getrennt von seiner Universitätsarbeit – entwickelt wurde, war ein Persönlichkeitstest, bei dem sich 270.000 Benutzer anmeldeten und akzeptierten, dass sie Zugriff auf einige ihrer persönlichen Daten und auch auf einige Daten ihrer Freunde hatten. Dies bedeutete auch, dass diese Freunde der Verwendung ihrer Daten auf diese Weise nicht zugestimmt hatten.

Facebook aktualisiert routinemäßig seine API und im Jahr 2014 bestätigte das Unternehmen, dass es Apps von Drittanbietern nicht mehr den Zugriff auf Daten über die Freunde von App-Nutzern gestatten werde. Dadurch wurde die von Kogan angeblich verwendete Datenerfassungsmethode deaktiviert.

Es gibt verschiedene Möglichkeiten, wie Entwickler – die den Richtlinien von Facebook zustimmen müssen – Daten mithilfe der API des Unternehmens sammeln können, und alle setzen mindestens grundlegende Computerprogrammierkenntnisse voraus. Eine der einfachsten Möglichkeiten, dies zu tun, besteht darin, mit einer speziellen Software–Toolbox auf die API zuzugreifen – Python und R verfügen über Tools, die speziell für diesen Zweck entwickelt wurden. In meiner Forschung verwende ich das Rfacebook-Paket, um Facebook-Daten zu sammeln.

Autorisieren meiner App mithilfe des Rfacebook-Pakets in RStudio – mit meiner eindeutigen ID redigiert. Gráinne Nic Lochlainn

Ein wesentlicher Unterschied zwischen meiner App und anderen besteht darin, dass ich nicht mit Benutzern interagiere, da meine App nicht live ist. Meine App ist im Wesentlichen eine automatisierte Möglichkeit, Informationen aus öffentlichen Facebook-Gruppen zu kopieren und einzufügen. Ich benutze die Facebook-API, um zu untersuchen, wie öffentliche Community-Gruppenseiten verwendet wurden, um gegen die Sparpolitik in Irland zu protestieren. Facebook-API-Toolkits Da ich öffentliche Daten von öffentlichen Seiten sammle, bitte ich Benutzer nicht, sich anzumelden, und es gibt keine Front-End-Oberfläche auf Facebook, obwohl dies mithilfe der API-Toolkits von Facebook erfolgen kann, um die Datenmenge zu erweitern, auf die zugegriffen werden kann. Es ist eine Methode, die eine Reihe von Fragen zu Funktionalität, Benutzerinformationen und Zugriffsberechtigungen aufwirft.

Die Facebook-API kann verwendet werden, um alle Arten von öffentlich zugänglichen Informationen zu sammeln, z. B. einige der neuesten Beiträge von The Conversation UK oder Beiträge in öffentlichen Gruppen.

Beiträge von der Facebook-Seite von The Conversation UK. Gráinne Nic Lochlainn.
Beiträge aus einer öffentlichen Gruppe auf Facebook geerntet. Gráinne Nic Lochlainn

Aber Versuche, über öffentliche Informationen hinauszugehen, um Daten von Facebook–Nutzern zu sammeln, die sich nicht bei der App angemeldet haben – wie zum Beispiel Zuckerberg -, geben Fehler zurück. Facebook „Likes“ können nicht geerntet werden, da Zuckerberg kein Benutzer meiner App ist und er ihr keine Berechtigung zum Zugriff auf seine Daten erteilt hat.

Unter den neuesten API-Updates von Facebook sind App-Berechtigungen erforderlich, um Informationen über öffentliche Profileigenschaften hinaus zu erfassen. Dies bedeutet, dass sich Benutzer bei einer App anmelden und den Zugriff auf andere Informationen autorisieren müssen, damit Entwickler die Daten sammeln können.

Ein gescheiterter Versuch, die Seiten zu ernten, die Mark Zuckerberg gefallen haben. Gráinne Nic Lochlainn

Legimatenforschung in Gefahr?

Während Werbefirmen eindeutig ein Interesse daran haben, Daten zu „nutzen“, haben Wissenschaftler in den letzten Wochen auf Forscher aufmerksam gemacht, die Facebook-Daten sammeln. Die Praxis hat sich in der sozialwissenschaftlichen Forschung relativ durchgesetzt.

Das Ausmaß, in dem zukünftige Forschung durch Änderungen an Facebooks API eingeschränkt werden könnte, ist dringend. Aber es ist erwähnenswert, dass, sobald Daten geerntet wurden, Facebook – die legal Menschen verfolgen können, die ihre Nutzungsbedingungen „verletzen“, um zu versuchen, sie zu zwingen, Daten zu löschen – hat nur begrenzte Kontrolle darüber, wo Daten landen.

Für Forscher, die sich Sorgen darüber machen, wie sich der Cambridge Analytica-Skandal auf ihre Arbeit auswirken wird, lohnt es sich, im Auge zu behalten, welche Änderungen Facebook in seinem nächsten API-Update implementiert. Es kann ein besseres Verständnis dafür vermitteln, welche Art von Forschung aus der Verwendung von geernteten Facebook–Daten zulässig sein kann – und was dauerhaft ausgeschlossen werden kann.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.