Facebook Data harvesting: co musisz wiedzieć

Facebook zarabia większość swoich pieniędzy na reklamach, a – ponieważ skandal Cambridge Analytica nadal nawiedza firmę Marka Zuckerberga – użytkownicy domagają się wiedzieć, w jaki sposób ich dane są przetwarzane i zbierane.Facebooka, od początku istnienia Facebooka było jasne, że jego działalność opiera się na szeroko zakrojonej inwigilacji ludzi, których dane są produktem.

niektórzy przedstawili rewelacje skandalu Cambridge Analytica – w którym dane zostały rzekomo zebrane z 50 milionów profili na Facebooku-jako „kryzys egzystencjalny”, podczas gdy inni podkreślili potencjalne konsekwencje dla badań akademickich.

krótko mówiąc, metody zbierania Danych przez Facebooka stały się przedmiotem nagłych i powszechnych obaw.

co to jest zbieranie danych?

zbiór danych, jak sama nazwa wskazuje, jest podobny do zbierania plonów, ponieważ obejmuje zbieranie i przechowywanie z oczekiwaniem przyszłej nagrody.

dane mogą być zbierane na różne sposoby, od prostego kopiowania i wklejania do bardziej skomplikowanego programowania. Wybrana metoda jest często ograniczona przez miejsce zbioru. Na prostych poziomach Wyszukiwania wiele witryn walczy z automatycznym zbieraniem za pomocą Google s i res, które pomagają witrynom odróżniać ludzi od botów.

jeśli kiedykolwiek skopiowałeś i wkleiłeś tekst z Facebooka lub zapisałeś obraz z Twittera, zebrałeś dane z mediów społecznościowych. Działanie „screenshotting” jest dozwolone na większości witryn, ponieważ użytkownicy mogą Zwykle uzyskać dostęp tylko do informacji, które są publiczne lub widoczne dla nich, ponieważ są zalogowani. Ponadto niemożliwe byłoby całkowite wyeliminowanie najprostszych metod zbierania danych, takich jak robienie notatek i robienie zdjęć.

Facebook i inne sieci społecznościowe są bardziej zainteresowane ograniczaniem automatycznego zbierania danych, ze względu na wymagania dotyczące serwerów internetowych i kontrolowania, kto ma dostęp do jakich danych (i dlaczego). Dane osobowe i zachowania w mediach społecznościowych mają wartość komercyjną, polityczną i badawczą.

wosk szefa Facebooka Marka Zuckerberga.

sieci społecznościowe decydują o własnych zasadach użytkowania, równoważąc interesy handlowe ze stronami trzecimi i regulując kwestie prywatności użytkowników – często opisywane w dokumentach firmy jako żonglowanie optymalizacją „zachowań klientów” i przestrzeganiem „standardów społecznościowych”.

jak zbierane są dane?Facebook, Twitter, Instagram i inne strony wykorzystują interfejsy programowania aplikacji (API), aby ograniczyć dostęp potencjalnych kombajnów. API działają jako oprogramowanie pośrednie, które pozwala naukowcowi lub komputerowi programisty aplikacji „rozmawiać” z siecią społecznościową w kontrolowany sposób.

jeden z głównych warunków obejmuje ograniczenia dotyczące sposobu wykorzystania i udostępniania zebranych danych, które można agresywnie realizować. W 2010 roku programista Pete Warden zebrał dane z 210 mln publicznych profili na Facebooku do celów badawczych. Ale nie zwrócił się najpierw o zgodę do Facebooka, naruszając w ten sposób jego Warunki korzystania z usługi. Później stanął przed groźbą podjęcia działań prawnych ze strony Facebooka i został zmuszony do usunięcia danych-w echu rzekomego udziału badacza akademickiego Aleksandra Kogana w skandalu Cambridge Analytica.

aplikacja Kogana, nazwana „thisisyourdigitallife”, opracowana w 2014 roku przez jego firmę Global Science Research (GSR) – niezależnie od pracy na uniwersytecie – była testem osobowości, do którego zalogowało się 270 000 użytkowników, akceptując, że będzie mieć dostęp do niektórych ich danych osobowych, a także danych znajomych. Oznaczało to również, że ci przyjaciele nie wyrazili zgody na wykorzystanie ich danych w ten sposób.

Facebook regularnie aktualizuje swoje API, aw 2014 firma potwierdziła, że przestanie zezwalać aplikacjom innych firm na dostęp do danych o znajomych użytkowników aplikacji. To wyłączyło metodę zbierania danych rzekomo stosowaną przez Kogan.

istnieje kilka różnych sposobów, w jakie programiści – którzy są zobowiązani do wyrażenia zgody na politykę Facebooka – mogą zbierać dane za pomocą API firmy i wszyscy zakładają przynajmniej podstawowe umiejętności programowania. Jednym z najprostszych sposobów jest dostęp do API za pomocą specjalistycznego oprogramowania toolbox-Python i R mają narzędzia zaprojektowane specjalnie do tego celu. W moich badaniach używam pakietu Rfacebook do zbierania danych z Facebooka.

autoryzacja mojej aplikacji za pomocą pakietu Rfacebook w RStudio – z moim unikalnym identyfikatorem zredagowanym. Gráinne Nic Lochlainn

kluczową różnicą między moją aplikacją a innymi jest to, że nie wchodzę w interakcję z użytkownikami, ponieważ moja aplikacja nie jest aktywna. Moja aplikacja jest zasadniczo zautomatyzowanym sposobem kopiowania i wklejania informacji z publicznych grup na Facebooku. Używam interfejsu API Facebooka do badania, w jaki sposób strony grupy Społeczności publicznych zostały użyte do protestu przeciwko oszczędnościom w Irlandii. Facebooku nie ma interfejsu front-end, chociaż można to zrobić za pomocą zestawów narzędzi API Facebooka, aby rozszerzyć ilość danych, które można uzyskać dostęp. Jest to metoda, która rodzi wiele pytań dotyczących funkcjonalności, informacji o użytkowniku i uprawnień dostępu.

interfejs API Facebooka może być używany do zbierania wszelkiego rodzaju publicznie dostępnych informacji, takich jak niektóre z ostatnich postów Conversation UK lub postów w grupach publicznych.

posty zebrane ze strony Conversation UK na Facebooku. Gráinne Nic Lochlainn.
posty zebrane z grupy publicznej na Facebooku. Gráinne Nic Lochlainn

ale próby wyjścia poza informacje publiczne w celu zebrania danych użytkowników Facebooka, którzy nie zalogowali się do aplikacji-na przykład Zuckerberg-zwracają błędy. „Polubienia” Facebooka nie można zbierać, ponieważ Zuckerberg nie jest użytkownikiem mojej aplikacji i nie udzielił mu pozwolenia na dostęp do swoich danych.

w najnowszych aktualizacjach API Facebooka wymagane są uprawnienia aplikacji do zbierania wszelkich informacji poza właściwościami profilu publicznego. Oznacza to, że użytkownicy muszą zalogować się do aplikacji i autoryzować dostęp do wszelkich innych informacji, aby umożliwić programistom zbieranie danych.

nieudana próba zebrania stron, które spodobały się Markowi Zuckerbergowi. Gráinne Nic Lochlainn

legimate badania zagrożone?

podczas gdy firmy reklamowe wyraźnie mają interes w „wykorzystywaniu” danych, naukowcy-w ostatnich tygodniach – zwrócili uwagę na naukowców, którzy zbierają dane z Facebooka. Praktyka ta stała się stosunkowo głównym nurtem w badaniach nauk społecznych.

zakres, w jakim przyszłe badania mogą być ograniczone przez zmiany w API Facebooka, jest naglący. Warto jednak zauważyć, że po zebraniu danych Facebook – który może legalnie ścigać osoby, które „naruszają” jego Warunki korzystania z usługi, aby zmusić je do usunięcia danych – ma ograniczoną kontrolę nad tym, gdzie DANE się kończą.

dla badaczy, którzy obawiają się, jak afera Cambridge Analytica wpłynie na ich pracę, warto mieć oko na to, jakie zmiany wprowadza Facebook w kolejnej aktualizacji API. Może to zapewnić lepsze zrozumienie rodzaju badań, które mogą być dozwolone w związku z wykorzystaniem zebranych danych Facebooka – i które mogą być trwale wykluczone.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.