Facebook data harvesting: what you need to know

a Facebook a legtöbb pénzt reklámokból szerzi, és – mivel a Cambridge Analytica botrány továbbra is kísérti Mark Zuckerberg cégét – a felhasználók azt követelik, hogy tudják, hogyan gyűjtik össze és gyűjtik össze adataikat.

de bár a Facebook felhasználói adatvédelme iránti aggodalom megnőtt, a Facebook megalakulása óta egyértelmű, hogy üzleti tevékenysége az emberek széles körű felügyeletén alapul, akiknek az adatai a termék.

egyesek “egzisztenciális válságként” ábrázolták a Cambridge Analytica botrány felfedését – amelyben állítólag 50 millió Facebook – profilból gyűjtöttek adatokat -, míg mások rámutattak az akadémiai kutatásokra gyakorolt lehetséges következményekre.

röviden, A Facebook adatgyűjtési módszerei hirtelen és széles körben aggodalomra adnak okot.

mi az adatgyűjtés?

a betakarítási adatok, amint azt a mezőgazdasági neve is sugallja, hasonlóak a növények gyűjtéséhez, mivel gyűjtést és tárolást foglalnak magukban a jövőbeni jutalom elvárásával.

az adatok különböző módon gyűjthetők, az egyszerű másolástól a beillesztésig a bonyolultabb programozásig. A választott módszert gyakran korlátozza a betakarított hely. Egyszerű keresési szinten Sok webhely küzd az automatizált betakarítással a Google s és res segítségével, amelyek segítenek a webhelyeknek megkülönböztetni az embereket és a robotokat.

ha valaha is másolt és beillesztett szöveget a Facebook-ról, vagy mentett képet a Twitterről, akkor összegyűjtötte a közösségi média adatait. A “screenshotting” művelet a legtöbb webhelyen megengedett, mivel a felhasználók általában csak olyan információkhoz férhetnek hozzá, amelyek nyilvánosak vagy láthatóak számukra, mert bejelentkeztek. Ezenkívül lehetetlen lenne teljesen felszámolni a legegyszerűbb adatgyűjtési módszereket, például a jegyzetek készítését és a fényképek készítését.

a Facebook és más közösségi hálózatok jobban foglalkoznak az automatizált adatgyűjtés korlátozásával, mivel a webszerverek megkövetelik, és ellenőrzik, hogy ki milyen adatokhoz fér hozzá (és miért). A személyes információknak és a közösségi médiában való viselkedésnek kereskedelmi, politikai és kutatási értéke van.

a Facebook főnöke, Mark Zuckerberg viaszmunkája.

a közösségi hálózatok maguk döntenek a saját használati irányelveikről, egyensúlyba hozzák a harmadik felekkel fennálló kereskedelmi érdekeket és a szabályozó felhasználói adatvédelmi aggályokat – a vállalati dokumentumokban gyakran úgy írják le, hogy zsonglőrködnek az “ügyfélmagatartás” optimalizálásával és a “közösségi szabványok”betartásával.

hogyan gyűjtik az adatokat?

alkalmazásprogramozási interfészeket (API-kat) használ a Facebook, a Twitter, az Instagram és más oldalak a leendő betakarítók hozzáférésének korlátozására. Az API-k olyan szoftver-közvetítőként működnek, amely lehetővé teszi a kutató vagy az alkalmazásfejlesztő számítógépének, hogy ellenőrzött módon “beszéljen” egy közösségi hálózattal.

az egyik fő feltétel az összegyűjtött adatok felhasználásának és megosztásának korlátozása,amely agresszív módon követhető. 2010-ben Pete Warden számítógépes programozó 210 millió nyilvános Facebook-profilból gyűjtött adatokat kutatási célokra. De először nem kért engedélyt a Facebook-tól, ezzel megsértve annak szolgáltatási feltételeit. Később szembesült azzal a fenyegetéssel, hogy a Facebook jogi lépéseket tesz, és kénytelen volt törölni az adatokat-Alexander Kogan akadémikus kutatónak a Cambridge Analytica botrányban való állítólagos szerepére visszhangozva.

Kogan “thisisyourdigitallife” névre keresztelt alkalmazása, amelyet 2014 – ben fejlesztett ki a Global Science Research (GSR) cégén keresztül – egyetemi munkájától elkülönítve-egy személyiségteszt volt, amelybe 270 000 felhasználó jelentkezett be, elfogadva, hogy hozzáférhet néhány személyes adatukhoz és néhány barátjuk adataihoz is. Ez azt is jelentette, hogy ezek a barátok nem járultak hozzá az adataik ilyen módon történő felhasználásához.

a Facebook rendszeresen frissíti API-ját, és 2014-ben a vállalat megerősítette, hogy nem engedélyezi harmadik féltől származó alkalmazások számára az alkalmazásfelhasználók barátainak adataihoz való hozzáférést. Ez letiltotta a Kogan által állítólag használt adatgyűjtési módszert.

van néhány különböző módja annak, hogy a fejlesztők – akiknek el kell fogadniuk a Facebook irányelveit – összegyűjtsék az adatokat a vállalat API-jával, és mindannyian legalább alapvető számítógépes programozási ismereteket vállalnak. Ennek egyik legegyszerűbb módja az API elérése egy speciális szoftver eszköztár segítségével – a Python és az R kifejezetten erre a célra tervezett eszközökkel rendelkezik. Kutatásom során az Rfacebook csomagot használom a Facebook adatok gyűjtésére.

az alkalmazásom engedélyezése az Rfacebook csomag használatával az RStudio – ban-az egyedi azonosítóm szerkesztésével. Gr Enterprises Nic Lochlainn

a legfontosabb különbség az alkalmazásom és mások között az, hogy nem lépek kapcsolatba a felhasználókkal, mert az alkalmazásom nem él. Az alkalmazásom lényegében automatizált módszer a nyilvános Facebook-csoportokból származó információk másolására és beillesztésére. A Facebook API-t használom annak kutatására, hogy a nyilvános közösségi csoportok oldalait hogyan használták fel az írországi megszorítások elleni tiltakozásra.

mivel nyilvános oldalakról gyűjtöm a nyilvános adatokat, nem kérem a felhasználókat, hogy jelentkezzenek be, és nincs front-end felület a Facebook-on, bár ezt a Facebook API eszközkészleteivel lehet megtenni az elérhető adatok mennyiségének kibővítéséhez. Ez egy olyan módszer, amely számos kérdést vet fel a funkcionalitással, a felhasználói információkkal és a hozzáférési engedélyekkel kapcsolatban.

a Facebook API-ja felhasználható mindenféle nyilvánosan elérhető információ összegyűjtésére, például a Conversation UK néhány legutóbbi bejegyzésére vagy nyilvános csoportokban történő bejegyzésére.

a Conversation UK Facebook oldaláról gyűjtött bejegyzések. Nic Lochlainn.
egy nyilvános csoportból gyűjtött bejegyzések a Facebook-on. Gr Enterprises Nic Lochlainn

de megpróbálja túllépni a nyilvános információkon, hogy összegyűjtse az alkalmazásba be nem jelentkezett Facebook – felhasználók adatait – például Zuckerberg például-visszatérési hibákat. A Facebook “lájkjait” nem lehet begyűjteni, mert Zuckerberg nem használja az alkalmazásomat, és nem adott engedélyt az adataihoz való hozzáféréshez.

a Facebook legújabb API-frissítései alatt az alkalmazás engedélyei szükségesek a nyilvános profil tulajdonságain túlmutató információk összegyűjtéséhez. Ez azt jelenti, hogy a felhasználóknak be kell jelentkezniük egy alkalmazásba, és engedélyezniük kell a hozzáférést minden más információhoz, hogy a fejlesztők begyűjthessék az adatokat.

sikertelen kísérlet a Mark Zuckerberg által kedvelt oldalak betakarítására. Nic lochlainn

Legimate kutatás veszélyben?

míg a hirdetésekkel töltött vállalatok egyértelműen érdekeltek az adatok “kihasználásában”, az akadémikusok – az elmúlt hetekben – felhívták a figyelmet a Facebook adatait betakarító kutatókra. A gyakorlat viszonylag mainstream lett a társadalomtudományi kutatásban.

sürgető, hogy a jövőbeli kutatásokat milyen mértékben korlátozhatják a Facebook API-jának változásai. De érdemes megjegyezni, hogy az adatok összegyűjtése után a Facebook-amely törvényesen üldözheti azokat az embereket, akik “megsértik” a szolgáltatási feltételeit, hogy megpróbálják őket az adatok törlésére kényszeríteni – korlátozott ellenőrzést gyakorol az adatok felett.

azoknak a kutatóknak, akik azon aggódnak, hogy a Cambridge Analytica botrány hogyan befolyásolja munkájukat, érdemes szemmel tartani, hogy a Facebook milyen változásokat hajt végre a következő API-frissítésben. Ez jobban megértheti, hogy milyen típusú kutatás engedélyezhető a begyűjtött Facebook-adatok felhasználásából – és mi lehet véglegesen kizárva.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.