Facebook sběr dat: co potřebujete vědět

Facebook vydělává většinu svých peněz z reklamy a – jak skandál Cambridge Analytica nadále pronásleduje společnost Marka Zuckerberga-uživatelé požadují vědět, jak jsou jejich data hádána a sklízena.

ale zatímco obavy o soukromí uživatelů Facebook se zvýšil, je to jasné, protože Facebook je založení, že jeho podnikání je založeno na rozšířeném sledování lidí, jejichž data jsou produktem.

někteří vylíčili odhalení skandálu Cambridge Analytica – ve kterém byla data údajně získána z 50m profilů Facebook-jako „existenciální krize“, zatímco jiní zdůraznili potenciální důsledky pro akademický výzkum.

Stručně řečeno, metody sběru dat Facebook se staly předmětem náhlých a rozšířených obav.

co je sběr dat?

údaje o sklizni, jak napovídá jeho zemědělský název, jsou podobné sběru plodin, protože zahrnují sběr a skladování s očekáváním budoucí odměny.

Data lze sklízet různými způsoby, od jednoduchého kopírování a vkládání až po složitější programování. Zvolená metoda je často omezena sklizeným místem. Na jednoduchých úrovních vyhledávání, mnoho webů bojuje proti automatickému sběru pomocí Google S A res, které pomáhají webům rozlišovat mezi lidmi a roboty.

pokud jste někdy zkopírovali a vložili text z Facebook nebo uložili obrázek z Twitteru, shromáždili jste data sociálních médií. Akce „screenshotting“ je povolena na většině webů, protože uživatelé mají obvykle přístup pouze k informacím, které jsou pro ně veřejné nebo viditelné, protože se přihlásili. Také by nebylo možné úplně vymýtit nejjednodušší metody sběru dat, jako je vytváření poznámek a fotografování.

Facebook a další sociální sítě se více zajímají o omezení automatizovaného sběru dat kvůli požadavkům na webové servery a o kontrolu, kdo má přístup k jakým datům (a proč). Osobní informace a chování na sociálních médiích mají komerční, politickou a výzkumnou hodnotu.

Voskovec šéfa Facebook Marka Zuckerberga.

sociální sítě rozhodují o svých vlastních zásadách používání, vyvažují obchodní zájmy s třetími stranami a regulační obavy o soukromí uživatelů-často popsané ve firemních dokumentech jako žonglování s optimalizací „chování zákazníků“ a dodržováním „standardů Společenství“.

jak se shromažďují údaje?

aplikační programovací rozhraní (API) používají Facebook, Twitter, Instagram a další weby k omezení přístupu budoucích kombajnů. API fungují jako softwarový přechod, který umožňuje počítači výzkumného pracovníka nebo vývojáře aplikací „mluvit“ se sociální sítí kontrolovaným způsobem.

jednou z hlavních podmínek je omezení, jak mohou být shromážděná data použita a sdílena, což může být agresivně sledováno. V roce 2010 počítačový programátor Pete Warden sbíral data z 210m veřejných Facebook profilů pro výzkumné účely. Nejprve však neuspěl s žádostí o povolení Facebook, čímž porušil jeho podmínky služby. Později čelil hrozbě právních kroků ze strany Facebook a byl nucen data smazat – v ozvěně údajné účasti akademického výzkumníka Aleksandra Kogana na skandálu Cambridge Analytica.

Koganova aplikace, nazvaná „thisisyourdigitallife“, vyvinutá v roce 2014 prostřednictvím své společnosti Global Science Research (GSR) – odděleně od jeho univerzitní práce – byla testem osobnosti, do kterého se přihlásilo 270,000 XNUMX uživatelů, kteří akceptovali, že bude mít přístup k některým svým osobním údajům a některým údajům svých přátel. To také znamenalo, že tito přátelé nesouhlasili s tím, aby jejich data byla použita tímto způsobem.

Facebook rutinně aktualizuje své API a v roce 2014 společnost potvrdila, že přestane umožňovat aplikacím třetích stran přístup k údajům o přátelích uživatelů aplikací. Tím byla zakázána metoda sběru dat údajně používaná společností Kogan.

existuje několik různých způsobů, jak vývojáři-kteří jsou povinni souhlasit s politikami Facebook – mohou sbírat data pomocí API společnosti a všichni předpokládají alespoň základní dovednosti v oblasti programování. Jedním z nejjednodušších způsobů, jak toho dosáhnout, je přístup k API pomocí specializovaného softwarového panelu nástrojů-Python a R mají nástroje navržené speciálně pro tento účel. Ve svém výzkumu používám balíček Rfacebook ke sběru dat Facebook.

autorizace mé aplikace pomocí balíčku Rfacebook v RStudio – s mým jedinečným ID redigovaným. Gráinne Nic Lochlainn

klíčovým rozdílem mezi mou aplikací a ostatními je to, že neinteraguji s uživateli, protože moje aplikace není živá. Moje aplikace je v podstatě automatizovaný způsob kopírování a vkládání informací z veřejných skupin Facebook. Používám Facebook API k výzkumu, jak byly stránky veřejných komunitních skupin použity k protestu proti úsporným opatřením v Irsku.

protože sbírám veřejná data z veřejných stránek, nežádám uživatele o přihlášení a na Facebook není žádné front-end rozhraní, i když to lze provést pomocí Facebook API toolkits rozšířit množství dat, ke kterým lze přistupovat. Je to metoda, která vyvolává řadu otázek týkajících se funkčnosti, informací o uživateli a přístupových oprávnění.

Facebook API lze použít ke sběru všech druhů veřejně dostupných informací, jako jsou některé nedávné příspěvky nebo příspěvky ve veřejných skupinách.

příspěvky získané z konverzace UK na Facebook stránce. Gráinne Nic Lochlainn.
příspěvky získané z veřejné skupiny na Facebook. Gráinne Nic Lochlainn

ale pokouší se přesunout za veřejné informace, aby shromáždil data uživatelů Facebook, kteří se do aplikace nepřihlásili-například Zuckerberg-vracejí chyby. Facebook „lajky“ nelze sklízet, protože Zuckerberg není uživatelem mé aplikace a neudělil jí povolení k přístupu ke svým datům.

pod Facebook nejnovější aktualizace API, oprávnění aplikace jsou vyžadovány pro sběr veškeré informace nad rámec vlastností veřejného profilu. To znamená, že uživatelé se musí přihlásit do aplikace a povolit přístup k jakýmkoli dalším informacím, aby vývojáři mohli data sbírat.

neúspěšný pokus o sklizeň stránek, které se Markovi Zuckerbergovi líbily. Gráinne Nic Lochlainn

Legimate výzkum v ohrožení?

zatímco společnosti plněné reklamami mají zjevně zájem na“ využití “ dat, akademici-v posledních týdnech-upozornili na výzkumníky, kteří sbírají data Facebook. Tato praxe se stala relativně hlavním proudem ve výzkumu společenských věd.

rozsah, v jakém by budoucí výzkum mohl být omezen změnami API Facebook, je naléhavý. Je však třeba poznamenat, že po sběru dat má Facebook – který může legálně pronásledovat lidi,kteří „porušují“ jeho podmínky služby, aby se je pokusili donutit k vymazání dat-omezenou kontrolu nad tím, kde data končí.

pro vědce, kteří se obávají, jak skandál Cambridge Analytica ovlivní jejich práci, stojí za to sledovat, jaké změny Facebook implementuje ve své další aktualizaci API. To může poskytnout lepší pochopení typu výzkumu, který může být povolen z použití sklizených dat Facebook – a co může být trvale vyloučeno.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna.