Facebook data harvesting: ce trebuie să știți

Facebook își câștigă majoritatea banilor din publicitate și – în timp ce scandalul Cambridge Analytica continuă să bântuie compania lui Mark Zuckerberg – utilizatorii cer să știe cum sunt încurcate și recoltate datele lor.

dar, în timp ce îngrijorarea cu privire la confidențialitatea utilizatorilor Facebook a crescut, a fost clar de la înființarea Facebook că afacerea sa se bazează pe supravegherea pe scară largă a oamenilor, ale căror date sunt produsul.

unii au descris dezvăluirile scandalului Cambridge Analytica – în care se presupune că au fost colectate date din 50 de milioane de profiluri Facebook – ca o „criză existențială”, în timp ce alții au evidențiat implicații potențiale pentru cercetarea academică.

pe scurt, metodele de recoltare a datelor Facebook au devenit un subiect de îngrijorare bruscă și răspândită.

ce este recoltarea datelor?

datele de recoltare, așa cum sugerează și numele său agricol, sunt similare cu colectarea culturilor, deoarece implică colectarea și depozitarea cu așteptarea unei recompense viitoare.

datele pot fi recoltate în moduri diferite, variind de la simpla copiere și lipire la programare mai complicată. Metoda aleasă este adesea constrânsă de site-ul recoltat. La niveluri simple de căutare, multe site-uri combate recoltarea automată cu Google s și res, care ajută site-urile să facă diferența între oameni și roboți.

dacă ați copiat și lipit vreodată text de pe Facebook sau ați salvat o imagine de pe Twitter, ați recoltat date de pe rețelele de socializare. Acțiunea „screenshotting” este permisă pe majoritatea site-urilor, deoarece utilizatorii pot accesa de obicei numai informații care sunt fie publice, fie vizibile pentru ei, deoarece s-au conectat. De asemenea, ar fi imposibil să eradicăm complet cele mai simple metode de recoltare a datelor, cum ar fi notarea și fotografierea.

Facebook și alte rețele sociale sunt mai preocupate de restricționarea recoltării automate a datelor, din cauza cerințelor serverelor web și de a controla cine are acces la ce date (și de ce). Informațiile personale și comportamentul pe social media au valoare comercială, politică și de cercetare.

o lucrare de ceară a șefului Facebook, Mark Zuckerberg.

rețelele sociale decid propriile politici de utilizare, echilibrând interesele comerciale cu părțile terțe și preocupările de reglementare privind confidențialitatea utilizatorilor – adesea descrise în documentele companiei ca jonglând cu optimizarea „comportamentului clienților” și aderarea la „standardele comunitare”.

cum se recoltează datele?

interfețele de programare a aplicațiilor (API) sunt utilizate de Facebook, Twitter, Instagram și alte site-uri pentru a restricționa accesul potențialilor recoltatori. API-urile funcționează ca un software care permite computerului unui cercetător sau dezvoltator de aplicații să „vorbească” cu o rețea socială într-un mod controlat.

una dintre principalele condiții implică restricții privind modul în care datele colectate pot fi utilizate și partajate, care pot fi urmărite agresiv. În 2010, programatorul de calculator Pete Warden a recoltat date de la 210 milioane de profiluri publice de Facebook în scopuri de cercetare. Dar nu a reușit să solicite mai întâi permisiunea de la Facebook, încălcând astfel termenii și condițiile sale. Ulterior, el s – a confruntat cu amenințarea unei acțiuni legale din partea Facebook și a fost forțat să șteargă datele-într-un ecou al presupusului rol al cercetătorului academic Aleksandr Kogan în scandalul Cambridge Analytica.

aplicația lui Kogan, denumită „thisisyourdigitallife”, dezvoltată în 2014 prin intermediul companiei sale Global Science Research (GSR) – separată de activitatea sa Universitară – a fost un test de personalitate la care s-au conectat 270.000 de utilizatori, acceptând că va avea acces la unele dintre informațiile lor personale și la unele dintre datele prietenilor lor. De asemenea, a însemnat că acei prieteni nu au consimțit ca datele lor să fie utilizate în acest fel.

Facebook își actualizează în mod obișnuit API-ul, iar în 2014 compania a confirmat că va înceta să permită aplicațiilor terțe să aibă acces la date despre prietenii utilizatorilor de aplicații. Aceasta a dezactivat metoda de colectare a datelor presupusă a fi utilizată de Kogan.

există câteva moduri diferite în care dezvoltatorii – cărora li se cere să fie de acord cu politicile Facebook – pot recolta date folosind API-ul companiei și toți își asumă cel puțin abilități de bază de programare pe computer. Una dintre cele mai ușoare modalități de a face acest lucru este să accesați API folosind un set de instrumente software specializat – Python și R au instrumente concepute special în acest scop. În cercetarea mea, folosesc pachetul Rfacebook pentru a recolta date Facebook.

autorizarea aplicației mele folosind pachetul Rfacebook în RStudio-cu ID-ul meu unic redactat. Gr Nic Lochlainn

o distincție cheie între aplicația mea și altele este că nu interacționez cu utilizatorii, deoarece aplicația mea nu este live. Aplicația mea este în esență o modalitate automată de a copia și lipi informații din grupurile publice de Facebook. Folosesc API-ul Facebook pentru a cerceta modul în care paginile grupurilor comunitare publice au fost folosite pentru a protesta împotriva austerității în Irlanda.

pentru că recoltez date publice din pagini publice, nu cer utilizatorilor să se conecteze și nu există o interfață front-end pe Facebook, deși acest lucru se poate face folosind seturile de instrumente API ale Facebook pentru a extinde cantitatea de date care pot fi accesate. Este o metodă care ridică o serie de întrebări despre funcționalitate, informații despre utilizator și permisiuni de acces.

API-ul Facebook poate fi folosit pentru a recolta tot felul de informații disponibile publicului, cum ar fi unele dintre postările recente ale conversației din Marea Britanie sau postări în grupuri publice.

postări recoltate de pe pagina de Facebook a conversației din Marea Britanie. Nic Lochlainn.
postări recoltate de la un grup public pe Facebook. Gr Nic Lochlainn

dar încearcă să treacă dincolo de informațiile publice pentru a recolta date ale utilizatorilor Facebook care nu s – au conectat la aplicație – cum ar fi Zuckerberg, de exemplu-returnează erori. „Like-urile” Facebook nu pot fi recoltate, deoarece Zuckerberg nu este un utilizator al aplicației mele și nu i-a acordat permisiunea de a accesa datele sale.

sub cele mai recente actualizări API Facebook, permisiunile aplicației sunt necesare pentru a recolta orice informație dincolo de proprietățile profilului public. Aceasta înseamnă că utilizatorii trebuie să se conecteze la o aplicație și să autorizeze accesul la orice alte informații pentru a permite dezvoltatorilor să recolteze datele.

o încercare eșuată de a recolta paginile care i-au plăcut lui Mark Zuckerberg. Gr Nic Lochlainn

cercetare Legimate sub amenințare?

în timp ce companiile umplute cu anunțuri au în mod clar un interes în „valorificarea” datelor, academicienii-în ultimele săptămâni – au atras atenția asupra cercetătorilor care recoltează date Facebook. Practica a devenit relativ mainstream în cercetarea științelor sociale.

măsura în care cercetările viitoare ar putea fi restricționate de modificările aduse API-ului Facebook este una presantă. Dar este demn de remarcat faptul că, odată ce datele au fost recoltate, Facebook – care poate urmări în mod legal persoanele care „încalcă” termenii și condițiile sale pentru a încerca să le forțeze să șteargă datele – are un control limitat asupra locului în care se termină datele.

pentru cercetătorii care sunt îngrijorați de modul în care scandalul Cambridge Analytica le va afecta activitatea, merită să fim atenți la ce schimbări implementează Facebook în următoarea sa actualizare API. Poate oferi o mai bună înțelegere a tipului de cercetare care poate fi permis din utilizarea datelor Facebook recoltate – și a ceea ce poate fi exclus definitiv.

Lasă un răspuns

Adresa ta de email nu va fi publicată.