Facebook data harvesting: what you need to know

Facebook tienaa suurimman osan rahoistaan mainonnalla, ja – Cambridge Analytica – skandaalin edelleen vainoaessa Mark Zuckerbergin yritystä-käyttäjät vaativat tietää, miten heidän tietojaan väännetään ja korjataan.

mutta vaikka huoli Facebook – käyttäjien yksityisyydestä on noussut, Facebook-perustamisesta lähtien on ollut selvää, että sen liiketoiminta perustuu ihmisten laajaan seurantaan, jonka tiedot ovat tuote.

jotkut ovat kuvanneet Cambridge Analytica-skandaalin paljastukset – joissa tietoja väitettiin kerättävän 50m Facebook-profiileista – ”eksistentiaaliseksi kriisiksi”, kun taas toiset ovat korostaneet mahdollisia vaikutuksia akateemiseen tutkimukseen.

lyhyesti sanottuna Facebook – tietojen keruumenetelmät ovat nousseet äkillisen ja laajan huolen kohteeksi.

mitä tietojen keruu on?

Korjuutiedot, kuten maatalousnimi antaa ymmärtää, muistuttavat sadon keräämistä, koska ne sisältävät keräämistä ja varastointia tulevaa palkkiota odotellen.

tietoja voidaan kerätä eri tavoin, yksinkertaisesta kopioinnista ja liittämisestä monimutkaisempaan ohjelmointiin. Valittua menetelmää rajoittaa usein korjattavan kohteen sijainti. Yksinkertaisilla hakutasoilla monet sivustot taistelevat automaattista korjuuta vastaan Google s: n ja res: n avulla, jotka auttavat sivustoja erottamaan ihmiset ja botit toisistaan.

jos olet joskus kopioinut ja liittänyt tekstiä Facebookista tai tallentanut kuvan Twitteristä, olet kerännyt sosiaalisen median tietoja. Toiminta ”screenshotting” on sallittua useimmilla sivustoilla, koska käyttäjät voivat yleensä vain käyttää tietoja, jotka ovat joko julkisia tai näkyviä heille, koska he ovat kirjautuneet sisään. Olisi myös mahdotonta hävittää kokonaan yksinkertaisimpia tiedonkeruumenetelmiä, kuten muistiinpanojen tekemistä ja valokuvien ottamista.

Facebook ja muut sosiaaliset verkostot ovat kiinnostuneempia rajoittamaan automaattista tiedonhankintaa, mikä johtuu verkkopalvelimiin kohdistuvista vaatimuksista ja valvomaan, kenellä on pääsy mihinkin tietoon (ja miksi). Henkilökohtaisilla tiedoilla ja käytöksellä sosiaalisessa mediassa on kaupallista, poliittista ja tutkimuksellista arvoa.

Facebook-pomo Mark Zuckerbergin vahakuva.

sosiaaliset verkostot päättävät omista käyttöpolitiikoistaan, tasapainottaen kaupalliset intressit kolmansien osapuolten kanssa ja lakisääteiset käyttäjien yksityisyyteen liittyvät huolenaiheet – joita YRITYKSEN asiakirjoissa usein kuvaillaan ”asiakaskäyttäytymisen” optimoinniksi ja ”yhteisön standardien”noudattamiseksi.

miten tietoja kerätään?

sovellusrajapintoja (Application Programming Interfaces, API) käyttävät Facebook, Twitter, Instagram ja muut sivustot rajoittamaan hakkuukoneiden pääsyä. Sovellusliittymät toimivat ohjelmistona, jonka avulla tutkijan tai sovelluskehittäjän tietokone voi ”puhua” yhteisöpalvelulle hallitusti.

yksi tärkeimmistä ehdoista koskee rajoituksia sille, miten kerättyä tietoa voidaan käyttää ja jakaa, mihin voidaan pyrkiä aggressiivisesti. Vuonna 2010 tietokoneohjelmoija Pete Warden keräsi tutkimustarkoituksiin tietoja 210M julkisista Facebook-profiileista. Hän ei kuitenkaan ensin hakenut lupaa Facebookilta ja rikkoi näin sen käyttöehtoja. Myöhemmin Facebook uhkasi häntä oikeustoimilla ja joutui poistamaan tiedot – kaikuna akateemikko Aleksandr Koganin väitetystä osuudesta Cambridge Analytica-skandaaliin.

Koganin sovellus, jota kutsutaan nimellä ”thisisyourdigitallife”, kehitettiin vuonna 2014 hänen yrityksensä Global Science Research (GSR) – erillään hänen yliopistotyöstään – oli persoonallisuustesti, johon 270 000 käyttäjää kirjautui ja hyväksyi, että sillä olisi pääsy joihinkin heidän henkilökohtaisiin tietoihinsa ja myös heidän ystäviensä tietoihin. Se tarkoitti myös sitä, että nämä ystävät eivät olleet suostuneet siihen, että heidän tietojaan käytettiin tällä tavalla.

Facebook päivittää OHJELMOINTIRAJAPINTAANSA rutiininomaisesti, ja vuonna 2014 yhtiö vahvisti lopettavansa kolmansien osapuolten sovellusten pääsyn tietoihin sovelluksen käyttäjien ystävistä. Tämä poisti Koganin käyttämäksi väitetyn tiedonkeruumenetelmän käytöstä.

on olemassa muutamia eri tapoja, joilla kehittäjät – joiden on suostuttava Facebook – käytäntöihin-voivat kerätä tietoja yhtiön API: n avulla ja he kaikki omaksuvat vähintään perustiedot tietokoneohjelmointitaidoista. Yksi helpoimmista tavoista tehdä tämä on käyttää API käyttämällä asiantuntija ohjelmisto toolbox-Python ja R on työkaluja suunniteltu erityisesti tähän tarkoitukseen. Tutkimuksessani käytän Rfacebook-pakettia Facebook-tietojen keräämiseen.

sallimalla minun app käyttäen rfacebook-paketti RStudio – minun ainutlaatuinen ID redacted. Gráinne Nic Lochlainn

keskeinen ero sovellukseni ja muiden välillä on se, että en ole vuorovaikutuksessa käyttäjien kanssa, koska sovellukseni ei ole live. Sovellukseni on käytännössä automatisoitu tapa kopioida ja liittää tietoja julkisista Facebook-ryhmistä. Käytän Facebook API: a tutkiakseni, miten julkisia yhteisöryhmäsivuja on käytetty protestoimaan ankaruutta Irlannissa.

koska kerään julkisia tietoja julkisilta sivuilta, en pyydä käyttäjiä kirjautumaan sisään, eikä Facebookilla ole front-end-käyttöliittymää, vaikka tämä voidaan tehdä Facebook API toolkits-sovelluksen avulla, jolla voidaan laajentaa käytettävissä olevaa datamäärää. Se on menetelmä, joka herättää useita kysymyksiä toiminnallisuudesta, käyttäjätiedoista ja käyttöoikeuksista.

Facebook API: n avulla voidaan kerätä kaikenlaista julkisesti saatavilla olevaa tietoa, kuten joitakin Conversation UK: n viimeaikaisia julkaisuja tai julkaisuja julkisissa ryhmissä.

viestit poimittu Conversation UK: n Facebook-sivulta. Gráinne Nic Lochlainn.
viestit poimittu julkisesta ryhmästä Facebookista. Gráinne Nic Lochlainn

mutta yrittää siirtyä julkisen tiedon ulkopuolelle poimiakseen tietoja Facebook – käyttäjistä, jotka eivät ole kirjautuneet sovellukseen – kuten esimerkiksi Zuckerberg-palautusvirheet. Facebook ”tykkäyksiä” ei voi korjata, koska Zuckerberg ei ole sovellukseni käyttäjä eikä hän ole myöntänyt sille lupaa päästä käsiksi tietoihinsa.

Facebookin uusimpien API-päivitysten mukaan sovellusten käyttöoikeuksia tarvitaan, jotta Facebook voi kerätä kaikkea muuta tietoa kuin julkisen profiilin ominaisuuksia. Tämä tarkoittaa, että käyttäjien on kirjauduttava sovellukseen ja sallittava pääsy muihin tietoihin, jotta kehittäjät voivat kerätä tietoja.

epäonnistunut yritys harventaa Mark Zuckerbergin suosimia sivuja. Gráinne Nic Lochlainn

Legimaattitutkimus uhattuna?

vaikka mainosten täyttämillä yrityksillä on selvästi kiinnostusta ”vipuvaikutukseen”, tutkijat ovat-viime viikkoina – kiinnittäneet huomiota tutkijoihin, jotka keräävät Facebook – tietoja. Käytännöstä on tullut suhteellisen valtavirtaa yhteiskuntatieteellisessä tutkimuksessa.

se, missä määrin Facebookiin tehdyt API-muutokset voisivat rajoittaa tulevaa tutkimusta, on painava asia. Mutta on syytä huomata, että kun tiedot on korjattu, Facebook – joka voi laillisesti jatkaa ihmisiä, jotka ”rikkovat” sen käyttöehtoja yrittää pakottaa heidät poistamaan tietoja – on rajoitettu valvoa, mihin tiedot, jotka päätyvät.

niiden tutkijoiden, jotka tuskailevat Cambridge Analytica-skandaalin vaikutusta työhönsä, kannattaa pitää silmällä, mitä muutoksia Facebook toteuttaa seuraavassa API-päivityksessään. Se voi antaa paremman käsityksen siitä, minkälainen tutkimus voidaan sallia käytöstä kerättyjen Facebook-tietojen – ja mitä voidaan pysyvästi sulkea pois.

Vastaa

Sähköpostiosoitettasi ei julkaista.