Facebook data harvesting: lo que necesitas saber

Facebook obtiene la mayor parte de su dinero de la publicidad y, a medida que el escándalo de Cambridge Analytica continúa atormentando a la empresa de Mark Zuckerberg, los usuarios exigen saber cómo se están manipulando y recolectando sus datos.

Pero aunque la preocupación por la privacidad de los usuarios de Facebook ha aumentado, ha quedado claro desde el inicio de Facebook que su negocio se basa en la vigilancia generalizada de las personas, cuyos datos son el producto.

Algunos han retratado las revelaciones del escándalo de Cambridge Analytica, en el que se supuestamente se obtuvieron datos de 50 millones de perfiles de Facebook, como una «crisis existencial», mientras que otros han destacado las implicaciones potenciales para la investigación académica.

En resumen, los métodos de recolección de datos de Facebook se han convertido en un tema de preocupación repentina y generalizada.

¿Qué es la recolección de datos?

Los datos de cosecha, como sugiere su nombre agrícola, son similares a los de recolección de cultivos porque implican recolección y almacenamiento con la expectativa de una recompensa futura.

Los datos se pueden recopilar de diferentes maneras, desde un simple copiado y pegado hasta una programación más complicada. El método elegido a menudo está limitado por el sitio que se está cosechando. En niveles de búsqueda simples, muchos sitios combaten la recolección automatizada con Google s y res, que ayudan a los sitios a diferenciar entre humanos y bots.

Si alguna vez has copiado y pegado texto de Facebook o guardado una imagen de Twitter, has recopilado datos de redes sociales. La acción de «captura de pantalla» está permitida en la mayoría de los sitios porque los usuarios generalmente solo pueden acceder a información que es pública o visible para ellos porque han iniciado sesión. Además, sería imposible erradicar por completo los métodos más simples de recolección de datos, como tomar notas y tomar fotografías.

Facebook y otras redes sociales están más preocupados por restringir la recolección automatizada de datos, debido a las demandas en los servidores web y para controlar quién tiene acceso a qué datos (y por qué). La información personal y el comportamiento en las redes sociales tienen valor comercial, político y de investigación.

Una cera del jefe de Facebook Mark Zuckerberg.

Las redes sociales deciden sus propias políticas de uso, equilibrando los intereses comerciales con terceros y las preocupaciones normativas sobre la privacidad de los usuarios, a menudo descritas en los documentos de la empresa como malabares con la optimización del «comportamiento del cliente» y el cumplimiento de los «estándares comunitarios».

¿Cómo se recopilan los datos?Instagram Facebook, Twitter, Instagram y otros sitios utilizan las interfaces de programación de aplicaciones (API)

para restringir el acceso de los posibles recolectores. Las API funcionan como un intermediario de software que permite que el equipo de un investigador o desarrollador de aplicaciones «hable» con una red social de manera controlada.

Una de las principales condiciones implica restricciones sobre cómo se pueden usar y compartir los datos recopilados, que se pueden perseguir de manera agresiva. En 2010, el programador de computadoras Pete Warden recolectó datos de 210 millones de perfiles públicos de Facebook para fines de investigación. Pero no solicitó permiso a Facebook primero, violando así sus términos de servicio. Más tarde se enfrentó a la amenaza de acciones legales de Facebook y se vio obligado a eliminar los datos, en un eco de la supuesta participación del investigador académico Aleksandr Kogan en el escándalo de Cambridge Analytica.

La aplicación de Kogan, denominada «thisisyourdigitallife», desarrollada en 2014 a través de su empresa Global Science Research (GSR), aparte de su trabajo universitario, era una prueba de personalidad en la que 270.000 usuarios iniciaron sesión, aceptando que tendría acceso a parte de su información personal y también a algunos de los datos de sus amigos. También significaba que esos amigos no habían dado su consentimiento para que sus datos se utilizaran de esta manera.

Facebook actualiza rutinariamente su API y en 2014 la compañía confirmó que dejaría de permitir que las aplicaciones de terceros tuvieran acceso a los datos de los amigos de los usuarios de la aplicación. Esto deshabilitó el método de recopilación de datos supuestamente utilizado por Kogan.

Hay varias maneras diferentes en que los desarrolladores, que deben aceptar las políticas de Facebook, pueden recopilar datos utilizando la API de la compañía y todos asumen al menos habilidades básicas de programación informática. Una de las formas más fáciles de hacer esto es acceder a la API utilizando una caja de herramientas de software especializada: Python y R tienen herramientas diseñadas específicamente para este propósito. En mi investigación, uso el paquete Rfacebook para recopilar datos de Facebook.

Autorizar mi aplicación usando el paquete Rfacebook en RStudio – con mi ID único redactado. Gráinne Nic Lochlainn

Una distinción clave entre mi aplicación y las demás es que no estoy interactuando con los usuarios, porque mi aplicación no está en vivo. Mi aplicación es esencialmente una forma automatizada de copiar y pegar información de grupos públicos de Facebook. Utilizo la API de Facebook para investigar cómo se han utilizado las páginas públicas de grupos comunitarios para protestar por la austeridad en Irlanda.

Como estoy recopilando datos públicos de páginas públicas, no estoy pidiendo a los usuarios que se conecten y no hay una interfaz de front-end en Facebook, aunque esto se puede hacer utilizando los kits de herramientas API de Facebook para ampliar la cantidad de datos a los que se puede acceder. Es un método que plantea una serie de preguntas sobre la funcionalidad, la información del usuario y los permisos de acceso.

La API de Facebook se puede usar para recopilar todo tipo de información disponible públicamente, como algunas de las publicaciones recientes de Conversation UK o publicaciones en grupos públicos.

Publicaciones recogidas de la página de Facebook de Conversation UK. Gráinne Nic Lochlainn.
Publicaciones recolectadas de un grupo público en Facebook. Gráinne Nic Lochlainn

Pero intenta ir más allá de la información pública para recopilar datos de usuarios de Facebook que no han iniciado sesión en la aplicación, como Zuckerberg, por ejemplo, devuelve errores. Los «me gusta» de Facebook no se pueden recopilar porque Zuckerberg no es un usuario de mi aplicación y no le ha concedido permiso para acceder a sus datos.

En las últimas actualizaciones de la API de Facebook, se requieren permisos de aplicación para recopilar cualquier información que vaya más allá de las propiedades de perfil público. Esto significa que los usuarios tienen que iniciar sesión en una aplicación y autorizar el acceso a cualquier otra información para permitir a los desarrolladores recopilar los datos.

Un intento fallido de recoger las páginas que le han gustado a Mark Zuckerberg. Gráinne Nic Lochlainn

¿Investigación legal amenazada?

Mientras que las empresas llenas de anuncios claramente tienen un interés en» aprovechar » los datos, los académicos, en las últimas semanas, han llamado la atención sobre los investigadores que recopilan datos de Facebook. La práctica se ha convertido en una práctica relativamente común en la investigación en ciencias sociales.

El grado en que la investigación futura podría restringirse por cambios en la API de Facebook es urgente. Pero vale la pena señalar que, una vez que se han recopilado los datos, Facebook, que puede perseguir legalmente a las personas que «violan» sus términos de servicio para tratar de obligarlas a eliminar datos, tiene un control limitado sobre dónde terminan los datos.

Para los investigadores que se preocupan por cómo el escándalo de Cambridge Analytica afectará su trabajo, vale la pena vigilar qué cambios implementa Facebook en su próxima actualización de API. Puede proporcionar una mejor comprensión del tipo de investigación que se puede permitir a partir del uso de los datos recolectados de Facebook, y lo que puede excluirse permanentemente.

Deja una respuesta

Tu dirección de correo electrónico no será publicada.