Todas las personas, alguna vez, hemos oído hablar de Big Data, incluso cada vez que hablamos de internet, de datos o de almacenamiento online, nos estamos relacionando con este término. En la última década se observó un crecimiento exponencial en torno a Big data. Pero ¿cómo lo podríamos definir? ¿Qué es Big Data?
Entre las definiciones existentes, podemos destacar dos ideas importantes: por un lado el almacenaje de un gran volumen de datos (hay quienes hablan de 500 terabytes semanales) y, por el otro, el análisis cuantitativo y visual de los datos con el objetivo de encontrar patrones, establecer leyes y predecir conductas.
Les proporcionamos una forma fácil de entender y memorizar lo que es Big Data que consta en 3 V:
- El volumen ( terabytes, petabytes, exabytes).
- La velocidad (datos, en continua generación).
- La variedad (textos, imágenes, sonidos).
Posteriormente, algunos informes han añadido a la definición una cuarta V correspondiente al término veracidad. Esta definición, anclada en el volumen, solo tiene sentido si tenemos en cuenta como principal fuente de datos los blogs, las redes sociales y los sensores. Existen dos intelectuales que se han destacado en sus estudios sobre Big Data: Tom Boellstorff y Bill Maurer (antropólogos de la Universidad de California), quienes proponen las 3R para entender el fenómen de Big Data:
- Relación
- Reconocimiento
- Descomposición (Rof)
Estos autores apuestan por esta definición porque entienden que Big Data nace del significado que se extrae de las relaciones entre datos. Subrayan que los datos son reconocidos como tal porque siguen unas condiciones socioculturales.
Thick Data
Para poder entender mejor el concepto de thick Data hay que relacionarlo con Big Data. En la era digital, las empresas y organizaciones acumulan datos cuantitativos que, usados estadísticamente, han demostrado que son muy útiles y valiosos para detectar comportamientos, extraer patrones de conducta, etc. Las cifras, por más grandes que sean, no explican por qué las personas hacen lo que hacen, sus emociones ni sentimientos. Para cubrir este vacío aparecen los Thick Data (datos denso o información densa). Término que acuñó en 2013 la antropóloga Tricia Wong en un guiño al intelectual del mismo campo, Clifford Geetz, y su descripción densa como método para analizar los fenómenos, las culturas y las relaciones entre personas.
Para investigadores como Boellstorff, los datos tienen una naturaleza densa, interpretativa y contextual. Los datos deben tomarse como construcciones propias basadas en las construcciones de otras personas sobre objetos imaginados por una comunidad determinada. Sostiene que cada persona es un animal inserto en tramas de significación que ella misma ha tejido.
Algunas de sus características:
- Son interpretativos: interpretan el flujo de discursos sociales.
- Rescatan lo dicho por quienes intervienen (hechos, dichos, cosas).
- Son microscópicos, en contextos pequeños.
¿Cómo podríamos llevar a la práctica este concepto?
Lego es un ejemplo de una compañía que apostó por los Thick Data. A comienzos del siglo XXl la empresa pasaba por una importante crisis. Tras horas de trabajo observando cómo niñas y niños jugaban con productos Lego, el equipo investigador terminó concluyendo que las infancias no estaban interesadas en muñecos articulados, sino que disfrutaban cuando podían inventar, crear y construir sus propios juguetes. Como fruto de ese estudio, Lego decidió potenciar su línea de bloques de construcción abandonando las otras.
Defensa de la teoría
Hay un descrédito hacia la teoría, bajo el argumento de que si disponemos de grandes cantidades de datos y de métodos estadísticos, no necesitamos teorías y modelos o hipótesis que deban demostrarse o refutarse con experimentos. Desde el punto de vista humanístico, en la era de Big Data, las teorías y los modelos cobran aún mayor importancia porque es necesario explicar y entender los fenómenos analizados mediante abstracciones. Y porque los datos son construcciones, no existen como entidades autónomas, responden a marcos interpretativos bien definidos.
Dentro del Panóptico: el lado oscuro de los datos
Uno de los aspectos que genera más preocupación en torno a este tema es el uso y almacenamiento de los datos. El gobierno controla a la ciudadanía para garantizar su seguridad. Actualmente, cada persona es vigilada y también incitada a revelar sus más íntimos secretos a través de la confesión (como los estados de Facebook). Al consumir cultura, nuestros actos son registrados cada vez que usamos internet. Lo mismo pasa cuando visitamos un museo; la cámara de vigilancia está ahí para proteger nuestro patrimonio de delitos y robos, pero también para controlar a quien vigila.
Por Paloma Acosta, Mateo Bertello, Braian Comment, Julián Mautino, Tomás Perinotto, estudiantes del Seminario Ciberculturas, ciclo 2019.