IGOR SANTOS GRUEIRO
Investigador de DeustoTech Computing y profesor en la Facultad de Ingeniería
isantos@deusto.es
@santos_grueiro
Blog s3lab.deusto.es/blog
Creo que entre las mejores definiciones que he leído de «Big Data» cabría destacar la pronunciada por Dan Ariely: «Big Data es como el sexo en la adolescencia: todo el mundo habla sobre ello, pero nadie sabe realmente cómo se hace, así que todo el mundo dice que lo está haciendo». Habiendo trabajado en análisis de datos, no puedo sino ver un abuso de un buzzword hasta para definir «datos que no caben en hoja de excel».
Pese al escepticismo, creo que hemos pasado a una realidad en la que los datos son vitales. Peter Sondergaard, vicepresidente de la reputada consultora Gartner, dijo: «La información es la gasolina del siglo 21 y el análisis de datos el motor de combustión». La democratización de los servicios online genera una gran cantidad de datos listos para convertirse en valiosa información.
En el aprendizaje automático hay métodos que a partir de datos, pueden traducir texto, sugerir búsquedas, predecir trayectorias de automóviles… y además han sabido adaptarse a la mayor cantidad de datos con nuevas y más robustas tecnologías.
Pero, ¿no habéis sentido en ocasiones que vuestros datos en la red ya no son vuestros? Yo sí. Cuando utilizamos una red social para reconectar con algunos compañeros de instituto o cuando subimos ficheros a un sistema de almacenamiento en la nube, hemos de ser conscientes de sus riesgos. ¿Y todo el mundo entiende esto? Permitidme que lo dude…
Con Big Data, podemos ir mucho más allá, correlacionando datos de texto, imágenes (metadatos y las propias imágenes), datos localización, etc.. Ser o no consciente, no tiene tanta importancia. Por ejemplo, aunque tengamos una cuenta de twitter, blindada y anónima, podríamos saber quién está detrás —en mi equipo identificamos a los autores de un caso de ciberbullying mediante el texto de la cuenta que los acosadores usaban—. Y es que de cara a nuestros datos online, tenemos demasiadas plataformas, contextos, etc. El único aspecto en el que centrar la privacidad es el usuario. S3Lab – DeustoTech Computing trabaja en una iniciativa que llamamos «User Centric , Context Aware, Cross-Platform Security & Privacy» para que los datos y la seguridad vuelvan (o estén) en manos del usuario. ¿Esto significa que «Big Data» es «malo»? No, es presente y es futuro. Lo único, dejadme que os aconseje, inspirándome en la definición de Dan Ariely: «El Big Data es como el sexo adolescente. Mejor si tomamos precauciones.»