Qué es el Big Data y por qué debería preocuparte

big data reportaje

Seguramente alguna vez te hayas parado a pensar en la cantidad de datos que la llamada sociedad de la información genera a diario. La cifra es difícil de establecer, pero podemos hacernos una idea si tenemos en cuenta que actualmente Google procesa todos los días alrededor de 24 petabytes (1.000.000.000.000.000 de bytes).

Lo cierto es que las utilidades de esta “ingeniería de datos” son muchas, casi todas vinculadas con el rédito económico que se obtiene utilizando la información, aunque cada vez más se están encontrando salidas menos “materialistas”.

A pesar de que ya hace varios años que se viene hablando repetidamente del Big Data, son muchas las incógnitas y poco el conocimiento que se tiene de esta tendencia a nivel general, algo que está cambiando a marchas forzadas gracias a los continuos escándalos de la NSA americana y de 'whistle-blowers' como Snowden.

El concepto de Big Data

Tampoco existe un momento definido para la acuñación del concepto de Big Data, aunque todos los expertos coinciden en señalar que es algo que empezó a denominarse así alrededor de 2010, si bien la acumulación masiva de datos e información digital se viene produciendo desde hace más de una década.

Y la tendencia es completamente al alza, ya que se espera que para 2020 el volumen de datos almacenado en Internet sea 44 veces mayor al actual.

big data reportaje

Ventajas e inconvenientes del Big Data

Para comprender bien lo que es el Big Data hemos de diferenciar dos aspectos fundamentales: por un lado, el de los beneficios económicos que supone para las empresas, y por otro las ventajas que tiene para los usuarios.

Desde el punto de vista empresarial, según explica Javier Martínez, Director Técnico de NetApp para España y Portugal, “el negocio de los servidores y del almacenamiento masivo tiene multitud de beneficios que ofrecer a las empresas, facilitando el trabajo o reduciendo los costes, por ejemplo. Esa posibilidad de poder trabajar sin necesidad de pisar la oficina está cada vez más presente. El acceso remoto a cualquier información que podamos necesitar sin importar cuánto de lejos estemos de la oficina ofrece un grado de libertad y movilidad hasta hace poco impensables. Facilita, a fin de cuentas, la continuidad de negocio.”

javier martínez net app

Martínez añade: “el reto, y lo que marca la diferencia en estas nuevas soluciones de Big Data es el poder realizar un aprovechamiento más directo, a nivel de negocio, de toda esta información”.

Para los usuarios, el Big Data conlleva bastantes beneficios pero también algunas amenazas. Entre los primeros encontramos, sin ir más lejos, todas las posibilidades de almacenamiento en la nube; el poder enviar o recibir archivos a través de WhatsApp; el acceso a redes sociales; descargar un disco de iTunes; enviar un correo electrónico; o hacer una compra online.

Todo esto requiere de un buen rendimiento del Big Data para poder funcionar, y es que sin este procesamiento masivo de datos no podríamos concebir prácticamente nada del Internet actual. Pero también hay peligros, con la amenaza a nuestra privacidad como principal protagonista.

¿Qué hay de nuestra privacidad?

Si nos paramos a pensar fríamente en el funcionamiento de la ingeniería de datos, no cuesta mucho llegar a la conclusión de que, al final, nosotros mismos somos el producto: se comercializa con nuestros datos, con la información que intercambiamos en Internet, con nuestros gustos... Y aunque esto no tiene por qué ser negativo en un principio, la verdad es que es un asunto delicado.

snowden big data

La divulgación, necesaria sin ninguna duda, de proyectos como el programa PRISM norteamericano, que durante años estuvo espiando correos electrónicos de miles de usuarios con el supuesto objetivo de combatir el terrorismo, ayuda poco a nuestra tranquilidad.

Para Javier Martínez, “el uso ético y legal de la información tendrá que ser regulado por las autoridades pertinentes. El análisis de toda la información que generamos, ya sea en las redes sociales, en nuestros dispositivos móviles, o en nuestras cuentas de correo, puede ser útil para nosotros mismos, pero se debe garantizar el consentimiento y el uso lícito de estos datos. Por eso, en el escenario actual, con un modelo cloud y la movilidad como pieza esencial de los negocios, es el momento de conocer las amenazas de antemano, motivo que explica por qué los líderes de seguridad están apostando por un modelo orientado a la inteligencia”.

Sin pretender caer en la teoría de la conspiración, tendemos hacia una sociedad cada vez más conectada, en la que la mayor parte de nuestros dispositivos se apoya en la Red: móviles, tabletas, televisores inteligentes, GPS, etc.

Esto contribuye a que estemos conectados e identificados casi de forma permanente y automática, enviado y recibiendo datos las 24 horas del día, unos datos que, en la mayor parte de las ocasiones, esconden nuestros gustos, intereses, opiniones, una información tremendamente valiosa a nivel empresarial e institucional.

De ahí que la necesidad de una regulación seria y eficaz sea primordial.

Los móviles

Si hay un dispositivo que se ha infiltrado en nuestro día a día y que guarda nuestra información más personal, ese es el móvil. Los smartphones son ya nuestra agenda, nuestro álbum de fotos, nuestra puerta más inmediata a Internet y a las redes sociales, nuestro reproductor de música e incluso nuestro GPS.

Por eso, el papel que juegan en el Big Data es fundamental. Haciendo un buen uso de esta información se puede llegar, por ejemplo, a mejorar la movilidad del tráfico, prediciendo atascos, ofreciendo rutas alternativas o informando de accidentes u obras en las carreteras, por ejemplo.

Yendo un paso más allá, investigadores de la universidad de Birmingham presentaron un algoritmo con el que es posible predecir delitos gracias a la monitorización de teléfonos móviles.

El planteamiento recuerda demasiado al Gran Hermano de Orwell, ya que su propuesta consiste en hacer un rastreo de la señal de GPS, del histórico de mensajes enviados y de los números a los que habían hecho o de los que se habían recibido llamadas. De esta forma, a partir del algoritmo creado por los investigadores, se puede localizar a una persona con un margen de error de 20 metros y predecir sus movimientos e intenciones, lo cual, aplicado a la delincuencia y utilizado con personas sospechosas o vigiladas, podría ayudar a evitar actos delictivos.

Aplicaciones de todo tipo

No todas las aplicaciones del Big Data en la vida diaria dan para hacer el guión de un thriller de Hollywood. Sin ir más lejos Google Trends utiliza las posibilidades de la ingeniería de datos para predecir, por ejemplo, cómo se comportará el virus de la gripe en cualquier parte del mundo.

big data

Se basa en las tendencias de búsqueda, en este caso en las palabras relacionadas con la gripe, para ofrecer un panorama que sirva a la hora de tomar medidas y prevenir epidemias o ataques más agresivos del virus.

Hasta el momento se ha comportado de manera infalible, errando sólo en las predicciones del año pasado debido a que los medios tuvieron tanto interés en el funcionamiento de la herramienta que con las noticias publicadas contribuyeron a que los resultados no fuera del todo acertados, ya que no estaban basados en búsquedas de usuarios afectados por la enfermedad.

El futuro es sin duda prometedor y el horizonte de posibilidades del Big Data parece quedar muy lejos. En este camino será necesario proteger nuestra privacidad y no esperar solamente a que este sea salvaguardada por gobiernos o instituciones, sino que hacer un uso prudente de los datos y la información que compartimos en Internet está exclusivamente en nuestras manos.

Lo que debemos hacer

El de la seguridad es uno de los aspectos más comprometidos del Big Data. Javier Martínez, Director Técnico de NetApp, considera que 2013 marcará el inicio de la comercialización de tecnologías de Big Data en Seguridad: una tendencia que replanteará la aproximación al mundo de la seguridad, las soluciones y la inversión en los próximos años.

Algunas de las pautas de seguridad son:

  • Sentar las bases para una estrategia holísitica de ciberseguridad
  • Establecer una arquitectura de datos compartidos para la Seguridad de la Información
  • Migrar a una arquitectura unificada de seguridad
  • Herramientas de seguridad de Big Data abiertas y escalables
  • Reforzar las capacidades del SOC en términos de ciencia de datos
  • Aprovechar la inteligencia de las amenazas externas.

Artículo adaptado del original de @Mario__Jimenez para nuestra revista Personal Computer & Internet