20 de diciembre de 2016

Big data

Big data es un concepto informático relacionado con el manejo de grandes cantidades de datos. En nuestra sociedad de la información los seres humanos estamos constantemente generando y almacenando información, con distintos orígenes, formatos y estructuras. Desde hace décadas, todo tipo de organizaciones, empresas y administraciones manejan bases de datos de las que extraen información sobre sus clientes y sus administrados, o sea, sobre nosotros.

Los ciudadanos que no estamos afectados por la brecha digital tenemos más de un aparato (smartphone, tablet, ordenador portátil) para conectarnos a Internet, buscar información, actuar en redes sociales, rellenar formularios, hacer compras, etc. El ritmo de crecimiento de esta cantidad de información que generamos cada día está aumentando notablemente y cada vez más hacen falta herramientas, algoritmos y metodologías más potentes, capaces de extraer información de valor casi en tiempo real.

La generación y almacenamiento de datos sobre consumo existe desde el comienzo de la tecnologías de información y comunicaciones (TIC), inicialmente con la retirada de dinero en cajeros automáticos, el pago mediante tarjeta de crédito o las reposiciones de almacenes mediante códigos de barras.

En muchas transacciones digitales se genera una información que queda registrada por parte del banco, de la entidad emisora de la tarjeta, o del comercio que vende, pero fuera del alcance del consumidor. Además, a través de las tarjetas de fidelización, los comercios o cadenas de comercios llegan a saber todo sobre nuestras pautas de consumo (qué compramos, dónde compramos, cuándo compramos, cómo pagamos)


Todo este flujo de datos se ha multiplicado en 10 años desde la generalización de Internet. Cada vez que visitamos una página web nuestras andanzas digitales quedan registradas en las molestas cookies. En las compras por Internet (portales de consumo), se asocia nuestra cuenta de correo electrónico a nuestra tarjeta de crédito. Es frecuente tener que rellenar formularios para acceder a contenidos. Nuestros perfiles en redes sociales se asocia nuestra cuenta de correo electrónico con nuestra lista de contactos y con los contenidos intercambiados. Y nuestros smartphones, con los que cada vez hacemos más compras, asocian una tarjeta SIM, nuestra ubicación física (GPS), nuestro número de teléfono, nuestra lista de contactos y nuestra cuenta de correo electrónico. 

Además de estos datos generados por nosotros mismos existen muchos otros datos relacionados con nosotros mismos que son generados por máquinas (imágenes de video grabadas en las calles, ubicación del GPS, señales de telefonía móvil).

Todo esto genera cada día millones de big data, de datos masivos, dispersos y sin aparentemente sin valor, pero si estos datos se analizan y organizan según una estructura de interés para los vendedores pueden llegar a ser un importante activo comercial que les permite segmentar a sus clientes clientes.

El concepto big data se define por 3 variables que empiezan por v (volumen, variedad y velocidad de los datos), a las que en ocasiones se añaden 2 v más (veracidad y valor de los datos). Su propósito es convertir datos en información más o menos estructurada y filtrada que facilite (a quien la tiene) la toma de decisiones, en general sobre su oferta comercial extraer valor de estos datos para conocer mejor a los clientes, analizar el pasado y hacer predicciones de futuro. 

Muchas veces nos graban "por seguridad" las conversaciones telefónicas que mantenemos con nuestro banco o empresa de telecomunicaciones. Pero la grabación nunca está en nuestro poder. Es una demostración de la asimetría existente en la privacidad de los datos ¿Quién es el propietario de esa información sobre nosotros y nuestro consumo? En una entrada anterior sobre los contadores inteligentes se exponía otro ejemplo flagrante de asimetría.

Los usuarios de esta información estructurada son entidades financieras (aseguradoras, crédito), administraciones públicas (gobiernos, hacienda, fraude, educación, sanidad, seguridad ciudadana, tráfico) o empresas (fabricantes, distribuidores, energía, comunicaciones).

El big data no es una moda informática más, ya que este análisis y comercio de información personal puede plantear cuestiones éticas sobre confidencialidad, transparencia o discriminación. Como ciudadanos, como consumidores y como votantes debemos ser conscientes de que el big data es la información que todos (empresas y administraciones) quieren tener sobre nosotros, de que constantemente vamos dejando pistas y de que nada cae en saco roto y que nuestra promiscuidad en facilitar datos puede ser utilizada para insistir en pesadas propuestas comerciales personalizadas que -sin haberlas solicitado- nos llegan vía teléfono y/o mensajes y/o correo electrónico.

Para llegar a esto hace falta interpretar, ser capaces de extraer conclusiones a partir de esta marea de datos. Esto está dando pie a nuevas profesiones emergentes como científico de datos. Para esta profesión de futuro hace falta saber de informática, de psicología y de sociología, conocer bien el negocio y, sobre todo, saber hacerse las preguntas adecuadas

Solo dentro del concepto de big data es posible comprender el valor económico de aplicaciones como WhatsApp, comprada por una millonada por una red social. El poder y el valor de empresas como Google (la que aloja los contenidos de este blog) radica en obtener millones datos, procesarlos y usar o vender esta información estructurada, con fines comerciales, al margen de los intereses de los ciudadanos.

No hay comentarios:

Publicar un comentario