lunes, 3 de octubre de 2016

Big Data y ventanas al futuro

Un mundo paralelo

Con cada click, con cada toque de la pantalla, con cada palabra que digitamos, con cada site que visitamos, con cada comentario que emitimos estamos dejando una huella inconfundible de quienes somos, nuestros gustos, nuestros deseos, nuestros temores, lo que hacemos, con quién estamos e incluso por qué. Cada vez que clicamos inocente y alegremente la pantalla estamos dejando reflejada una parte de nosotros mismos.

Hablar de esto no es un simple desahogo de paranoia o de rebeldía contenida, es una realidad muy tangible. No se trata de entrar en pánico, aislarse o tratar de "destrozar el sistema", es más bien un recordatorio de algo con lo que debemos convivir, de lo que debemos ser conscientes y a cuyas reglas, nos gusten o no, estamos sujetos.

La Internet es casi un mundo paralelo, un complejo y rico ecosistema en el que nuestros egos más profundos cobran vida e interactúan de mil maneras tanto entre ellos como con su entorno.  Y es que se debe aceptar el hecho de que a nuestros computadores, smartphones y más dispositivos, y con ellos a la Internet, hemos confiado información que consideramos confidencial, sensible, privada. Pensemos un momento en lo que nuestros aparatos contarían sobre nosotros si pudieran hablar. Ese es precisamente el asunto, pues nuestros aparatos ciertamente "hablan", y esa es en parte la esencia del Big Data.

Las 3 V's del Big Brother

Existen múltiples definiciones y conceptos sobre Big Data, siendo quizá el enfoque que ofrece Gartner el más preciso:  las 3 V's por Volumen, Variedad y Velocidad. Esto implica que Big Data agrupa a todas aquellas tecnologías que tienen la capacidad de procesar grandes volúmenes de datos, de variadas fuentes y formatos, a gran velocidad. Por ejemplo: nuestros datos personales.

Bajo esta perspectiva "Big Data" llega a convertirse en un eufemismo para algo así como Big Brother. Pensar que Big Data nos puede llevar a la sociedad distópica de 1984 de George Orwell es una idea exagerada y no menos escalofriante, pero tampoco es del todo descabellada.

Se podría pensar que al manejar nuestra información solamente en páginas seguras, utilizando contraseñas complejas, evitando aplicaciones de dudosa procedencia, limpiando regularmente nuestros navegadores, etc., se podrá mantener la confidencialidad de nuestra identidad en la red. Si bien es cierto todas estas medidas ayudan en la red, y de hecho son medidas indispensables de seguridad, el Big Data está más allá y puede "desenmascarar" nuestra identidad.

Uno de los grandes dilemas con el Big Data es que su gran capacidad de procesamiento de información puede llegar a trazar una especie de huella digital de nosotros. Cada día, mientras navegamos o utilizamos aplicaciones móviles, informamos quiénes somos pues implícitamente estamos respondiendo decenas de preguntas y tomando decenas de decisiones que quedan registradas en un historial al que grandes sistemas de información como Google, Amazon, Facebook, Twitter, etc., tienen acceso en forma casi ilimitada. Pensemos en el potencial que tiene toda esa información combinada.

Uno de los argumentos con los que las empresas e instituciones recopilan información sobre nuestra actividad es la optimización o personalización de la experiencia en la red, para ofrecernos productos y servicios más ajustados a nuestras expectativas. En parte esto es cierto, sin embargo no es menos cierto que la personalización de un sitio requiere que el sistema nos conozca y en cierto modo se adelante a nuestros requerimientos. Es un juego psicológico, recibimos lo que esperamos dando pistas sobre quiénes somos todo el tiempo.

Juego del subconsciente

En 2002 es psicólogo estadounidense Daniel Kahneman ganó el premio Nobel de Económia por sus trabajos sobre la forma en que decidimos. Demostró que nuestra noción de decisiones voluntarias muchas veces no es más que un artificio de nuestra mente para hacernos creer que tomamos decisiones que en realidad son tomadas por nuestro subconsciente. Esto explica por qué muchas de nuestras decisiones, y no solamente las triviales sino también las críticas e importantes, pueden ser tan irracionales o incomprensibles.

Kahneman estableció que nuestras decisiones dependen de una compleja interacción entre dos mecanismos: uno automático, de respuesta casi inmediata y del que de hecho depende nuestra supervivencia, y uno consciente, no automático, cuya respuesta muchas veces requiere un gran esfuerzo y tomar papel y lápiz. El truco en nuestra mente está en que muchas decisiones que podríamos apostar hemos tomado con una gran dosis de razonamiento no son tomadas en forma consciente, sino que son ejecutadas en forma automática por el primer mecanismo, y por tanto se trata de respuestas que ofrece nuestro subconsciente. Esto deja un vacío que luego se llena en nuestra mente dándonos la ilusión de que hemos decidido, cuando en realidad nunca fue así.

Ahora bien, decisiones triviales e importantes pueden seguir el camino del mínimo esfuerzo y ser tomadas en forma automática convirtiéndonos por ejemplo en compradores compulsivos, o en sujetos desconfiados. Este comportamiento es exhibido abiertamente en muchos sitios de la red, como en sitios de juegos y de compras en línea.

Si se recopila y procesa toda la información relacionada con nuestra toma de decisiones y preferencias se va generando una imagen única, una huella digital que dice mucho sobre nosotros, tal vez más de lo que nos gustaría.

Incontables fuentes de datos

A los datos derivados de nuestro comportamiento en la red hay que sumarle información adicional como datos biométricos. Pues sí, los sistemas que utilizamos pueden obtener información como nuestra velocidad escritura en el teclado, nuestra velocidad de lectura, la cantidad de horas que podemos pasar frente al computador, nuestro nivel de actividad, etc.

Los micrófonos y cámaras de nuestros equipos además registran imágenes y sonidos de nosotros y de nuestro entorno. Y no es necesario que nos espíen o lo hagan sin nuestro conocimiento pues registramos mucha información de estos dispositivos en forma totalmente libre y voluntaria.

Las tecnologías móviles aportan más datos, pues además permiten registrar nuestra ubicación geográfica y todos nuestros movimientos, desde nuestra rutina diaria hasta nuestros recorridos clandestinos.

Finalmente está toda la información que libre y voluntariamente colocamos en la red como publicaciones en redes sociales, comentarios, estados de ánimo, búsquedas en navegadores, nuestros registros en diferentes sitios, etc., etc. Para hacerse una idea, en el mundo actualmente se generan en un solo día alrededor de 500 millones de tweets, se realizan 3.5 billones de búsquedas en Google, se observan alrededor de 6 billones de vídeos en Youtube, se envían aproximadamente 102 billones de emails y se navega por alrededor de 1 billón de  sitios web por nombrar solamente algunas de las estadísticas.

Big Data tiene la capacidad de consolidar, almacenar, y procesar información asociada con toda esa actividad agregándole un valor enorme. Imaginen lo valioso que puede ser para cualquier empresa conocer los hábitos de compra y la psicología de sus clientes, comprender por qué el mercado presenta ciertos comportamientos, y más aún, poder predecir el impacto de sus estrategias comerciales y ajustarlas sobre una base de información real y concreta. El Big Data es una herramienta que sin duda está transformando a las empresas y redefiniendo su forma de competir en el corto plazo. 

El Tío Ben nos lo había advertido

Más allá de los temas puramente comerciales existe un potencial enorme, la información puede ser utilizada en otros ámbitos. Por ejemplo en planificación urbana, servicios de salud y medicina, preparación de planes de emergencia y desastres, gobierno y servicios públicos, movilidad y transporte, educación, etc. Planificar, desarrollar y controlar sobre una base de información concreta, coherente y altamente correlacionada puede significar un ahorro de tiempo y recursos incalculable. Bajo estas condiciones Big Data puede convertirse en una herramienta de desarrollo de gran valor, pero también con mucho poder. Y bueno, como dijo Franklin D. Roosevelt en uno de sus discursos ( y lo imprimió Stann Lee en la célebre frase del Tío Ben a Peter Parker) un gran poder conlleva una gran responsabilidad. 

El poder del Big Data radica en que además de información valiosa para la planificación y para el desarrollo de estrategias a gran escala, existe la posibilidad de ir refinando el procesamiento a un nivel altamente granular partiendo de una escala global a escala de países, de ciudades, de barrios, de sectores y finalmente de individuos. Es esta capacidad de refinamiento la que levanta las alarmas en muchos sectores.

Por un lado está el desbalance que puede provocar una herramienta con tanto poder entre naciones y sectores de la sociedad. Quienes disponen de la tecnología, los medios y el conocimiento pueden fácilmente dominar y adelantarse a otras naciones y sectores, aumentando las brechas existentes.

Por otro lado está la inherente invasión a la privacidad. Si la información puede ser desmenuzada a nivel de individuos todos estamos sujetos a la observación y posible juicio de nuestro comportamiento. Esa incómoda sensación de que nos están observando deja de ser una simple sensación y se convierte en una escalofriante realidad.

Riesgo y oportunidad

El término Big Data es relativamente nuevo. Apareció por primera vez en 1997 en un artículo de Michael Cox y David Ellsworth que trataba sobre la visualización de grandes volúmenes de datos y los problemas que esto conlleva debido al consumo exhaustivo de memoria, disco y recursos computacionales. 

Desde entonces la utilización de tecnologías de computación distribuida y el notable incremento en el poder computacional de los equipos han ido resolviendo poco a poco los problemas relacionados con el manejo de la carga computacional que implica el manejo de grandes volúmenes de información, hasta alcanzar en la actualidad un cierto nivel de madurez que le ha permitido extenderse y estar cada vez más al alcance de todos quienes se interesen por este tipo de tecnologías. Así por ejemplo, Hadoop, la herramienta de almacenamiento distribuido más difundida es software libre, al igual que sucede con herramientas de procesamiento estadístico sofisticado y visualización como R o plataformas minería de datos y aprendizaje de máquinas como Weka.

De la mano del Big Data están tecnologías como la Inteligencia Artificial y la Minería de Datos que hacen posible obtener valor de la información y generar productos en forma de interpretaciones, predicciones y herramientas para toma de decisiones. En cierto modo todas estas herramientas son motivadas por un deseo humano más profundo, la predicción del futuro. Desde obscuros rituales, pasando por oráculos y potentes alucinógenos hasta complejas interpretaciones cuánticas del universo, uno de los grandes sueños del hombre es tener una ventana del futuro que nos permita quizás reformular nuestro presente. Lo más cercano y real que tenemos a abrir estas ventanas al futuro es el aprovechamiento del Big Data.
Desde esta perspectiva el temor del Big Brother se desvanece, pues la tecnología de Big Data no es una tecnología exclusiva de ciertas élites, sino que está al alcance de todos, y como humanidad, todos tenemos de alguna manera los mismos anhelos en cuanto a nuestra necesidad por visiones del futuro.

El verdadero reto de Big Data entonces no es esconderse, escudarse y aislarse, sino integrarse inteligentemente como participantes activos, dispuestos a jugar en un terreno en el que existen nuevas reglas, muchas de las cuales recién se empiezan a entender y escribir. El análisis de información a nivel de Big Data es casi un terreno virgen en el que los más osados van tomando la delantera, y en el que, si queremos integrarnos, debemos participar. No se trata de asustarse, quejarse y lamentarse, sino de desarrollar, lanzarse y arriesgarse, no dejar que otros escriban las reglas por nosotros sino luchar por que se respeten nuestras reglas y nuestros puntos de vista. 

El primer paso es que nosotros mismos entendamos que navegar por la red tiene riesgos, pero también oportunidades. Debemos hacer entender esto a nuestras autoridades, a nuestros gobernantes, muchos de los cuales desafortunadamente son completamente ignorantes o sencillamente no tienen interés en este tipo de tecnologías.

Alguien dijo que si los servicios son gratuitos en la Internet es porque nosotros somos los productos. En el mundo del Big Data es nuestra gran oportunidad para dejar de ser simples productos.





No hay comentarios: