domingo, 16 de octubre de 2016

Open Data, materia prima para el desarrollo tecnológico

El valor de los bits

Nicholas Negroponte, fundador del Media Lab del MIT en su libro "Ser Digital" de 1995 cuenta que en alguna ocasión en una conferencia le solicitaban en la recepción del hotel indicar el precio de su computador portátil. Él respondía entre unos dos mil y unos dos millones de dólares!

La respuesta puede parecer absurda hasta que consideramos que, en términos del mismo Negroponte, el valor de los bits puede ser muy superior al valor de los átomos, o dicho de otra manera, el valor de la información puede ser muy superior al valor de equipo que la contiene.

Pero claro, el valor de los bits no siempre es objetivo. Así, las fotografías digitales que ha tomado un explorador en el viaje de su vida pueden tener un enorme valor simbólico y emocional, pero quizás ser triviales para otra persona. Sin embargo la clave privada de una billetera de bitcoins tendrá un valor concreto y objetivo para cualquier persona. Bajo esta perspectiva, el valor de los bits depende de su naturaleza y su origen, pero también puede llegar a depender de su destino.

El valor de los bits, o más bien de la información, cuando se habla de su naturaleza y de su origen, es un valor que ya sea objetiva o subjetivamente está definido, y por tanto es como si se hablase de un producto terminado y listo para ser utilizado. Así las fotografías, piezas musicales, claves privadas, algoritmos, libros digitales, módulos de software, etc., son producto de un procesamiento, ya sea este automático o manual, y por tanto ya incluyen un valor definido.

Cuando se habla del valor de los bits dependiendo de su destino, la historia es diferente. Aquí no se habla de un valor concreto sino más bien de un valor potencial. No se trata de un producto terminado y listo para ser utilizado, sino que se trata de materia prima o "bits en bruto" que deben ser procesados para obtener un producto final. En este caso es más complicado hablar de un valor, sea este objetivo o subjetivo, pues quien establecerá ese valor no es solo la naturaleza de la información contenida, sino la eficiencia y sofisticación de los procesos con que estos bits van a ser tratados.

La fuente más prometedora y con el mayor potencial a nivel de bits como materia prima es sin duda el Open Data o los datos abiertos. El Open Data Institute ODI, cofundado por Sir Tim Berners-Lee en 2012 hace referencia a algunos estudios que presentan datos interesantes sobre el valor de la utilización de datos abiertos a nivel mundial.

Por ejemplo, en Estados Unidos los datos liberados de Lansat habrían generado ahorros de entre 350 y 436 millones de dólares. En este mismo país una empresa de Open Data se habría vendido por 930 millones de dólares.
Por otro lado, un estudio del European Data Portal que indica que en la EU28+ la utilización de datos abiertos habría reducido los costos asociados con la administración pública en un estimado de 1.7 billones de euros además de ahorrar alrededor de 629 millones de horas de trabajo innecesario.

Así mismo, un estudio de McKinsey de 2013 muestra que el Open Data podría ayudar a liberar entre 3 y 5 trillones de dolares anuales en 7 sectores de la economía.

Estas cifras dan una idea del valor de los bits, del valor de la información y de su enorme impacto en la economía mundial.

Open Data es más que transparencia

La transparencia surge de forma espontánea del Open Data. El hecho de declarar un set de datos como Open Data es por sí mismo un ejercicio de transparencia. Sin embargo no son sinónimos y por tanto no deberían ser el único fin que persiguen las instituciones gubernamentales.

En múltiples reuniones de trabajo, charlas y conferencias en las que se menciona Open Data se habla de transparencia de forma casi exclusiva, y esto va generando una incómoda sensación de paranoia con respecto a la liberación de datos, va degradando el concepto de los datos abiertos hasta dejarlos reducidos a una simple herramienta de control de gasto público.

En nuestra región este tipo de conceptos errados respecto al Open Data ha desnaturalizado tanto su principio fundamental que Open Data se considera un sinónimo de Open Government. Ambos conceptos son equivalentes en muchos ámbitos y tienen principios similares, sin embargo el Open Data es más amplio y no se puede tratar como una simple política de control gubernamental.

Los datos liberados por las instituciones gubernamentales o privadas deben ser vistos como lo que realmente son, como materia prima, como un insumo primordial con el que existe la posibilidad de desarrollar múltiples productos y servicios enfocados no solamente en transparencia sino además en productividad.

Productividad a partir de Open Data es un concepto que los gobiernos de la región deben empezar a desarrollar con mayor decisión, apoyo y convicción. Tristemente es algo que hasta el momento no se ve y a lo que se ha prestado una atención muy marginal. A nivel de tecnologías de información las consecuencias de no tomar las decisiones correctas en el momento correcto nos dejarán nuevamente en una posición del tipo "las venas abiertas de América Latina", y esta vez no serán lamentos por el oro, la plata o el azúcar, sino por un recurso menos tangible pero más poderoso, nuestros datos. 

A nivel de todo el mundo surgen cada día nuevas herramientas capaces de procesar la información con niveles de sofisticación que nunca antes se habían conseguido. La Inteligencia Artificial y la Minería de Datos extraen valor de grandes "minas de información" de manera cada vez más eficiente y el Big Data es una herramienta que cada vez se hace más común en las empresas.

Bajo estos precedentes y en este contexto resulta irónico, ridículo y hasta indignante que en nuestro entorno se hable de Open Data de forma tan tibia y apenas pensando en transparencia como un gran logro.

Materia prima para una nueva revolución industrial

Estamos parados en medio de una nueva revolución industrial de la que tal vez no somos de todo conscientes. En esta nueva revolución los datos ya no constituyen el valor agregado, sino que son la materia prima. 


Conseguir que los gobiernos de nuestra región lleguen a entender este concepto puede ser la piedra angular para garantizar el desarrollo de la sociedad en esta nueva era de información. Una idea que puede parecer tan simple y básica sin embargo tiene un gran alcance y requiere de un cambio total de mentalidad y conceptos para muchas instituciones, empresas y sobre todo la misma sociedad.

Existen varios pasos a seguir para que este concepto se concrete y los datos puedan ser utilizados efectivamente como materia prima.

El primer paso es definir los sets de datos que pueden y deben ser liberados tanto por empresas como por instituciones. Así mismo se deben establecer los criterios a través de los cuales un set de datos se puede considerar como apto para ser liberado. Esta parte puede ser compleja desde el punto de vista de la negociación, pues tradicionalmente las empresas e incluso las instituciones se creen dueñas de toda la información que generan, un concepto que debe discutirse y modificarse.

El segundo paso es garantizar la generación de materia prima, esto implica que las actividades y procesos realizados por las empresas y entidades gubernamentales deben llevar asociados procesos virtuales que se conviertan en fuentes de datos. Dichos datos deben respetar criterios que garanticen su reusabilidad (formatos apropiados) y que aseguren su calidad.

El tercer paso es el favorecimiento de la adopción de tecnologías que permitan un flujo libre, constante y predecible de datos por parte de empresas e instituciones. Este paso puede incluir el mejoramiento de la infraestructura de red y servicios tecnológicos de las empresas e instituciones. Es chocante escuchar que ciertas entidades hablan de que tienen datos abiertos porque tienen página web. Esta miopía tanto técnica como conceptual debe ser corregida.

El último paso es involucrar en este proceso a participantes claves de la sociedad para construir una industria sobre los sets de datos disponibles y los que seguirán liberándose. Dichos participantes deben incluir a la academia, las empresas de tecnología, expertos, aficionados y entusiastas. La realización de eventos como hackatones y ferias tecnológicas generan expectativa y pueden dar un impulso a iniciativas frescas, nuevas e interesantes.

En resumen, se deberían seguir al menos cuatro pasos de la siguiente manera:
  • Exploración y liberación de datasets de interés.
  • Establecimiento de mecanismos para asegurar la generación, disponibilidad y continuidad de los datasets.
  • Establecimiento de mecanismos de distribución masiva y eficiente de los datasets.
  • Levantamiento de una industria destinada a explotar y extraer valor de los datasets.
Vale indicar que estos pasos pueden ser parte de un ciclo constante, pues a cada momento pueden surgir nuevos datasets de interés y puede haber nuevos interesados en agregar valor. 

¿Hacia dónde mirar ahora?

La industria de los datos gana cada vez mayor terreno y existen innumerables ejemplos de casos de éxito con la liberación de datos. Sin embargo es importante que no se centre la mirada exclusivamente en soluciones llave en mano ni en empresas que nos ofrezcan todo de la manera fácil y con recetas casi mágicas.

La historia nos ha dejado amargos ejemplos de lo que implica convertirnos en simples consumidores de servicios y tecnología como sucedió en su momento con el boom petrolero o con las industrias mineras o agrícolas.

Una gran ventaja que presenta el mundo globalizado de hoy es que todos tenemos accesos a la tecnología de diferentes formas. No debemos conformarnos con ser consumidores sino que debemos garantizar nuestra posición como productores y como exploradores de nuestros propios sets de datos basados en nuestros intereses y necesidades como región  y como sociedad.

Eduardo Galeano cita como frase inicial de su libro de Las Venas Abiertas De América Latina "hemos guardado un silencio bastante parecido a la estupidez". Quizás es la única frase con la que realmente concuerdo en esta obra, pues refleja lo que muchos gobiernos de nuestra región hacen en la actualidad con respecto a la nueva revolución industrial: guardan silencio. O en ocasiones hablan en forma tibia o sin fundamento, lo que resulta tanto o más nocivo que guardar silencio.

Como referencias a seguir y como documentos a tomar muy en cuenta me gustaría dejar los siguientes links:

El Open Data Institute:
http://theodi.org/

El Open Data Barometer:
http://opendatabarometer.org/

El Open Data Index de la Open Knowledge Fundation:
http://index.okfn.org/dataset/

El reporte de McKinsey sobre la liberación de valor con el Open Data:
http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/open-data-unlocking-innovation-and-performance-with-liquid-information

Un estudio de la Comisión Europea sobre la generación de valor a partir del
Open Data:
http://www.europeandataportal.eu/sites/default/files/edp_creating_value_through_open_data_0.pdf

No hay comentarios: