Mostrando entradas con la etiqueta Open Data. Mostrar todas las entradas
Mostrando entradas con la etiqueta Open Data. Mostrar todas las entradas

domingo, 16 de octubre de 2016

Open Data, materia prima para el desarrollo tecnológico

El valor de los bits

Nicholas Negroponte, fundador del Media Lab del MIT en su libro "Ser Digital" de 1995 cuenta que en alguna ocasión en una conferencia le solicitaban en la recepción del hotel indicar el precio de su computador portátil. Él respondía entre unos dos mil y unos dos millones de dólares!

La respuesta puede parecer absurda hasta que consideramos que, en términos del mismo Negroponte, el valor de los bits puede ser muy superior al valor de los átomos, o dicho de otra manera, el valor de la información puede ser muy superior al valor de equipo que la contiene.

Pero claro, el valor de los bits no siempre es objetivo. Así, las fotografías digitales que ha tomado un explorador en el viaje de su vida pueden tener un enorme valor simbólico y emocional, pero quizás ser triviales para otra persona. Sin embargo la clave privada de una billetera de bitcoins tendrá un valor concreto y objetivo para cualquier persona. Bajo esta perspectiva, el valor de los bits depende de su naturaleza y su origen, pero también puede llegar a depender de su destino.

El valor de los bits, o más bien de la información, cuando se habla de su naturaleza y de su origen, es un valor que ya sea objetiva o subjetivamente está definido, y por tanto es como si se hablase de un producto terminado y listo para ser utilizado. Así las fotografías, piezas musicales, claves privadas, algoritmos, libros digitales, módulos de software, etc., son producto de un procesamiento, ya sea este automático o manual, y por tanto ya incluyen un valor definido.

Cuando se habla del valor de los bits dependiendo de su destino, la historia es diferente. Aquí no se habla de un valor concreto sino más bien de un valor potencial. No se trata de un producto terminado y listo para ser utilizado, sino que se trata de materia prima o "bits en bruto" que deben ser procesados para obtener un producto final. En este caso es más complicado hablar de un valor, sea este objetivo o subjetivo, pues quien establecerá ese valor no es solo la naturaleza de la información contenida, sino la eficiencia y sofisticación de los procesos con que estos bits van a ser tratados.

La fuente más prometedora y con el mayor potencial a nivel de bits como materia prima es sin duda el Open Data o los datos abiertos. El Open Data Institute ODI, cofundado por Sir Tim Berners-Lee en 2012 hace referencia a algunos estudios que presentan datos interesantes sobre el valor de la utilización de datos abiertos a nivel mundial.

Por ejemplo, en Estados Unidos los datos liberados de Lansat habrían generado ahorros de entre 350 y 436 millones de dólares. En este mismo país una empresa de Open Data se habría vendido por 930 millones de dólares.
Por otro lado, un estudio del European Data Portal que indica que en la EU28+ la utilización de datos abiertos habría reducido los costos asociados con la administración pública en un estimado de 1.7 billones de euros además de ahorrar alrededor de 629 millones de horas de trabajo innecesario.

Así mismo, un estudio de McKinsey de 2013 muestra que el Open Data podría ayudar a liberar entre 3 y 5 trillones de dolares anuales en 7 sectores de la economía.

Estas cifras dan una idea del valor de los bits, del valor de la información y de su enorme impacto en la economía mundial.

Open Data es más que transparencia

La transparencia surge de forma espontánea del Open Data. El hecho de declarar un set de datos como Open Data es por sí mismo un ejercicio de transparencia. Sin embargo no son sinónimos y por tanto no deberían ser el único fin que persiguen las instituciones gubernamentales.

En múltiples reuniones de trabajo, charlas y conferencias en las que se menciona Open Data se habla de transparencia de forma casi exclusiva, y esto va generando una incómoda sensación de paranoia con respecto a la liberación de datos, va degradando el concepto de los datos abiertos hasta dejarlos reducidos a una simple herramienta de control de gasto público.

En nuestra región este tipo de conceptos errados respecto al Open Data ha desnaturalizado tanto su principio fundamental que Open Data se considera un sinónimo de Open Government. Ambos conceptos son equivalentes en muchos ámbitos y tienen principios similares, sin embargo el Open Data es más amplio y no se puede tratar como una simple política de control gubernamental.

Los datos liberados por las instituciones gubernamentales o privadas deben ser vistos como lo que realmente son, como materia prima, como un insumo primordial con el que existe la posibilidad de desarrollar múltiples productos y servicios enfocados no solamente en transparencia sino además en productividad.

Productividad a partir de Open Data es un concepto que los gobiernos de la región deben empezar a desarrollar con mayor decisión, apoyo y convicción. Tristemente es algo que hasta el momento no se ve y a lo que se ha prestado una atención muy marginal. A nivel de tecnologías de información las consecuencias de no tomar las decisiones correctas en el momento correcto nos dejarán nuevamente en una posición del tipo "las venas abiertas de América Latina", y esta vez no serán lamentos por el oro, la plata o el azúcar, sino por un recurso menos tangible pero más poderoso, nuestros datos. 

A nivel de todo el mundo surgen cada día nuevas herramientas capaces de procesar la información con niveles de sofisticación que nunca antes se habían conseguido. La Inteligencia Artificial y la Minería de Datos extraen valor de grandes "minas de información" de manera cada vez más eficiente y el Big Data es una herramienta que cada vez se hace más común en las empresas.

Bajo estos precedentes y en este contexto resulta irónico, ridículo y hasta indignante que en nuestro entorno se hable de Open Data de forma tan tibia y apenas pensando en transparencia como un gran logro.

Materia prima para una nueva revolución industrial

Estamos parados en medio de una nueva revolución industrial de la que tal vez no somos de todo conscientes. En esta nueva revolución los datos ya no constituyen el valor agregado, sino que son la materia prima. 


Conseguir que los gobiernos de nuestra región lleguen a entender este concepto puede ser la piedra angular para garantizar el desarrollo de la sociedad en esta nueva era de información. Una idea que puede parecer tan simple y básica sin embargo tiene un gran alcance y requiere de un cambio total de mentalidad y conceptos para muchas instituciones, empresas y sobre todo la misma sociedad.

Existen varios pasos a seguir para que este concepto se concrete y los datos puedan ser utilizados efectivamente como materia prima.

El primer paso es definir los sets de datos que pueden y deben ser liberados tanto por empresas como por instituciones. Así mismo se deben establecer los criterios a través de los cuales un set de datos se puede considerar como apto para ser liberado. Esta parte puede ser compleja desde el punto de vista de la negociación, pues tradicionalmente las empresas e incluso las instituciones se creen dueñas de toda la información que generan, un concepto que debe discutirse y modificarse.

El segundo paso es garantizar la generación de materia prima, esto implica que las actividades y procesos realizados por las empresas y entidades gubernamentales deben llevar asociados procesos virtuales que se conviertan en fuentes de datos. Dichos datos deben respetar criterios que garanticen su reusabilidad (formatos apropiados) y que aseguren su calidad.

El tercer paso es el favorecimiento de la adopción de tecnologías que permitan un flujo libre, constante y predecible de datos por parte de empresas e instituciones. Este paso puede incluir el mejoramiento de la infraestructura de red y servicios tecnológicos de las empresas e instituciones. Es chocante escuchar que ciertas entidades hablan de que tienen datos abiertos porque tienen página web. Esta miopía tanto técnica como conceptual debe ser corregida.

El último paso es involucrar en este proceso a participantes claves de la sociedad para construir una industria sobre los sets de datos disponibles y los que seguirán liberándose. Dichos participantes deben incluir a la academia, las empresas de tecnología, expertos, aficionados y entusiastas. La realización de eventos como hackatones y ferias tecnológicas generan expectativa y pueden dar un impulso a iniciativas frescas, nuevas e interesantes.

En resumen, se deberían seguir al menos cuatro pasos de la siguiente manera:
  • Exploración y liberación de datasets de interés.
  • Establecimiento de mecanismos para asegurar la generación, disponibilidad y continuidad de los datasets.
  • Establecimiento de mecanismos de distribución masiva y eficiente de los datasets.
  • Levantamiento de una industria destinada a explotar y extraer valor de los datasets.
Vale indicar que estos pasos pueden ser parte de un ciclo constante, pues a cada momento pueden surgir nuevos datasets de interés y puede haber nuevos interesados en agregar valor. 

¿Hacia dónde mirar ahora?

La industria de los datos gana cada vez mayor terreno y existen innumerables ejemplos de casos de éxito con la liberación de datos. Sin embargo es importante que no se centre la mirada exclusivamente en soluciones llave en mano ni en empresas que nos ofrezcan todo de la manera fácil y con recetas casi mágicas.

La historia nos ha dejado amargos ejemplos de lo que implica convertirnos en simples consumidores de servicios y tecnología como sucedió en su momento con el boom petrolero o con las industrias mineras o agrícolas.

Una gran ventaja que presenta el mundo globalizado de hoy es que todos tenemos accesos a la tecnología de diferentes formas. No debemos conformarnos con ser consumidores sino que debemos garantizar nuestra posición como productores y como exploradores de nuestros propios sets de datos basados en nuestros intereses y necesidades como región  y como sociedad.

Eduardo Galeano cita como frase inicial de su libro de Las Venas Abiertas De América Latina "hemos guardado un silencio bastante parecido a la estupidez". Quizás es la única frase con la que realmente concuerdo en esta obra, pues refleja lo que muchos gobiernos de nuestra región hacen en la actualidad con respecto a la nueva revolución industrial: guardan silencio. O en ocasiones hablan en forma tibia o sin fundamento, lo que resulta tanto o más nocivo que guardar silencio.

Como referencias a seguir y como documentos a tomar muy en cuenta me gustaría dejar los siguientes links:

El Open Data Institute:
http://theodi.org/

El Open Data Barometer:
http://opendatabarometer.org/

El Open Data Index de la Open Knowledge Fundation:
http://index.okfn.org/dataset/

El reporte de McKinsey sobre la liberación de valor con el Open Data:
http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/open-data-unlocking-innovation-and-performance-with-liquid-information

Un estudio de la Comisión Europea sobre la generación de valor a partir del
Open Data:
http://www.europeandataportal.eu/sites/default/files/edp_creating_value_through_open_data_0.pdf

sábado, 25 de junio de 2016

Open Data, un concepto que aún no despega en el país

La accesibilidad a la información proveniente de la gestión de entidades públicas y privadas ha sido siempre un elemento fundamental para garantizar la transparencia gubernamental en las sociedades democráticas. Siempre se ha hablado del poder que conlleva la información. Entonces, hablar de Open Data o Datos Abiertos en principio no es un concepto novedoso.


¿Qué exactamente es Open Data? Pues bien, es ante todo una filosofía que busca garantizar que la información generada y administrada, por entidades públicas e incluso privadas, sea difundida de manera igualitaria y sin discriminación entre todos los actores de la sociedad. Adicionalmente, Open Data incorpora conceptos tecnológicos, o derivados de estos, que buscan asegurar que los datos sean liberados bajo ciertos parámetros indispensables mínimos.
 
Para entender los conceptos tecnológicos involucrados con Open Data es importante considerar el hecho de que la capacidad de almacenamiento, transferencia y procesamiento de información ha experimentado un dramático crecimiento en las últimas tres décadas. Un artículo publicado por Matin Hilbert de la USC University of Southern California en 2012 señala que en el período de 1986 a 2007 la capacidad de almacenamiento y transferencia de información tuvo un crecimiento anual entre 25% y 30%, lo que es aproximadamente 5 veces mayor al crecimiento económico mundial en ese mismo período. Por su parte, la capacidad de procesamiento de información tuvo un crecimiento aún más notorio, entre 60% y 85% cada año.

En la actualidad, de acuerdo con www.internetlivestats.com, un sitio de estadísticas globales de uso de internet,  en el mundo existen más de 3000 millones de usuarios de internet, se realizan más de 4000 millones de búsquedas diarias en google, se generan más de 540 millones de tweets diarios, se  se publican más de 3 millones de blogs por día, entre otras cifras. Esto genera un tráfico del orden de los 3 exabytes diarios.

La gestión y procesamiento de tales volúmenes de información ha sido posible en gran medida gracias al surgimiento y desarrollo de nuevos conceptos, esquemas y filosofías, entre ellos Open Data, cuya relevancia ha impulsado alrededor del mundo el surgimiento de múltiples iniciativas destinadas a fomentar la apertura y difusión  pública de la información generada y administrada por las entidades gubernamentales . 

En este sentido, una de las iniciativas más importantes es la Alianza para el Gobierno Abierto OGP  (Open Government Partnership) www.opengovpartnership.org, lanzada en 2011 con 8 países y cuyo número ha crecido hasta 64 en la actualidad.

Para que un set de datos sea considerado Open Data, debe cumplir con ciertos parámetros enfocados en la accesibilidad, la disponiblidad y la usabilidad de la información. Así, la World Wide Web Foundation webfoundation.org, organización fundada por Sir Tim Berners-Lee, establece que los sets de datos abiertos deberían tener las siguientes caracteristicas:
  • Disponible en línea con el fin de permitir el acceso a una amplia varidad de usuarios y usos.
  • Licenciamiento abierto de modo que cualquier persona tenga permiso para utilizar y reutilizar los datos.
  • Legible por máquina, de modo que los sets de datos pueden ser analizados de manera eficiente por otras máquinas.
  • Disponible en volumen de modo que pueda descargarse como un único set completo de datos para ser analizado fácilmente por otras máquinas .
  • Libre de pago para que cualquier persona pueda obtenerlo sin importar su presupuesto.
Estas características son establecidas de acuerdo con la "Open Definition", un proyecto de Open Knowledge Foundation okfn.org, organización dedicada a establecer y promover lineamientos para la filosofía Open.

El Open Data en el Ecuador es un concepto que ha ido tomando forma poco a poco, aunque aún no se entienda en toda su dimensión ni se visualice su verdadero potencial. Sin duda es un tema que si no se discute al menos se menciona en las entidades públicas. Tanto es así que en 2014 la Secretaría Nacional de la Administración Pública (SNAP) publicó su Guía de Datos Abiertos.

Por su parte, el Sistema Nacional de Información (SNI) sni.gob.ec ofrece múltiples sets de datos a los que se puede acceder en forma libre, aunque sin un licenciamiento formal ni un esquema muy claro. Adicionalmente, dispone de un enlace específico de Datos Abiertos que lleva hacia el Archivo Nacional de Datos y Metadatos Estadísticos (ANDA) anda.inec.gob.ec.

La percepción general respecto al Open Data en el Ecuador es que no existe un esquema muy ordenado ni una estrategia clara sobre los datos abiertos. Los objetivos aparentemente se centran en la transparencia de la gestión gubernamental y en análisis  estadístico  de información histórica. No obstante su enfoque productivo, al menos desde el punto de vista práctico y técnico, es incipiente, obsoleto o nulo.

Esta percepción se puede evidenciar a través de dos indicadores que tienen por objetivo la evaluación del desarrollo y desempeño del Open Data a nivel mundial: el Open Data Barometer opendatabarometer.org publicado por la World Wide Web Foundation y el Global Open Data Index index.okfn.org/place/ publicado por Open Konwledge.

El Open Data Barometer está compuesto por 10 indicadores que se evalúan 3 parámetros: preparación, implementación e impacto. En 2015 el Ecuador ocupó la posición 42 entre 92 países y tuvo una caída de 4 posiciones respecto al 2014. Analizando los valores se observa que las calificaciones más bajas corresponden a los indicadores de Impacto. Es decir, que a pesar de existir el entorno y la implementación de datos abiertos, la capacidad de utilización de este recurso es muy baja y por tanto no genera un impacto significativo.
http://opendatabarometer.org/data-explorer/?_year=2015&indicator=ODB&open=ECU


El Global Open Data Index está compuesto por 13 indicadores que se evalúan con 9 parámetros a través de los que se califica la disponibilidad, accesibilidad, y usabilidad de los sets de datos. En 2015 el Ecuador ocupo la posición 58 entre 122 países cayendo 14 posiciones respecto al 2014.  Analizando estos indicadores para el Ecuador se puede observar que el principal problema de los sets de datos es la falta de licenciamiento y la falta de disponibilidad de sets completos de datos lo que obliga a los usuarios a descargar la información por partes.

http://index.okfn.org/place/ecuador/

En cuanto a la Alianza para el Gobierno Abierto, el Ecuador no forma parte de los países miembros, quedando así aislado de los esfuerzos colaborativos que se hacen a nivel mundial con respecto a los datos abiertos. Cabe indicar que los países de la región que no forman parte de esta alianza además de Ecuador son Bolivia, Venezuela, Guyana, Surinam y Nicaragua.

En conclsión, el Open Data en el Ecuador es una idea aún muy imprecisa, que no se ha considerado en toda su dimensión por parte de entidades públicas ni privadas. Carece de formalidad incluso en los principios básicos que rigen a los Datos Abiertos. El entorno actual no favorece su desarrollo convirtiendo al Open Data en un simple cliché tecnológico carente de planes y objetivos.

Si bien es cierto, el panorama no parece muy alentador, por otro lado existe la presión que ejerce la tecnolgía así como el surgimiento de nuevas necesidades por parte de los ciudadanos. A pesar de no existir conceptos formales y claros, y a pesar de la miopía de muchas autoridades y empresas con respecto a este tema, al menos existe una idea de lo que significa Open, y esta sola idea es capaz de ir abriéndose paso a medida que va cambiando la mentalidad de la gente.

En la era de la información el Open Data es materia prima, y sirve de insumo no solamente para alimentar los procesos de búsqueda de transparencia, sino como un recurso que puede generar toda una industria a su alrededor. Si no somos capaces de entender y aprovechar nuestros propios datos, sin duda alguien más lo hará, y así el Ecuador abrá perdido una valiosa oportunidad.