Artículo

¿Qué son los datos abiertos y cómo funcionan (o no)?

Pedro Gerson

- ¿Qué son los datos abiertos?, pregunta Luis.
- Datos abiertos son aquellos que – explotando la productividad colectiva del ser humano – y utilizando la interoperabilidad permitida por nuestras capacidades tecnológicas…
- Pérate, ¿qué?
- …Decía, se distribuyen colectiva y gratuitamente –y liberan nuestro potencial social a través de plataformas compartidas.
- Ahhh, okay.
- Sí y cuando maximizas la interconectividad de los usuarios de la información y el acceso a la misma…
Ya harto, Luis dejó de escuchar.

Esta conversación en torno a los datos abiertos es quizá una caricatura, pero no se aleja tanto de la realidad. Los evangelistas de los datos abiertos vivimos convencidos de nuestra causa, sin necesariamente poder explicar el porqué de este movimiento. Aquí se presenta una guía breve para empezar a entenderlo.

¿Qué son los datos abiertos?

A grandes rasgos, los datos abiertos son aquellos que pueden ser utilizados y compartidos por cualquier persona de una forma gratuita, usualmente a través de internet. Desde la política pública, la mayoría del tiempo se refieren a datos que los gobiernos pongan a la disposición de la sociedad para que ésta los analice y descubra aspectos del gasto público, el estado de las escuelas, el uso de los hospitales y mucho más.

¿Cómo pueden servir?

En general, los datos abiertos permiten conocer a fondo los hábitos de la gente. Por ejemplo, podemos ver qué compramos o qué buscamos en internet, o cómo consumimos energía y qué vialidades son las que más usamos. Estos hábitos son una ventana a nuestras necesidades y, conociéndolos, podemos diseñar instituciones y servicios públicos que las atiendan mejor. Por ejemplo, si entendiéramos perfectamente cómo se mueve la gente en la ciudad, podríamos ajustar los horarios del metro para que funcione de una manera más eficiente. De acuerdo con un estudio del McKinsey Global Institute, usando datos abiertos y tomando medidas como éstas –a través de varios sectores como salud, energético y educativo, entre otros ­– podríamos producir alrededor de 3 billones de dólares anuales en el mundo.[1]

La promesa es amplia, sin embargo, del dicho al hecho…

¿Cuáles son los obstáculos?

Principalmente hay dos tipos de obstáculos. El primero tiene que ver con educación e infraestructura. Para que aprovechemos la información de los datos abiertos tenemos que tener el capital humano y tecnológico necesario. O sea, hay que tener gente con educación en informática y ciencias sociales a un nivel avanzado y que esta gente tenga buenas computadoras con acceso a internet. Y tiene que haber mucha de esta gente con acceso a esta tecnología, porque sólo así funciona bien el sistema. En un país donde sólo el 31%[2] de los hogares tienen acceso a internet y menos del 20%[3] tiene educación superior, no hay aún las condiciones para el aprovechamiento pleno de los datos abiertos.

El segundo problema es más del lado del analista y es que los datos abiertos producen un tipo de información que apenas empezamos a entender cómo usar. El tipo de información se conoce como big data (grandes datos). Si bien las oportunidades son amplias, la realidad es que aún estamos en pañales en el entendimiento de cómo usar el big data. Por ejemplo, la compañía Google inventó Google Flu Trends, una plataforma que utilizaría las búsquedas de internet para determinar en tiempo real posibles brotes de influenza. Sin embargo, esta plataforma fue un fracaso por el cómo y cuándo la gente busca información acerca de la influenza, en muchos casos poco tiene que ver con el momento en que la gente se enferma.

Esta anécdota sirve como ejemplo de que tener los datos no es suficiente, se requiere también un contexto para darles sentido, propósito y uso. Saber que la gente busca influenza en Google no sirve si no sabemos qué motiva a la gente a hacer esta búsqueda. Sin una teoría de qué nos puede revelar la información, los datos nos pueden llevar a puros callejones sin salida. ¿De qué sirve saber cuáles son las carreteras más transitadas, los hospitales más visitados o los productos más consumidos, si no sabemos por quién, para qué o – lo más importante – por qué? Los datos por sí solos no nos pueden contestar eso.

Por lo pronto, el enfoque de la comunidad de datos abiertos ha sido el de abrir los datos y conectar a los usuarios con los datos abiertos. Sin embargo, es primordial que fomentemos políticas de enriquecimiento de capital humano y tecnológico para realmente aprender a usarlos. Y también, los usuarios de los datos debemos de ser humildes y entender nuestras propias limitaciones. Tenemos que ser rigurosos y tener buenas teorías para entender el contexto de las imágenes que nos pintan los datos abiertos. Sin eso, nos quedaremos como el pobre Luis. Oyendo muchas palabras, pero no entendiendo nada.

[1] Manykia, James et. al. Open data: Unlocking innovation and performance with liquid information. McKinsey Global Institute, Oct. 2013.
[2] Instituto Nacional de Estadistica y Geografía, Estadística de Ciencia y Tecnología – Sociedad de la información, 5/10/2014
[3] Instituto Nacional de Estadistica y Geografía, Estadística de Sociedad y Gobierno, 5/10/2014
Publicado por Animal Político
07-10-2014