Visualización de datos abiertos

Cuando se comienza el proceso bibliolabs 2015 (recogiendo aprendizajes de la experiencia del 2014) se plantea el uso de la Visualización de Información como una herramienta potente para mostrar a la comunidad de las bibliotecas y a los tomadores de decisión los procesos que se vienen dando dentro del sistema y los posibles rumbos que pueden tomar. En este sentido se hace la propuesta de explorar datos que existen y otros nuevos que se pudieran recoger y en primera instacia generar visualizaciones sobre:

  • Mapa de actores: Actores claves en el trabajo de las bibliotecas y sus relacionamientos con esta
  • Visualizaciones grupo de interés comunicación territorial: ¿Cómo influyen los grupos de interés en el trabajo colaborativo dentro del SBPM?
  • Visualización Planes de Trabajo: De la planeación hecha a principio de año, ¿cuáles son los principales tópicos que se plantean?, ¿cómo es el desarrollo de las actividades en el momento de la ejecución?
  • Visualización Datos de Cultura Digital: El canal específico Cultura Digital, ¿qué viene proponiendo dentro del SBPM?
  • Visualización de Estadísticas del Sistema: Dentro del SBPM se recogen de manera ordena gran cantidad de datos de manera permanente, ¿qué nos pueden decir estos datos?
  • Propuesta Datos Abiertos en el SBPM: Dadas las condiciones de operación del SBPM, que herramientas se pueden implementar para la recolección, el análisis y la publicación de la información que este genera.

En el proceso de creación de las visualizaciones mencionadas arriba se conocen los detalles de la información que se genera en el SBPM y se plantean nuevos retos para darle continuidad a la generación de visualizaciones sin la dependencia de personas con una experticia técnica. Se desvía la atención por un momento de la generación de visualizaciones y se hace un esfuerzo por darle fundamento a unas báses para la gestión de información dentro del sistema.

Surgen entonces nuevas preguntas: Empieza un proceso de experimentación/investigación con los datos, de esto se pueden resaltar algunos aprendizajes.

  • Las fuentes de información son múltiples y diversas
  • Las necesidades de recolección de información surgen en cualquier momento y son promovidas tanto en el orden institucional como para resolver asuntos individuales del quehacer cotidiano.
  • Existe una necesidad de centralizar la información de las múltiples fuentes en una común que facilite la exploración y el análisis
  • Para no generar confuciones los datos de la fuente no se deben modificar en los reportes o visualizaciones. Esto últimos consumen las información centralizada para el análisis y la publicación de resultados
  • Para una misma información es necesario comunicar resultados y análisis de acuerdo a la comunidad con la que se compartan

Nos damos a la tarea de experimentar un proceso de ciclo completo teniendo encuenta lo expuesto arriba. En el siguiente gráfico se pueden ver los pasos Acá se ven fuentes de información usadas en algún momento dentro del sistema como MILFS1), googlesheets2) o hojas de cálculo de excel. La propuesta va en el sentido de usar algo que las pueda integrar a todas. Primero se usa el lenguaje de programación R3) para generar scripts que permiten obtener la información de estas fuentes, hacer verificaciones de integridad de la misma y normalizarlos para, en segunda instancia, indexarlos en el motor de búsqueda elasticsearch4) así obtenemos una interfaz bien definida de análisis y consulta sobre cualquier información. De esta interfaz se pueden conectar reportes, visualizaciones, mapas, aplicaciones.

Se propone también una herramienta que se integra naturalmente con elasticsearch que ofrece todas las posibilidades de conexión a la interfaz de datos mencionadas antes.

Así las cosas, las visualizaciones propuestas inicialmente se transforman; no en lo que se ve sino de fondo pues surgen de un proceso juicioso de análisis y experimentación. A continuación se da una explicación de cada una de una de las visualizaciones establecidas como producto y una vista de algunas de sus secciones. El detalle de cada una y el código para reproducirlas puede ser consultado en la sección Documentación del proceso

Siguiendo los pasos planteados en la explicación anterior, se exploran muchas posibilidades para el mapa de actores orientadas principalmente por las necesidades planteadas por el equipo de Gestión Social y Cultural, al igual que por la comunidad. La pregunta que medió el proceso es ¿cómo hacemos algo útil para la comunidad y para el SBPM?

En el siguiente enlace se puede observar el último resultado http://bibliolabs.cc/visualizaciones/mapaactores/ pero no el final.
El proceso se puede consultar acá http://wiki.bibliolabs.cc/bibliolabs:datos_abiertos:mapa_actores.
El código desarrollado se puede consultar acá http://192.241.160.231:3000/brolin/SBPM_mapa_actores.

Algunas otras aproximaciones

“El grupo de Comunicación Territorial genera ideas y propuestas para fortalecer la comunicación con los diferentes públicos de la bibliotecas en el territorio; propuestas de ejercicios que podamos aplicar para identificar intereses, deseos y percepciones de los usuarios y la comunidad; ideas para la promoción de los servicios de las bibliotecas.”5)

Audio discusión sobre Lectura de Territorio

El Sistema de Bibliotecas Públicas de Medellín genera una cantidad enorme de datos a los que se les hace un seguimiento juicioso desde hace varios años y que para el año 2015 se hace de manera semiautomática la generación de reportes como se puede apreciar en el video abajo.

Los flujos de datos están dividos en las siguientes categorías:

  • Actividades ejecutadas
  • Consulta y referencia
  • Flujo de usuarios
  • Colecciones
  • Circulación y préstamo
  • Préstamo de espacio
  • Acceso a TIC
  • Gestión institucional o interinstitucional

Y para cada uno de estos se tienen reportes así:

  • Consolidado
  • Consulta
  • Control de ingreso
  • Comparativo
  • Informe mensual
  • Reporte díario de datos

Las estadísticas son generadas a través de formularios de google, entonces se crea un programa en R que se trae estos datos por cada unidad de información, los integre, corrije el campo coordenadas que tiene alto ocurrencia de errores y luego indexa la información en elasticsearch.

Flujo de usuarios

Para el flujo de usuarios se han experimentado varias formas de visualizarlo. Visto sobre el mapa y que evoluciona en el tiempo, visto sobre un calendario con un mapa de calor, visto como un gráfico en ejes x, y donde se comparan todas las bibliotecas …

El código para producir todo esto se puede consultar en http://192.241.160.231:3000/brolin/SBPM_estadisticas

Actividades Ejecutadas en las Bibliotecas

Circulación y Préstamo

Se ha usado http://wiki.bibliolabs.cc para llevar registro de todas las exploraciones, en algunos frentes de trabajo están mejor documentados que otros pero en general el contenido de cada uno se estructura así:

  • Descripción general del tema
  • Muestra en imágenes o html de lo que se ha logrado
  • Referentes
  • Repositorio con el código para replicar los ejercicios

Para acceder lo puede hacer a través de los siguientes enlaces:

Cronograma de Trabajo

Datos Cultura Digital

Estadísticas del SBPM

Mapa de actores del SBPM

Grupo de Interés Comunicación Territorial

Planes de Trabajo del SBPM

Experiencias interactivas para compartir datos del SBPM

Propuesta de Datos Abiertos para el SBPM

Cartografía Histórica con la Biblioteca Nacional

Agenda de actividades