Medialab Prado

Compartir

Periodismo de datos. Gestión de la información económica sensible y expresiones regulares con Open Refine

11.06.2014 17:00h - 20:00h

Lugar: Auditorio (2ª planta / 2nd Floor)

Decimoséptima sesión del Grupo de Trabajo Periodismo de Datos Medialab-Prado dedicado a presentar el trabajo de investigación de José F. Leal (El Mundo) sobre las mayores fortunas en España y a impartir un breve taller sobre la herramienta de software Open Refine

fortunas

Figura 1: Portada del Magazine Los 200 más ricos de España

 

Para la última sesión del grupo antes del parón veraniego hemos preparado un menú especial. Llevábamos tiempo queriendo que viniera José F. Leal, periodista de El Mundo y autor del trabajo monográfico anual de la lista de las 200 mayores fortunas españolas, uno de los trabajos de periodismo de investigación y datos más importantes y destacados de la prensa española que lleva realizando ininterrumpidamente desde 2006. Luego, no por ya conocido menos interesante, Juan Elosua realizará un taller introductorio a Expresiones Regulares apoyándose en el conocido software Open Refine.

 

Programa

17:00h - 18:00h: Gestión de la información económica sensible, exposición de José F. Leal sobre su trabajo en El Mundo.

 

José F. Leal lleva años haciendo periodismo de datos y no habíamos reparado en ello. Comenzó en 2006 la lista de las 200 mayores fortunas españolas y hoy continúa con esa y otras listas. La actividad noticiosa de los multimillonarios es tan generosa que expone una vez por semana alguna historia interesante en el blog Billonarios, aunque si tuviera tiempo, seguro que haría muchas más.

De la información que trata le preocupa, sobre todo, la gestión de la información económica sensible, es decir, el acceso público a las fuentes de datos económicos que indiquen patrimonio y propiedad de las empresas, compras y ventas, personas que intervienen, etc. Solo así podremos sacar conclusiones interesantes, y no meras notas de prensa, ya que el periodismo va de lo primero, lo segundo debería quedarse en las agencias de comunicación y los gabinetes de prensa.

En otro contexto periodístico, su trabajo podría ser considerado modesto. En el actual, en España, representa una apuesta por el periodismo de investigación y de calidad. Nos contará cómo trabaja con los datos, las fuentes, las relaciones entre los mismos, y cómo podría mejorar si contara con equipos multidisciplinares. Periodismo de datos en estado puro.

 

18:15h - 20:00h: Introducción a las Expresiones Regulares con Open Refine, taller impartido por Juan Elosua

 
 

Juan Elosua ha participado más de una vez en las sesiones del grupo, a veces presentando proyectos en los que ha trabajado, como el Mapa de Incendios en Galicia, y otras en talleres de herramientas de búsqueda y almacenamiento de datos. Siempre ha conseguido explicar fácilmente lo que en principio se nos antojaba muy complejo. En este caso la apuesta no es distinta, citar expresiones regulares o RegExp -como se las conoce en el ambiente técnico- puede echar para atrás a más de unx, pero si tienes alguna duda te recomiendo que veas el taller de SQL o de Web Scrapping y que saques tus conclusiones. Las expresiones regulares las podemos utilizar en nuestra vida diaria, bien para buscar un archivo, para cambiar varios de nombre o para trabajar con hojas de cálculo. Es por esto último que vamos a realizar un ejemplo con Open Refine, el software que nos permite limpiar datos desordenados en las mismas. Juan ha colaborado con Civio en los proyectos España en llamas, El indultómetro y Dónde van mis impuestos, entre otros. Precisamente en El indultómetro explica cómo utilizaron expresiones regulares, hojas de cálculo y Google Refine (nombre anterior de Open Refine).

Si vienes al taller, no olvides traer descargado e instalado Open Refine.


 


Condiciones de uso