Riesgo meteorológico de incendio en Europa
Para el continente europeo -excepto Rusia y ciertas islas-, entre 1971 y 2022.
Fecha publicación | 17 octubre 2023 |
Fuente | Copernicus Climate Data Store |
Rango temporal | 1971 - 2022 |
Formato | CSV |
Tamaño | 10 GB (262.160.379 lineas) |
//English version below//
Este dataset contiene los datos históricos de los índices de peligro de incendios del Servicio de Gestión de Emergencias de Copernicus extraídos desde la Climate Data Store API el 25 de julio. Como periodo temporal, hemos elegido analizar los últimos 50 años de este índice. En total han sido 52 años analizados porque decidimos empezar en 1971 para tener todos los años de la década de los 70. A pesar de existir datos de 2023, no los hemos analizado por ser parciales y no abarcar el año completo, como el resto de años analizados. Hemos analizado todos los países europeos excepto Rusia y ciertas islas.
Los datos en crudo, en formato NetCDF-4 (estándar para el intercambio de datos científicos), fueron incialmente explorados con el programa de la Nasa Panoply. Para su posterior limpieza y análisis completo se utilizó el lenguaje de programación R a través de RStudio junto con los paquetes tidyverse, giscoR y terra. Por otro lado, la visualización se prototipó en Observable y Plot, para ser finalmente desarrollada en Svelte utilizando Javascript, D3 y Arquero.
Qué es el Índice Meteorológico de Incendio (FWI, por su nombre en inglés, Fire Weather Index)
El FWI es un índice de estimación del riesgo de que se produzca un incendio según diferentes valores meteorológicos y no está directamente relacionado con la provocación de incendios. El FWI comienza en 0 y sus valores más altos indican condiciones meteorológicas más severas. Consta de diferentes componentes que tienen en cuenta los efectos de la humedad del combustible y el viento en el comportamiento y la propagación del fuego. Cuanto más alto es el FWI, más favorables son las condiciones meteorológicas para desencadenar un incendio forestal.
Cómo hemos analizado los datos
Los datos originales proporcionados por Copernicus tienen un tamaño de celda de 0.25ºx0.25º grados. Para la latitud correspondiente a la Península Ibérica, el tamaño de cada punto equivaldría a 27.8 x 21.4 km (aunque los situados más al sur tendrían una correspondencia de mayor superficie, y los más norteños, algo menos de superficie), que hemos aproximado en la leyenda del mapa a unos 25km por 25km.
Una vez descargados los datos, los leímos y agrupamos con terra y posteriormente los convertimos en dataframe para su análisis. Para filtrar los datos descargados según los límites espaciales de Europa y de cada país usamos giscoR.
Todas las decisiones relativas al análisis de datos han sido tomadas en base a consejos y directrices de los expertos a los que hemos entrevistado para el reportaje.
Hemos decidido centrar el análisis en las categorías de “muy alto”, “extremo” y “muy extremo”, ya que son aquellas en las que el riesgo de que se produzca un incendio es alto. Los valores para cada categoría vienen determinados por el Sistema Europeo de Información sobre Incendios Forestales (EFFIS) de la Comisión Europea. Aunque la categoría de “muy extremo” se introdujera en 2021, en esta investigación la hemos utilizado de forma retroactiva para una mejor comparación.
Para analizar los datos de Europa manteniendo los valores extremos que se dan en todo el territorio no hemos realizado una media de todos los datos sino que hemos calculado el porcentaje del territorio, calculado como el número de celdas afectadas entre el total, para cada categoría. De esta forma no alteramos los datos originales, que por su naturaleza no están pensados para determinados análisis temporales o espaciales.
Así, en primer lugar, calculamos para cada día del año la categoría en la que se encontraba cada celda y filtramos para quedarnos únicamente con aquellas que se encontraban en las categorías que nos interesaban. Posteriormente calculamos para cada año el número de días en los que cada celda se encontró en cada categoría. Estos son los datos que se visualizan en el mapa interactivo.
Para dar una visión global de Europa y los diferentes países en cada año, hemos calculado el porcentaje que ha estado, al menos, una vez en cada categoría y la mediana de días en los que esas celdas se encontraron en cada categoría. Estos son los datos que se visualizan en el gráfico radial de porcentajes.
Una vez realizados los cálculos para Europa y para cada país se exportaban en csv. Puedes descargar los datos que hemos usado para los gráficos en Datos Civio.
Además de los datos mencionados anteriormente, para confirmar las hipótesis de este reportaje hemos realizado diferentes entrevistas con expertos y otros análisis de datos que no hemos terminado incluyendo en el reportaje por su complejidad a la hora de ser comunicados y para no sobrecargar el reportaje de datos. Entre otros, hemos calculado el aumento de valores extremos en España respecto al periodo de referencia 1991-2020, la estacionalidad de los datos y variación de los datos por década.
Visualización
Para poder realizar las visualizaciones interactivas realizamos un trabajo previo de exploración de datos con Observable y Plot, tras el cual decidimos desarrollarlas en Svelte, usando Javascript, D3 y Arquero para terminar la limpieza de los datos y adecuarlos a las necesidades de cada gráfico. Por ejemplo, con estas librerías hemos obtenido valores máximos para las escalas o filtramos los datos globales para adecuarlos a cada año y país seleccionado.
Al seleccionar una país se destacan las celdas que conforman dicha región. En el caso en el que una celda forme parte de varios países únicamente se destaca en aquella en la que el centro de la celda se encuentra dentro de sus límites geográficos.
Todos los gráficos se han realizado con SVG, a excepción de los puntos del mapa, que se han visualizado en Canvas para optimizar el rendimiento. Para ello hemos adaptado el método empleado por Der Spiegel en su visualización de ganadores del Premio Nobel, que se puede encontrar en este repositorio de GitHub.
Queremos agradecer la ayuda brindada en la realización de este reportaje por el doctor en Geografía Física Dominic Royé, investigador en la Fundación para la Investigación del Clima; Pampa G. Molina, directora de Science Media Centre España; Francesca Di Giuseppe, manager del servicio ‘Fire Danger Forecasting’ de ECMWF; y el Joint Research Centre de la Comisión Europea.
//English version//
For this dataset we have relied on historical fire weather risk index data from the Copernicus Emergency Management Service extracted from the Climate Data Store API on 25 July 2023. We chose to analyse the last 50 years of this index. In total 52 years have been analysed because we decided to start in 1971 to include the entire decade of the 1970s. Although there are data from 2023, we have not analysed them because they do not yet cover the whole year and are not comparable to other whole-year data. We analysed data from continental Europe excluding Russia and certain islands.
We cleaned and analysed the raw data, in NetCDF-4 format (a standard for scientific data exchange), using the R programming language through RStudio together with the packages tidyverse, giscoR and terra. We prototyped the visualisation in Observable and Plot, and finally developed it in Svelte using Javascript, D3 and Arquero.
What is the Fire Weather Index (FWI)?
The FWI is an index for estimating the risk of fire occurrence according to different weather values and is not directly related to intentional fire setting. The FWI starts at 0 and higher values indicate more severe weather conditions. It consists of different components that account for the effects of fuel moisture and wind on fire behaviour and fire spread. The higher the FWI, the more favourable the weather conditions are for triggering a wildfire.
How we have analysed the data
The original data provided by Copernicus have a cell size of 0.25ºx0.25º degrees. For the latitude corresponding to the Iberian Peninsula, the size of each point would be equivalent to 27.8 x 21.4 km (although those located further south would correspond to a larger area, and those further north, to a slightly smaller area), which we have approximated in the map legend to about 25km by 25km.
Once we downloaded the data, we read and grouped them with terra and then converted them into dataframes for analysis. To filter the downloaded data according to the spatial boundaries of Europe and each country we used giscoR maps.
All decisions regarding data analysis followed advice and guidelines from the experts we interviewed for the report.
We decided to focus the analysis on the “very high”, “extreme” and “very extreme” categories. The values for each category are determined by the European Forest Fire Information System (EFFIS) of the European Commission. Although the “very extreme” category was introduced in 2021, in this research we have used it retroactively for a better comparison.
To analyse the data for Europe while maintaining the extreme values that occur throughout the territory, we have not averaged all the data but have calculated the percentage of the territory, calculated as the number of affected cells out of the total, for each category. In this way we did not alter the original data, which by their nature are not intended for certain temporal or spatial analyses.
First, we calculated for each day of the year the category of each cell and filtered to keep only those cells that were in categories of interest. We then calculated for each year the number of days on which each cell in the categories of interest. This is the data displayed on the interactive map.
To give an overview of Europe and the different countries in each year, we calculated the percentage of territory spent at least one day in each category and the median number of days in which these cells were in each category. These are the data visualised in the radial graph of percentages.
Once we had performed the calculations for Europe and for each country, we exported them to comma-separated values (.csv) files. You can download the data at Civio Data.
In addition to the data mentioned above, to check the hypotheses of this report, we carried out different interviews with experts and other data analyses. We have not included them all in this report due to their complexity in terms of communication and to avoid burdening the report with excessive data. Among others, we have calculated the increase of extreme values in Europe with respect to the reference period of 1991 to 2020, the seasonality of the data, and the variation of the data by decade.
Visualisation
To develop the interactive visualisations, we explored the data with Observable and Plot, after which we decided to develop our visualizations in Svelte, using Javascript, D3 and Arquero to finish cleaning the data and adapt them to the needs of each plot. For example, with these libraries we obtained maximum values for the scales and filtered the global data to adapt them to each year and province selected.
When users select a province, the cells that make up that region are highlighted. In the case where a cell is part of several provinces, only the one in which the centre of the cell is located within its geographical limits is highlighted.
All graphics have been made with SVG, except the map points, which are in Canvas to optimise performance. For this we have adapted the method used by Der Spiegel in their visualisation of Nobel Prize winners, which can be found in this GitHub repository.
We would like to thank Dominic Royé, PhD in Physical Geography, researcher at the Foundation for Climate Research; Pampa G. Molina, director of Science Media Centre Spain; Francesca Di Giuseppe, manager of ECMWF’s Fire Danger Forecasting service; and the Joint Research Centre of the European Commission for their help in producing this report.
Estos datos han sido usados en: