INTRODUCCIÓN
La información meteorológica es una de las herramientas más importantes para la toma de decisiones en la agricultura. Entre sus aplicaciones se encuentran el cálculo de las necesidades de agua de los cultivos y la programación de riegos, el diseño de los sistemas de riego y drenaje, la lucha integrada contra plagas y enfermedades de los cultivos y la lucha contra heladas.
Durante las dos últimas décadas del siglo pasado se produjo una gran expansión de las redes de estaciones meteorológicas automáticas en todo el mundo. Este desarrollo se materializó en España con la implantación de la Red SIAR (Sistema de Información Agroclimática para el Regadío) por parte del Ministerio de Agricultura, Alimentación y Medio Ambiente (Figura 1). En Andalucía está red dispone en la actualidad de más de 100 estaciones (Figura 2). Esta rápida evolución ha sido consecuencia de la necesidad de disponer de datos meteorológicos específicos en tiempo real o casi real, así como de la evolución de los sistemas automáticos de adquisición y transmisión remota de datos.
Hasta hace pocos años las metodologías aplicadas en el control de calidad de la información de las redes agrometeorológicas eran variadas y los procesos para asegurar su calidad era con frecuencia dudosos, siendo en algunos casos inexistentes. Existen tres grandes razones por las cuales es necesario aplicar un sistema de control de calidad: 1. Asegura que la información está siendo generada adecuadamente; 2. Identifica los registros erróneos que conducirían a una inadecuada toma de decisiones; 3. Permite detectar problemas para resolverlos mediante las oportunas labores de mantenimiento, reparación y calibración de los sensores. Además, se puede afirmar que la prevención de errores es mucho más deseable que su detección, puesto que ésta es con frecuencia costosa y no puede garantizar la detección de aquellos en su totalidad.
![]() |
Figura 2. Estaciones de la Red SIAR en Andalucía. |
Para asegurar la calidad de la información obtenida se pueden aplicar diferentes métodos. Desde aquellos que implican el mantenimiento periódico de las estaciones y la verificación en campo de la información proporcionada por los sensores, hasta los basados en la validación de los datos registrados utilizando procedimientos estadísticos, pasando por la calibración periódica de los sensores en laboratorio (Figura 3). En los procedimientos de validación basados en la aplicación de reglas de decisión, los registros de dudosa calidad son detectados y corregidos o marcados como sospechosos. En estos procedimientos el resultado final es un dato que lleva adjunto una marca de seguridad o confianza (“bueno”, “sospechoso”, “alarmante” ó “fallido”). Este sistema se utiliza en los procesos de validación de la Red CIMIS (California Irrigation Management Information System) del estado de California (www.cimis.water.ca.gov), una de las redes agrometeorológicas dedicadas a la agricultura más importantes del mundo. En algunos casos se aplican algoritmos que permiten corregir los registros o rellenar los datos perdidos, pero en cualquier caso tanto el dato original como el corregido se almacenan en la base de datos. Finalmente, los registros meteorológicos potencialmente erróneos deben ser juzgados por personal debidamente cualificado.
![]() |
Figura 3. Calibración de piranómetros |
TEST DE VALIDACIÓN
La norma UNE 500540 define siete niveles de validación que deben aplicarse sucesivamente, con excepción de la inspección visual (Nivel 6) que puede realizarse después de la validación correspondiente a los niveles 0 y 1. Los niveles 0 (Estructura del registro de datos) y 1 (Validación de los datos según límites) son de obligada aplicación, mientras que el resto son opcionales. Únicamente se califican de forma automática como no válidos aquellos datos que no superen el nivel 0 o el test de límites rígidos. Los datos que no pasan con éxito cualquiera de los otros test se consideran sospechosos y por inspección visual se deberá discernir si el dato es válido o no.
Nivel 0. Validación de la estructura del registro de datos
Se comprueba que tanto la estructura del registro como el número de datos son los que se espera que lleguen. Si alguno de los datos no puede ser extraído correctamente, se considerará dicho dato como no válido. Si existe error en la fecha y/u hora, todos los datos del registro asociados a esa fecha y hora se considerarán no válidos.
Nivel 1. Validación de los datos según límites
En este nivel se comprueba el rango de los valores meteorológicos introducidos en la base de datos. Por rango entendemos los límites superior y el inferior entre los que debe estar el valor de un dato para ser considerado como válido. Se definen dos tipos de límites: límites físicos e instrumentales y límites flexibles (p.e. efemérides meteorológicas).
Límites rígidos: físicos e instrumentales
Se aplican los límites que resulten más restrictivos de los físicos e instrumentales. Cualquier dato fuera de los límites establecidos será un dato no valido (Tabla 1).
Tabla 1. Límites físicos de diferentes variables meteorológicas (UNE 500540).
Límites flexibles: efemérides meteorológicas
Estos límites se basan en los valores extremos que las distintas variables puedan tomar en la zona donde está ubicada la estación. Lo ideal es contar con un conjunto de efemérides meteorológicas para cada mes que sean representativas del entorno de donde provienen los datos que se validan. Si el dato no superase este test de límites flexibles será calificado como sospechoso y se deberá hacer una inspección visual para considerarlo válido o no. Estos tests incorporan un módulo de verificación de efemérides en el que cada valor se compara con el valor extremo registrado históricamente en la misma estación. Si el registro que se está validando supera el valor extremo prefijado, el sistema generará una alerta que deberá ser validada por el administrador para incorporarla como nueva efeméride.
Las medidas de radiación solar (Rs) pueden ser validadas comparándolas con los valores de radiación extraterrestre (Ra) de acuerdo con la expresión:
Las medidas de radiación solar (Rs) pueden ser validadas comparándolas con los valores de radiación extraterrestre (Ra) de acuerdo con la expresión:
0.03 x Ra ≤ Rs < Ra
Un test más restrictivo, aunque de mucha utilidad, puede ser aplicado considerando que la Rs no debe superar los valores de radiación solar que se dan en condiciones de cielo despejado (Rso) incrementados en un 10%:
Rs < 1.10 x Rso
En la Figura 1 se presenta un ejemplo de la aplicación de estos tests a los valores diarios de Rs de la estación meteorológica de Las Cabezas de San Juan (Sevilla) entre los años 2006 y 2008. Se puede observar que durante el primer semestre del 2006 se produjeron sistemáticamente valores fuera del rango definido por la ecuación anterior, que desaparecieron a partir del 30 de junio de 2006, cuando se reemplazó el sensor por uno recién calibrado.
![]() |
Figura 4. Resultados de la aplicación de los tests de rango flexible a los registros diarios de radiación solar de la estación meteorológica de Las Cabezas de San Juan (Sevilla). |
Nivel 2. Validación de la coherencia temporal del dato
Los procedimientos basados en la coherencia temporal comprueban si la diferencia entre medidas meteorológicas sucesivas excede un valor determinado, en cuyo caso habría que sospechar de ambas medidas. Es decir, se chequea el exceso de variabilidad de dos registros consecutivos. Si esta diferencia supera el valor preestablecido dentro del sistema de validación, se genera una alerta para los dos datos. Si la diferencia excede un valor prefijado, distinto para cada variable, se considerará que el dato o datos no ha superado el test. Por ejemplo, para las medidas intradiarias de Rs se puede aplicar el test de coherencia temporal:
0 ≤ |Rs(h) x Rs(h-1) | ≤ 555 W/m2
donde Rs(h) es el valor de la radiación solar medida en una hora determinada y Rs(h-1) es su valor medido una hora antes.
Nivel 3. Validación de la coherencia interna de los datos. Relaciones entre variables
Los procedimientos denominados de coherencia interna están basados en la verificación de la coherencia física o climatológica de cada variable observada o también de la consistencia entre variables. Valores medidos al mismo tiempo y en el mismo lugar no pueden ser incoherentes entre ellos. En este caso, puesto que no se puede discernir cuál de las variables involucradas es la responsable, se considerará que ambas observaciones no han superado el test. También entran en esta categoría los tests que comprueban la coherencia interna del propio sistema. Por ejemplo, un valor promediado debe ser siempre menor que el valor instantáneo máximo, o la precipitación durante media hora siempre deberá ser menor que la precipitación acumulada durante 24 horas. También son habituales las comprobaciones del tipo
Tmax(i)>Tmed(i)>Tmin ó Tmax(i)>Tmin(i-1) siendo i un día cualquiera.
Existen también comprobaciones para rangos diarios de temperatura excesivos. Para el caso de la precipitación, en regiones semiáridas como Andalucía la mayoría de los eventos diurnos de lluvia se producen con altos valores de humedad relativa (por encima del 75-80%) y bajos valores de transmitancia atmosférica (KT), proponiéndose el siguiente test a escala intradiaria:
Evento de lluvia cierto si: KT < 0.5 y HR > 80%
Nivel 4. Validación de la coherencia temporal de la serie
Este nivel se aplica sobre series temporales de datos del periodo que se vaya a analizar (p.e. cada 24 horas). Se calculará la media y la desviación típica de cada variable. Si la desviación típica fuese menor que un mínimo aceptable, todos los datos de ese periodo se considerarán sospechosos. Para el caso de la humedad relativa del aire se puede aplicare el test que comprueba que la desviación típica de sus registros intradiarios supera un valor umbral determinado, por ejemplo el 1%.
Nivel 5. Validación de la coherencia espacial. Contraste de los datos de cada estación con datos de estaciones vecinas
En este nivel de validación se tiene en cuenta que los valores de una misma variable medidos al mismo tiempo en estaciones correlacionadas no pueden diferir demasiado unos de otros. Llevar a la práctica este test puede resultar más o menos complicado dependiendo de la densidad de estaciones y de lo compleja que sea la orografía de la zona. Para la aplicación del test se utilizarán, por ejemplo, técnicas de interpolación. Es suficiente con aplicar algún método sencillo que permitan detectar los errores más groseros. Los errores más sutiles se pueden descubrir por inspección visual. Para validar la coherencia espacial se suele estimar un valor para cada observación. Esto se hace a partir de datos de la misma variable (que no hayan sido etiquetados como no válidos en niveles previos), registrados en otras estaciones correlacionadas con la variable que se está analizando. A continuación, se calculará alguna expresión que de cuenta de la diferencia entre el valor medido y el valor estimado. Si esta diferencia excediese un cierto umbral (p.e. dos veces la desviación típica de los datos empleados en la estimación), se considerará que el dato analizado no ha superado este test.
Nivel 6. Inspección visual
Para llevar a cabo una inspección visual de los datos que se pretende analizar resulta muy útil representar la evolución temporal de las distintas variables en varios niveles de agregación, especialmente cuando se trate de determinar si un dato sospechoso es válido o no. Igualmente, resulta muy útil cartografiar valores máximos, mínimos, acumulados, etc. de las distintas variables así como de parámetros derivados. Para identificar problemas sutiles, en el caso de la temperatura, la velocidad y dirección del viento y la presión, se recomienda un análisis de valores promedio a una hora específica del día (p.e. 0, 6,12 y 18). En el caso de la humedad relativa, la media de los máximos y la media de los mínimos. Finalmente, para la precipitación y la irradiación, es conveniente estudiar los valores acumulados. Se pueden aplicar otros análisis estadísticos, como por ejemplo el método de doble masa, aunque muchos de ellos dependen de la longitud de las series para que den buenos resultados.
A MODO DE RESUMEN
Los resultados obtenidos de la aplicación de los diferentes tests de validación de acuerdo con la norma AENOR UNE 500540 ponen de manifiesto la existencia de registros meteorológicos erróneos y potencialmente erróneos en las bases de datos meteorológicas (diaria y semihoraria). El análisis temporal de los registros detectados por los tests y el uso de gráficos de control generados de forma dinámica permiten tomar decisiones tan importantes como la sustitución de sensores o la depuración de registros fuera de rango antes de ser empleados en aplicaciones agronómicas como el cálculo de la evapotranspiración de referencia y la programación de los riegos.
PARA SABER MÁS
Estévez, J., Gavilán, P., Giráldez, J.V., 2011. Guidelines on validation procedures for meteorological data from automatic weather stations. Journal of Hydrology, 402(1–2):144–154.
Estévez, J., Gavilán, P., García-Marín, A.P., 2011. Data validation procedures in agricultural meteorology–a prerequisite for their use. Advances in Science and Research, 6:141-146.
Gavilán, P., Estévez, J., 2009. Validación de la información agrometeorológica. Un requisito previo a su utilización. XXVII Congreso Nacional de Riegos. Murcia.