Artículos
Esta serie sobre garitas meteorológicas se compone de 3 artículos:
Vídeo
Aquí se muestra la instalación de las 9 garitas participantes en el estudio: SmartCellino, Davis 6828, Davis Ventilada, Davis 7714, Garita Stevenson, Ecowitt WS69 con filtro, Ecowitt WS69 sin filtro, Ecowitt WS90 y Garita Artesana de fabricación casera.
Los datos comparativos de 4 de estas garitas (Davis 7714, SmartCellino, Davis Ventilada y Garita Stevenson) se pueden ver en tiempo real en la Estación Meteorológica de Fresnedillas.
Nota de transparencia: Este estudio es completamente independiente. Ninguna de las marcas mencionadas ha patrocinado, influido o aportado material para su realización. Todas las garitas han sido adquiridas por cuenta propia con el único fin de realizar esta comparativa y para la mejora de la información meteorológica proporcionada abiertamente y de manera gratuita en esta web.
Introducción
Tras haber presentado las garitas participantes en la Parte I, y analizado en detalle sus comportamientos térmicos en la Parte II, medias, máximas, mínimas y diferencias día/noche; llegamos a la última entrega de este estudio comparativo.
En este último artículo vamos a resumir los resultados generales obtenidos para ofrecer una visión global del rendimiento de cada modelo.
El objetivo es sintetizar los hallazgos de todo el experimento en un ranking de eficacia, que permita identificar con claridad qué garitas ofrecen el mejor equilibrio entre precisión, estabilidad y respuesta térmica bajo distintas condiciones ambientales.
Ciclo horario
Este es uno de los gráficos más reveladores, pues ofrece la diferencia horaria de cada modelo respecto a la garita de diferencia. Como podemos ver, las únicas garitas que muestran sesgos negativos en las horas centrales del día son las Ecowitt con la compensación de temperatura activada, mientras que tanto la WS69 como la Stevenson muestran las mayores diferencias positivas. Por el contrario, durante la noche todas las garitas registran temperaturas más bajas que la SmartCellino.
En los gráficos diurnos/nocturnos podemos apreciar más claramente las diferencias comentadas.
Boxplot y Violin Plot
Para analizar la distribución de las diferencias térmicas entre cada garita y la referencia, se han elaborado dos tipos de gráficos complementarios: boxplots y violin plots.
Boxplot
El boxplot (diagrama de caja) resume de forma compacta los valores más representativos del conjunto de datos: la mediana, los cuartiles (Q1 y Q3) y los valores atípicos o extremos. Este tipo de gráfico permite identificar de un vistazo el rango en el que se concentran la mayoría de las diferencias, así como la simetría o sesgo de cada garita respecto a la referencia.
Como podemos ver, de manera general todas las garitas tienden a dar temperaturas más altas que la garita de referencia. Únicamente las garitas Ecowitt con la compensación de temperatura activada dan una media negativa (el período de comparación de estas garitas también es bastante inferior al resto). Por otro lado, las garitas WS69 y Stevenson muestran el mayor volumen de «caja», con una amplia variabilidad tanto en máximas como en mínimas.
Ahora se presentan los mismos datos en una tabla.

Y estos serían los Boxplot correspondientes a los períodos diurno y nocturno.
Violin Plot
El violin plot, por su parte, amplía esta información combinando el esquema del boxplot con la densidad de probabilidad de los datos. Esto proporciona una visión mucho más rica de la distribución: no solo muestra los valores centrales, sino también la forma y concentración de los datos. Por ejemplo, si una garita tiende a mostrar dos comportamientos distintos (bimodalidad) o si su variabilidad es mayor en ciertos rangos de temperatura.
Evolución acumulada
El gráfico de evolución acumulada de las diferencias ofrece una perspectiva temporal del comportamiento de cada garita frente a la referencia. En lugar de centrarse en valores puntuales o promedios diarios, este enfoque muestra cómo se acumulan las desviaciones a lo largo del tiempo, revelando tendencias que podrían pasar desapercibidas en otros análisis.
Una línea horizontal y estable indica que la garita mantiene un sesgo constante, ya sea positivo o negativo, durante todo el periodo, lo cual es señal de un comportamiento predecible y controlado. En cambio, una pendiente creciente o decreciente refleja una deriva progresiva, que puede deberse a factores como una compensación térmica incorrecta, un cambio en las condiciones de ventilación, exposición solar o simplemente por el diseño y materiales de la garita.
Podemos apreciar como al inicio de la serie hay una diferencia negativa (debido a comenzar de noche), que luego se estabiliza según se van contabilizando los datos. La desviación final es de mayor a menor: Stevenson, Aspirada, Davis 7714 y 6828. Otras garitas que no ocupan toda la serie con resultados muy favorables son la garita Artesana y las Ecowitt después de la activación de la compensación de la temperatura.
KDE de diferencias
Los gráficos KDE (Kernel Density Estimation) permiten visualizar la distribución continua de las diferencias entre cada garita y la referencia, mostrando no solo el rango de valores, sino también dónde se concentran las mediciones. A diferencia de los histogramas, que agrupan los datos en intervalos discretos, los KDE ofrecen una representación suave y detallada de la probabilidad de ocurrencia de cada desviación.
En estos gráficos, una curva estrecha y bien centrada en torno a cero indica que la garita mide de forma precisa y consistente, sin sesgos notables respecto a la referencia. Por el contrario, una curva desplazada hacia valores positivos o negativos revela una tendencia sistemática a sobrecalentar o subestimar la temperatura, respectivamente. Además, una distribución ancha refleja mayor dispersión o inestabilidad, lo que sugiere que el rendimiento de la garita es más sensible a las condiciones ambientales.
De esta forma, los KDE permiten comparar de un vistazo la precisión y la fiabilidad de los distintos modelos, destacando cuáles ofrecen un comportamiento más equilibrado y cuáles presentan sesgos estructurales más marcados.
Heatmap comparativo
Aunque tanto en el primer como en el segundo artículo ya hemos mostrado algunos heatmap individuales y colectivos, aquí presentamos los heatmap o mapas de calor comparativos.
Estos gráficos son muy atractivos visualmente, ya que permiten entender de manera sencilla las diferencias negativas y positivas por el color azul o rojo presente en cada casilla. Todos los datos corresponden a las diferencias respecto a la garita de referencia (SmartCellino) a lo largo del día.
Aquí observamos con claridad que la mayoría de garitas sobreestiman las temperaturas diurnas y subestiman las nocturnas respecto a la garita de referencia. Las únicas que muestran diferencias negativas durante las horas diurnas son las Ecowitt con la compensación de temperatura activada. Los valores positivos que se dan en estas dos garitas (WS90-2, WS69-2) entre las 8 y las 11 de la mañana se debe a la sombra del arbolado de alrededor, que afecta a otras garitas mientras a estas ya les da el sol. Algo similar ocurre al atardecer, cuando algunas garitas reciben antes la sombra a pesar de estar situadas apenas 20 metros entre la primera y la última.
Y los mismos datos, presentados en una tabla y destacando el valor más alto y más bajo.
Ahora, más detallados, los heatmap correspondientes al período diurno y el nocturno.
Matriz de correlación
Uno de los análsis más útiles es la matriz de correlación. Esta herramienta permite evaluar el grado de similitud entre las lecturas de todas las garitas, no solo frente a la referencia (SmartCellino), sino también entre sí.
En este caso, se ha utilizado el coeficiente de correlación de Pearson, que mide la relación lineal entre dos series de datos. Su valor varía entre -1 y 1, donde:
- 1 indica una correlación perfecta (ambas garitas varían exactamente igual),
- 0 indica ausencia de relación,
- -1 señalaría una correlación inversa (cuando una sube, la otra baja).
Un valor cercano a 1 implica que las garitas responden de manera muy similar a los cambios térmicos, lo que sugiere diseños o dinámicas térmicas parecidas. Por el contrario, correlaciones más bajas pueden reflejar diferencias estructurales, ventilación desigual o una mayor sensibilidad a condiciones externas.
Este análisis permite identificar grupos de garitas con comportamientos equivalentes, así como detectar «outliers», es decir, modelos cuyo patrón de respuesta térmica se aleja del resto. En nuestro caso, el comportamiento es muy similar entre todas las garitas (siempre por encima de 0,990), lo que indica el mismo patrón térmico a lo largo del tiempo, con las mismas variaciones de temperaturas y al mismo ritmo en un entorno muy homogéneo.
Resultados finales y Ranking
El ranking global y los rankings diferenciados para las fases diurna y nocturna nos permiten valorar con mayor detalle el comportamiento de cada garita frente a la referencia SmartCellino. Es importante recordar que esta última ha sido utilizada como garita de referencia comparativa, pero no necesariamente representa la temperatura “más real”. Su diseño avanzado hace que sea especialmente precisa en máximas, donde suele registrar los valores más bajos y, por tanto, más próximos a la temperatura real del aire. Sin embargo, en mínimas tiende a mantener temperaturas más altas que el resto, por lo que las diferencias negativas no deben interpretarse como errores, sino como características propias del comportamiento térmico de cada abrigo.
Parámetros utilizados
- BIAS (Sesgo medio) Indica la diferencia promedio entre las temperaturas medidas por cada garita y las registradas por la referencia.
- Si el valor es positivo, la garita tiende a sobrecalentar (marca temperaturas más altas).
- Si es negativo, tiende a subenfriar.
- Un BIAS cercano a 0 significa que las lecturas son muy precisas en promedio.
- SD (Desviación estándar): Mide la variabilidad de las diferencias. Una desviación pequeña implica que la garita mantiene un comportamiento estable y predecible, mientras que una desviación alta indica fluctuaciones o inestabilidad (por ejemplo, sobrecalienta solo en ciertas horas del día o con viento débil).
- MAE (Error absoluto medio): Es el promedio del error en valor absoluto. Representa la diferencia media real entre cada medición y la referencia. Cuanto menor es el MAE, más consistente y fiable es la garita en condiciones generales.
- RMSE (Error cuadrático medio): Similar al MAE, pero penaliza más los errores grandes. Es especialmente útil para detectar garitas que ocasionalmente se desvían mucho del valor real (picos de sobrecalentamiento o enfriamiento). Un RMSE bajo indica un rendimiento más estable incluso en condiciones extremas.
- Within ±0.5 °C / Within ±1.0 °C: Muestran el porcentaje de datos cuya diferencia con la referencia se encuentra dentro de esos márgenes de error. Por ejemplo, un valor del 0,9 dentro de ±0.5 °C significa que en el 90 % del tiempo la garita midió con una precisión muy alta respecto a la SmartCellino.
- N (Número de datos): Indica la cantidad total de registros válidos analizados para cada garita. Cuanto mayor sea este número, más robustas son las conclusiones.
- Ranking: Finalmente, se elabora un ranking global que combina todas las métricas anteriores (BIAS, SD, MAE, RMSE y precisión dentro de los márgenes). Este índice sintetiza el comportamiento general de cada garita, ponderando tanto la exactitud media como la estabilidad y el rendimiento en un escenario global.
Ranking Global
En la clasificación general, las garitas que mejor reproducen el comportamiento de la referencia son la Davis 7714, la Artesana F7 y la Davis 6828, que presentan un BIAS casi nulo, una desviación estándar baja (0,2–0,4 °C) y más del 90 % de los datos dentro de ±0,5 °C respecto a SmartCellino.
La Davis Aspirada también muestra buenos resultados, aunque con un ligero sesgo positivo (+0,2 °C), probablemente debido al efecto de su sistema de ventilación en determinadas condiciones de radiación. Por debajo de este grupo encontramos a las WS90 y WS69, que pese a sus mejoras de compensación mantienen una mayor dispersión (SD ≈ 0,4-0,5 °C) y errores algo más amplios.
Las garitas con peor rendimiento global son la Stevenson y las WS69 (sin y con), con desviaciones estándar superiores a 0,7 °C y solo entre el 50 % y 70 % de los datos dentro del margen de ±0,5 °C. En estos casos, el diseño más abierto o los materiales menos aislantes parecen influir notablemente en su estabilidad térmica.
Ranking Diurno
El periodo diurno (9–19 h) es el más exigente para cualquier garita, ya que la radiación solar intensa pone a prueba su capacidad de ventilación y aislamiento.
En estas condiciones, las Davis 7714 y Artesana F7 destacan por su buen control térmico (BIAS ≈ +0,2–0,3 °C y SD ≈ 0,3–0,4 °C), seguidas de la Davis 6828 y la Davis Aspirada, que aunque más estables, tienden a sobrecalentar ligeramente (+0,4 °C y +0,5 °C respectivamente). Las Ecowitt WS90 y WS69 compensadas (–0,1 °C) muestran en cambio un sesgo negativo leve, lo que sugiere que su sistema de corrección térmica puede sobrerreaccionar en horas de máxima radiación.
En el extremo inferior del ranking, la Stevenson (+0,9 °C) y la WS69 (con) (+1,0 °C) registran las mayores desviaciones positivas, evidenciando un sobrecalentamiento importante durante las horas centrales del día.
En conjunto, se aprecia que las garitas pasivas bien diseñadas (como la Davis 7714 o la Artesana) pueden igualar o incluso superar en estabilidad a sistemas más complejos si se sitúan en condiciones adecuadas de ventilación.
Ranking Nocturno
Durante la noche, el panorama cambia completamente. Sin radiación solar, las diferencias entre garitas se reducen de forma notable y el comportamiento de casi todos los modelos se vuelve más homogéneo.
Aquí, la Davis 7714, la Davis Aspirada y la Davis 6828 logran los mejores resultados, con BIAS entre 0,0 °C y –0,2 °C, SD inferiores a 0,2 °C y prácticamente el 100 % de los datos dentro de ±0,5 °C de la referencia. También la Artesana F7 mantiene un excelente rendimiento (–0,2 °C de BIAS), muy similar al de las Davis.
Las Ecowitt WS90 y WS69 muestran un leve sesgo negativo (–0,1 a –0,3 °C), lo que indica una ligera tendencia al sobreenfriamiento nocturno, típica en garitas de menor volumen o materiales más conductivos. Las Stevenson y WS69 C5 cierran el ranking con desviaciones algo mayores, probablemente asociadas a su exposición directa y a una ventilación más irregular.
En resumen, las diferencias nocturnas son pequeñas, pero se mantiene la jerarquía observada durante el día: Davis 7714, Artesana y Davis 6828 se comportan de forma más coherente y predecible, con una gran estabilidad térmica.
Conclusión
Tras tres entregas, este estudio de garitas nos ha permitido comparar de manera rigurosa el comportamiento térmico de diferentes modelos, desde los clásicos de tipo Stevenson hasta los diseños modernos como los Davis o SmartCellino, bajo las mismas condiciones en un período de radiación máxima.
Los resultados muestran que no existe una garita perfecta, sino configuraciones más o menos adecuadas según el contexto. En líneas generales, las Davis 7714, la garita Artesana o la Davis 6828 han demostrado una excelente correlación respecto a SmartCellino, manteniendo errores muy bajos tanto en máximas como en mínimas, y una gran estabilidad diurna y nocturna.
Las garitas con ventilación activa, como la Davis Aspirada, confirman su eficacia en condiciones de fuerte radiación, aunque no siempre mejoran significativamente a las pasivas de buen diseño. También hay que tener en cuenta, que la aspiración de esta garita es casera, y no el kit oficial de Davis, el cual funciona 24 horas al día y también sería interesante utilizar en una comparativa de este tipo. En cambio, los modelos más simples o compactos, como ambas Ecowitt (WS90 y WS69) tienden a sobrecalentar o a sobrerrefrigerar, mostrando un rendimiento más dependiente de las condiciones ambientales y con una gran variabilidad.
Este trabajo evidencia que la calidad de la ventilación natural, el material y la geometría interna son factores decisivos para lograr mediciones representativas. Tras la instalación de muchas garitas Ecowitt y la observación de sus datos, el hecho de instalarlas a una altura algo mayor de lo establecido por la OMM (a 2,5-3 metros e incluso en azoteas), ha supuesto que el error disminuya bastante, lo que denota la importancia de la instalación.
En definitiva, esperamos que este estudio suponga una referencia objetiva tanto para investigadores como para aficionados interesados en la instrumentación meteorológica, y pueda sentar las bases para mejorar los datos de nuestra red de estaciones meteorológicas.