Entrada | home

A partir del 24 de Abril, 2020, los reportes epidemiológicos del número diario de casos de COVID-19, colapsaron. Un hecho lamentable que refleja la situación general del manejo de la epidemia en Ecuador.

Para empezar, los reportes epidemiológicos solo se hicieron públicos a partir de una publicación denunciando la falta de información y comunicación por parte del Ministerio de Salud Pública con referencia a los datos de la epidemia***. De hecho, este es un ejemplo espectacular de cómo la comunidad científica puede hacer la diferencia haciéndose escuchar en círculos internacionales; ese artículo está en inglés.

A partir del 13 de Marzo, se empezaron a publicar las infografías de la epidemia, casi dos semanas después del primer caso reportado en Ecuador. Parece poco, pero un contexto epidémico, dos semanas es un siglo. Al principio, las infografías se publicaban diariamente con actualizaciones a las 10 am y a las 5 pm. Yo las encontraba a través de la cuenta del Ministerio de Salud en twitter o a través de whatsapp en estados de amigos o grupos interesados en el tema (o sea en cualquier lugar). Lo interesante es que estos reportes eran realizados por el Servicio Nacional de Gestión de Riesgos y Emergencias, no por el Ministerio de Salud Pública. Pero no hay lío, finalmente habían datos (Fig. 1).

Figura 1. Primer reporte oficial sobre la epidemia de COVID-19 en Ecuador. Nótese el reporte de casos en forma de mapa y los íconos de la derecha, esto irá mutando sin control en las siguientes figuras.

En realidad sí hay lío. La información era compartida a través de archivos en formato pdf. Y no en forma estructurada, es decir en formato de base tabulada con filas y columnas para el libre procesamiento de información. En archivos .pdf, si uno quiere ir extrayendo la información día a día para crear sus propias curvas o sus propias tablas, es necesario abrir el archivo y pues, COPIAR MANUALMENTE. Existen aproximaciones para automatizar la extracción de datos usando programas de computadora pero esto es válido solo si el formato es el mismo en cada reporte. Algo que no ocurre, cada reporte se acompaña de nueva información distribuida sin consistencia a través de todas las publicaciones (Figs. 1-2).

Bueno pero hay datos. Habían algunos errores por supuesto, pero los errores típicos del reporte epidemiológico y hasta entendibles en el contexto de una epidemia explosiva y de rápida diseminación como ha resultado ser la de SARS-CoV-2. Por ejemplo, la provincia de Santa Elena reportó 3 casos el 17 de Marzo que luego desaparecieron el 18 de Marzo, o el caso que apareció y desapareció de Sucumbíos entre el 10 y el 11 de Abril (mirar los reportes de las fechas correspondientes). Otros aportes interesantes incluyen el cese del reporte nocturno ahora solo representado por una publicación entre las 10-11 am a partir del 2 de Abril, y la inclusion de un cuña informativa en el extremo inferior de los reportes: '*Adicional, hasta la fecha se registran 46 probables fallecidos COVID-19', dando lugar a la nueva variable: fallecidos probables (Fig. 3).

Figura 2. Reporte epidemiológico con la nueva variable: Fallecidos probables. Nótese que es bastante simple pasar por alto el detalle de la nueva variable en una infografía tan cargada.

Muchos de estos problemas pueden evitarse utilizando datos tabulados. Países ejemplares en la publicación de este tipo de información incluyen Estados Unidos o Brasil. El acceso a sus bases de datos es directa y está disponible en varios formatos como excel, txt, o csv, que son amigables para descargar, procesar y automatizar. Además de Ecuador, muchos otros países en el mundo son reacios a compartir esta información y el fenómeno está descrito científicamente junto con una lista de buenas prácticas para poder solucionarlo (Fairchild, 2018). Una de las razones del problema es el carácter estrictamente político que tienen los datos de salud. La presencia de un aumento de casos (de lo que sea...) representa un fallo en la salud que es visto de mala manera por el político de turno.

Como siempre en este mundo, los fenómenos son más complicados. También es parte del sistema irrisorio de evaluación establecido por la Organización Mundial de la Salud (OMS) y sus famosísimos objetivos del milenio. Obviamente países con más recursos tienen la habilidad de alcanzarlos, y pues, países con menos recursos son mal vistos cuando fracasan en, por ejemplo, disminuir los casos de una patología. En el caso de la enfermedad de Hansen (lepra), se ha visto que algunos países se esmeran por alcanzar el objetivo de menos de 1 caso en 10.000 habitantes disminuyendo su esfuerzo de vigilancia epidemiológica. Sino buscan casos, obviamente van a dejar de reportarlos y obviamente alcanzan el objetivo del 'milenio' (Penna, 2011 ). Un sistema de éxito/fracaso con premio/castigo en el contexto de sistemas de salud heterogéneos es infantil y promueve malas prácticas de salud pública.

Conforme el número de pruebas diagnósticas moleculares para COVID-19 se acumulaban y muchas de ellas no podían ser procesadas a tiempo, la bomba de tiempo estalló el 24 de Abril cuando se liberaron ~11,000 nuevos casos positivos asignados a diferentes provincias del país (Fig. 3). Por estas mismas fechas (el 22 de Abril), se publicaron datos en formato abierto (o al menos estaban publicados, acabo de entrar a la página y no hay nada allí: Mayo 14, 2020). Tras un silencio epidemiológico el 25 y 26, el lunes 27 de Abril se publicó un nuevo reporte epidemiológico más o menos con el mismo formato que la anterior (nuevas variables aparecieron como el número de casos descartados), pero con un nuevo problema: los casos publicados el 24 de Abril fueron re-distribuidos a lo largo de todo el país. En Galápagos, 84 casos reportados se transformaron en 59; los ~15,000 en Guayas se convirtieron ~10,000, los 1634 de Pichincha se volvieron 1194, y así en todo el resto de las provincias. Sin embargo, el número total de positivos aumentó: de 22.719 a 23.240.

Figura 3. Los reportes del 24 y 27 de Abril muestran una falta de consistencia fuerte. Las flechas verdes apuntan a las provincias descritas en el texto pero todas las provincias muestran incoherencias en el reporte.

A partir de aquí, fenómenos inexplicables como el aumento de tan solo un caso diario en todo el país, más pruebas acumuladas, casos que desaparecen haciendo que la curva acumulada de disminuya en vez de aumentar, causaron una nueva ola de lamentaciones, en twitter al menos:

Una consecuencia inmediata fue que, considerando la inestabilidad de los reportes epidemiológicos, cualquier modelo matemático/estadístico creado a partir de ellos estaba destinado también al fracaso. La liberación de ~11.000 pruebas en un día es un artefacto que ningún modelo pudo haber previsto y por supuesto estropeó cualquier intención de predicción. Para explicar las últimas inconsistencias, en la página oficial se publican también aclaraciones de cómo los datos se 'reclasifican' y por ende disminuyen (e.g., Nota aclaratoria MSP referente a las cifras de la infografía # No. 074 COVID 19_11052020), aunque tienen poca credibilidad.

Es fundamental publicar datos en forma tabulada, no solo en contextos epidémicos pero en todo momento. Se ahorra muchísimo tiempo que en última instancia significa recursos humanos y dinero que pueden ser distribuidos de mejor manera. ¿Cómo se ahorra tiempo? Pues los datos tabulados son rápidamente capturados por programas que automáticamente agregan a bases de datos globales como los disponibles por la OMS, u otros repositorios como Epiarchive (Cordova, 2018). Además, aumenta la credibilidad pues los datos pueden ser procesados por usuarios fuera de afiliaciones políticas y se demuestra un precedente de transparencia. Este tipo de datos pueden ser actualizados y corregidos, el ruido de este proceso ha sido denominado en inglés 'backfill' y existen modelos estadísticos para estimarlo (Osthus, 2019), algo que se sigue estudiando con la epidemia anual de Influenza en Estados Unidos.

Los datos abiertos han sido fundamentales para comprender COVID-19. Información clave como tiempo de inicio de síntomas y hospitalización, grupo de edad en riesgo, género, etc. han sido corroboradas en tiempo real por diferentes científicos en el mundo. Bases de datos como la de Xu, et al. (2020) demuestran cómo los datos pueden organizarse, procesarse y compartirse para explotarlos al máximo. Otro ejemplo es la cantidad de información disponible a través de our world in data.

Ojalá que entre los aprendizajes del COVID-19 se incluya el compartir datos tabulados por parte de las autoridades de salud. La salud no debería estar vinculada con el discurso político del éxito o fracaso de un país y más bien debería servir como un indicador para ayudar a los grupos más vulnerables y para distribuir recursos de manera eficaz y correcta durante cualquier epidemia y durante tiempos en los que enfermedades infecciosas endémicas, el hambre, y la pobreza son la carga eterna que doblega la esperanza de desarrollo de los sectores más vulnerables.

__________________________________________________

*** La publicación mencionada tiene fecha de Marzo 31, eso es porque fue publicada el 29 de Febrero ya que 2020 es año bisiesto. El problema es que muchas páginas web (e incluso programas como excel) no reconocen la fecha y colocan al azar otra fecha para reemplazarla. Por eso el '31 de Marzo' indicado en realidad es un error.

romero stories

Y el reporte (COVID-19) se fue al diablo... en Ecuador