Abstract:
Implementación de un algoritmo para la detección de brotes aplicado a
un sistema microbiológio
Speaker: Esther López Vizcaíno
Introduccion
En un sistema de vigilancia pasiva de enfermedades infecciosas (en este caso
problemas de salud definidos microbiológicamente) es importante la
detección precoz de brotes a fin de poder establecer medidas de
control. La detección de brotes en este tipo de sistemas es
conceptualmente simple: número de microorganismos declarados por
distintos laboratorios en una semana comparado con un umbral derivado de datos
históricos.
Un algoritmo estadístico para el cálculo del valor umbral debe
tener en cuenta las fluctuaciones en los datos debidas a ciclos estacionales,
tendencia y brotes pasados, que varían de un microorganismo a otro.
Además, el sistem a debe ser suficientemente robusto para ser aplicado
a una gran variedad de microorganismos. Farrington et al. (1996) desarrollaron
un algoritmo que tiene en cuenta estos factores, calculando el valor umbral
mediante un modelo de regresión log-lin eal ajustado por
sobredispersión, estacionalidad, tendencia y brotes pasados.
El objetivo de este trabajo es la adaptación a este sistema de
vigilancia del modelo propuesto por Farrington et al. (1996). El paquete
estadístico Stata 5.0 fue utilizado para el desarrollo del algoritmo.
Asumimos que los datos siguen una distribución de Poisson de media
m i excepto cuando existe
sobredispersión; en ese caso la media de la distribución de
Poisson se supone distribuída de acuerdo a una Gamma con media m i y varianza m i(f
-1), f parámetro de
sobredispersión, lo que resulta en una Binomial-Negativa con media
m i y varianza f m i. La
componente sistemática del modelo es: ln m i =a
+b ti +g ni, donde ti es la variable
tiempo medida en semanas y ni es el número de hospitales en
los que se produjeron los casos declarados. Asumimos también que existe
correlación entre los datos de un mismo año, y que los datos de
años distintos son independientes.
Descripción del algoritmo
Para cada uno de los microorganismos notificados se siguen los siguientes pasos:
Los datos históricos para estimar el modelo de regresión para la
semana t0 son los correspondientes a las semanas t0-3 a
t0+3 de los cinco años anteriores, resultando un total de 35
datos:
| Año a |
|
|
|
|
t0 |
|
|
|
| Año a-1 |
|
|
|
|
|
|
|
|
| Año a-2 |
|
|
|
|
|
|
|
|
| Año a-3 |
|
|
|
|
|
|
|
|
| Año a-4 |
|
|
|
|
|
|
|
|
| Año a-5 |
|
|
|
|
|
|
|
|
Se estima un modelo inicial utilizando poisson y se contrasta la
sobredispersión de los datos.
Si hay sobredispersión, se estima un modelo de regresión
Binomial-Negativa haciendo uso del ado ml con el métodolf para
maximizar la función de verosimilitud y tomando como valores iniciales
los obtenidos con el modelo de Poisson. Este nuevo modelo proporciona
estimaciones iniciales y permite definir una función de
ponderación que asigna pesos bajos a las observaciones atípicas.
A continuación se reajusta el modelo teniendo en cuenta los pesos def
inidos, y de este modo se corrige el efecto de posibles brotes pasados. En
este modelo la correlación existente entre datos pertenecientes a un
mismo año se corrigió en el cálculo del valor umbral.
En otro caso, se reestima el modelo de Poisson con poisml utilizando las
opciones robust, que corrige el efecto de
brotes pasados, y cluster, que tiene en cuenta
la correlación existe nte entre los datos del mismo año.
En ambos casos, tanto en el modelo de Poisson como en el de la
Binomial-Negativa, se contrasta la significación de la tendencia, de
tal forma que si esta no es significativa se elimina del modelo y se repite la
estimación sin esta variable.
En cada caso el ajuste del modelo nos proporciona una predicción por
intervalo con una confianza del 97.5% para la semana t0. El valor
umbral será el límite superior del intervalo de
predicción.
El resultado final del algoritmo es una tabla con la siguienta estructura:
------------------------+-----------------------------------
Organismo | Casos Umbral Brote
------------------------+-----------------------------------
A.caviae | 5 2.92 Brote
Aeromonas sp. | 0 0.02 -
C.coli | 4 8.78 -
C.difficile | 1 3.20 -
C.laridis | 0 2.18 -
Campylobacter sp. | 16 24.16 -
Y.enterocolitica | 8 8.53 -
Y.enterocolitica ser.03 | 1 3.45 -
------------------------+-----------------------------------
Referencias
- Biggeri, A. 1998.
- Negative Binomial Distribution. In Encyclopedia of
Biostatistics, Vol. 4. P. Armitage and T. Colton, eds. Wiley, 2962–2967.
- Dean, C. B. 1998.
- Overdispersion. In Encyclopedia of Biostatistics, Vol.
4. P. Armitage and T. Colton, eds. Wiley, 3226–3232.
- Farrington, C.P. et al. 1996.
- A Statistical Algorithm for ther Early Detection
of Outbreaks of Infectious Disease. J. R. Statist. Soc. A 159: 547–563.
- Gould, W. 1996.
- ip13: Maximum likelihood estimation using the ml command.
Stata Technical Bulletin 34: 10–21. Reprinted in Stata Technical
Bulletin Reprints, vol 6, pp. 55–68.
- Hilbe, J. 1998.
- sg91: Robust variance estimators for MLE Poisson and negative
binomial regression. Stata Technical Bulletin 45: 26–28.
|
Meetings
Stata Conference
User Group meetings
Proceedings
|