El gran volumen de datos geoetiquetados en Twitter sobre epidemias de influenza brinda a los investigadores la oportunidad de explorar, modelar y predecir las tendencias de los casos de influenza de forma puntual. Sin embargo, el crecimiento explosivo de los datos de las redes sociales hace que el muestreo sea una elección natural.
En un artículo publicado el pasado 21 de enero en el portal del International Journal of Environmental Reseach and Public Health, se desarrolla un método para la predicción en tiempo real de la influenza a partir de los datos de tweets en las redes sociales, que garantiza la predicción en tiempo real y es aplicable a los datos de muestreo.
En concreto, primero se simuló el proceso de muestreo de tweets de gripe y luego desarrolló un modelo específico de ecuación diferencial parcial (PDE - partial differential equation ) para caracterizar y predecir los volúmenes agregados de tweets de gripe. Nuestro modelo PDE incorpora los efectos de la propagación de la gripe, la recuperación de la gripe y las intervenciones activas humanas para reducir la gripe.
Los amplios resultados de simulación muestran que este modelo PDE puede eliminar casi por completo el efecto de la reducción de datos en el proceso de muestreo: requiere menos datos históricos, logrando unos resultados de predicción más sólidos, con una precisión relativa de más del 90%, con un 1% de los datos de muestra. Incluso para proporciones de datos de muestra más agresivas, como el 0,1% y 0,01%, el modelo aún puede lograr precisiones relativas de 85% y 83%, respectivamente.
Estos prometedores resultados resaltan la capacidad de nuestro este PDE mecanicista para predecir patrones temporales-espaciales de las tendencias de la gripe, incluso en el escenario de pequeñas muestras de datos de Twitter.
Regional Influenza Prediction with Sampling Twitter Data and PDE model
Yufang Wang, Kuai Xu ,Yun Kang ,Haiyan Wang ,Feng Wang y Adrian Avram
Int. J. Environ. Res. Public Health
https://doi.org/10.3390/ijerph17030678