Paquete de trabajo 2
Enfoques armonizados para los datos
recopilación y análisis
El WP2 tiene 5 objetivos:
-
Armonización del contenido modular para diccionarios de datos.
-
Herramienta web «CRF Builder» para la generación rápida de eCRF FAIR personalizados. Ver aquí.
-
Metadatos legibles por máquina.
-
Armonización con el flujo de datos de cohortes existente en ReCoDID.
-
Nuevos enfoques bayesianos para abordar el error de medición en el diagnóstico de arbovirus en análisis entre cohortes.
En el Paquete de Trabajo 2 (WP2), CONTAGIO abordará las principales barreras técnicas para la interoperabilidad de cohortes identificadas en el WP1, aprovechando la experiencia en armonización e intercambio de datos de ReCoDID y el Observatorio de Datos de Enfermedades Infecciosas (IDDO13). Colaboraremos con las partes interesadas, tanto dentro como fuera de CONTAGIO, para identificar un conjunto mínimo y extendido de variables necesarias para caracterizar los síndromes de interés, incluyendo los virus del dengue y el chikunguña. Estas variables se registrarán en el Consorcio de Estándares de Intercambio de Datos Clínicos (CDISC) para garantizar la interoperabilidad y proporcionarán contenido a un generador de CRF basado en la web. Este generador combina flexibilidad con FAIR, permitiendo a los usuarios finales (cohortes) crear un eCRF personalizado a partir de un conjunto de variables. De igual forma, trabajaremos con las partes interesadas internas y externas para definir un conjunto mínimo de metadatos necesarios para describir cohortes relacionadas. Los metadatos contarán con un amplio consenso, serán FAIR y legibles por máquina para garantizar la convergencia de FAIR dentro de las comunidades de enfermedades relacionadas. El WP2 se centrará en los requisitos técnicos para facilitar la interoperabilidad entre los conjuntos de datos de cohortes. Para ello, brindaremos apoyo aplicado para ayudar a las cohortes a desarrollar un flujo de trabajo claro para la extracción, gestión y armonización de datos, en particular con respecto a nuevos tipos de datos como la etabalomía. Los datos sobre pruebas diagnósticas han demostrado ser una fuente de considerable heterogeneidad en la última pandemia. Desarrollaremos un enfoque bayesiano para explicar la varianza en los diagnósticos de arbovirus y así proporcionar diagnósticos más precisos e interpretables, en términos de probabilidad de positividad14 que tenga en cuenta la reactividad cruzada y el uso de herramientas de diagnóstico con diversos niveles de precisión a lo largo del tiempo, un desafío persistente para la respuesta de la investigación a las EID y otras fuentes de error de medición complejo. Estas innovaciones en el análisis de los datos de diagnóstico de EID contribuirán a la respuesta actual y futura a la pandemia.
