Intern
Lehrstuhl für klinische Epidemiologie und Biometrie

NAPCODE

National Post-COVID Dataset

Der Post-COVID Zustand beschreibt Gesundheitsprobleme, die nach oder während einer COVID-19 Erkrankung auftreten und nach der akuten Erkrankung bestehen bleiben. Während der Pandemie wurden zahlreiche COVID-19 Studien durchgeführt, wodurch viele Patientinnen- und Patientendaten gesammelt wurden. Diese sind jedoch sehr heterogen und variieren bezüglich ihrer zugrundeliegenden Fragestellung, der eingeschlossenen Teilnehmenden, dem Infektionszeitpunkt, dem Umfang sowie dem Zeitraum durchgeführter Nachuntersuchungen. Außerdem muss berücksichtigt werden, dass sich das Virus im Verlauf der Pandemie ständig weiterentwickelt hat.

Um die vielen Ergebnisse der COVID-19 Forschung optimal für die Post-COVID-Forschung nutzen zu können, bedarf es eines speziell auf Post-COVID zugeschnittenen Datensatzes, der die eben genannten Aspekte berücksichtigt. Das Projekt “National Post-COVID Dataset” (NAPCODE) des Bundesministerium für Forschung, Technologie und Raumfahrt (BMFTR) zielt darauf ab, einen solchen für Post-COVID zugeschnittenen Datensatz zu erstellen. Dieser Variablensatz wird forschungsrelevante Informationen aus der klinisch-epidemiologischen und biomedizinischen Forschung zu Post-COVID beinhalten und mittels innovativer Verfahren der Datenanalyse aus bereits vorhandenen Datensätzen definiert.  In Verbindung mit Versorgungsdaten von Post-COVID-Erkrankten sollen die Erkenntnisse zur Entwicklung besserer Behandlungs- und Versorgungskonzepte beitragen.

Ziel des Projektes ist ein einheitlicher Post-COVID Variablen- sowie Datensatz, auf den Forscherinnen und Forscher durch ein öffentliches Antragsverfahren zugreifen können. Dies ermöglicht den Zugang zu hoch relevanten und qualitativ hochwertigen Forschungsdaten. Dadurch sollen aktuelle Forschungsfragen, einschließlich Definitionen, Risikofaktoren und effizienten Interventionen, beantwortet und somit die allgemeine Versorgung von Post-COVID-Erkrankten langfristig verbessert werden.

Der im Projekt definierte Variablensatz soll auf die Daten des Nationalen Pandemie-Kohorten Netzes (NAPKON) angewendet werden, um einen ersten Post-COVID Datensatz zu generieren. Aus den drei NAPKON-Kohorten “hochauflösende Plattform” (HAP), “populationsbasierte Plattform” (POP) und “sektorenübergreifende Plattform” (SÜP) sollen drei pseudonymisierte Datensätze entstehen. Die Datensätze dienen als Grundlage für die Entwicklung weiterer Datensätze.

Ergänzend dazu werden frei zugängliche unterstützende Analyseskripte (in R) bereitgestellt, welche den Datenexport für Analysen erleichtern und alle notwendigen Schritte zur Bereinigung, Gestaltung und Annotation der Daten umfassen. Schließlich sind noch ein frei zugänglicher, anonymisierter Datensatz und ein synthetisierter Datensatz, welcher die Struktur und Syntax des Post-COVID-Datensatzes aufweist, geplant.

Das Projekt ist gegliedert in fünf Arbeitspakete. Das IKE-B und das ImDS sind beratend an Arbeitspaket 2 im Rahmen der AG Post-COVID beteiligt und federführend für Arbeitspaket 4 verantwortlich.