Infektionsketten zeitnah nachgehen

Die deutsche Corona-App hat keine durchschlagenden Erfolge erzielt. Dass es mit Contact Tracing und Graphtechnologie auch anders geht, erklärt Dirk Möller, Area Director of Sales CEMEA, Neo4j, in einem Gastbeitrag.

Nachverfolgen und Eindämmen gilt noch immer als die effektivste Strategie im Kampf gegen Corona. Solange der Impfstoff auf sich warten lässt, heißt es für Gesundheitsämter, Daten sammeln und jeden neuen Fall isolieren. Die Universität Genf hat dazu ein Projekt gestartet und arbeitet gemeinsam mit dem Kanton (République et Canton de Genève) an einer Lösung, Infektionsketten schneller zurück zu verfolgen. Wichtigster Baustein dabei: Graphtechnologie.

Im Kontext von COVID-19 sind Daten zu Inzidenzraten, die Zahl der Neuinfektionen und Reproduktionswert allgegenwärtig geworden. Sie bestimmen mit, wann und wo Masken getragen werden müssen, wie viele Personen sich treffen können, wo Ausganssperren einzuhalten sind und wie lange Schulen, Geschäfte und Einrichtungen geschlossen bleiben. Die Erfassung dieser Daten und die Verfolgung der Infektionskette ist bei COVID-19 alles andere als einfach. Der Virus ist hochansteckend und Menschen können infektiös sein, lange bevor die ersten Symptome auftreten.

Ist eine Infektion mit dem Coronavirus bei einer Person nachgewiesen, erfragen die Gesundheitsämter in der Regel alle direkten Kontakte des Betroffenen der vergangenen Tage, bis zum Tag der ersten Symptome und noch zwei Tage zurück. Zu Beginn der Pandemie wurden so oft 40 bis 100 weitere Personen identifiziert. Kommt es zu größeren, isolierten Ausbrüchen – beispielsweise auf Hochzeitsfeiern – lassen sich Infektionsketten noch nachvollziehen. Bei vielen Einzelfällen dagegen ist das komplexe Netzwerk aus sozialen Kontakten ohne die entsprechenden Tools nicht mehr einsehbar.

Komplexe soziale Netzwerke abbilden

Contact Tracing, also die Rückverfolgung von neuen Ansteckungen über mehrere Personen hinweg, benötigt ein Datenmodell, das die vielfachen Kontaktpunkte und Beziehungen im sozialen Umfeld realitätsnah abbildet. Die Universität Genf setzt in einem Projekt aus diesem Grund auf eine Datenbank, die große Mengen unstrukturierter Daten im Kontext ihrer Datenbeziehungen speichert. Die Rede ist von Graphtechnologie und Graphdatenbanken. Was abstrakt klingt, kennt jeder, der schon einmal einen Familienstammbaum gesehen hat: Personen werden dabei als Kreise (Knoten) dargestellt, die über Linien (Kanten) miteinander verbunden sind. Jeder Kreis kann mit einem Namen, jede Linie mit einem Verwandtschaftsgrad (z. B. „verheiratet“) versehen werden. Dieses einfache Modell lässt sich auf unterschiedlichste Datensätze übertragen: „Kunde A kauft Produkt B“, „Felge X passt auf Autotyp Y“, „die A9 verbindet München mit Berlin“ oder eben auch „getestete Person 1 hatte Kontakt mit Person 1A, die wiederum mit den Personen 1AA und 1AB in einem Haushalt lebt“.

Graphdatenbanken unterstützen unzählige solcher gerichteten Beziehungen. Die gesamte Architektur ist auf Geschwindigkeit bei Management, Speicher und Abfragen von Knoten und Beziehungen optimiert. Dabei lassen sich mehrere Millionen Sprünge (Hops) pro Sekunde innerhalb des Knoten-Kanten-Modells durchführen. Diese hohe Geschwindigkeit ist für die Rückverfolgung von COVID-19 entscheidend. Die anschauliche Visualisierung der Daten sowie die Flexibilität des Modells helfen zudem, die extrem dynamische epidemiologische Situation zeit- und realitätsnah abzubilden. Das macht es auch für Anwender in Behörden, Gesundheitsämtern und medizinisches Personal einfacher, die Daten zu verstehen und Infektionsherde und Risikogebiete gezielter auszumachen.
Infektionswege im Graphen

Die Visualisierung im Graphen bietet drei grundsätzliche Vorteile für das Contact Tracing:

  1. Die Übertragung des Coronavirus kann überall stattfinden. Werden sämtliche Kontakte im Graphen abgebildet, lassen sich potenzielle Kontaktpunkte (z. B. Arbeitsplatz, Hotel) oder bestimmte Ereignisse (z. B. Fußballspiel, Gottesdienst) über die Knoten-Kanten-Verbindungen automatisch identifizieren. Berechnen lässt sich diese Wahrscheinlichkeit durch sogenannte Graph-Algorithmen.
  2. Im Graphen lassen sich neue Daten als Knoten-Kanten-Konstrukt hinzufügen, ohne das Modell an sich ändern zu müssen. Knoten und Kanten können zudem mit zusätzlichen Properties (Eigenschaften) versehen werden – zum Beispiel mit dem Datum des Testergebnisses, des letzten Kontakts zwischen zwei Personen oder eines Ereignisses (z. B. Restaurantbesuch). Das Anreichern der Daten kann helfen, die Infektionsrichtung zu bestimmen und Infektionen sowohl vorwärts- als auch rückwärtsgerichtet nachzuverfolgen.
  3. Es gibt nicht eine Infektionskette, sondern Tausende. Zudem ist es schwierig ausnahmslos alle Kontakte zu erfassen. Das erschwert es, Prioritäten bei der Untersuchung von Infektionsketten zu treffen. Wo konnte die Übertragung bereits weitgehend eingedämmt werden? Wer befindet sich bereits in Quarantäne? Welche Personen hatten die meisten/wenigsten Kontakte? Graph Analytics kann hier Daten filtern und komplexe Abfragen in Echtzeit durchführen, um Risiken besser zu bewerten und Ressourcen bedarfsgerecht einzuteilen.

 Projekt der Universität Genf

Ausgehend von diesen drei Prämissen machten sich die Entwickler der Universität Genf daran, ein Graphmodell für das Contact Tracing zu erstellen. Das Projekt ist Teil des „Graphs4Good”-Programms. Data Scientists, Entwickler, Wissenschaftler, Graph-Enthusiasten und Tech-Interessierte, die Graphtechnologie beispielsweise im Kampf gegen das Coronavirus einsetzen, können auf Anfrage kostenlos auf die Enterprise-Version der Neo4j-Datenbank zugreifen. Darüber hinaus erhalten sie Hilfe bei der Vermittlung von Mentoren, dem Teilen von Datensätzen und dem Austausch innerhalb der Community.

Das Team der Universität Genf stützt sein Graphmodell auf aktuelle Daten zu Infektionszahlen, die im Kanton Genf täglich von den Behörden gesammelt und aktualisiert werden. Die Daten umfassen alle positiven Testergebnisse auf SARS-CoV-2 sowie die letzten Kontakte der getesteten Personen. Hinzu kommen Daten von Personen, die sich zu einem bestimmten Zeitpunkt an einem Ort mit einem positiven COVID-19 Fall aufgehalten haben (z. B. Arbeitsplatz). Das schließt auch Personen aus einem Haushalt bzw. mit der gleichen Adresse mit ein. Auch Personen, die aus Risikogebieten zurückkehren, werden erfasst.

Ermittler im Datenmeer
Der Blick in den Graphen gibt schnell Auskunft über einige grundsätzliche Informationen:

    • X und Y haben sich auf einer Veranstaltung am Tag 321 getroffen.
    • Y steht in Beziehung zu zwei anderen Personen, die wahrscheinlich während eines Ereignisses an Tag 324 infiziert wurden. Beide erkrankten fünf bzw. sechs Tage nach diesem Ereignis. Es kann also angenommen werden, dass Y diese zwei Personen infiziert hat.
    • X hatte an den Tagen 323, 324 und 325 Kontakt mit mehreren Kollegen am Arbeitsplatz. Keiner von ihnen entwickelte Corona-typische Symptome.
    • Am Tag 327 stand X zweimal im Kontakt mit einer anderen Person, die vier Tage später (Tag 331) positiv getestet wurde.

Der anschauliche Blick auf die Daten legt die Vermutung nahe, dass Y mit großer Wahrscheinlichkeit Person X infiziert hat. Y scheint insbesondere um den Tag 324 infektiös gewesen zu sein – anders als X, der zur gleichen Zeit niemanden an seinem Arbeitsplatz ansteckte. Damit ist zwar noch nicht klar, wie und wo sich Y infizierte. Behörden und Gesundheitsämter haben aber wichtige Anhaltspunkte erhalten, um ihre Untersuchungen weiter zu fokussieren, gezielter nach dem Ursprung der Infektionskette zu fahnden und entsprechende Maßnahmen zu priorisieren.

 

Fazit

Je mehr Daten in einem Graphen miteinander verknüpft werden, desto aussagekräftiger sind die Abfragen, die in diesem semantischen Umfeld gestellt werden können. Grundsätzlich gilt es ja nicht nur, Kontaktdaten zu pflegen, sondern auch maßnahmenrelevante Informationen damit zu verknüpfen. Zeigt die Kontaktperson Symptome? Ist sie in Quarantäne? Wurde ein Test durchgeführt? Wie sind die Ergebnisse?

 

Jede Technologie, die Behörden und medizinischem Fachpersonal bei der Verfolgung von Kontakten und der Reduzierung der Übertragung unterstützt, ist ein Schritt in die richtige Richtung. Vor allem da uns Corona noch über eine sehr lange Zeit in all seinen Formen, einschließlich Langzeitfolgen, begleiten wird.

WEBINAR

Beim Endpunkt-Schutz zählt jede Sekunde: Warum die Entschärfung in Echtzeit entscheidend ist

Carsten Maceus, Systems Engineer bei Fortinet, erläutert in diesem Webinar, wie eine moderne IT-Sicherheitsarchitektur in Unternehmen aussehen sollte. Er illustriert dies am Beispiel eines Fußballstadions wo Bengalos, Flitzer, Ordner und Zuschauer agieren. Spannend.

Themenseiten: COVID-19, Neo4j

Fanden Sie diesen Artikel nützlich?
Content Loading ...
Whitepaper

Artikel empfehlen:

Neueste Kommentare 

3 Kommentare zu Infektionsketten zeitnah nachgehen

Kommentar hinzufügen
  • Am 22. Februar 2021 um 11:07 von Andreas Boehlk

    Der Datenschutz wird für die Nutzungs-Phase ein großes Problem darstellen. In der derzeitigen Test-Phase ist er jedenfalls in keiner Weise gewährleistet. Der Ansatz ist aber überzeugend. Interessant wird dann außerdem die technische Umsetzung der Generierung der Daten, was bisher ja auch ein Haupt-Problem in vielerlei Hinsicht ist.

  • Am 23. Februar 2021 um 20:29 von Daniel

    Solange man nicht genügend testen kann oder will ( könnte ja rauskommen, dass Covid 19 doch an Arbeitsplätze stark verbeitet wird ), nützt das Tracking wenig.

  • Am 24. Februar 2021 um 13:08 von Friedhelm Müller

    Mir läuft ein Schauer den Rücken runter.
    Präzise gläsern würde ich dargestellt.
    Genau das, worauf Staat und Geheimdienste schon lange warten.
    Brr. Ab in die totale (oder totalitäre?) Zukunft.
    Genau deshalb habe ich selbstverständlich keine Corona App auf dem Handy.
    Genau deshalb sind die Ortungsdienste aus.
    Genau deshalb bleibt das Handy zuhause, wen ich unterwegs bin.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *