Categories: CloudCloud-Management

Infektionsketten zeitnah nachgehen

Nachverfolgen und Eindämmen gilt noch immer als die effektivste Strategie im Kampf gegen Corona. Solange der Impfstoff auf sich warten lässt, heißt es für Gesundheitsämter, Daten sammeln und jeden neuen Fall isolieren. Die Universität Genf hat dazu ein Projekt gestartet und arbeitet gemeinsam mit dem Kanton (République et Canton de Genève) an einer Lösung, Infektionsketten schneller zurück zu verfolgen. Wichtigster Baustein dabei: Graphtechnologie.

Im Kontext von COVID-19 sind Daten zu Inzidenzraten, die Zahl der Neuinfektionen und Reproduktionswert allgegenwärtig geworden. Sie bestimmen mit, wann und wo Masken getragen werden müssen, wie viele Personen sich treffen können, wo Ausganssperren einzuhalten sind und wie lange Schulen, Geschäfte und Einrichtungen geschlossen bleiben. Die Erfassung dieser Daten und die Verfolgung der Infektionskette ist bei COVID-19 alles andere als einfach. Der Virus ist hochansteckend und Menschen können infektiös sein, lange bevor die ersten Symptome auftreten.

Ist eine Infektion mit dem Coronavirus bei einer Person nachgewiesen, erfragen die Gesundheitsämter in der Regel alle direkten Kontakte des Betroffenen der vergangenen Tage, bis zum Tag der ersten Symptome und noch zwei Tage zurück. Zu Beginn der Pandemie wurden so oft 40 bis 100 weitere Personen identifiziert. Kommt es zu größeren, isolierten Ausbrüchen – beispielsweise auf Hochzeitsfeiern – lassen sich Infektionsketten noch nachvollziehen. Bei vielen Einzelfällen dagegen ist das komplexe Netzwerk aus sozialen Kontakten ohne die entsprechenden Tools nicht mehr einsehbar.

Komplexe soziale Netzwerke abbilden

Contact Tracing, also die Rückverfolgung von neuen Ansteckungen über mehrere Personen hinweg, benötigt ein Datenmodell, das die vielfachen Kontaktpunkte und Beziehungen im sozialen Umfeld realitätsnah abbildet. Die Universität Genf setzt in einem Projekt aus diesem Grund auf eine Datenbank, die große Mengen unstrukturierter Daten im Kontext ihrer Datenbeziehungen speichert. Die Rede ist von Graphtechnologie und Graphdatenbanken. Was abstrakt klingt, kennt jeder, der schon einmal einen Familienstammbaum gesehen hat: Personen werden dabei als Kreise (Knoten) dargestellt, die über Linien (Kanten) miteinander verbunden sind. Jeder Kreis kann mit einem Namen, jede Linie mit einem Verwandtschaftsgrad (z. B. „verheiratet“) versehen werden. Dieses einfache Modell lässt sich auf unterschiedlichste Datensätze übertragen: „Kunde A kauft Produkt B“, „Felge X passt auf Autotyp Y“, „die A9 verbindet München mit Berlin“ oder eben auch „getestete Person 1 hatte Kontakt mit Person 1A, die wiederum mit den Personen 1AA und 1AB in einem Haushalt lebt“.

Graphdatenbanken unterstützen unzählige solcher gerichteten Beziehungen. Die gesamte Architektur ist auf Geschwindigkeit bei Management, Speicher und Abfragen von Knoten und Beziehungen optimiert. Dabei lassen sich mehrere Millionen Sprünge (Hops) pro Sekunde innerhalb des Knoten-Kanten-Modells durchführen. Diese hohe Geschwindigkeit ist für die Rückverfolgung von COVID-19 entscheidend. Die anschauliche Visualisierung der Daten sowie die Flexibilität des Modells helfen zudem, die extrem dynamische epidemiologische Situation zeit- und realitätsnah abzubilden. Das macht es auch für Anwender in Behörden, Gesundheitsämtern und medizinisches Personal einfacher, die Daten zu verstehen und Infektionsherde und Risikogebiete gezielter auszumachen.
Infektionswege im Graphen

Die Visualisierung im Graphen bietet drei grundsätzliche Vorteile für das Contact Tracing:

  1. Die Übertragung des Coronavirus kann überall stattfinden. Werden sämtliche Kontakte im Graphen abgebildet, lassen sich potenzielle Kontaktpunkte (z. B. Arbeitsplatz, Hotel) oder bestimmte Ereignisse (z. B. Fußballspiel, Gottesdienst) über die Knoten-Kanten-Verbindungen automatisch identifizieren. Berechnen lässt sich diese Wahrscheinlichkeit durch sogenannte Graph-Algorithmen.
  2. Im Graphen lassen sich neue Daten als Knoten-Kanten-Konstrukt hinzufügen, ohne das Modell an sich ändern zu müssen. Knoten und Kanten können zudem mit zusätzlichen Properties (Eigenschaften) versehen werden – zum Beispiel mit dem Datum des Testergebnisses, des letzten Kontakts zwischen zwei Personen oder eines Ereignisses (z. B. Restaurantbesuch). Das Anreichern der Daten kann helfen, die Infektionsrichtung zu bestimmen und Infektionen sowohl vorwärts- als auch rückwärtsgerichtet nachzuverfolgen.
  3. Es gibt nicht eine Infektionskette, sondern Tausende. Zudem ist es schwierig ausnahmslos alle Kontakte zu erfassen. Das erschwert es, Prioritäten bei der Untersuchung von Infektionsketten zu treffen. Wo konnte die Übertragung bereits weitgehend eingedämmt werden? Wer befindet sich bereits in Quarantäne? Welche Personen hatten die meisten/wenigsten Kontakte? Graph Analytics kann hier Daten filtern und komplexe Abfragen in Echtzeit durchführen, um Risiken besser zu bewerten und Ressourcen bedarfsgerecht einzuteilen.

Projekt der Universität Genf

Ausgehend von diesen drei Prämissen machten sich die Entwickler der Universität Genf daran, ein Graphmodell für das Contact Tracing zu erstellen. Das Projekt ist Teil des „Graphs4Good”-Programms. Data Scientists, Entwickler, Wissenschaftler, Graph-Enthusiasten und Tech-Interessierte, die Graphtechnologie beispielsweise im Kampf gegen das Coronavirus einsetzen, können auf Anfrage kostenlos auf die Enterprise-Version der Neo4j-Datenbank zugreifen. Darüber hinaus erhalten sie Hilfe bei der Vermittlung von Mentoren, dem Teilen von Datensätzen und dem Austausch innerhalb der Community.

Das Team der Universität Genf stützt sein Graphmodell auf aktuelle Daten zu Infektionszahlen, die im Kanton Genf täglich von den Behörden gesammelt und aktualisiert werden. Die Daten umfassen alle positiven Testergebnisse auf SARS-CoV-2 sowie die letzten Kontakte der getesteten Personen. Hinzu kommen Daten von Personen, die sich zu einem bestimmten Zeitpunkt an einem Ort mit einem positiven COVID-19 Fall aufgehalten haben (z. B. Arbeitsplatz). Das schließt auch Personen aus einem Haushalt bzw. mit der gleichen Adresse mit ein. Auch Personen, die aus Risikogebieten zurückkehren, werden erfasst.

Ermittler im Datenmeer
Der Blick in den Graphen gibt schnell Auskunft über einige grundsätzliche Informationen:

    • X und Y haben sich auf einer Veranstaltung am Tag 321 getroffen.
    • Y steht in Beziehung zu zwei anderen Personen, die wahrscheinlich während eines Ereignisses an Tag 324 infiziert wurden. Beide erkrankten fünf bzw. sechs Tage nach diesem Ereignis. Es kann also angenommen werden, dass Y diese zwei Personen infiziert hat.
    • X hatte an den Tagen 323, 324 und 325 Kontakt mit mehreren Kollegen am Arbeitsplatz. Keiner von ihnen entwickelte Corona-typische Symptome.
    • Am Tag 327 stand X zweimal im Kontakt mit einer anderen Person, die vier Tage später (Tag 331) positiv getestet wurde.

Der anschauliche Blick auf die Daten legt die Vermutung nahe, dass Y mit großer Wahrscheinlichkeit Person X infiziert hat. Y scheint insbesondere um den Tag 324 infektiös gewesen zu sein – anders als X, der zur gleichen Zeit niemanden an seinem Arbeitsplatz ansteckte. Damit ist zwar noch nicht klar, wie und wo sich Y infizierte. Behörden und Gesundheitsämter haben aber wichtige Anhaltspunkte erhalten, um ihre Untersuchungen weiter zu fokussieren, gezielter nach dem Ursprung der Infektionskette zu fahnden und entsprechende Maßnahmen zu priorisieren.

Fazit

Je mehr Daten in einem Graphen miteinander verknüpft werden, desto aussagekräftiger sind die Abfragen, die in diesem semantischen Umfeld gestellt werden können. Grundsätzlich gilt es ja nicht nur, Kontaktdaten zu pflegen, sondern auch maßnahmenrelevante Informationen damit zu verknüpfen. Zeigt die Kontaktperson Symptome? Ist sie in Quarantäne? Wurde ein Test durchgeführt? Wie sind die Ergebnisse?

Jede Technologie, die Behörden und medizinischem Fachpersonal bei der Verfolgung von Kontakten und der Reduzierung der Übertragung unterstützt, ist ein Schritt in die richtige Richtung. Vor allem da uns Corona noch über eine sehr lange Zeit in all seinen Formen, einschließlich Langzeitfolgen, begleiten wird.

WEBINAR

Beim Endpunkt-Schutz zählt jede Sekunde: Warum die Entschärfung in Echtzeit entscheidend ist

Carsten Maceus, Systems Engineer bei Fortinet, erläutert in diesem Webinar, wie eine moderne IT-Sicherheitsarchitektur in Unternehmen aussehen sollte. Er illustriert dies am Beispiel eines Fußballstadions wo Bengalos, Flitzer, Ordner und Zuschauer agieren. Spannend.

ZDNet.de Redaktion

Recent Posts

Vier von fünf Deutschen sind auch im Urlaub online

Für berufliche Belange steht die Hälfte der Berufstätigen jedoch nicht zur Verfügung. Allerdings sind 15…

1 Stunde ago

Cyberkriminelle nutzen Youtube-Streamjacking rund um das Trump-Attentat

Vermeintliche Video-Deepfake-Kommentare von Elon Musk locken auf kriminelle Seiten zur angeblichen Bitcoin-Verdopplung.

7 Stunden ago

Google schließt schwerwiegende Sicherheitslöcher in Chrome

Sie stecken unter anderem in der JavaScript-Engine V8. Angreifbar sind Chrome für Windows, macOS und…

1 Tag ago

VMware-Alternativen: Diese Möglichkeiten bieten andere Anbieter, Open Source und die Cloud

Die Übernahme von VMware durch Broadcom schlägt in der IT-Welt hohe Wellen. Die Produkt- und…

1 Tag ago

Checkpoint: Microsoft überarbeitet kumulative Updates für Windows 11

Mit Windows 11 Version 24H2 setzt Microsoft auf kleinere kumulative Update-Pakete. Dafür erhält Windows zwischen…

1 Tag ago

Smartphoneverkäufe steigen um 6,5 Prozent im zweiten Quartal

Samsung und Apple wachsen langsamer als die Konkurrenz aus China. IDC rechnet mit weiteren Wachstumsimpulsen…

2 Tagen ago