COVID-19 Knowledge Space

Der »COVID-19 Knowledge Space« ist das weltweit umfangreichste, computebare Cause-and-Effect Modell für COVID-19. Er bietet darüber hinaus auch eine COVID-19 Terminologie, die mittelfristig zur »referential COVID-19 Ontology« ausgebaut werden soll. Die Terminologie wird auch Bestandteil einer COVID-19 Text-Mining-Machinerie, die der Scientific Community zur Verfügung gestellt wird.
Mittelfristig liefert das Text Mining die Daten für einen umfassenden »Chemical Space« rund um COVID-19.
Diese Wissensbasis will das Fraunhofer SCAI zusammen mit den Kollegen des IME in Hamburg nutzen, um die Vorhersagen für Kandidaten zum Drug Re-Purposing erheblich zu verbessern.

BiKMi Knowledge Graph

© Fraunhofer SCAI

Der Biomedical Knowledge Miner (BiKMi) bietet Werkzeuge für den Zugang zu und die Validierung von Wissen, das alle aktuellen Informationen zu COVID-19 (SARS-CoV-2) umfasst.

Der COVID-19-Wissensgraph ist ein umfassendes Cause-and-Effect-Netzwerk, das auf Grundlage der wissenschaftlichen Literatur über das neue Coronavirus erstellt wurde und einen weitreichenden Überblick über seine Pathophysiologie geben soll.  Aktuell umfasst es 3.954 Knoten, die 10 Entitätstypen (z. B. Proteine, Gene, Chemikalien und biologische Prozesse) und 9.484 Beziehungen (z. B. Zunahme, Abnahme und Assoziation) abdecken und ein nahtloses Interaktionsnetzwerk bilden.

Diese Ursache-Wirkungs-Beziehungen bezeichnen in erster Linie Wirt-Pathogen-Interaktionen sowie Komorbiditäten und Symptome im Zusammenhang mit COVID-19. Darüber hinaus enthält der Knowledge Graph molekulare Interaktionen im Zusammenhang mit der Wirtsinvasion (z. B. Spike-Glykoprotein und seine Interaktion mit dem Wirt über den Rezeptor ACE2) und den Auswirkungen der nachgeschalteten Entzündungs-, Zellüberlebens- und Apoptose-Signalwege.

Ein Schlüsselaspekt des COVID-19 Knowledge Graph liegt in der umfassenden Erfassung der Wechselwirkungen zwischen Medikament und Zielmolekülen sowie der biologischen Prozesse, Gene und Proteine, die mit dem neuartigen Coronavirus assoziiert sind.

Es wurden 300 Arzneimittelkandidaten identifiziert, die derzeit im Rahmen von COVID-19 untersucht werden, darunter sowohl bereits zugelassende Medikamente, als auch solche, die in medizinischen Studien getestet werden.

SCAIView zu COVID-19

© Fraunhofer SCAI

Das Information-Retrieval-System SCAIView ermöglicht die semantische Suche in großen Textsammlungen, indem es Freitextsuchen mit den ontologischen Darstellungen von Entitäten kombiniert, die von Text-Mining-Systemen abgeleitet wurden.

Für die Forschung über das neuartige Coronavirus SARS-CoV-2 und die daraus resultierende COVID-19-Krankheit wurde ein spezielles System – das COVID-19 SCAIView – entwickelt. Dieses System ist so abgestimmt, dass es Antworten auf Fragen wie »Welche Gene/Proteine sind mit COVID-19 verwandt?«, »Welche Medikamente sind im Zusammenhang mit COVID-19 relevant?« oder »Welche Biologie steckt hinter dem neuen Coronavirus SARS-CoV-2?« liefern kann.

Die Hauptmerkmale von COVID-19 SCAIView sind:

  • Eine benutzerfreundliche Suchumgebung mit einem Query Builder, der semantische Abfragen mit biomedizinischen Entitäten unterstützt
  • Schnelles und präzises Suchen und Auffinden, basierend auf den neuesten Technologien semantischer Suchmaschinen
  • Farbcodierte Visualisierung und Rangfolge der relevantesten Entitäten und Dokumente
  • Export der Suchergebnisse in verschiedene Dateiformate

Derzeit indexiert COVID-19 SCAIView Korpora aus PubMed, PubMed Central und den CORD-19-Datensätzen, die auch Artikel von bioRxiv und medRxiv enthalten.

Diese Korpora werden in unserem System regelmäßig aktualisiert, damit immer die neuesten Forschungsartikel durchsucht werden können.

Die Dokumente werden durch präzise formulierte Fragen unter Verwendung ontologischer Darstellungen biomedizinischer Entitäten abgerufen. Zu den Entitäten gehören Gene/Proteine, Phänotypen, Arzneimittelverbindungen und mehr. COVID-19 SCAIView unterstützt die Auswahl geeigneter Entitäten durch eine Autokomplettierungsfunktion und eine Wissensdatenbank für jede Entität. Dazu gehören eine Textbeschreibung der Entität, alternative Namen, ein Entitätsidentifikator und Links zu relevanten biomedizinischen Datenbanken.

In naher Zukunft konzentrieren wir uns auf die Einführung von Chemie und Triples/Beziehungen, die Informationen über Wirkstoff-Ziel und Arzneimittelnebenwirkungen enthalten. Darüber hinaus werden wir auch Text-Mining-Module für die Extraktion von Informationen entwickeln, die klinische Behandlungen mit Ergebnissen verknüpfen.