Das Information-Retrieval-System SCAIView ermöglicht die semantische Suche in großen Textsammlungen, indem es Freitextsuchen mit den ontologischen Darstellungen von Entitäten kombiniert, die von Text-Mining-Systemen abgeleitet wurden.
Für die Forschung über das neuartige Coronavirus SARS-CoV-2 und die daraus resultierende COVID-19-Krankheit wurde ein spezielles System – das COVID-19 SCAIView – entwickelt. Dieses System ist so abgestimmt, dass es Antworten auf Fragen wie »Welche Gene/Proteine sind mit COVID-19 verwandt?«, »Welche Medikamente sind im Zusammenhang mit COVID-19 relevant?« oder »Welche Biologie steckt hinter dem neuen Coronavirus SARS-CoV-2?« liefern kann.
Die Hauptmerkmale von COVID-19 SCAIView sind:
- Eine benutzerfreundliche Suchumgebung mit einem Query Builder, der semantische Abfragen mit biomedizinischen Entitäten unterstützt
- Schnelles und präzises Suchen und Auffinden, basierend auf den neuesten Technologien semantischer Suchmaschinen
- Farbcodierte Visualisierung und Rangfolge der relevantesten Entitäten und Dokumente
- Export der Suchergebnisse in verschiedene Dateiformate
Derzeit indexiert COVID-19 SCAIView Korpora aus PubMed, PubMed Central und den CORD-19-Datensätzen, die auch Artikel von bioRxiv und medRxiv enthalten.
Diese Korpora werden in unserem System regelmäßig aktualisiert, damit immer die neuesten Forschungsartikel durchsucht werden können.
Die Dokumente werden durch präzise formulierte Fragen unter Verwendung ontologischer Darstellungen biomedizinischer Entitäten abgerufen. Zu den Entitäten gehören Gene/Proteine, Phänotypen, Arzneimittelverbindungen und mehr. COVID-19 SCAIView unterstützt die Auswahl geeigneter Entitäten durch eine Autokomplettierungsfunktion und eine Wissensdatenbank für jede Entität. Dazu gehören eine Textbeschreibung der Entität, alternative Namen, ein Entitätsidentifikator und Links zu relevanten biomedizinischen Datenbanken.
In naher Zukunft konzentrieren wir uns auf die Einführung von Chemie und Triples/Beziehungen, die Informationen über Wirkstoff-Ziel und Arzneimittelnebenwirkungen enthalten. Darüber hinaus werden wir auch Text-Mining-Module für die Extraktion von Informationen entwickeln, die klinische Behandlungen mit Ergebnissen verknüpfen.