03. Mai 2018

Suchmaschinen für die personalisierte Onkologie

HU-Informatiker wollen mit verbesserter Datenanalyse ärztliche Entscheidungsfindung erleichtern

Prof. Ulf Leser. Bild: © Adlershof Journal

Informatiker Ulf Leser erleichtert die Recherchemöglichkeiten von Medizinern. Bild: © Adlershof Journal

Wird bei einer Patientin ein bösartiger Tumor diagnostiziert, steht die Frage nach der passenden Behandlung an: Operation, Therapie – und welche? Professor Ulf Leser und sein Lehrstuhl für Wissensmanagement in der Bioinformatik am Institut für Informatik der Humboldt-Universität zu Berlin will mit der Entwicklung spezieller Suchmaschinen Mediziner bei dieser Entscheidung unterstützen. Die Software kann aus der Vielzahl medizinischer Publikationen und Datenbanken gezielt solche heraussuchen, die in einem spezifischen Krankheitsfall Hinweise für eine möglichst erfolgreiche Behandlung geben können.

Die Aufgabe klingt leichter, als sie ist, denn mit PubMed gibt es zwar ein öffentlich zugängliches Verzeichnis aller medizinischen Veröffentlichungen. Die dafür angebotene Suchmaschine ordnet Treffer aber in erster Linie chronologisch und nicht nach ihrer medizinischen Relevanz. Und die Fülle verfügbarer Informationen ist enorm. Jedes Jahr kommen zu den aktuell 30 Millionen bereits gespeicherten wissenschaftlichen Papern ungefähr eine weitere Million hinzu. Zu häufigen Tumoren forschen Hunderte Gruppen weltweit und publizieren ständig neue Erkenntnisse aus Dutzenden klinischer Studien und einer Vielzahl großer Sequenzierprojekte. Das ist erfreulich, aber auch Teil des Dilemmas, vor dem die behandelnden Ärzte stehen. „Kein Experte kann da auch nur für seinen Bereich noch den Überblick behalten“, weiß Leser. „Bei komplizierten Fällen suchen Mediziner zurzeit zwischen 30 Minuten und einem Tag pro Patient. Wir wollen Zeit sparen und das Suchergebnis verbessern.“

Speziell geht es um die Suche nach Informationen zu Tumoren mit bestimmten Genmutationen, die einer Standardtherapie nicht oder nicht mehr zugänglich sind. Hierfür werden zunehmend molekular genaue Wirkstoffe entwickelt, die an bestimmten Genen andocken, aber nur, wenn diese auf bestimmte Weise mutiert sind (oder nicht) – sonst wirkt das Medikament nicht.

Wird das Genom eines Tumors sequenziert, ergibt sich eine Liste von einigen Dutzend bis Tausenden Mutationen. Aus diesen müssen die Ärzte dann idealerweise die entscheidenden fünf bis zehn herauskristallisieren, die einen Ansatzpunkt für die Behandlung liefern. „Diesen Kristallisationsprozess zu unterstützen, ist das Ziel unserer Projekte PERSONS und PREDICT, die beide aus interdisziplinären Teams bestehen“, sagt Leser. Neben der Berliner Charité sind unter anderem auch die Universität Tübingen und die Universitätsklinik Tübingen beteiligt. „Unsere Software soll selber keine Entscheidungen treffen, sondern stellt eine umfassende und aktuelle Datenbasis zur Unterstützung der ärztlichen Entscheidungsfindung zur Verfügung“, betont Leser. „Was weiß man weltweit über die einzelnen Mutationen und ihre klinischen Implikationen, also ihre Auswirkungen auf den Verlauf der Krankheit? Und wie können wir dieses Wissen einem Arzt möglichst schnell, intuitiv, gut zusammengestellt und gut aufbereitet zur Verfügung stellen?“

Dafür braucht es optimierte Suchmaschinen. Doch deren Programmierung gestaltet sich schwierig. Das Problem beginnt mit dem Finden der geeigneten Suchbegriffe. Es ist mitnichten so, dass die Benennung eines Gens oder einer Mutation in der Literatur einheitlich wäre. Ein typisches menschliches Gen hat ca. acht Namen, die oft auch extrem ähnlich zu den Namen anderer Gene sind und identisch mit den Namen von Genen in anderen Säugetieren. Auch eine Krankheit heißt nicht immer gleich: Man sagt Darmkrebs oder kolorektales Karzinom, und meint es mit oder ohne Metastasen. Ein Hauptaugenmerk der Forscher liegt darin, Veröffentlichungen und Datenbanken zu finden, die für einen gegebenen Patienten klinische Relevanz haben.

Für den Informatiker Ulf Leser sind das große Integrations- und Text-Mining-Probleme. Mit seinem Team entwickelt er Methoden, die zum einen die relevanten Veröffentlichungen automatisch finden. Und zum anderen extrahieren sie aus diesen die gewünschten Informationen: über Gene, Mutationen, Krankheitsnamen, Medikamente etc. Dabei wenden die Forscher Methoden des Machine-Learning an. Sie lassen die Software an einem Set von Tausend klinisch relevanten Studien lernen. Ein sogenannter Klassifikator betrachtet jedes einzelne Wort und seine Häufigkeit im Text und vergleicht diese mit Tausenden von Dokumenten, die nicht klinisch relevant sind. Mittels der gelernten Unterschiede kann das System dann bei neuen Veröffentlichungen mit einer bestimmten Wahrscheinlichkeit vorhersagen, ob sie als klinisch relevant einzuordnen ist.

Das Forscherteam hat gerade erste Versionen einer Suchmaschine entwickelt, die jetzt von Ärzten getestet und bewertet werden. „Die Genauigkeit der Ergebnisse ist vielversprechend und deutlich besser als bei PubMed, der de facto Standardsuchmaschine für Onkologen“, resümiert Leser.

Von Uta Deffke für Adlershof Journal

www.informatik.hu-berlin.de

Sonderforschungsbereich FONDA sucht neue Methoden zur Analyse großer Datensätze
Ziel des hochschulübergreifenden Forschungsprojektes ist eine einfachere und wiederverwendbare Datenanalyse für die Naturwissenschaften
DFG fördert neuen Sonderforschungsbereich an der HU
Der SFB 1404 „FONDA – Grundlagen von Workflows für die Analyse großer naturwissenschaftlicher Daten“ wird ab 1. Juli 2020 gefördert
Adlershof Journal Mai/Juni 2018
Hier steckt Biotechnologie drin: Von Algenteppich bis Zuckerimpfstoff
Der Herr der Daten
Mit ausgeklügelten Algorithmen krankmachende Gene aufstöbern

Humboldt-Universität zu Berlin | Institut für Informatik

Suchmaschinen für die personalisierte Onkologie

HU-Informatiker wollen mit verbesserter Datenanalyse ärztliche Entscheidungsfindung erleichtern

Sonderforschungsbereich FONDA sucht neue Methoden zur Analyse großer Datensätze

DFG fördert neuen Sonder­forschungs­bereich an der HU

Adlershof Journal Mai/Juni 2018

Der Herr der Daten

DFG fördert neuen Sonderforschungsbereich an der HU