Interview mit Paul Hellwig, Elsevier – „Der Trend geht weg von Black Box Methoden hin zu erklärbaren Modellen.“

Paul Hellwig, Director Research & Development, Elsevier

Paul Hellwig
Director Research & Development
Elsevier

Hallo Herr Hellwig, Sie sind Research & Development Director bei Elsevier. Welche Bedeutung hat Predictive Analytics für Ihre Arbeit?

Predictive Analytics ist ein Kernbereich unserer Arbeit. Elsevier hat, als weltweit führender Wissenschaftsverlag, Zugriff auf eine riesige Zahl wissenschaftlicher Publikationen. Die Informationen darin sind extrem vielfältig, und wären ohne technische Unterstützung unüberschaubar. Wir arbeiten daran, dem Wissenschaftler oder Arzt genau die Information zur Verfügung zu stellen, die er in seiner konkreten Situation benötigt. Das gelingt zum einen durch Verbesserung von Suchfunktionen, z.B. mit Hilfe von Text Mining Methoden. Zum anderen ist aber auch ein genaueres Verständnis der Situation notwendig, für die eine Information gerade benötigt wird. Beispielsweise wollen wir behandelnden Ärzten in Entscheidungssituationen genau die Hilfen an die Hand geben, die für den aktuellen Patienten von Belang sind. Dies beinhaltet Patienten-spezifische Prognosen von Krankheitsverläufen, um den Arzt darauf hinzuweisen, auf welche Risiken er bei seinem weiteren Vorgehen besonders achten sollte. Diese Prognosen erreichen wir mit Predictive Analytics auf medizinischen Daten.

Sie sprechen auf der Predictive Analytics World am 8.-9. November in Berlin. Der Titel Ihrer Session ist “Elsevier Medical Graph – Mit Machine Learning zu Precision Medicine”. Warum ist dieses Thema so wichtig?

Ein Arzt hat maximal 10 Minuten Zeit je Patient (Durchschnittswert für Europa). In dieser Zeit muss er die Krankengeschichte, aktuelle Symptome des Patienten und sonstige Vorkommnisse erfassen, muss Informationen über Ursachen und Risiken der verschiedenen Krankheiten abrufen, eine Diagnose stellen, und eine Therapie empfehlen. Gleichzeitig steigt das weltweit verfügbare Wissen über Krankheiten und Therapien exponentiell, so werden z.B. jedes Jahr >15.000 neue Artikel zum Thema Depression publiziert. Wir müssen den Arzt hier unterstützen, indem wir die Situation des Patienten analysieren, mit Predictive Analytics mögliche Risiken und Folgen ermitteln, und dies mit aktuellen wissenschaftlichen Informationen anreichern. Der Elsevier Medical Graph ist dabei ein Baustein, mit dem wir Zusammenhänge innerhalb der Medizin darstellen, basierend auf 2000+ Prognosemodellen.

Was können die Konferenzteilnehmer aus Ihrem Vortrag für die tägliche Arbeit mitnehmen?

Fachanwender wie Ärzte bevorzugen erklärbare Modelle, die ihnen helfen, Zusammenhänge zu verstehen. Also auch, wie eine Vorhersage zustande kommt, welche Effekte die einzelnen Parameter haben – so kann die Vorhersagegüte eines Modells vom Experten-Anwender besser eingeschätzt werden. Wir stellen mit dem Medical Graph eine Methode vor, um erklärbare Modelle zu visualisieren.

Welche Trends werden Predictive Analytics voraussichtlich in den nächsten Jahren prägen?

Der Trend geht weg von Black Box Methoden hin zu erklärbaren Modellen. Schöne Algorithmen allein werden nicht mehr ausreichen. Random Forests, Deep Learning, und andere Ensemble Methoden werden vermutlich weiterhin die üblichen Competitions gewinnen. In der Anwendung aber liefert keine Methode perfekte Prognosen – deswegen wird es wichtiger, dem Anwender im Feld erklären zu können, wie eine Prognose entsteht und wo die Grenzen eines Modells liegen. Dies gilt besonders für Anwender, die Experten auf ihrem jeweiligen Gebiet sind, zum Beispiel Ärzte. Und dies gilt auch besonders für Fälle, in denen ein Fehler im Modell ein hohes Risiko bedeutet, wie etwa bei selbstfahrenden Autos oder in der Medizin.
Aber auch in einfachen Fällen– wer von uns würde nicht gern verstehen, warum die Produktvorschläge bei Online Shops bereits gekaufte Produkte enthalten?

Insgesamt wird Predictive Analytics fachbezogener werden. Treiber sind fachliche Fragen und der (wirtschaftliche) Nutzen der Antwort, nicht mehr die reine Neugier der Data Scientists und der Spaß am Ausprobieren neuer Algorithmen auf immer größeren Datenmengen. Hoffentlich bleiben uns Neugier und Spaß aber erhalten.

Was halten Sie von dem erneuten Hype um Künstliche Intelligenz: folgt dem KI-Boom bald wieder ein KI-Winter?

Die Schwierigkeit ist, dass der Begriff „Künstliche Intelligenz“ dem normalen Nutzer etwas suggeriert – im Übrigen ganz ähnlich wie der Begriff „Autopilot“ – was nicht den aktuell konkret möglichen Anwendungen entspricht. In der Breite wird es deshalb eine Enttäuschung geben, die derzeit fast schon greifbar ist in der Diskussion um selbstfahrende Autos.
Jedem Experten ist klar, dass wir auch in den nächsten 10 Jahren in der Berliner Innenstadt keine autonom fahrenden Autos erleben werden, der Arzt nicht ersetzt wird durch automatisierte Diagnose und Therapie, und kein Roboter besser Fußball spielt als ein Mensch.
Aber, in eng abgegrenzten Bereichen wird die KI immer besser werden: Chatbots simulieren menschliche Konversation und machen Customer Support damit billiger, Assistenzsysteme wie Siri und Cortana wissen eher, wann wir den Kalender brauchen und wann ein Restaurant suchen, und Decision Support Systeme wie die von Elsevier werden Informationen immer konkreter und situationsgerechter aufbereiten können. Hier lässt sich die Entwicklung unabhängig von „Hype“ oder „Winter“ nicht mehr aufhalten. So wie es heute selbstverständlich ist, dass die Vermittlung einer Telefonverbindung kein menschlicher Operator übernimmt, sondern eine Art KI, so werden wir uns auch an KI Assistenzsysteme und Co gewöhnen – und es dann nicht mehr Künstliche Intelligenz nennen.

Und eine persönliche Frage: was ist Ihr bevorzugtes Predictive Modeling Tool oder Methode? Und warum?

Python, in Verbindung mit einem H2O Machine Learning Cluster. Weil Python-Code so wunderbar strukturiert ist, und clevere Lösungen für Schleifen und Vergleiche bietet. Und H2O, weil sich viele ML-Methoden damit leicht skalieren lassen, und –noch wichtiger – die Ergebnisse schnell produktiv eingesetzt werden können.

Vielen Dank, dass Sie sich Zeit genommen haben! Wir freuen uns, Sie bald in Berlin begrüßen zu dürfen und sind schon sehr gespannt auf Ihren Vortrag auf der Predictive Analytics World.