Dr. Kata Vuk
Universität Regensburg
From Data to Discovery in the Healthcare Information Age: Interpretable Machine Learning with Piecewise Constant Models
Das Projekt „From Data to Discovery in the Healthcare Information Age: Interpretable Machine Learning with Piecewise Constant Models” zielt darauf ab, die Anwendung von maschinellen Lernmodellen im Gesundheitsbereich zu verbessern. Dabei wird der Fokus auf die Entwicklung von Modellen gelegt, die nicht nur präzise Vorhersagen ermöglichen, sondern auch leicht verständlich sind. Im Gesundheitsbereich ist dies besonders wichtig, da medizinische Entscheidungen nachvollziehbar und transparent sein müssen.
Im Zentrum des Vorhabens stehen stückweise konstante Modelle, insbesondere Entscheidungsbäume und Change-Point-Modelle. Stückweise konstante Modelle sind mathematische Verfahren, die komplexe Zusammenhänge in einfacher Form darstellen. Entscheidungsbäume und Change-Point-Modelle helfen dabei, Daten zu analysieren, um zum Beispiel Entscheidungen zu treffen oder Veränderungen in Datenmustern zu erkennen. Entscheidungsbäume sind ein grundlegender Baustein vieler maschineller Lernmethoden und eignen sich besonders gut für tabellarische Daten, wie etwa tabellarische Patientendaten. Eine hohe Vorhersagekraft bieten sie jedoch nur, wenn mehrere Entscheidungsbäume in Form von sogenannten Ensembles, wie zum Beispiel Random Forests oder Boosting-Methoden, kombiniert werden. Gleichzeitig führt dies in komplexen Kombinationen dazu, dass die Interpretierbarkeit verloren geht. Das Projekt entwickelt Ansätze, um diese Modelle so anzupassen, dass sie sowohl individualisierte Vorhersagen treffen als auch verständlich bleiben. Auf der anderen Seite werden Change-Point-Modelle, die für serielle Daten wie zeitabhängige Vitalparameter oder genetische Informationen genutzt werden, optimiert, um Interpretierbarkeit auch bei hohen Dimensionen sicherzustellen. Dies ist entscheidend, um spezifische Veränderungen im Gesundheitszustand eines Patienten oder in genetischen Sequenzen zu identifizieren.
Langfristig strebt das Projekt an, solche interpretierbaren Modelle für personalisierte Medizin einzusetzen, um maßgeschneiderte Behandlungsstrategien zu entwickeln.