Simulation von 12-Kanal Oberflächen-EKGs für eine Klassifizierung von Herzkrankheiten mit Machine Learning Algorithmen

Das Elektrokardiogramm (EKG) ist eine nicht-invasive und kosteneffektive Messmethode für die Untersuchung und das Monitoring von Patienten mit Herzbeschwerden, wie z.B. Vorhofflattern oder Ischämie. Die steigende Anzahl an an Herzkrankheiten leidenden Patienten weltweit sowie zukünftige Telemedizinsysteme werden den Bedarf an automatisierten und validierten EKG-Analysetools weiter erhöhen. 

Machine Learning (ML) Techniken sind bereits für die Detektion und Klassifikation von Herzkrankheiten basierend auf dem EKG im Einsatz. Eine zentrale Herausforderung von ML Algorithmen ist allerdings die Untersuchung von Einflüssen der Datenunsicherheit auf das Klassifikationsergebnis. Daher ist es gerade in diesem Gebiet wichtig, die Algorithmen mit Referenzdaten, die eine nachvollziehbare Grundwahrheit besitzen, zu validieren. Für medizintechnische Applikationen wird als Grundwahrheit entweder der Konsens von mehreren Ärzten herangezogen oder es werden synthetische Daten verwendet.

Daher ist das Ziel dieses Projekts, eine große Datenbank an gelabelten synthetischen EKG Zeitsignalen zu generieren, um die ML Algorithmen hinsichtlich der Datenunsicherheit zu untersuchen und ein Benchmarking unter ihnen durchzuführen. Dafür werden 10.000 12-Kanal EKG Signale mit einem elektrophysiologischen Modellierungsframework simuliert. Diese in silico generierten Daten werden als der Wirklichkeit entsprechend akzeptiert, wenn ein Arzt die computersimulierten EKGs in einer Blindstudie nicht mehr von klinisch aufgenommenen Signalen unterscheiden kann. Somit kann eine realistische gelabelte EKG Referenzdatenbank erzeugt werden, die eine virtuelle Population mit gesunden und an Herzkrankheiten leidenden Patienten repräsentiert.

Video pitch