Einleitung
Pandemien stellen eine ernsthafte Bedrohung für uns dar. COVID-19 ist dabei weder die erste, noch wird es die letzte sein.
Doch wie nie zuvor sammeln und veröffentlichen wir gemeinsam Informationen, die über das Virus bekannt werden. Hunderte von Forschungsteams auf der ganzen Welt schließen sich zusammen, um kollektiv Daten zu sammeln und gemeinsam Lösungsansätze mit KI zu entwickeln.
In diesem Artikel fassen wir zusammen wir, wie Machine Learning dabei hilft:
- Risikogruppen zu identifizieren,
- Patienten zu diagnostizieren,
- Medikamente schneller zu entwickeln,
- Die Ausbreitung des Virus vorherzusagen,
- Viren besser zu verstehen,
- Festzustellen woher ein Virus kommt und
- Die nächste Pandemie vorherzusagen.
Entscheidend ist nun diese Forschung und Anwendungsfälle zu fördern und dafür zu sorgen, dass wir das nächste Mal besser vorbereitet sind.
1. Wer ist durch COVID-19 am stärksten gefährdet?
Machine Learning hat sich als ungemein wertvoll für die Risikovorhersage in verschiedenen Bereichen erwiesen.
Besonders im Hinblick auf medizinische Risiken ist Machine Learning in drei wesentlichen Bereichen relevant:
- Infektionsrisiko: Wie hoch ist das Risiko, dass sich bestimmte Personen oder -gruppen mit COVID-19 anstecken?
- Risiko eines schweren Verlaufs: Wie hoch ist das Risiko, dass eine bestimmte Person oder Gruppe schwere COVID-19-Symptome oder Komplikationen entwickelt, die einen Krankenhausaufenthalt oder eine Intensivpflege erfordern?
- Behandlungsergebnis: Wie hoch ist das Risiko, dass eine bestimmte Behandlung für einzelne Personen oder Gruppen unwirksam ist, und wie hoch ist die Sterbewahrscheinlichkeit?
Machine Learning kann zur Prognose jeder dieser drei Risiken eingesetzt werden. Zum jetzigen Zeitpunkt ist die Anzahl veröffentlichter Studien zwar noch begrenzt, erste Ergebnisse klingen jedoch vielversprechend. Gleichzeitig ist es hilfreich, sich Anwendungsbereiche von Machine Learning in verwandten Bereichen anzusehen, und zu prüfen, ob es auf ähnliche Weise auch zur Risikovorhersage für COVID-19 eingesetzt werden kann.
1.1 Vorhersage des Infektionsrisikos
Erste Statistiken zeigen, dass die Wahrscheinlichkeit, an COVID 19 zu erkranken, durch folgende Risikofaktoren bestimmt wird
- Alter,
- Vorerkrankungen,
- Hygieneverhalten,
- Soziale Gewohnheiten,
- Anzahl sozialer Interaktionen,
- Häufigkeit sozialer Interaktionen,
- geografische Lage und klimatische Bedingungen,
- Sozioökonomischer Status.
Die Erforschung der aktuellen Pandemie befindet sich noch in ihrem Anfangsstadium. Mit Hilfe von Machine Learning haben Decapprio et al. beispielsweise einen ersten ‘Vulnerability Index’ für COVID-19 entwickelt. Auch Präventionsmaßnahmen wie das Tragen von Masken, regelmäßiges Händewaschen und social distancing beeinflussen das Gesamtrisiko. Sobald mehr und bessere Daten zur Verfügung stehen und aktuell laufende Studien weitere Ergebnisse liefern, wird sich auch der Anwendungsbereich von Machine Learning zur Vorhersage von Infektionsrisiken weiter vergrößern.
1.2 Vorhersage des Risikos eines schweren Verlaufs
Sobald sich eine Person oder Gruppe infiziert hat, muss das Risiko berechnet werden, dass diese Person oder Gruppe Komplikationen entwickelt oder intensive medizinische Versorgung benötigt.
Viele Betroffene berichten von nur leichten Symptomen, während andere schwerere Lungenerkrankungen oder akutes Atemnotsyndrom (ARDS) entwickeln, welche tödlich ausgehen können. Es ist zwar unmöglich, alle Patienten die nur leichte Symptome haben zu behandeln und zu beobachten; wichtig ist jedoch, in den Fällen frühzeitig mit der Behandlung zu beginnen, bei denen ein schwerer Verlauf wahrscheinlich ist.
In dem Journal ‘Computers, Materials and Continua’ haben Forscher einen Artikel veröffentlicht, der aufzeigt, dass mit Hilfe von Machine Learning die Wahrscheinlichkeit, dass ein Patient ARDS entwickelt oder an der Krankheit verstirbt, anhand seiner anfänglichen Symptome vorhergesagt werden kann. Neben diesen Ergebnissen räumen die Forscher auch Limitationen ihrer Studie ein:
"Eine wesentliche Limitation dieser Studie ist der Umfang des Datensatzes: Er besteht aus 53 Patienten mit teilweise unvollständigen Daten sowie einem begrenzten Spektrum des Schweregrades der Krankheit."(Übersetzung des Autors)
Dennoch liefert die Studie eine wichtige Grundlage für die Nutzung von Machine Learning, sobald ausreichend Daten zur Verfügung stehen.
1.3 Vorhersage des Behandlungsergebnis
Ein zusätzlicher Faktor der Vorhersage des Krankheitsverlaufs ist die Vorhersage des Behandlungsergebnis, das oftmals buchstäblich über die Frage nach Leben oder Tod entscheidet. Es wäre offensichtlich hilfreich, die Wahrscheinlichkeit bestimmen zu können, ob ein Patient mit bestimmten Symptomen überlebt. Jedoch muss dabei zusätzlich berücksichtigt werden, dass nicht alle Patienten auf gleiche Weise behandelt werden. Wie effektiv ist also eine bestimmte Behandlungsmethode, wenn sie bei einer bestimmten Person oder Gruppe angewendet wird?
Wenn Ergebnisse bestimmter Behandlungsmethoden vorhergesagt werden können, sind Ärzte besser dazu in der Lage, ihre Patienten effektiv zu behandeln. Nicht nur im Bezug zu COVID-19 wird Machine Learning dafür eingesetzt, patientenspezifische Behandlungsmethoden zu entwickeln. So wurde in der Vergangenheit Machine Learning auch genutzt, um Behandlungsergebnisse für Epilepsie-Patienten vorherzusagen, oder um Reaktionen auf eine Krebs-Immuntherapie zu prognostizieren.
Da sich die Behandlungsmöglichkeiten für COVID-19 noch im Anfangsstadium befinden, wird es vermutlich auch noch etwas Zeit in Anspruch nehmen, bis mit Hilfe von Machine Learning Behandlungsergebnisse vorhergesagt werden können. Diese Vorhersagen sind jedoch ein essentieller Teil der Risikoanalyse, da sie Hand in Hand mit den Vorhersagen zum Infektionsrisiko sowie zum Risiko eines schweren Verlaufs einhergehen.
2. Patienten Screening und Diagnose von COVID-19
Sobald eine neuartige Pandemie ausbricht, stellt die Diagnose einzelner Betroffener eine große Herausforderung dar. In großem Maße Tests durchzuführen ist schwierig umzusetzen, und besonders am Anfang auch recht kostspielig. Sobald jemand auch nur leichte Symptome von COVID-19 verspürt, ist die Sorge einer Ansteckung schnell groß, auch wenn die gleichen Symptome Anzeichen vieler anderer, weitaus milderer Krankheiten sein könnten.
Anstatt von jedem Patienten medizinische Proben zu nehmen und auf langsame, teure Laborergebnisse zu warten, wäre einfachere, schnellere und günstigere Tests nützlich, um mehr Daten sammeln zu können (selbst dann, wenn diese Tests weniger akkurat sind). Diese Daten können dann wiederum in weiteren Forschungen analysiert sowie für Triage und Screening weiterer Patienten eingesetzt werden.
In Zusammenhang mit dem Einsatz von Machine Learning zur Unterstützung der Diagnose von COVID-19 gibt es vielversprechende Forschungsbereiche:
- Einsatz von Gesichts-Scans zur Ermittlung von Symptomen, z.B. ob der Patient unter Fieber leidet,
- Verwendung von Wearables, wie z.B. Smartwatches, um auffällige Muster im Ruhepuls von Patienten zu ermitteln,
- Einsatz von Machine-Learning Chatbots, um Screenings von Patienten anhand ihrer selbst berichteten Symptome durchzuführen
2.1 Einsatz von Gesichts-Scans zur Ermittlung von Symptomen
Ein Krankenhaus in Florida als eines der ersten Institutionen auf sich aufmerksam gemacht, das Machine Learning zur Bewältigung von COVID-19 einsetzt. Beim Betreten des Krankenhauses wird ein automatischer Gesichtsscan durchgeführt, der mit Hilfe von Machine Learning feststellt, ob ein Patient Fieber hat oder nicht.
Für sich allein genommen sind diese Daten zwar nicht besonders aufschlussreich, beim Umgang mit Hunderten oder sogar Tausenden von Patienten ist jedoch jedes einzelne Datenelement außerordentlich wichtig, um eine effektive Triage der Patienten zu ermöglichen.
2.2 Einsatz von Wearables zur Ermittlung des Ruhepulses
Apple sorgte für Schlagzeilen, als bekannt wurde, dass ihre Apple Watch mit Hilfe von Machine Learning Herzkrankheiten ermitteln kann. Muster im Ruhepuls können jedoch auch Hinweise auf spezifischere Krankheitsbilder enthalten. Basierend auf Fitbit Daten deuten vorläufige Forschungsergebnisse darauf hin, dass Veränderungen im Ruhepuls auf grippeähnliche Erkrankungen (Influenza like illness/ ILI) hinweisen können. Offensichtlich ist dies noch weit entfernt von einer spezifischen Diagnose von COVID-19, die Forschung befindet sich jedoch in ihren Anfangsstadien und entwickelt sich stetig.
Auf ähnliche Weise werden mithilfe von OURA, einem Ring, der den Schlaf-Wach-Rhythmus misst, Forschungen darüber angestellt, inwieweit Indikatoren wie Körpertemperatur, Herzfrequenz und Atemfrequenz bestimmte Muster des Auftretens, des Verlaufs sowie der Genesung von COVID-19 vorhersagen können.
Da beide Studien noch nicht abgeschlossen sind, liegen bislang keine endgültigen Ergebnisse vor.
2.3 Einsatz von Chatbots für Screening und Diagnose
Wenn Ärzte viel Zeit mit der Beantwortung allgemeiner Fragen besorgter Patienten verbringen, bleibt ihnen zu wenig Zeit, sich um die eigentliche Behandlung ihrer Patienten zu kümmern. Viele Länder haben daher "Selbsttriage"-Systeme entwickelt, bei denen Patienten einen Fragebogen über ihre Symptome und Krankheitsgeschichte ausfüllen, anhand dessen sie Anweisungen darüber erhalten, ob sie zu Hause bleiben, einen Arzt anrufen oder ins Krankenhaus fahren sollen.
Viele Unternehmen, darunter Microsoft, haben Chatbots bereitgestellt, die Betroffene dabei anleiten, wie sie angesichts ihrer Symptome am besten vorgehen.
Anhand dieser Beispiele wird deutlich, dass Machine Learning aktuell vor allem zum Screening von Patienten mit Verdacht auf COVID-19 eingesetzt werden kann, und nur schwierig zur zuverlässigen Diagnose. Der Diagnoseprozess stellt eine große Herausforderung dar, unter anderem deshalb, da jeder Algorithmus zur Diagnostik gegen Mutationen robust sein muss. Pardis Sabeti beschreibt einige damit verbundene Herausforderungen in einem Ted Talk:
"Wir konnten auch feststellen, dass das Virus mutierte, wenn es zwischen verschiedenen Menschen übertragen wurde. Und jede dieser Mutationen ist bedeutend, da jegliche Art von Diagnostik, Impfstoffen und Therapien, die wir anwenden, auf dieser Genomsequenz basieren - das ist im Grunde genommen das, was es antreibt.” (Übersetzung des Autors)
Wenn wir all diese Arbeit anhand eines bestimmten Virus durchführen und dieses Virus dann mutiert, ist eine Menge Arbeit verschwendet und muss von neuem begonnen werden. Sollten wir eine Art “heiligen Gral” in Form eines Machine Learning Algorithmus finden, der COVID-19 schnell und akkurat diagnostizieren kann, muss dieser gegen jegliche Mutationen robust sein.
3. Beschleunigung der Arzneimittelentwicklung
Als Reaktion auf eine neuartige Pandemie ist es wesentlich, einen Impfstoff, eine zuverlässige Diagnosemethode und ein Medikament zur Behandlung zu entwickeln - und das möglichst schnell. Die derzeitigen Methoden basieren stark auf Versuch-und-Irrtum Prinzipien, was viel Zeit in Anspruch nimmt. Dadurch kann es Monate dauern, auch nur einen einzigen brauchbaren Impfstoff-Kandidaten zu entwickeln.
Machine Learning kann dabei helfen, diesen Prozess erheblich zu beschleunigen, ohne dabei die Qualitätssicherung zu gefährden. Bei dem Versuch, niedermolekulare Inhibitoren des Ebola-Virus zu identifizieren, entdeckten Forscher, dass mit Hilfe von Bayesschen ML Modelle der Auswertungsprozess wesentlich schneller durchgeführt werden konnte (bei der Auswertung wird jedem Molekül ein Wert zugewiesen, der angibt, wie wahrscheinlich es hilfreiche Ausprägungen besitzt). Durch diesen beschleunigten Prozess konnten sehr schnell drei potentiell wirksame Moleküle identifiziert werden.
In ähnlicher Weise entdeckten Forscher, die an der Vogelgrippe H7N9 arbeiteten, dass ML-gestütztes virtuelles Screening und Scoring zu erheblichen Verbesserungen der Genauigkeit der Scores führte. Die besten Ergebnisse für H7N9 wurden dann erzielt, wenn der sog. "Random-Forest-Algorithmus" (ein Klassifizierungs-Algorithmus, der aus einer Reihe von Entscheidungsbäumen besteht) eingesetzt wurde.
In Situationen wie der COVID-19-Pandemie, bei der sich ein Virus schnell ausbreitet, ist es für die Beschleunigung der Arzneimittelentwicklung von entscheidender Bedeutung, zuverlässige Ergebnisse schnell zu erhalten.
4. Identifikation vorhandener wirksamer Medikamente
Unternehmen investieren viel Zeit und Geld in die Zulassung neuer Medikamente. Sie müssen zuverlässig sicherstellen, dass diese Medikamente keine unerwarteten, gesundheitsschädlichen Nebenwirkungen verursachen.
Dieser Prozess schützt uns zwar, besonders während einer Pandemie bremst er uns jedoch auch erheblich aus - genau dann, wenn schnelle Entwicklungen am nötigsten wären.
Eine Alternative zur Testung und Zulassung neuer Medikamente besteht darin, Medikamente zu verwenden, die bereits getestet und zur Behandlung anderer Krankheiten eingesetzt wurden.
Es gibt jedoch Tausende von bereits vorhandenen Arzneimitteln, und uns fehlt die Zeit, sie alle einzeln zu testen - wie also findet man das Richtige?
Machine Learning kann dabei helfen, potentielle Arzneimittel-Kandidaten um vieles schneller zu priorisieren, und zwar durch:
- Aufbau einer Ontologie
- Vorhersage von Wechselwirkungen zwischen Medikamenten und viralen Proteinen
4.1 Aufbau biomedizinischer Ontologien
Vieles von den Informationen, die über Medikamente, Viren und deren Mechanismen vorhanden sind, erstreckt sich über eine Vielzahl von Forschungsartikeln. Mit Hilfe von Sprachtechnologien (Natural Language Processing; Machine Learning angewandt auf Text) kann eine große Anzahl wissenschaftlicher Artikel gelesen und interpretiert werden, anhand dessen biomedizinische Ontologien erstellt werden. Diese bilden strukturierte Netzwerke, die verschiedene Einheiten - wie unterschiedliche Medikamente und Proteine - sinnvoll miteinander in Beziehung setzen.
So haben Wissenschaftler eine durch ML erstellte Ontologie adaptiert und auf COVID-19 angewandt, um einen möglichen Zusammenhang zwischen dem Virus und dem Arzneimittel-Kandidaten Baricitinib zu erforschen.
COVID-19 gelangt höchstwahrscheinlich über das Protein ACE2 in unsere Lungenzellen. Dieser Prozess - Endozytose genannt - wird reguliert durch AAK1 (ein anderes Protein). Baricitinib hemmt AAK1 und könnte möglicherweise so auch das Eindringen von COVID-19 in unsere Lungenzellen verhindern.
4.2 Vorhersage von Wechselwirkungen zwischen Arzneimittel und Target
Zusätzlich nutzen Wissenschaftler Machine Learning für die Identifizierung von Arzneimittel-Kandidaten auch, indem Vorhersagen der Wechselwirkung zwischen den Proteinen des Virus und bereits vorhandenen Medikamenten berechnet werden.
Diese Wechselwirkungen sind hochkomplex, sodass Forscher meist neuronale Netze wählen, um sie zu identifizieren (1, 2, 3). Diese Netzwerke werden auf großen Datenbanken von Wechselwirkungen trainiert, um Listen von Arzneimittel-Kandidaten zu erstellen, die sich am ehesten an die Proteine des Virus binden und diese hemmen.
Insbesondere hat eine Forschungsgruppe ein End-to-End-Framework für die Verwendung neuronaler Netze zur Verarbeitung von Ontologien entwickelt, wie z.B. die die für die Suche nach Baricitinib verwendet wurde. Das Modell wird dann auf die Interpretation einer Ontologie trainiert und kann anschließend zur genauen Vorhersage von Wechselwirkungen zwischen Arzneimitteln und Targetproteinen verwendet werden.
Mithilfe dieses Ontologie-Modells haben Forscher bereits einen vielversprechenden Arzneimittel-Kandidaten gefunden, der aktuell in einer klinischen Studie geprüft wird.
5. Vorhersage der Ausbreitung von Infektionskrankheiten über soziale Netzwerke
Um während einer Pandemie die richtigen Strategien zur Bekämpfung der Krankheit entwickeln zu können, braucht es zunächst eine präzise Bestandsaufnahme, um Fragen beantworten zu können wie: Wie viele Menschen sind infiziert? Wo befinden sich die Betroffenen? Es ist leider äußerst schwierig und kostenintensiv, den Verlauf von Pandemien im Auge zu behalten, insbesondere dann, wenn diese durch Viren verursacht werden.
Die wichtigsten Fragen werden in der Regel von Regierungsbehörden in Zusammenarbeit mit dem jeweiligen Gesundheitssystem beantwortet. Beispielsweise wird jeden Tag (bzw. jede Woche) die Anzahl neu diagnostizierter Patienten von den zuständigen Behörden erfasst und veröffentlicht. Problematisch wird dabei jedoch, dass zwischen Ansteckung mit der Krankheit, der Entwicklung erster Symptome und einem positiven Testergebnis große (zeitliche, aber auch räumliche) Lücken bestehen können.
Glücklicherweise leben wir in einer digitalisierten Welt. Ein Landwirt, der erste Symptome entwickelt, befindet sich unter Umständen in einer Kleinstadt ohne Zugang zu einem Krankenhaus mit Testkapazitäten. Durch Zugang zu sozialen Netzwerken kann er jedoch trotzdem Hinweise über seinen Gesundheitszustand und die Ausbreitung der Krankheit direkt übermitteln - wichtige Hinweise, die in großem Maßstab nur mit Hilfe von Machine Learning verarbeitet werden können.
Indem Inhalte öffentlich einsehbarer Interaktionen in sozialen Medien analysiert werden, können Machine Learning Modelle die Wahrscheinlichkeit einer neuen Viruskontamination berechnen. Diese Modelle sind zwar nicht in der Lage, Einzelpersonen individuell einzuordnen, können jedoch die gesamte Datenmenge nutzen, um die Ausbreitung der Pandemie in Echtzeit abzuschätzen und die Ausbreitung in den darauffolgenden Wochen vorherzusagen.
Diese Informationen sind für Entscheidungsprozesse inmitten einer sich so rapide entwickelnden Pandemie extrem wichtig und von großem Mehrwert.
6. Viren anhand von Proteinen verstehen
Einen Virus wie COVID-19 zu durchschauen bedeutet, seine Proteine zu durchschauen - ob und wie wir krank werden, hängt entscheidend davon ab, wie diese Proteine mit unserem Körper interagieren. Doch diese zu entschlüsseln ist eine komplexe Aufgabe.
Die folgenden Anwendungsfälle sind Beispiele dafür, wie Machine Learning dazu beitragen kann, unser Verständnis von Viren durch die Analyse ihrer Proteine zu verbessern.
6.1 Vorhersage von Protein-Protein-Interaktion zwischen Virus und Zelle
Protein-protein Interaktionen (PPIs) zwischen Viren und menschlichen Körperzellen entscheiden über die Reaktionen unseres Körpers auf Krankheitserreger. Das Virus-Wirt Interaktom ist das Gesamtnetzwerk der Wechselwirkungen zwischen den Proteinen eines Virus und seines Wirts. Dieses Interaktom agiert als Muster dafür, wie das Virus unseren Körper infiziert und sich in unseren Zellen vermehrt.
Viele Forschungsgruppen arbeiten daran, die große Bandbreite möglicher Wechselwirkungen zu reduzieren. Machine Learning Modelle, die anhand von Protein Daten trainiert wurden, konnten erfolgreich dafür eingesetzt werden, die wahrscheinlichsten Virus-Wirt-PPIs für HIV und H1N1 vorherzusagen - was den Aufwand für die Erfassung des gesamten Virus-Wirt-Interaktoms erheblich reduziert.
Zu verstehen, wie ein Virus mit unserem Körper interagiert, ist äußerst wichtig für die Entwicklung neuer Behandlungsmethoden und die Erforschung neuer Medikamente.
6.2 Vorhersagen von Proteinfaltungen
Die Struktur eines Proteins steht eng mit dessen Funktion in Zusammenhang. Sobald diese Struktur einmal erfasst wurde, weiss man auch um die Rolle des Proteins in der Zelle. Darauf basierend können Wissenschaftler Medikamente entwickeln, die mit der jeweiligen Struktur des Proteins zusammenarbeiten.
Die 3D-Struktur eines Proteins zu ermitteln ist jedoch keine leichte Aufgabe - die Bandbreite der möglichen Strukturen für ein einzelnes Protein ist gewaltig: Ein Protein, das aus 100 Aminosäuren besteht, kann auf 3100 unterschiedliche Weisen aufgebaut sein.
Gleichzeitig gibt es über eine Milliarde bekannter Proteinsequenzen, und es konnten bislang von nur weniger als 0.1% die Strukturen ermittelt werden.
Mithilfe künstlicher neuronaler Netze haben Forschergruppen erfolgreich Modelle erstellt, die Proteinstrukturen vorhersagen können, sodass es letztlich mittels computergestützter Berechnungsmethoden machbar wurde, Proteinstrukturen zu identifizieren.
7. Herausfinden, wie das Virus bekämpft werden kann
Epitope sind Cluster von Aminosäuren, die sich an der Außenseite eines Virus befinden. Antikörper binden an Epitope, wodurch unser Immunsystem das Virus erkennt und vernichtet. Das Auffinden und Klassifizieren von Epitopen ist demnach wesentlich um zu entscheiden, auf welchen Teil eines Moleküls bei der Entwicklung von Impfstoffen abgezielt werden muss.
Im Vergleich zu herkömmlichen Impfstoffen, die abgeschwächte Krankheitserreger enthalten, sind Impfstoffe, die auf Epitopen basieren, sicherer. Sie beugen Krankheiten vor, ohne gleichzeitig das Risiko potenziell tödlicher Nebenwirkungen zu vergrößern.
Die Suche nach dem richtigen Epitop kann ein sehr zeitaufwändiger und kostenintensiver Prozess sein. Bei einer neuartigen Pandemie wie COVID-19 beschleunigt die schnellere Lokalisierung der Epitope den Prozess der Entwicklung wirksamer Impfstoffe.
Auch an dieser Stelle kann Machine Learning helfen. Support Vector Machines (SVM), Hidden-Markov-Modelle und künstliche neuronale Netze (insbesondere Deep Learning) haben sich alle als schneller und genauer bei der Identifizierung von Epitopen erwiesen als menschliche Forscher.
8. Identifizierung der Wirte in der Natur
Eine zoonotische Pandemie - wie die, die wir aktuell mit dem neuartigen Coronavirus erleben - ist eine Pandemie, die durch einen Erreger ausgelöst wurde, der ursprünglich von einer anderen Spezies (z.B. Fledermäusen) stammt und sich von dort aus auf den Menschen überträgt. Viren wie Ebola, HIV oder COVID-19 können in der Natur lange Zeit unbemerkt überleben, während sie auf die nächste Mutation - und damit auf die nächste Gelegenheit, sich wieder auf Menschen auszubreiten - warten. Dabei verstecken sie sich in Tieren (sogenannten Reservoirwirten), die keine Symptome der Krankheit verspüren.
Zu wissen, wer diese Reservoirwirte sind, ist für die Bekämpfung einer Pandemie von entscheidender Bedeutung. Wenn wir sie gefunden haben, können Strategien entwickelt werden, um die Ausbreitung der Krankheit zu begrenzen und weitere Ausbrüche zu verhindern.
Der herkömmliche Ansatz, Reservoirwirte zu finden, erfordert unter Umständen jahrelange Forschung, und es gibt immer noch viele herrenlose Viren, die noch keinem tierischen Wirt zugeordnet werden konnten.
Was können wir also tun?
Dank enormer technologischer Fortschritte ist das sog. Whole-Genome Sequencing (WGS, Prozess des Bestimmens des kompletten Erbguts eines Organismus) mittlerweile kostengünstig und schnell. Forschungsergebnisse haben gezeigt, dass Machine Learning Modelle WGS-Daten nutzen können, um in Kombination mit Expertenwissen diejenigen Arten zu bestimmen, die am wahrscheinlichsten als Wirt für die Krankheit in Frage kommen.
Wenn nur eine kleinere Untergruppe von Arten untersucht werden muss, wird der Prozess des Aufspürens des eigentlichen Krankheitserregers in der Natur drastisch beschleunigt.
9. Die nächste Pandemie vorhersagen
Akkurate Vorhersagen darüber, ob es sich bei bestimmten Influenzaviren um zoonotische Erreger handelt (die von einer Spezies auf andere übertragbar sind), können Ärzten und medizinischem Fachpersonal dabei helfen, potenzielle Pandemien vorherzusehen und sich entsprechend vorzubereiten.
Ein konkretes Beispiel ist die Influenza A, die in erster Linie in der Vogelpopulation vorkommt, sich jedoch auch auf menschliche Wirte übertragen kann. Forscher, die sich mit Influenza A befasst haben, extrahierten 67.940 Proteinsequenzen aus einer Datenbank und filterten diese Sequenzen so, dass der Datensatz nur noch diejenigen Influenzastämme mit vollständigen Sequenzen von 11 Influenza-Proteinen enthielt.
Basierend auf Machine Learning Modellen waren die Forscher dann dazu in der Lage, potenziell zoonotische Influenzastämme mit hoher Treffsicherheit zu identifizieren. Es müssen noch weitere Forschungen angestellt werden um Vorhersagemodelle für direkte Übertragungen erstellen zu können; Kenntnisse darüber, welche Influenzastämme höchstwahrscheinlich von Spezies zu Spezies übertragbar sind, stellen jedoch bereits einen sehr wichtigen ersten Schritt zur Vorbereitung auf kommende Pandemien dar.
Fazit
Machine Learning ist ein bedeutendes Instrument im Kampf gegen die aktuelle Pandemie. Wenn wir diese Gelegenheit nutzen, um Daten zu sammeln, vorhandenes Wissen zu vereinen und unsere Fachkenntnisse zusammenzubringen, können viele Leben gerettet werden - sowohl heute, als auch in der Zukunft.
Sollten Sie Unterstützung bei der Entwicklung von Machine Learning Anwendungen im medizinischen Kontext benötigen (z.B. bei der Zulassung von Arzneimitteln), wenden Sie sich gerne an uns.