Seit ein paar Jahren werden Metabolome-Mining- und Annotations-Tools immer beliebter. Daher wird es auch immer schwieriger, sämtliche Informationen der unterschiedlichen Tools sinnvoll miteinander zu kombinieren.
Aus diesem Grund haben Madeleine Ernst, Justin van der Hooft und Kollegen MolNetEnhancer entwickelt: ein Tool, das den Output der relevantesten Tools zu einem molekularen Netzwerk kombiniert. Dieses annotierte Netzwerk kann man im Anschluss in CytoScape visualisieren.
Sobald alle verfügbaren Informationen so miteinander in Relation gebracht werden, ist es viel einfacher, chemische Zusammenhänge in Proben zu erkennen, neue Molekülfamilien zu finden und Rückschlüsse auf ihre Strukturen zu ziehen.
MolNetEnhancer kombiniert unterschiedliche Annotationsschichten
Molekulares Netzwerk
Alles beginnt mit einem molekularen Netzwerk: ein Netzwerk, das alle MS/MS-Spektren einer Probe nach ihrer spektralen Ähnlichkeit anordnet. Jeder Node (Netzwerkknoten) im Netzwerk repräsentiert ein MS/MS-Spektrum, und die Verbindungen zwischen den Nodes (edges) entsprechen der spektralen Ähnlichkeit zwischen den jeweiligen Spektren.
MolNetEnhancer baut auf GNPS Molecular Networking Workflows auf. Dabei kann man zwischen dem klassischen Molecular Networking und dem kürzlich ergänzten Feature-based Molecular Networking wählen. Das klassische molekulare Networking berücksichtigt nur die MS/MS-Spektren, während das Feature-basierte molekulare Networking auch MS1-Informationen wie Isotope, Retentionszeit und Ionenmobilität mit einbezieht.
In beiden Workflows erstellt GNPS ein molekulares Netzwerk und startet die Suche nach Treffern in der GNPS-Massenspektrendatenbank.
In den meisten Fällen kann eine Datenbanksuche jedoch nur einen kleinen Teil der Nodes in einem Netzwerk annotieren (~2-4%), je nach Probe und Vergleichsdatenbank. So sind z. B. menschliche Metabolite in der Regel besser dokumentiert als pflanzliche Metabolite.
So bekommt man zwar etwas mehr Informationen, die meisten Metaboliten im Netzwerk bleiben aber vorerst ohne Annotation. Bei Molekülfamilien, für die kein einziger Treffer gefunden wurde, müssen die Spektren mühsam manuell annotiert werden.
An dieser Stelle enden die meisten Workflows. Mit MolNetEnhancer können jedoch noch wesentlich mehr Informationen auf automatisiertem Weg hinzugefügt werden.
MS2LDA
MS2LDA erlernt häufig miteinander auftretende Massenpeaks und Neutralverluste (Mass2Motifs). MS2LDA basiert auf der Annahme, dass Mass2Motifs molekularen Substrukturen entsprechen.
Mit einem MS2LDA Modell lässt sich jedes Massenspektrum mit den darin enthaltenen Mass2Motifs annotieren, woraus sich drei spannende Möglichkeiten ergeben:
Erfahre mehr über die molekularen Zusammenhänge in einer Probe: Mit den Substruktur-Annotationen kann markiert werden, welche Metaboliten strukturell verwandt sind und welche Proben welche Verteilung bestimmter Substrukturen enthalten.
Anhaltspunkte über die Struktur von Metaboliten: Wenn man einen Bibliothekstreffer für die Substruktur findet, erhält man Hinweise auf die Struktur jedes Moleküls, das diese Substruktur enthält.
Wiederverwendung von Motif-Datenbanken: Die MS2LDA-Website enthält eine Reihe vor-gelernter MotifSets in MotifDB, die bereits mit hilfreichen Annotationen versehen sind.
MS2LDA ist auch deshalb großartig, weil es sich um eine unüberwachte Klassifizierung handelt. Das bedeutet, du kannst sämtliche Spektren in deinem Datensatz ohne jegliche Einschränkungen annotieren. Außerdem gibt es für MS2LDA eine Web Anwendung, mit der du die ermittelten Substrukturmuster visuell überprüfen kannst.
Mit MolNetEnhancer kannst du Informationen aus MS2LDA auf zwei Arten visualisieren: ein Tortendiagramm zeigt die relative Wichtigkeit von Mass2Motifs für jeden Metaboliten; zusätzliche farbige Edges zwischen Nodes markieren gemeinsame Mass2Motifs.
Und das ist nur der Anfang. Mit MolNetEnhancer können auch noch Annotationen aus den gängisten In-silico-Annotationstools hinzugefügt werden.
In silico Strukturannotationen
Massenspektrendatenbanken sind zwar noch recht klein, aber Strukturdatenbanken wie PubChem haben bereits wesentlich mehr Einträge.
Um Übereinstimmungen zwischen einem Massenspektrum und einer dokumentierten Struktur zu finden, gibt es verschiedene Techniken. In der Regel handelt es sich dabei um eine Kombination aus Regeln und Prognosen.
Diese Tools erstellen eine Liste potentiell passender Strukturen für eine Vielzahl an Massenspektren in deiner Probe.
MolNetEnhancer kann die Ergebnisse verschiedener In-silico-Annotationstools miteinander verknüpfen. Dabei hast du die Wahl zwischen:
- Network Annotation Propagation;
- DEREPLICATOR;
- VARQUEST; oder
- SIRIUS+CSI:FingerID (nicht vom GNPS-Workflow unterstützt, es gibt aber Jupyter Notebooks)
MolNetEnhancer übernimmt die so ermittelten Molekül-Struktur-Kandidaten und ergänzt sie als zusätzliche Schicht im molekularen Netzwerk. Sobald du mutmaßliche Strukturen für viele der Metaboliten gefunden hat, bist du bereits einen großen Schritt weiter.
Molekülklassen annotieren
ClassyFire annotiert Molekülklassen zu jeder molekularen Struktur, die in seiner umfangreichen chemischen Klassenontologie ChemOnt enthalten ist. Das bedeutet, dass du jetzt zu fast allen Struktur-Kandidaten in deinem Netzwerk Molekülklassen-Annotationen hinzugefügen kannst.
MolNetEnhancer verfeinert ClassyFire-Ergebnisse noch weiter, indem es die Topologie des molekularen Netzwerks berücksichtigt: Moleküle, die zusammen geclustert sind, gehören höchstwahrscheinlich alle zur gleichen Molekülklasse. MolNetEnhancer findet also den mehrheitlichen Konsens unter allen Klassenannotationen und kennzeichnet die molekulare Familie (Gruppe von eng Verbundenen Metaboliten) mit dieser Klasse.
Mit nur einem Blick auf das Netzwerk kannst du nun direkt erkennen, welche Molekülklassen in deiner Probe vorhanden sind. Insgesamt erhältst du so ein sehr umfangreich annotiertes molekulares Netzwerk, das es wesentlich einfacher macht, einen Datensatz zu verstehen und Informationen daraus zu ziehen.
Ergebnisse in Cytoscape visualisieren
MolNetEnhancer kann die Outputs eines molekularen Netzwerks, einer MS2LDA-Motivbeschriftung und einer In-silico-Annotation zusammenführen und um ClassyFire-Klassenannotationen ergänzen.
MolNetEnhancer exportiert all diese Informationen in eine GraphML-Datei, die du mit Cytoscape, einem Open-Source-Tool zur visuellen Darstellung von Netzwerken und Annotationen, öffnen kannst.
Hier nur einige Beispiele dafür, auf welchen Wegen MolNetEnhancer auch deine Forschung optimieren kann.
Anwendungsbereiche von MolNetEnhancer
MolNetEnhancer für die Suche nach Biomarkern
Angenommen, du untersuchst Unterschiede zwischen erkrankten und gesunden Patienten. Nachdem du Metaboliten identifizieren konntest, die einen Unterschied zwischen den beiden Gruppen erklären, könntest du anhand der Annotationen von MolNetEnhancer herausfinden, dass die meisten dieser Verbindungen Fettsäuren sind.
Da du nun weißt, dass du Fettsäuren untersuchen solltest, kannst du deine Probenaufbereitung und Geräteeinstellungen entsprechend optimieren, um dich auf Lipide zu fokussieren und keine Zeit mehr auf Peptide zu verschwenden.
MolNetEnhancer für die Entdeckung von Naturstoffen
Nehmen wir nun an, eine bestimmte Pflanzenart enthält ein Molekül mit interessanten antimikrobiellen Eigenschaften. Allerdings produziert diese bestimmte Pflanzenart nicht genügend von dieser Verbindung, als dass es sich lohnen würde, sie zu kultivieren.
Andere Arten der gleichen Gattung könnten jedoch ähnliche Moleküle enthalten, und zwar eventuell in größerer Menge.
Sobald du einen Datensatz mit den Spektren verschiedener Spezies hast, kannst du mithilfe von MolNetEnhancer Molekülfamilien finden, die ähnliche Substrukturen wie die gesuchte Verbindung aufweisen.
So kannst du Rückschlüsse auf chemische Verbindungen ziehen, welche wiederum mit genetischen Unterschieden in Verbindung gebracht werden können. Ausführlichere Beispiele findest du im MolNetEnhancer Paper.
Das ist natürlich nur ein erster Vorgeschmack; der beste Weg um festzustellen, wie MolNetEnhancer deine Arbeit verbessern kann, ist, es direkt auszuprobieren.
MolNetEnhancer direkt einsetzen
Egal, ob du mit R oder Python vertraut bist oder ein Web-Interface bevorzugst, MolNetEnhancer ist einfach zu bedienen:
- R – Nutze MolNetEnhancer als R-Paket (zu finden auf Github);
- Python – Alternativ gibt es auch eine leicht zu bedienende Python Bibliothek;
- GNPS – MolNetEnhancer ist vollständig in die GNPS platform integriert. Dort kannst du den kompletten Workflow auch ohne jeglichen Code durchführen.
GNPS ermöglicht es dir außerdem, deinen Workflow mit anderen zu teilen, sodass jeder deine Arbeit reproduzieren kann.
In weniger als zwei Jahren haben die innovativen Visualisierungen von MolNetEnhancer bereits zahlreichen Teams geholfen, ihren Workflow zu verbessern. Es ist daher nicht erstaunlich, dass die Software bereits über 50 Mal zitiert wurde.
Die nächsten Schritte für MolNetEnhancer
MolNetEnhancer ist eine großartige Plattform, die sich laufend weiterentwickeln wird. Hier einige Fortschritte, auf die wir gespannt sind:
- Spec2Vec: Mit fortschrittlicheren spektralen Ähnlichkeitsmetriken lassen sich präzisere molekulare Netzwerke erstellen und die Bibliothekssuche verbessern. Erfahre mehr über Spec2Vec.
- Consensus Building: Mit dem richtigen Ansatz könnten Substruktur- und In-silico-Annotationen aus mehreren Tools zusammengeführt werden, um die Kandidaten neu zu sortieren, z.B. anhand ihrer Substrukturen.
- Große und zuverlässige MotifSets: Mass2Motif-Bibliotheken, die noch mehr mögliche Substrukturen für chemische Verbindungen unterschiedlicher Herkunft enthalten, werden die Ergebnisse von MolNetEnhancer zweifellos verbessern.
- Mass2Motif-Netzwerkoptimierung: Zuverlässige Mass2Motif-Annotationen können ebenfalls ihre Informationen zum Aufbau der molekularen Netzwerke beisteuern und so die Struktur der molekularen Netzwerke verbessern.
Beschleunige dein Forschungsprojekt
Wir helfen dir gerne dabei, Metabolomics-Datensätze effizienter zu untersuchen. Mit unseren Tools und unserer Infrastruktur lassen sich Machine Learning Analysen sehr leicht automatisieren. Solltest du also mit Schwierigkeiten oder Engpässen bei Metabolomics-Analysen in Berührung kommen, melde dich bei uns.