Mit KI Proteine jenseits der Natur erschaffen
Von Mark Miller
Maschinelles Lernen und andere Werkzeuge der künstlichen Intelligenz (KI) wurden in der Proteinforschung bereits eingesetzt, um die Strukturen von natürlich vorkommenden Proteinen vorherzusagen. Jetzt setzen Biochemiker KI ein, um über natürliche Vorlagen hinauszugehen und Proteine zu bauen, die noch nie zuvor existiert haben. Aber wie kann KI natürliche Prozesse nachbilden, um Proteine von Grund auf neu zu bauen, und was sind ihre möglichen Anwendungen?
Ein Textmodell wie ChatGPT
Nach dem Artikel "Proteins Never Seen in Nature Are Designed Using AI to Address Biomedical and Industrial Problems Unsolved by Evolution" von Michael Eisenstein in Scientific American, können sprachbasierte generative KI-Modelle - wie das von ChatGPT verwendete - angepasst werden, um neue Proteinsequenzen und -strukturen zu generieren. Ein effektiver Weg, um Proteinsequenzen zu verstehen, besteht darin, sie als Text zu betrachten.
In diesen Anwendungen werden KI-Algorithmen auf große Mengen biologischer Informationen trainiert, müssen aber auch chemischen und biologischen Regeln folgen - oder einer biologischen Grammatik, wie Eisenstein es nennt. "Um einen flüssigen Satz oder ein Dokument zu generieren, muss der Algorithmus die Beziehungen zwischen verschiedenen Wortarten lernen, aber er muss auch Fakten über die Welt lernen, um ein Dokument zu erstellen, das zusammenhängend ist und Sinn ergibt", so Ali Madani, Gründer des Protein-Design-Unternehmens Profluent, in dem Artikel. Mit dieser textbasierten Modellierungstechnologie kann die künstliche Intelligenz bei der Entwicklung neuer Proteine helfen, ähnlich wie ChatGPT Texte auf der Grundlage der Sprache produziert, auf die es trainiert wurde.
Bilder und Landschaften
Der Sprachmodell-Ansatz hat sich zwar bewährt, ist aber nicht die einzige Option. Ein Programm namens Chroma verwendet Diffusionsmodelle, die üblicherweise in KI-Tools für die Bilderzeugung verwendet werden und sich für die Bearbeitung mehrdimensionaler Daten eignen.
Faruck Morcos, PhD, ein angesehener Professor für Biowissenschaften an der University of Texas in Dallas (UT Dallas), verwendet eine Variante dieser Bildgebungsstrategie. Laut einer Story, die von der UT Dallas veröffentlicht wurde, erzeugen er und sein Team 3D-Landschaften, die es ihnen ermöglichen, neue Proteine sichtbar zu machen. "Unser neues System ist wie eine Straßenkarte", so Morcos. "Anstatt einfach nur bestehende Proteinsequenzen zu analysieren, betrachten wir die Evolution der Proteine und erstellen Karten, die sowohl bereits existierende Proteine als auch potenzielle Sequenzen darstellen."
"Für die Anwendungen, an denen wir interessiert sind, wie Nachhaltigkeit, Medizin, Lebensmittel, Gesundheit und Materialdesign, müssen wir über das hinausgehen, was die Natur getan hat."
- Markus Buehler, PhD, McAfee Professor of Engineering, am Massachusetts Institute of Technology
Der Beweis liegt in der Faltung
Eine der größten Herausforderungen bei der Entwicklung und Herstellung neuer Proteine besteht darin, zu beweisen, dass sie wie natürliche Proteine funktionieren und nicht nur zufällige Ketten chemischer Verbindungen sind.
Ein Forscherteam der Universität Toronto testet seine von der KI erstellten Proteine mit OmegaFold, einer Version der DeepMind-Software AlphaFold 2. Mit diesem System konnten sie bestätigen, dass sich neue Sequenzen zu einer funktionalen Struktur falten. Diese Validierung ist von entscheidender Bedeutung, da durch die Faltung eine Proteinkette in eine dreidimensionale Struktur übersetzt wird und festgestellt werden kann, ob sie die richtige Form hat, um zu funktionieren. Das Team bestätigte die Lebensfähigkeit ihrer Strukturen, indem es physikalische Versionen von ihnen im Labor herstellte.
Protein-Power
Da neue Proteine für bestimmte Eigenschaften entworfen werden können, sind sie sehr vielversprechend für biomedizinische, industrielle und Umweltanwendungen.
Ein Bericht des Massachusetts Institute of Technology (MIT) stellt fest, dass neue Proteine bei biomedizinischen Anwendungen zwar problematisch sein können, weil ihre Eigenschaften noch nicht vollständig bekannt sind, dass sie aber ein großes Potenzial haben, weil sie nach dem Vorbild bestehender natürlicher Proteine entworfen und auf bestimmte Anforderungen zugeschnitten werden können.
In der Industrie können neue Proteine zur Herstellung von Materialien mit bestimmten Steifigkeits- und Biegsamkeitseigenschaften verwendet werden, um Materialien auf Erdöl- oder Keramikbasis zu ersetzen, allerdings mit einem viel geringeren Kohlenstoffausstoß. Eine weitere Möglichkeit sind Lebensmittelbeschichtungen, die dazu beitragen, dass Lebensmittel sicher und länger frisch bleiben.
"Für die Anwendungen, an denen wir interessiert sind, wie Nachhaltigkeit, Medizin, Lebensmittel, Gesundheit und Materialdesign, müssen wir über das hinausgehen, was die Natur getan hat", sagte Dr. Markus Bühler, McAfee Professor of Engineering am MIT.
Mark Miller ist ein Mitarbeiter von Thermo Fisher Scientific.