Was ist der Ansatz der computergestützten Chemie in der industriellen Enzymforschung?
In diesem Beitrag werden die wichtigsten Methoden der Computerchemie vorgestellt, die in der industriellen Enzymforschung eingesetzt werden, insbesondere zur Steuerung des Enzym-Engineerings. Dazu gehören molekularmechanische Kraftfeld- und Molekulardynamiksimulationen, quantenmechanische und kombinierte quantenmechanische/molekularmechanische Modellierung, elektrostatische Kontinuumsmodellierung und molekulares Docking. Diese Methoden werden im Text aus zwei Blickwinkeln zusammengefasst: erstens die grundlegenden Konzepte der Methoden selbst, die Ergebnisse der ursprünglichen Berechnungen, die Bedingungen für die Anwendbarkeit und die Vor- und Nachteile; und zweitens die wertvollen Informationen, die aus den Berechnungen gewonnen werden, um das Design von Mutanten und Mutantenbibliotheken zu steuern.
Die industrielle Anwendung von Enzymen hat eine hundertjährige Geschichte, und die Enzymkatalyse wird aufgrund ihrer hohen Effizienz, hohen Spezifität und Selektivität sowie ihrer Umweltfreundlichkeit in verschiedenen Industriezweigen wie der Lebensmittelindustrie, der Landwirtschaft, der Medizin und der chemischen Industrie eingesetzt. [1-2]. Da sich das industrielle Anwendungsumfeld weit von dem Umfeld unterscheidet, in dem Enzyme in der Natur leben, stimmen die Natur und die katalytische Funktion natürlicher Enzyme und ihr Anwendungsumfeld in der Regel nicht überein oder sind nicht optimal. In diesem Fall ist es notwendig, die natürliche Aminosäuresequenz des Enzyms mit Hilfe des Enzym-Engineering zu verändern, um seine Leistung zu verbessern [3]. Die am häufigsten angewandte Enzym-Engineering-Strategie ist die Erstellung von Mutationsbibliotheken für das Screening, d. h. die gerichtete Evolution im Labor. [4]. Eine der notwendigen Voraussetzungen für eine wirksame gerichtete Evolution ist, dass die Bibliothekskapazität (d. h. die Anzahl der in der Bibliothek enthaltenen Mutanten) der Mutantenbibliothek, die einem Screening unterzogen wird, im Verhältnis zum Anteil der potenziell nützlichen Mutanten in der Bibliothek ausreichend groß ist. Die Größe einer Mutantenbibliothek wird häufig durch die Screening-Methode, die verfügbaren Ressourcen und andere objektive Bedingungen begrenzt. Die Schlüsselfrage ist, wie der Prozentsatz der wirksamen Mutanten in der Mutantenbibliothek erhöht werden kann. Ein tiefes Verständnis der Beziehung zwischen Enzymsequenz, Struktur und wichtigen Eigenschaften kann helfen, Mutations-Hotspots zu identifizieren, den Umfang der Mutation zu begrenzen und eine qualitativ hochwertige Mutantenbibliothek zu entwerfen. Methoden der computergestützten Chemie sind ein wichtiges Mittel, um dieses Verständnis zu erlangen. Es hat sich gezeigt, dass rechnergestützte Proteinmutationsbibliotheken den Prozentsatz der effektiven Mutanten im Vergleich zu zufälligen Mutationsbibliotheken um mehrere Größenordnungen erhöhen können [5]. Bei einigen schwierigen Enzym- oder Protein-Engineering-Themen kann die erhebliche Verbesserung, die durch Berechnungen erzielt werden kann, ausreichen, um über den endgültigen Erfolg oder Misserfolg des Themas zu entscheiden, das nicht mehr auf die Verbesserung der Effizienz beschränkt ist. In der Tat haben Methoden der Computerchemie und Computerbiologie erfolgreich die Entwicklung künstlicher Enzyme von Grund auf ermöglicht, die über katalytische Funktionen verfügen, die natürliche Enzyme nicht besitzen. Da sich andere Übersichtsarbeiten in diesem Album mit Methoden für das automatisierte optimale Design von Aminosäuresequenzen befasst haben, konzentriert sich dieser Beitrag auf rechnergestützte Methoden zur Simulation und Analyse von Enzymen mit einer gegebenen Aminosäuresequenz. Natürlich können Forscher diese Methoden nutzen, um Wildtyp und Mutanten getrennt zu untersuchen und dann die Ergebnisse zu vergleichen.
Die Untersuchung von Proteinen, insbesondere von Enzymen, ist seit langem ein wichtiger Bereich der computergestützten Chemieforschung. [6-8]. Zu den wichtigsten Methoden gehören Molekulardynamiksimulationen (klassische MD) auf der Grundlage klassischer molekularmechanischer Kraftfelder [9], Quantenmechanik (QM) [10] und kombinierte quantenmechanische/molekularmechanische (QM/MM) Methoden [8,11-12], Vorhersage intermolekularer Komplexe, d. h. molekulares Docking (Docking) [13], und polarisierbares Kontinuumsmodell (PCM) zur Quantifizierung von elektrostatischen und Lösungsmitteleffekten [ 14]. ) wie das Poisson-Boltzmann-Modell (PB) [14], und einige auf geometrischen Eigenschaften basierende Modelle. In diesem Beitrag geben wir einen Überblick über jede dieser Methoden aus zwei Blickwinkeln: erstens über die Methoden selbst, einschließlich der Grundprinzipien, der ursprünglichen Berechnungsergebnisse, der Bedingungen für die Anwendbarkeit und der (potenziellen) Vor- und Nachteile, usw.und zweitens darüber, wie diese Methoden eingesetzt werden können, um ingenieurwissenschaftlich relevante Informationen zu erhalten, z. B. ein tieferes Verständnis katalytisch relevanter Mechanismen, theoretische Vorhersagen oder Erklärungen für Veränderungen der Eigenschaften oder Funktionen verschiedener Mutanten im Vergleich zum Wildtyp, die das Design qualitativ hochwertiger Mutationsbibliotheken für die gerichtete Evolution oder das Design qualitativ hochwertiger Mutationsbibliotheken oder das Design von Mutationsbanken anleiten können.
1
Molekulardynamische Simulation (MD) auf der Grundlage klassischer Molekularmechanik-Kraftfelder (MM)
1.1
Einführung in die Methode
Wir betrachten vorerst nicht die chemischen Veränderungen, die bei der Enzymkatalyse auftreten, sondern nur die Prozesse der Konformationsänderungen des Enzyms sowie die Bildung und Dissoziation von nicht-kovalenten Komplexen zwischen dem Enzym und den Reaktanten (oder Produkten) aufgrund molekularer Wärmebewegungen. Während dieser Vorgänge ändert sich der elektronische Zustand des Moleküls nicht (d. h. es werden keine kovalenten Bindungen gebrochen oder geschaffen), und es gilt das molekularmechanische Kraftfeldmodell. Das so genannte molekularmechanische Kraftfeld ist eine empirische mathematische Funktion, die die Abhängigkeit der potenziellen Energie eines molekularen Systems von der geometrischen Konfiguration (d. h. den räumlichen Koordinaten aller Atome, aus denen das molekulare System besteht) ausdrückt (Abb. 1A). Mit anderen Worten, wenn wir X die Raumkoordinaten aller Atome darstellen und VMM (X ), um die potenzielle Energie des molekularen Kraftfelds darzustellen, ändert sich die potenzielle Energie, wenn das Molekül von einer Konformation in eine andere übergeht X1 zum anderen X2:
∆VMM = VMM ( X2 ) – VMM ( X1 ).
Nach der thermodynamischen Theorie befinden sich die Atome eines Moleküls immer in thermischer Bewegung, d. h., X ändert sich ständig mit der Zeit; außerdem besteht die Probe bei experimentellen Beobachtungen immer aus einer großen Anzahl von Molekülen (mit Ausnahme von Einzelmolekülexperimenten), wobei sich verschiedene Moleküle in unterschiedlichen Konformationszuständen befinden. Daher müssen wir aus kinetischer Sicht die Konformationsänderungen im Laufe der Zeit und aus thermodynamischer Sicht die Wahrscheinlichkeitsverteilung von Molekülen mit unterschiedlichen Konformationen berücksichtigen. Die Molekulardynamiksimulation (MD) ist das einfachste Modell zur Untersuchung dieser beiden Aspekte der Eigenschaften (Abb. 1B). Bei der MD-Simulation gehen wir von einer Anfangskonformation aus, berechnen die Kraft, die zu jedem Zeitpunkt auf jedes Atom wirkt, auf der Grundlage der aktuellen Konformation und der potenziellen Energiefunktion (die Kraft ist die negative Ableitung der potenziellen Energiefunktion in Bezug auf die Koordinaten der Atome), integrieren numerisch die Newtonschen Bewegungsgleichungen, um die Konformation zum nächsten Zeitpunkt zu erhalten, und wiederholen den Prozess, um die Trajektorie der Konformationsentwicklung über die Zeit zu erhalten.
Dazwischen können spezielle Algorithmen verwendet werden, um die Auswirkungen von Umweltfaktoren (z. B. Temperatur, Druck usw.) auf die Molekularbewegung zu simulieren. Nach dem thermodynamischen Prinzip ist die Wahrscheinlichkeitsverteilung der Konformation desselben Moleküls zu verschiedenen Zeitpunkten und der Konformation verschiedener Moleküle im thermodynamischen Gleichgewichtszustand gleich, wenn das Zeitintervall lang genug ist (d. h. die Zeitmittelung entspricht der Systemmittelung). Wenn die MD-Simulation über einen ausreichend langen Zeitraum durchgeführt wird, kann die aus der Simulation gewonnene Menge an Konformationen daher als Stichprobe für die Verteilung der Molekülkonformationen in einem bestimmten thermodynamischen Gleichgewichtszustand verwendet werden. Auf der Grundlage dieses Prinzips können wir beliebige beobachtbare Eigenschaften eines Systems in seinem thermodynamischen Gleichgewichtszustand auf der Grundlage der durch MD erhaltenen Zeittrajektorien analysieren.
MD ist ein leistungsfähiges Berechnungsinstrument zur umfassenden Analyse des kinetischen Veränderungsprozesses von Konformationsänderungen und wichtiger mikroskopischer quanten-thermodynamischer Verteilungen bei atomarer Auflösung, was besonders wichtig für die Aufklärung der Konstruktionsprinzipien und Arbeitsmechanismen komplexer biomakromolekularer Maschinen wie Enzyme ist. Da die derzeitigen experimentellen Methoden zur makromolekularen Strukturanalyse nur räumlich-zeitlich gemittelte statische Strukturen liefern können, haben MD-Simulationen eine unersetzliche Funktion in der einschlägigen Forschung. Unter dieser Prämisse befindet sich das MD-Werkzeug selbst noch in einem Prozess der kontinuierlichen Verbesserung und Verfeinerung. Aus methodischer Sicht ergeben sich die wichtigsten Einschränkungen der MD aus zwei Aspekten: erstens aus der Genauigkeit des molekularen Kraftfeldmodells und zweitens aus der begrenzten Simulationszeit, die eine vollständige Erfassung des Konformationsraums erschwert. Was das erste Problem betrifft, so wurde das molekulare Kraftfeld in den letzten Jahren stark verbessert, und die Genauigkeit der thermodynamischen Beschreibung des Konformationsgleichgewichts biologischer Makromoleküle, insbesondere von Proteinsystemen, wurde erhöht, so dass eine Vielzahl von Proteinmolekülen vom Prozess der Kopffaltung bis zur natürlichen Struktur erfolgreich simuliert werden konnte. [15-16]. Was die Simulationszeit anbelangt, so ist es dank der Entwicklung von Computerhardware und -software heute möglich, Simulationen in der Größenordnung von Mikrosekunden für Systeme üblicher Größe (z. B. Enzymmoleküle mit Hunderten von Resten in wässriger Lösung) mit herkömmlicher Computerhardware (z. B. den von der Gruppe verwendeten Multi-Core-Servern) durchzuführen. Auf dieser Zeitskala können Prozesse wie das Öffnen und Schließen von Strukturdomänen oder Ringregionen beobachtet werden. Wenn mehr Rechenressourcen zur Verfügung stehen, können auch direkte Simulationen von Prozessen wie der Substratbindung/-dissoziation durchgeführt werden. Zur Untersuchung von Prozessen auf Zeitskalen, die über die Reichweite der Simulation hinausgehen (z. B. große funktionelle Veränderungen allosterischer Proteine usw.), können erweiterte Sampling-Methoden eingesetzt werden [17], vorausgesetzt, der Nutzer verfügt über ein vertieftes Verständnis der MD-Theorie.
Derzeit decken die meisten MD-Simulationsanwendungen Zeitskalen von Nanosekunden bis zu Mikrosekunden ab, und die Abtastung des Konformationsraums ist meist auf die Umgebung der Ausgangsstruktur beschränkt (bei Proteinen mit einer Domäne ist dies in der Regel der strukturelle Anstieg und Abfall der RMS-Verschiebung im Bereich von 3-4 Å). Damit die Simulationsergebnisse aussagekräftig sind, ist es daher notwendig, eine vernünftige Ausgangsstruktur als Eingabe für die MD zu verwenden. In den meisten Fällen werden experimentell bestimmte Kristallstrukturen oder Strukturen, die auf der vergleichenden Modellierung homologer Proteine beruhen, als Ausgangsstrukturen für die MD verwendet. Bei der Simulation von Enzym-Substrat-Komplexen ist es oft notwendig, die Ausgangsstruktur des Komplexes auf der Grundlage der Struktur des leeren Enzyms oder des Enzyms im Komplex mit anderen Molekülen zu modellieren, entweder durch molekulares Docking oder indem andere kleine Moleküle (z. B. Inhibitoren) in der Kristallstruktur direkt durch das Substrat ersetzt werden. MD-Simulationen erfordern auch die Erstellung eines molekularen Kraftfeldes, das alle chemischen Einheiten des Systems abbildet. Wenn das zu simulierende System ein kleines Molekül als Substrat enthält, ist es häufig der Fall, dass das im MD-Softwarepaket enthaltene molekulare Standardkraftfeld das kleine Molekül als Substrat nicht abdeckt. In diesem Fall kann eine Software verwendet werden, die automatisch Kraftfelder für kleine Moleküle erzeugen kann [18-19]. Die Kraftfelddateien sollten manuell überprüft und für kurze Simulationsversuche verwendet werden, bevor die automatisch generierten Kraftfelder für lange MD-Simulationen verwendet werden.
Abb. 1 Kraftfeld der Molekularmechanik (A) und Molekulardynamik-Simulation (B)
Abb. 1 Molekularmechanisches Kraftfeld (A) und Molekulardynamiksimulation (B)
1.2
Anwendung auf die Enzymforschung
Die aus MD-Simulationen gewonnenen Informationen können auf verschiedene Weise zur Steuerung von Änderungen bei der Enzymtechnik verwendet werden [20]. Durch den Vergleich von MD-Simulationen bei Raumtemperatur und bei hohen Temperaturen lässt sich beispielsweise vorhersagen, welche Regionen des Enzymmoleküls wahrscheinlich die empfindlichste strukturelle Stabilität gegenüber der Umgebungstemperatur aufweisen. Die Einführung von Prolin-Punktmutationen, Disulfidbindungen usw. in diesen Regionen könnte die Hitzeresistenz des Enzyms möglicherweise verbessern. [21-24]. Eine weitere Strategie zur Verbesserung der Stabilität besteht darin, Mutanten zu entwickeln, die mehr Oberflächenwasserstoff- und Salzbindungen bilden. [25-26]. Vor der experimentellen Validierung solcher Mutanten können Wildtyp und Mutanten parallel simuliert werden, um theoretisch abzuschätzen, ob die Mutation die gewünschte Wirkung erzielen kann [27-28]. Neben der Temperatur kann MD auch dazu verwendet werden, die Auswirkungen von Änderungen des pH-Werts, der Lösungsmittel usw. auf die Proteinkonformation und ihre Stabilität zu analysieren. [29-30].
Zusätzlich zur Stabilität wurde MD zur Vorhersage von Hotspot-Resten eingesetzt, die das Potenzial haben, die Konformationsdynamik im Zusammenhang mit der Substratbindung/Produktfreisetzung erheblich zu beeinflussen, und die eine Grundlage für die Entwicklung von Mutationen oder Mutantenbibliotheken bilden, die die Substratselektivität, Reaktionsselektivität, Produktfreisetzungsrate usw. verändern können. [31-32]. Eine Möglichkeit, die Substrat-/Reaktionsselektivität mit MD zu untersuchen, besteht darin, die Simulationsergebnisse von Enzym-Substrat-Komplexen mit unterschiedlichen (ursprünglichen) Strukturen zu vergleichen und Substrat- oder Strukturzustände mit höherer Affinität (oder höherer Reaktivität) vorherzusagen. Eine strenge quantitative Methode zur Berechnung der Affinität (oder Reaktivität) ist die Berechnung der freien Energie [33-34]. Da die Berechnung der freien Energie sehr rechenintensiv ist, verwenden die meisten derzeitigen Anwendungen qualitative Methoden für die Vorhersage: Die qualitative Unterscheidung der relativen Affinität kann auf der Stabilität der Struktur der Komplexe aus kleinen Molekülen und Makromolekülen, der durchschnittlichen intermolekularen Wechselwirkungsenergie usw. beruhen, während die qualitative Unterscheidung der Reaktivität auf der relativen geometrischen Konfigurationsverteilung der katalytischen und reaktiven funktionellen Gruppen usw. beruht. [35]. Die Ergebnisse einer solchen qualitativen Unterscheidung können als Grundlage für den Entwurf von Bibliotheken mit gerichteten evolutionären Sequenzen verwendet werden. Darüber hinaus können MD-Simulationen auch zur Analyse von Hotspot-Resten rund um die Substratbindungs-/Produktdissoziationspore verwendet werden [36-37]. Bei dieser Art von Anwendung geht es um die Simulation von Dissoziationspfaden für die Dissoziation kleiner Moleküle von Proteinen, und wenn es Schwierigkeiten mit unzureichenden Simulationszeitskalen gibt, können diese durch verbesserte Sampling-Techniken überwunden werden [38-39].
2
Quantenmechanik (QM) und kombinierte Modelle der Quantenmechanik/Molekularmechanik (QM/MM)
2.1
Einführung in die Methode
Für die Simulation chemischer Schritte in der Enzymkatalyse, wie z. B. das Entstehen und Aufbrechen kovalenter Bindungen, Elektronentransfer und Sprünge zwischen verschiedenen elektronischen Zuständen, werden quantenmechanische (QM) Modelle benötigt. Gegenwärtig werden die in der computergestützten Chemie verwendeten QM-Modelle in verschiedene Typen eingeteilt, wie z. B. ab initio ( von Anfang an ), Dichtefunktionaltheorie (DFT) und halb-empirische Methoden [40]. Unter ihnen sind halb-empirische Methoden die am wenigsten rechenaufwändigen. Allerdings handelt es sich dabei um Methoden, die nicht auf den ersten Prinzipien beruhen, und die Zuverlässigkeit der Berechnungsergebnisse hängt stark vom jeweiligen System und Problem ab. Sowohl die ab initio- als auch die DFT-Methoden sind First-Principle-Methoden und sind universell. Praktische DFT-Modelle können mehr empirische theoretische Näherungen enthalten als ab initio-Berechnungen, aber DFT kann Elektronenkorrelationsenergien mit sehr hoher Recheneffizienz behandeln. Darüber hinaus sind bei vielen chemischen Reaktionsproblemen die Rechenfehler der besten DFT-Modelle für Schlüsselparameter wie die Energieänderungen während des Reaktionsprozesses bereits so klein wie etwa 1 kcal/mol, und die Ergebnisse reichen aus, um als Grundlage für die Bestimmung der chemischen Solidität eines bestimmten katalytischen Mechanismus oder Reaktionsweges verwendet zu werden.
Ausgehend von der geometrischen Konfiguration eines Moleküls kann seine Energie mit Hilfe der QM berechnet werden. Das QM-Modell wird häufiger für die Optimierung von Molekülgeometrien verwendet, d. h. um eine lokal stabile Struktur (mit einer niedrigeren Energie als die benachbarten Strukturen) nach sukzessiven Änderungen einer Ausgangskonfiguration zu finden oder um die Wege mit der niedrigsten Energie zu finden, die die Reaktanten mit den Produkten verbinden, sowie die Übergangszustände entlang dieser Wege. Diese Berechnungen sind rechenintensiv, da verschiedene geometrische Konfigurationen berücksichtigt und verglichen werden müssen und in der Regel Dutzende bis Tausende von Einzelpunktberechnungen durchgeführt werden müssen. Eine gängige Strategie zur Einsparung von Rechenaufwand besteht darin, zunächst ein breites Spektrum von Reaktionspfaden mit Hilfe effizienter QM-Modelle mit begrenzter Genauigkeit zu optimieren und dann die Konfigurationsoptimierung mit Hilfe von Modellen höherer Genauigkeit in der Nähe der gesuchten Konfiguration/des gesuchten Pfads mit der niedrigsten Energie zu vervollständigen oder Einzelpunktberechnungen durchzuführen.
Derzeit ist die Anwendung von QM-Methoden des ersten Prinzips auf das gesamte Enzymmolekül rechenintensiv, im Wesentlichen auf Ein-Punkt-Berechnungen beschränkt und noch nicht praktikabel. Das QM/MM-Modell (Abb. 2) wird in der Regel für große Moleküle verwendet. [11]. In diesem Modell wird das molekulare System in mindestens zwei Teile aufgeteilt: Der Teil, der direkt an der chemischen Reaktion beteiligt ist, wird mit dem QM-Modell behandelt, der Rest mit der Molekularmechanik (MM). Es gibt verschiedene Strategien für den Umgang mit QM-MM-Grenzen und Wechselwirkungen [41]. Bei QM/MM-Modellen nach den ersten Grundsätzen sind QM-Berechnungen weitaus kostspieliger als MM-Berechnungen. Daher werden für die QM-Region meist Methoden zur Konformationsoptimierung verwendet, um ihre Geometrie vorherzusagen oder zu simulieren, und für den MM-Teil können Molekulardynamiksimulationen verwendet werden. [42]. Dies bedeutet, dass die Berechnungsergebnisse empfindlicher auf die Anfangsstruktur des QM-Bereichs des Systems reagieren können. In diesem Fall sind Berechnungen mit verschiedenen Anfangsstrukturmodellen erforderlich, um zuverlässige Ergebnisse zu erhalten. Wenn halb-empirische Methoden [43] oder empirische Valenzbindungstheorien [44-45] werden für den QM-Teil verwendet , kann es möglich sein, den Konformationsraum umfassender zu erforschen und die Auswirkungen der Ausgangsstruktur durch längere QM/MM-MD-Probenahmen zu verringern.
Abb. 2 Quantenmechanik (QM)/Molekular Mechanik (MM) Modelle
Abb. 2 Quantenmechanisches (QM)/molekularmechanisches (MM) Modell.
2.2
Anwendung der Methode
Beide das QM-Modell [10] und das QM/MM-Modell [41] wurden in großem Umfang für die theoretische Vorhersage und Prüfung der chemischen Mechanismen von enzymkatalysierten Reaktionen verwendet. Ihre Ergebnisse können uns helfen zu erkennen, welche Schlüsselreste am chemischen Reaktionsprozess beteiligt sind, den geschwindigkeitsbegrenzenden Schritt der Reaktion zu finden, die Struktur von Reaktionszwischenprodukten und Übergangszuständen zu modellieren, zu analysieren, wie sie mit der Enzymumgebung interagieren, usw. Im Vergleich zum QM-Cluster-Modell kann das QM/MM-Modell die Enzymumgebung, in der sich die chemischen Reaktionszentren befinden, realistischer simulieren. QM/MM wurde weithin verwendet, um den chemischen Mechanismus der Enzymkatalyse theoretisch vorherzusagen/zu testen und um die möglichen Auswirkungen der Aminosäurereste in der Umgebung auf den katalytischen Prozess zu analysieren und vorherzusagen. [46]. Im Prinzip können diese Ergebnisse als Leitfaden für die Entwicklung von Mutationsbibliotheken mit dem Ziel dienen, die katalytische Aktivität zu erhöhen und die Spezifität oder Selektivität zu verändern. Eine anspruchsvollere Studie würde darin bestehen, völlig neue künstliche Enzyme zu erhalten, die auf dem Entwurf neuer aktiver Zentren von Grund auf auf der Grundlage von QM- oder QM/MM-Strukturmodellen mit vorhergesagten Übergangszuständen basieren [47].
3
Modellierung elektrostatischer Kontinuumsmedien
3.1
Prinzip der Methode
Die Katalyse von Enzymen findet fast immer in einer bestimmten Lösungsumgebung statt. Lösungsmitteleffekte haben einen entscheidenden Einfluss auf die Enzymeigenschaften. Modelle zur Berechnung von Lösungsmitteleffekten bei chemischen Behandlungen lassen sich in zwei Kategorien einteilen: explizite Lösungsmittelmodelle, z. B. in molekularmechanischen Kraftfeldern oder QM-Modellen, bei denen jedes Lösungsmittelmolekül und jedes darin enthaltene Atom explizit in das Modell einbezogen wird, und implizite Lösungsmittel- oder Kontinuumsmediummodelle [48], wobei Die Lösungsmittelmoleküle und -atome werden nicht in das Modell einbezogen, und für die Behandlung von Lösungsmitteleffekten werden die so genannten "Solvent Mean Fields" verwendet. Der Vorteil des expliziten Lösungsmittelmodells besteht darin, dass es in der Lage ist, Lösungsmittel und Lösungsmittel in einer vollständig konsistenten Weise zu behandeln und spezifische Wechselwirkungen wie Wasserstoffbrückenbindungen zwischen Lösungsmittel und Lösungsmittel, Salzbindungen usw. realistisch zu modellieren. Der Nachteil ist, dass die Anzahl der Lösungsmittelmoleküle groß und rechenintensiv ist. Außerdem trägt der stochastische Anstieg des Lösungsmittels erheblich zur Gesamtenergie des Systems bei, und es muss eine lange Mittelung der Simulationsproben durchgeführt werden, um den Effekt des Anstiegs zu eliminieren. Das Modell des verborgenen Lösungsmittels stellt den Mittelungseffekt des Lösungsmittels dar, und der thermodynamische Anstieg und Abfall des Lösungsmittels wurde gemittelt.
Der Einfachheit halber trennen wir in der Regel den Effekt des unpolaren Lösungsmittels (hydrophober Effekt) vom Effekt des polaren Lösungsmittels im Modell des verborgenen Lösungsmittels. Die Erfahrung hat gezeigt, dass die freie Solvatationsenergie eines unpolaren gelösten Stoffes proportional zu seiner vom Lösungsmittel zugänglichen Oberfläche (SASA) ist. Daher wird für diese Komponente häufig das SASA-Solvatationsmodell verwendet. Zu den Parametern dieses Modells gehören die Atomradien, die zur Berechnung der SASA erforderlich sind, der Radius des Lösungsmittelmoleküls (1,4 Å für Wassermoleküle) und eine Proportionalitätskonstante für die freie Solvatationsenergie proportional zur SASA. Diese Parameter werden im Allgemeinen durch Anpassung der experimentellen Werte der freien Solvatationsenergie kleiner Moleküle bestimmt.
Die am häufigsten verwendeten Modelle zur Berücksichtigung von Effekten polarer Lösungsmittel behandeln den Bereich, der vom Lösungsmittel eingenommen wird, als ein kontinuierliches Medium mit einer spezifischen Dielektrizitätskonstante (78,4 für Wasser) und den Bereich des gelösten Stoffes als ein Medium mit einer niedrigen Dielektrizitätskonstante (üblicherweise 2-8) oder ein Vakuum (Dielektrizitätskonstante von 1) (Abb. 3A). Das kontinuierliche Medium wird durch das elektrostatische Feld polarisiert, das durch die Ladungsverteilung im Bereich des gelösten Stoffes erzeugt wird, und die daraus resultierende polarisierte Ladungsverteilung erzeugt wiederum ein elektrostatisches Feld im Bereich des gelösten Stoffes, das auf die Ladung des gelösten Stoffes wirkt. Das elektrische Feld, das durch die polarisierten Ladungen erzeugt wird, wird als Reaktionsfeld bezeichnet. Daher wird das elektrostatische Modell des kontinuierlichen Mediums auch als Reaktionsfeldmodell bezeichnet. Im Modell des kontinuierlichen Mediums ohne freie Ionen im Lösungsmittelbereich erfüllt die Beziehung zwischen dem elektrostatischen Raumpotential und der Raumladungsverteilung die Poisson-Gleichung. In einer Lösungsumgebung, die freie Ionen enthält, wird die räumliche Verteilung der Ionen durch das räumliche elektrostatische Potenzial beeinflusst. Unter Berücksichtigung dieses Faktors erfüllt die Beziehung zwischen dem räumlichen elektrostatischen Potenzial und der räumlichen Ladungsverteilung die Poisson-Boltzmann-Gleichung (PB-Gleichung), eine partielle Differentialgleichung, die die Beziehung zwischen der Verteilung des elektrostatischen Potenzials und der Verteilung der Ladung und des Dielektrikums im dreidimensionalen Raum beschreibt und numerisch gelöst werden kann. Die gängigste numerische Methode zur Lösung der PB-Gleichung für makromolekulare Systeme wie Enzyme ist die Finite-Differenzen-Methode (FD), die allgemein als FDPB-Modell bezeichnet wird (Abbildung 3B). [14]. Mit FDPB ist es möglich, das elektrostatische Potenzial in drei Dimensionen auf der Grundlage der Raumladungsverteilung des gelösten Stoffes zu berechnen, was wiederum die Berechnung anderer Eigenschaften wie der elektrostatischen freien Energie ermöglicht. In QM-Berechnungen für kleine Molekülsysteme wird das Reaktionsfeld häufig durch das elektrische Feld ersetzt, das durch die Oberflächenladungsverteilung auf der Moleküloberfläche erzeugt wird, und das entsprechende Modell wird als Modell des polarisierbaren kontinuierlichen Mediums (PCM) bezeichnet.
Das am häufigsten verwendete Modell zur Berücksichtigung von polaren Lösungsmitteleffekten behandelt den vom Lösungsmittel eingenommenen Bereich als kontinuierliches Medium mit einer spezifischen Dielektrizitätskonstante (78,4 für Wasser), während der gelöste Bereich so behandelt wird, als ob er von einem Medium mit einer niedrigen Dielektrizitätskonstante (üblicherweise 2-8) oder einem Vakuum (Dielektrizitätskonstante von 1) eingenommen würde (Abb. 3A). Das kontinuierliche Medium wird durch das elektrostatische Feld polarisiert, das durch die Ladungsverteilung in der gelösten Region erzeugt wird, und die daraus resultierende polarisierte Ladungsverteilung erzeugt wiederum ein elektrostatisches Feld in der gelösten Region, das auf die gelöste Ladung wirkt. Das elektrische Feld, das durch die polarisierten Ladungen erzeugt wird, wird als Reaktionsfeld bezeichnet. Daher wird das elektrostatische Modell des kontinuierlichen Mediums auch als Reaktionsfeldmodell bezeichnet. Im Modell des kontinuierlichen Mediums ohne freie Ionen im Lösungsmittelbereich erfüllt die Beziehung zwischen dem elektrostatischen Raumpotential und der Raumladungsverteilung die Poisson-Gleichung. In einer Lösungsumgebung, die freie Ionen enthält, wird die räumliche Verteilung der Ionen durch das räumliche elektrostatische Potenzial beeinflusst. Unter Berücksichtigung dieses Faktors erfüllt die Beziehung zwischen dem räumlichen elektrostatischen Potential und der räumlichen Ladungsverteilung die Poisson-Boltzmann-Gleichung (PB-Gleichung), eine partielle Differentialgleichung, die die Beziehung zwischen der Verteilung des elektrostatischen Potentials und der Verteilung der Ladung und des Dielektrikums im dreidimensionalen Raum beschreibt und numerisch gelöst werden kann. Die gängigste numerische Methode zur Lösung der PB-Gleichung für makromolekulare Systeme wie Enzyme ist die Finite-Differenzen-Methode (FD), die allgemein als FDPB-Modell bezeichnet wird (Abbildung 3B). [14]. Mit FDPB ist es möglich, das elektrostatische Potenzial in drei Dimensionen auf der Grundlage der Raumladungsverteilung des gelösten Stoffes zu berechnen, was wiederum die Berechnung anderer Eigenschaften wie der elektrostatischen freien Energie ermöglicht. Bei QM-Berechnungen kleiner molekularer Systeme wird das Reaktionsfeld häufig durch das elektrische Feld ersetzt, das durch die Oberflächenladungsverteilung auf der Oberfläche des Moleküls erzeugt wird, und das entsprechende Modell wird als Modell des polarisierbaren kontinuierlichen Mediums (PCM) bezeichnet.
Abb. 3 Elektrostatisches Kontinuumsmodell (A) und Finite-Differenzen-Poisson-Boltzmann (FDPB) Methode (B)
Abb. 3 Elektrostatisches Kontinuumsmodell (A) und Finite-Differenzen-Poisson-Boltzmann (FDPB)-Methode (B).
3.2
Anwendung der Methode
Eine der wichtigsten Anwendungen des Kontinuumsmodells ist die Untersuchung des Protonierungszustands von geladenen Aminosäureseitenkettengruppen in Enzymmolekülen. Die Software PROPKA sagt den pKa-Wert jeder dissoziierbaren Gruppe voraus, indem sie die PB-Gleichung löst, um die elektrostatische freie Energie für verschiedene Protonierungszustände zu berechnen [50]. Die Verteilung des elektrostatischen Oberflächenpotentials eines Enzymmoleküls ist ein wichtiger Faktor, der die Substratselektivität des Enzyms beeinflusst. Angesichts der räumlichen Struktur und des Protonierungszustands eines Enzymmoleküls kann die Verteilung des elektrostatischen Oberflächenpotenzials eines Enzymmoleküls mit der FDPB-Methode berechnet werden, die auch die Auswirkungen von Mutationen in Aminosäureresten oder Änderungen des pH-Werts der Umgebung, Änderungen der Ionenkonzentration usw. auf das elektrostatische Oberflächenpotenzial vorhersagt [14].
Bei der Untersuchung der chemischen Schritte der Enzymkatalyse mit dem QM-Cluster-Modell ist es oft notwendig, das PCM-Modell zu verwenden, um den elektrostatischen Einfluss der Umgebung auf die Reaktionszone zu simulieren. Wenn der Reaktionsprozess signifikante Änderungen in der Ladungsverteilung beinhaltet, sind die Ergebnisse von Vakuum-QM-Berechnungen ohne die Verwendung eines kontinuierlichen Mediums nicht sinnvoll und können sogar zu falschen qualitativen Schlussfolgerungen führen. Im QM/MM-Modell ist das Reaktionszentrum im Allgemeinen von löslichen Molekülen umgeben, die nach dem MM-Modell behandelt werden, und es besteht im Allgemeinen keine Notwendigkeit, das Reaktionsfeld eines kontinuierlichen Mediums zu berücksichtigen. Wenn sich jedoch die Nettoladung des Systems vor und nach der Reaktion ändert (z. B. bei Redoxpotenzialberechnungen), muss wahrscheinlich der Beitrag der Lösungsumgebung außerhalb der Systemgrenze zur freien Energie der Reaktion berücksichtigt werden, und in diesem Fall können die QM/MM-Ergebnisse mit dem Kontinuumsmediummodell korrigiert werden.
MM/PBSA ist eine Methode, die ein Gleichgewicht zwischen Effizienz und Genauigkeit herstellt, und kann zur Analyse der Affinität von Protein-Protein- und Protein-Kleinmolekül-Komplexen verwendet werden. [49]. Um die Fehlerauslöschung zu erreichen, werden üblicherweise explizite Molekulardynamiksimulationen der Komplexe durchgeführt, um eine Sammlung von Konformationen zu erhalten; für jede Komplexkonformation wird die MM/PBSA-Energie des Komplexes als Ganzes bzw. jedes Monomers, aus dem der Komplex besteht, berechnet; und die freie Bindungsenergie wird durch Verwendung des Durchschnitts der Differenz zwischen der MM/PBSA-Energie des Ganzen und derjenigen der Monomere für die gesamte Konformation angenähert. Diese Methode kann verwendet werden, um Hotspot-Reste zu analysieren, die die Substrataffinität beeinflussen, und sie kann auch verwendet werden, um Änderungen der Substratselektivität in Mutanten vorherzusagen.
4
Andere Methoden
4.1
Molekulares Docking
Docking bezieht sich auf den rechnerischen Prozess der Vorhersage der Struktur (und Affinität) eines Komplexes auf der Grundlage der Struktur eines Monomers. Das Andocken kleiner Moleküle an Proteine ist ein zentrales Instrument für das strukturbasierte virtuelle Screening von Arzneimitteln, für das mehrere Algorithmen entwickelt wurden [13]. Diese Algorithmen und Modelle können auch auf das Docking von Substrat-Enzym-Komplexen angewendet werden. Das virtuelle Wirkstoffscreening erfordert die Berücksichtigung einer großen Anzahl verschiedener kleiner Moleküle, und aus Gründen der Recheneffizienz werden die strukturellen Veränderungen des Rezeptors (oder nur der Seitenkette) bei den molekularen Docking-Berechnungen oft nicht berücksichtigt. Im Gegensatz zum virtuellen Screening werden bei Substrat-Enzym-Docking-Studien oft nur ein oder mehrere verschiedene Substrate betrachtet, und die strukturellen Veränderungen im Enzym können im Prinzip vollständiger berücksichtigt werden. Der einfachste Weg, dies zu erreichen, ist die Gewinnung verschiedener Enzymstrukturen durch Konformations-Sampling-Methoden wie MD, die separat an das Substrat angedockt werden. Beim Substrat-Enzym-Docking ist es häufig auch möglich, die relative räumliche Anordnung der funktionellen Gruppen von Substrat und Katalysator zu nutzen, um die Docking-Ergebnisse zu überprüfen und zu bewerten.
4.2
Vorhersage von Poren für kleine Moleküle auf der Grundlage der Geometrie
Zahlreiche experimentelle Studien haben gezeigt, dass einige Mutationen, die weit vom aktiven Zentrum entfernt sind, einen großen Einfluss auf die katalytische Leistung von Enzymen haben können. Einige dieser Stellen können durch Veränderung der Substratbindungs-/Produktfreisetzungspore wirken, und die Porengröße, die physikochemischen Eigenschaften der Rückstände um die Pore usw. können die Substrat-/Produktdurchgangsrate verändern und die Substratselektivität beeinträchtigen. Methoden zur Vorhersage von Poren können verwendet werden, um relevante heiße Reste zu finden und eine Grundlage für den Entwurf gerichteter Evolutionsbibliotheken zu schaffen. Es gibt mehrere auf geometrischen Strukturen basierende Methoden zur Vorhersage von Proteinoberflächengruben, internen Hohlräumen, Poren, die verschiedene Regionen verbinden, usw. [51-53]. Diese Methoden verwenden statische räumliche Strukturen als Eingaben und setzen meist geometrische und graphentheoretische Methoden ein, um die Vorhersage mit hoher Rechenleistung zu realisieren.
4.3
Active Center Vergleichsmethoden
In der Protein-3D-Strukturdatenbank (PDB) ist derzeit eine große Menge an 3D-Strukturdaten von Enzymen mit unterschiedlichen Strukturtypen und -familien gesammelt worden. Wenn wir verschiedene Enzyme vergleichen, werden wir feststellen, dass einige von ihnen einen hohen Grad an Ähnlichkeit in den aktiven Zentren aufweisen (typische Beispiele sind die aktiven Zentren der katalytischen Triade, die von Serinproteasen geteilt werden), auch wenn die strukturellen Sequenzen insgesamt nicht ähnlich sind. Die Methode zum Vergleich der Struktur des aktiven Zentrums [54-55] können verwendet werden, um automatisch die aktiven Zentren anderer Enzyme zu finden, die dem aktiven Zentrum des aktuellen Enzyms ähnlich sind. Das Stapeln mehrerer ähnlicher aktiver Zentren im dreidimensionalen Raum und die Analyse der Ähnlichkeiten und Unterschiede zwischen verschiedenen aktiven Zentren kann wertvolle Informationen für die Auswahl von Mutationsstellen liefern.
5
Zusammenfassung
Aus Gründen der Übersichtlichkeit haben wir die oben genannten Methoden in Kategorien eingeteilt. In der Praxis schließen sich die verschiedenen Arten von Methoden nicht gegenseitig aus. Sie können auf vielfältige Weise miteinander kombiniert werden, um die Fragen, die uns interessieren, besser zu beantworten. Bei Simulationen von Enzym-Substrat-Komplexen kann beispielsweise molekulares Docking verwendet werden, um die Ausgangskonformation der Simulation zu erhalten; die aus MD-Simulationen gewonnenen Konformationen können für Porenvorhersageanalysen, molekulares Docking, QM/MM-Simulationen usw. verwendet werden.MM-Modelle, die die aus QM- oder QM/MM-Modellen erhaltenen Übergangszustände einschreiben, können erstellt und für klassische MD-Langzeitsimulationen verwendet werden, um die Auswirkungen von Konformationsanstieg und -abfall auf chemische Prozesse zu analysieren, oder für die Simulation einer großen Anzahl von Mutanten, um ein virtuelles Screening von Mutanten auf der Grundlage von MD-Simulationen zu realisieren; der bereits erwähnte MM/PBSA-Ansatz ist eine Kombination aus MD- und Kontinuumsmedium-Modellierung usw.
Die Untersuchung von Biomolekülsystemen wie Proteinen mit Methoden der computergestützten Chemie hat eine mehr als 40-jährige Geschichte. Diese Methoden werden in der industriellen Enzymforschung in immer größerem Umfang eingesetzt und gleichzeitig ständig weiterentwickelt. Chinas Forschungsteams im Bereich der computergestützten Chemie und des industriellen Enzym-Engineerings werden immer größer und ihre Forschungskapazitäten verbessern sich rasch. Die Anwendung der computergestützten Chemie im Enzym-Engineering wird in dem Maße erweitert und vertieft werden, wie sich die beiden Disziplinen immer stärker miteinander verbinden. Protein-Engineering, gerichtete Evolution und andere Techniken haben einen großen Einfluss auf die industrielle Enzymforschung gehabt. Es wird erwartet, dass die künftige Entwicklung von Berechnungsmethoden, insbesondere der Durchbruch neuer Enzymdesignmethoden, der industriellen Enzymforschung im Zeitalter der synthetischen Biologie neue technologische Durchbrüche bescheren wird.
Kontaktieren Sie uns jetzt!
Wenn Sie einen Preis benötigen, tragen Sie bitte Ihre Kontaktdaten in das unten stehende Formular ein. Wir werden uns in der Regel innerhalb von 24 Stunden mit Ihnen in Verbindung setzen. Sie können mir auch mailen info@longchangchemical.com während der Geschäftszeiten ( 8:30 bis 18:00 Uhr UTC+8 Mo.~Sa. ) oder nutzen Sie den Live-Chat auf der Website, um eine schnelle Antwort zu erhalten.
Verbindung Glucoamylase | 9032-08-0 |
Pullulanase | 9075-68-7 |
Xylanase | 37278-89-0 |
Cellulase | 9012-54-8 |
Naringinase | 9068-31-9 |
β-Amylase | 9000-91-3 |
Glukose-Oxidase | 9001-37-0 |
alpha-Amylase | 9000-90-2 |
Pektinase | 9032-75-1 |
Peroxidase | 9003-99-0 |
Lipase | 9001-62-1 |
Katalase | 9001-05-2 |
TANNASE | 9025-71-2 |
Elastase | 39445-21-1 |
Urease | 9002-13-5 |
DEXTRANASE | 9025-70-1 |
L-Milch-Dehydrogenase | 9001-60-9 |
Dehydrogenase Malat | 9001-64-3 |
Cholesterin-Oxidase | 9028-76-6 |