20 août 2024 Longchang Chemical

Quelle est l'approche de la chimie computationnelle dans la recherche sur les enzymes industrielles ?

Ce document présente les principales méthodes de chimie computationnelle utilisées dans la recherche industrielle sur les enzymes, en particulier pour guider l'ingénierie enzymatique, y compris les simulations de champ de force de mécanique moléculaire et de dynamique moléculaire, la mécanique quantique et la modélisation combinée mécanique quantique/mécanique moléculaire, la modélisation électrostatique du continuum et l'amarrage moléculaire. Ces méthodes sont résumées dans le texte sous deux angles, respectivement : premièrement, les concepts de base des méthodes elles-mêmes, les résultats des calculs originaux, les conditions d'applicabilité, et les avantages et inconvénients ; et deuxièmement, les informations précieuses obtenues à partir des calculs pour guider la conception de mutants et de bibliothèques de mutants.

L'application industrielle des enzymes est centenaire et la catalyse enzymatique est largement utilisée dans différents secteurs tels que l'alimentation, l'agriculture, la médecine et l'industrie chimique en raison de sa grande efficacité, de sa spécificité et de sa sélectivité élevées, et de son respect de l'environnement [1-2]. Étant donné que l'environnement des applications industrielles est très différent de l'environnement dans lequel les enzymes vivent dans la nature, la nature et la fonction catalytique des enzymes naturelles et leur environnement d'application ne correspondent généralement pas ou ne sont pas optimaux. Dans ce cas, il est nécessaire de modifier la séquence naturelle d'acides aminés de l'enzyme à l'aide de l'ingénierie enzymatique afin d'améliorer ses performances. [3]. La stratégie d'ingénierie enzymatique la plus couramment utilisée consiste à construire des bibliothèques de mutations pour le criblage, c'est-à-dire l'évolution dirigée en laboratoire [4]. L'une des conditions préalables à une évolution dirigée efficace est que la capacité de la bibliothèque (c'est-à-dire le nombre de mutants contenus dans la bibliothèque) de la bibliothèque de mutants faisant l'objet d'un criblage soit suffisamment importante par rapport à la proportion de mutants potentiellement bénéfiques dans la bibliothèque. La taille d'une banque de mutants est souvent limitée par la méthode de criblage, les ressources disponibles et d'autres conditions objectives. La question clé est de savoir comment augmenter le pourcentage de mutants efficaces dans la banque de mutants. Une compréhension approfondie de la relation entre la séquence, la structure et les propriétés importantes de l'enzyme peut aider à identifier les points chauds de la mutation, à limiter l'étendue de la mutation et à réaliser une conception de qualité de la bibliothèque de mutants. Les méthodes de chimie computationnelle sont un moyen important d'acquérir cette compréhension. Il a été démontré que les bibliothèques de mutations protéiques conçues par calcul peuvent augmenter le pourcentage de mutants efficaces de plusieurs ordres de grandeur par rapport aux bibliothèques de mutations aléatoires [5]. Pour certains sujets difficiles liés à l'ingénierie des enzymes ou des protéines, l'amélioration substantielle que le calcul peut apporter peut suffire à déterminer le succès ou l'échec final du sujet, qui n'est plus limité à l'amélioration de l'efficacité. En fait, les méthodes de chimie et de biologie computationnelles ont permis de concevoir des enzymes artificielles à partir de zéro avec des fonctions catalytiques que les enzymes naturelles ne possèdent pas. Étant donné que d'autres analyses de cet album ont été consacrées aux méthodes de conception optimale automatisée de séquences d'acides aminés, cet article se concentrera sur les méthodes informatiques de simulation et d'analyse d'enzymes avec une séquence d'acides aminés donnée. Bien entendu, les chercheurs peuvent utiliser ces méthodes pour étudier séparément le type sauvage et les mutants, puis comparer les résultats.
L'étude des protéines, en particulier des enzymes, constitue depuis longtemps une frontière importante de la recherche en chimie computationnelle [6-8]. Les principales méthodes comprennent les simulations de dynamique moléculaire (MD classique) basées sur les champs de force de la mécanique moléculaire classique [9], mécanique quantique (MQ) [10] et les méthodes combinées de mécanique quantique/mécanique moléculaire (MQ/MM) [8,11-12], la prédiction de complexes intermoléculaires, c'est-à-dire l'amarrage moléculaire (Docking) [13], et modèle de continuum polarisable (PCM) pour quantifier les effets électrostatiques et de solvant [ 14]. ) comme le modèle de Poisson-Boltzmann (PB) [14], et certains modèles basés sur des propriétés géométriques. Dans cet article, nous donnerons un aperçu de chacune de ces méthodes sous deux angles : premièrement, les méthodes elles-mêmes, y compris les principes de base, les résultats de calcul originaux, les conditions d'applicabilité, et les avantages et inconvénients (potentiels), etc.; et deuxièmement, sur la manière d'utiliser ces méthodes pour obtenir des informations pertinentes pour l'ingénierie, telles qu'une compréhension plus approfondie des mécanismes catalytiques pertinents, des prédictions théoriques ou des explications des changements dans les propriétés ou les fonctions de différents mutants par rapport au type sauvage, qui peuvent guider la conception de bibliothèques de mutation de haute qualité pour l'évolution dirigée, ou la conception de bibliothèques de mutation de haute qualité, ou la conception de banques de mutation. conception de bibliothèques de mutation de haute qualité, ou suggérer des sites de mutation spécifiques et des types de mutation sur la base de l'analyse des résultats de calcul bruts, etc.

1

Simulation de la dynamique moléculaire (MD) basée sur les champs de force de la mécanique moléculaire classique (MM)

1.1

Introduction à la méthode

Pour l'instant, nous ne considérons pas les changements chimiques impliqués dans la catalyse enzymatique, mais seulement les processus de changements de conformation des enzymes, la formation et la dissociation de complexes non covalents entre l'enzyme et les réactifs (ou les produits) en raison du mouvement thermique moléculaire. Au cours de ces processus, l'état électronique de la molécule ne change pas (par exemple, aucune liaison covalente n'est rompue ou créée) et le modèle de champ de force de la mécanique moléculaire s'applique. Ce que l'on appelle le champ de force de la mécanique moléculaire est une fonction mathématique empirique qui exprime la dépendance de l'énergie potentielle d'un système moléculaire par rapport à la configuration géométrique (c'est-à-dire les coordonnées spatiales de tous les atomes qui composent le système moléculaire) (Fig. 1A). En d'autres termes, si l'on utilise X pour représenter les coordonnées spatiales de tous les atomes et VMM (X ) pour représenter l'énergie potentielle du champ de force moléculaire, l'énergie potentielle change lorsque la molécule passe d'une conformation à une autre. X1 à un autre X2:
∆VMM = VMM ( X2 ) – VMM ( X1 ).
Selon la théorie thermodynamique, les atomes d'une molécule sont toujours en mouvement thermique, c'est-à-dire.., X change constamment avec le temps ; en outre, lorsque nous faisons des observations expérimentales, l'échantillon est toujours constitué d'un grand nombre de molécules (à l'exception des expériences sur une seule molécule), avec différentes molécules dans différents états de conformation. Par conséquent, d'un point de vue cinétique, nous devons tenir compte des changements de conformation au fil du temps, et d'un point de vue thermodynamique, nous devons tenir compte de la distribution de probabilité des molécules ayant des conformations différentes. La simulation de la dynamique moléculaire (MD) est le modèle le plus simple pour examiner ces deux aspects des propriétés (Fig. 1B). Dans la simulation de dynamique moléculaire, nous partons d'une conformation initiale, nous calculons la force agissant sur chaque atome à chaque instant sur la base de la conformation actuelle et de la fonction d'énergie potentielle (la force est la dérivée négative de la fonction d'énergie potentielle par rapport aux coordonnées des atomes), nous intégrons numériquement les équations du mouvement de Newton pour obtenir la conformation à l'instant suivant, et nous répétons le processus pour obtenir la trajectoire de l'évolution de la conformation au cours du temps.
Entre les deux, des algorithmes spéciaux peuvent être utilisés pour simuler l'effet des facteurs environnementaux (par exemple, la température, la pression, etc.) sur le mouvement moléculaire. Selon le principe thermodynamique, lorsque l'intervalle de temps est suffisamment long, la distribution de probabilité de la conformation de la même molécule à différents moments et la conformation de différentes molécules dans l'état d'équilibre thermodynamique sont les mêmes (c'est-à-dire que la moyenne temporelle est équivalente à la moyenne du système). Par conséquent, si la simulation MD est effectuée pendant une période suffisamment longue, l'ensemble des conformations obtenues à partir de la simulation peut être utilisé comme un échantillon de la distribution des conformations moléculaires dans un état d'équilibre thermodynamique particulier. Sur la base de ce principe, nous pouvons analyser des propriétés observables arbitraires d'un système dans son état d'équilibre thermodynamique sur la base des trajectoires temporelles obtenues par MD.
La MD est un outil de calcul puissant qui permet d'analyser de manière exhaustive le processus de changement cinétique des changements de conformation et les distributions thermodynamiques quantiques microscopiques importantes à une résolution atomique, ce qui est particulièrement important pour élucider les principes de conception et les mécanismes de fonctionnement des machines biomacromoléculaires complexes telles que les enzymes. Étant donné que les méthodes expérimentales actuelles pour l'analyse de la structure macromoléculaire ne peuvent fournir que des structures statiques à moyenne spatio-temporelle, les simulations MD ont une fonction irremplaçable dans la recherche connexe. Dans ce contexte, l'outil MD lui-même est toujours en cours d'amélioration et de perfectionnement. D'un point de vue méthodologique, les principales limites de la MD proviennent de deux aspects : premièrement, la précision du modèle de champ de force moléculaire et, deuxièmement, le temps de simulation limité qui rend difficile l'échantillonnage complet de l'espace conformationnel. En ce qui concerne le premier problème, le champ de force moléculaire a été considérablement amélioré ces dernières années et la précision de la description thermodynamique de l'équilibre conformationnel des macromolécules biologiques, en particulier des systèmes protéiques, a été accrue, ce qui a permis de simuler avec succès une variété de molécules protéiques, depuis le processus de pliage de la tête jusqu'à la structure naturelle. [15-16]. En termes de temps de simulation, grâce au développement du matériel informatique et des logiciels, il est désormais possible d'effectuer des simulations de l'ordre de la microseconde pour des systèmes de taille habituelle (par exemple, des molécules d'enzymes de centaines de résidus dans une solution aqueuse) en utilisant du matériel informatique conventionnel (par exemple, les serveurs multi-cœurs utilisés par le groupe). À cette échelle de temps, des processus tels que l'ouverture et la fermeture de domaines structurels ou de régions annulaires peuvent être observés. Si davantage de ressources informatiques sont disponibles, des simulations directes de processus tels que la liaison/dissociation du substrat peuvent également être réalisées. Pour étudier les processus à des échelles de temps hors de portée de la simulation (par exemple, les changements fonctionnels à grande échelle des protéines allostériques, etc.), des méthodes d'échantillonnage améliorées peuvent être utilisées [17], à condition que l'utilisateur ait une compréhension plus approfondie de la théorie des DM.
Actuellement, la plupart des applications de simulation MD couvrent des échelles de temps allant de la nanoseconde à la microseconde, et l'échantillonnage de l'espace conformationnel est principalement limité au voisinage de la structure initiale (pour les protéines à domaine unique, il s'agit généralement de l'augmentation et de la diminution structurelles du déplacement quadratique moyen (RMS) dans la plage de 3-4 Å). Il est donc nécessaire d'utiliser une structure initiale raisonnable comme entrée de la MD pour que les résultats de la simulation soient significatifs. Dans la plupart des cas, les structures cristallines déterminées expérimentalement ou les structures basées sur la modélisation comparative de protéines homologues sont utilisées comme structures initiales pour la MD. Lors de la simulation de complexes enzyme-substrat, il est souvent nécessaire de modéliser la structure initiale du complexe sur la base de la structure de l'enzyme vide ou de l'enzyme en complexe avec d'autres molécules, soit en utilisant l'amarrage moléculaire, soit en remplaçant directement d'autres petites molécules (par exemple, des inhibiteurs) dans la structure cristalline par le substrat. Les simulations MD nécessitent également la construction d'un champ de force moléculaire qui représente toutes les unités chimiques du système. Lorsque le système à simuler comprend une petite molécule comme substrat, il arrive souvent que le champ de force moléculaire standard fourni dans le progiciel de MD ne couvre pas la petite molécule comme substrat. Dans ce cas, il est possible d'utiliser un logiciel outil capable de générer automatiquement des champs de force pour les petites molécules [18-19]. Les fichiers de champs de force doivent être vérifiés manuellement et utilisés pour des essais de simulation courts avant d'utiliser les champs de force générés automatiquement pour des simulations MD longues.

Fig. 1 Champ de force de la mécanique moléculaire (A) et simulation de la dynamique moléculaire (B)
Fig. 1 Champ de force de la mécanique moléculaire (A) et simulation de la dynamique moléculaire (B)

1.2

Application à la recherche sur les enzymes

Les informations obtenues à partir des simulations MD peuvent être appliquées de différentes manières pour guider les modifications de l'ingénierie enzymatique [20]. Par exemple, en comparant les simulations MD à température ambiante et à haute température, il est possible de prédire quelles régions de la molécule d'enzyme sont susceptibles d'avoir la stabilité structurelle la plus sensible à la température ambiante. L'introduction de mutations ponctuelles de la proline, de liaisons disulfures, etc. dans ces régions pourrait potentiellement améliorer la résistance à la chaleur de l'enzyme. [21-24]. Une autre stratégie pour améliorer la stabilité consiste à concevoir des mutants qui forment davantage de liaisons hydrogène et de liaisons salines en surface [25-26]. Avant de valider expérimentalement ces mutants, il est possible de simuler en parallèle le type sauvage et les mutants afin d'évaluer théoriquement si la mutation peut produire l'effet désiré [27-28]. Outre la température, la MD peut être utilisée pour analyser l'effet des modifications du pH environnemental, des solvants, etc. sur la conformation des protéines et leur stabilité. [29-30].
Outre la stabilité, la MD a été appliquée pour prédire les résidus "hotspot" qui ont le potentiel d'affecter de manière significative la dynamique conformationnelle associée à la liaison du substrat/libération du produit, fournissant ainsi une base pour la conception de mutations ou de bibliothèques de mutants qui peuvent modifier la sélectivité du substrat, la sélectivité de la réaction, la vitesse de libération du produit, etc. [31-32]. L'une des façons d'étudier la sélectivité substrat/réaction avec la MD est de comparer les résultats de simulation des complexes enzyme-substrat avec différentes (structures initiales) et de prédire le substrat ou les états structurels avec une affinité plus élevée (ou une réactivité plus élevée). Une méthode quantitative rigoureuse pour calculer l'affinité (ou la réactivité) est le calcul de l'énergie libre [33-34]. En raison de l'intensité des calculs d'énergie libre, la plupart des applications actuelles utilisent des méthodes qualitatives de prédiction : la discrimination qualitative de l'affinité relative peut être basée sur la stabilité de la structure des complexes petite molécule-macromolécule, l'énergie moyenne d'interaction intermoléculaire, etc., tandis que la discrimination qualitative de la réactivité est basée sur les distributions de configuration géométrique relative des groupes fonctionnels catalytiques et réactifs, etc. [35]. Les résultats de cette discrimination qualitative peuvent servir de base à la conception de bibliothèques de séquences évolutives dirigées. En outre, les simulations MD peuvent également être utilisées pour analyser les points chauds autour du pore de liaison du substrat/dissociation du produit. [36-37]. Ce type d'application implique la simulation des voies de dissociation pour la dissociation de petites molécules des protéines, et s'il y a des difficultés avec des échelles de temps de simulation insuffisantes, celles-ci peuvent être surmontées en utilisant des techniques d'échantillonnage améliorées. [38-39].

2

Modèles de mécanique quantique (MQ) et de mécanique quantique/mécanique moléculaire combinée (MQ/MM)

2.1

Introduction à la méthode

Pour simuler les étapes chimiques de la catalyse enzymatique, telles que la création et la rupture de liaisons covalentes, le transfert d'électrons et les sauts entre différents états électroniques, des modèles de mécanique quantique (MQ) sont nécessaires. Actuellement, les modèles de mécanique quantique couramment utilisés en chimie informatique sont classés en plusieurs types, tels que les modèles ab initio ( ab initio ), la théorie de la fonction de densité (DFT) et les méthodes semi-empiriques [40]. Parmi elles, les méthodes semi-empiriques sont les moins coûteuses en termes de calcul. Cependant, ce ne sont pas des méthodes de premier principe et la fiabilité des résultats de calcul dépend fortement du système et du problème particuliers. Les méthodes ab initio et DFT sont des méthodes de premier principe et sont universelles. Les modèles DFT pratiques peuvent contenir plus d'approximations théoriques empiriques que les calculs ab initio, mais la DFT peut traiter les énergies de corrélation des électrons avec une très grande efficacité de calcul. En outre, pour de nombreux problèmes de réaction chimique, les erreurs de calcul des meilleurs modèles DFT pour des paramètres clés tels que les changements d'énergie au cours du processus de réaction sont déjà aussi faibles qu'environ 1 kcal/mol, et les résultats sont suffisants pour servir de base à la détermination de la solidité chimique d'un mécanisme catalytique particulier ou d'une voie de réaction.
Étant donné la configuration géométrique d'une molécule, son énergie peut être calculée à l'aide du modèle QM. Le modèle QM est plus souvent utilisé pour l'optimisation des géométries moléculaires, c'est-à-dire pour trouver une structure localement stable (avec une énergie inférieure à celle des structures voisines) après des changements successifs à partir d'une configuration initiale, ou pour trouver les chemins de moindre énergie reliant les réactifs aux produits, et les états de transition le long des chemins. Ces calculs sont intensifs car différentes configurations géométriques doivent être prises en compte et comparées, et des dizaines voire des milliers de calculs en un seul point doivent être effectués. Une stratégie courante pour économiser l'effort de calcul consiste à optimiser d'abord un large éventail de recherches de chemins de réaction en utilisant des modèles QM efficaces avec une précision limitée, puis à compléter l'optimisation de la configuration en utilisant des modèles plus précis à proximité de la configuration/chemin d'énergie la plus basse recherchée, ou à effectuer des calculs en un seul point.
Actuellement, l'application des méthodes de QM de premier principe à l'ensemble de la molécule d'enzyme nécessite des calculs intensifs, se limite essentiellement à des calculs à un seul point et manque encore de praticité. Le modèle QM/MM (Fig. 2) est couramment utilisé pour les grandes molécules [11]. Dans ce modèle, le système moléculaire est divisé en au moins deux parties : la partie directement impliquée dans la réaction chimique est traitée avec le modèle QM, et le reste est traité avec la mécanique moléculaire (MM). Il existe plusieurs stratégies différentes pour traiter les frontières et les interactions QM-MM [41]. Dans les modèles QM/MM de première approche, les calculs QM sont beaucoup plus coûteux que les calculs MM. Par conséquent, les méthodes d'optimisation conformationnelle sont principalement utilisées pour la région QM afin de prédire ou de simuler sa géométrie, et les simulations de dynamique moléculaire peuvent être utilisées pour échantillonner la partie MM. [42]. Cela signifie que les résultats des calculs peuvent être plus sensibles à la structure initiale de la région QM du système. Dans ce cas, des calculs avec différents modèles de structure initiale sont nécessaires pour obtenir des résultats fiables. Si les méthodes semi-empiriques [43] ou théories empiriques sur les liaisons de valence [44-45] sont utilisés pour la partie QM , il peut être possible d'explorer plus complètement l'espace conformationnel et de réduire l'effet de la structure initiale par un échantillonnage QM/MM MD plus long.

Fig. 2 Mécanique quantique (QM)/Moléculaire Mécanique (MM) modèles
Fig. 2 Modèle de mécanique quantique (MQ)/moléculaire (MM).

2.2

Application de la méthode

Les deux le modèle QM [10] et le modèle QM/MM [41] ont été largement utilisées pour la prédiction théorique et le test des mécanismes chimiques des réactions catalysées par les enzymes. Leurs résultats peuvent nous aider à discerner les résidus clés qui participent au processus de réaction chimique, à trouver l'étape limitant la vitesse de la réaction, à modéliser la structure des intermédiaires réactionnels et des états de transition, à analyser la manière dont ils interagissent avec l'environnement enzymatique, etc. Le modèle QM/MM a été largement utilisé pour prédire/tester théoriquement le mécanisme chimique de la catalyse enzymatique et pour analyser et prédire les effets possibles des résidus d'acides aminés de l'environnement sur le processus catalytique. [46]. En principe, ces résultats peuvent être utilisés pour guider la conception de bibliothèques de mutations par évolution dirigée dans le but d'améliorer l'activité catalytique et de modifier la spécificité ou la sélectivité. Une étude plus ambitieuse consisterait à obtenir des enzymes artificielles entièrement nouvelles basées sur la conception de nouveaux centres actifs à partir de modèles de structure d'état de transition prédits par QM ou QM/MM. [47].

3

Modélisation électrostatique des milieux continus

3.1

Principe de la méthode

La catalyse enzymatique est presque toujours réalisée dans un environnement de solution spécifique. Les effets des solvants ont une influence cruciale sur les propriétés des enzymes. Les modèles de calcul des effets de solvant des traitements chimiques se divisent en deux catégories : les modèles de solvant explicites, par exemple dans les champs de force de la mécanique moléculaire ou les modèles QM, où chaque molécule de solvant et chaque atome qu'elle contient sont explicitement inclus dans le modèle ; et les modèles de solvant implicites ou de milieu continu. [48], où Les molécules et les atomes du solvant ne sont pas inclus dans le modèle et les "champs moyens du solvant" sont utilisés pour traiter les effets du solvant. qui n'inclut pas les molécules et les atomes du solvant, mais traite les effets du solvant avec ce que l'on appelle un "champ moyen du solvant". L'avantage du modèle de solvant explicite est qu'il permet de traiter le soluté et le solvant de manière totalement cohérente, en modélisant de manière réaliste des interactions spécifiques telles que la liaison hydrogène soluté-solvant, la liaison saline, etc. L'inconvénient est que le nombre de molécules de solvant est important et que le calcul est intensif. En outre, l'augmentation stochastique du solvant contribue de manière significative à l'énergie totale du système, et il faut calculer la moyenne d'un long échantillon de simulation pour éliminer l'effet de l'augmentation. Le modèle de solvant caché représente l'effet de moyennage du solvant, et la hausse et la baisse thermodynamiques du solvant ont été moyennées.
Pour simplifier le traitement, nous séparons généralement l'effet du solvant non polaire (effet hydrophobe) de l'effet du solvant polaire dans le modèle du solvant caché. L'expérience a montré que l'énergie libre de solvatation d'un soluté non polaire est proportionnelle à sa surface accessible au solvant (SASA). Par conséquent, le modèle de solvatation SASA est souvent utilisé pour cette composante. Les paramètres de ce modèle comprennent les rayons atomiques nécessaires pour calculer la SASA, le rayon de la molécule de solvant (1,4 Å pour les molécules d'eau) et une constante de proportionnalité pour l'énergie libre de solvatation proportionnelle à la SASA. Ces paramètres sont généralement déterminés en ajustant les valeurs expérimentales de l'énergie libre de solvatation des petites molécules.
Les modèles les plus couramment utilisés pour prendre en compte les effets des solvants polaires considèrent la région occupée par le solvant comme un milieu continu avec une constante diélectrique spécifique (78,4 pour l'eau), et la région du soluté comme étant occupée par un milieu avec une faible constante diélectrique (couramment évaluée à 2-8) ou un vide (constante diélectrique de 1) (Fig. 3A). Le milieu continu est polarisé par le champ électrostatique généré par la distribution des charges dans la région du soluté, et la distribution des charges polarisées qui en résulte génère à son tour un champ électrostatique dans la région du soluté qui agit sur la charge du soluté. Le champ électrique généré par les charges polarisées est appelé champ de réaction. Par conséquent, le modèle de milieu continu électrostatique est également connu sous le nom de modèle de champ de réaction. Dans le modèle du milieu continu sans ions libres dans la région du solvant, la relation entre le potentiel électrostatique de l'espace et la distribution de la charge de l'espace satisfait à l'équation de Poisson. Pour un environnement de solution contenant des ions libres, la distribution spatiale des ions est affectée par le potentiel électrostatique spatial. L'équation PB est une équation aux dérivées partielles concernant la relation entre la distribution du potentiel électrostatique et la distribution de la charge et du diélectrique dans l'espace tridimensionnel, et peut être résolue numériquement. La méthode numérique la plus courante pour résoudre l'équation PB pour les systèmes macromoléculaires tels que les enzymes est la méthode des différences finies (FD), collectivement appelée modèle FDPB (figure 3B). [14]. Avec la FDPB, il est possible de calculer le potentiel électrostatique en trois dimensions sur la base de la distribution des charges spatiales du soluté, ce qui permet à son tour de calculer d'autres propriétés telles que l'énergie libre électrostatique. Dans les calculs QM pour les systèmes de petites molécules, le champ de réaction est souvent remplacé par le champ électrique généré par la distribution des charges de surface sur la surface moléculaire, et le modèle correspondant est appelé le modèle du milieu continu polarisable (PCM).
Le modèle le plus couramment utilisé pour tenir compte des effets des solvants polaires traite la région occupée par le solvant comme un milieu continu avec une constante diélectrique spécifique (78,4 pour l'eau), tandis que la région du soluté est traitée comme si elle était occupée par un milieu avec une faible constante diélectrique (généralement évaluée entre 2 et 8) ou un vide (constante diélectrique de 1) (Fig. 3A). Le milieu continu est polarisé par le champ électrostatique généré par la distribution des charges dans la région du soluté, et la distribution des charges polarisées qui en résulte génère à son tour un champ électrostatique dans la région du soluté qui agit sur la charge du soluté. Le champ électrique généré par les charges polarisées est appelé champ de réaction. Par conséquent, le modèle de milieu continu électrostatique est également connu sous le nom de modèle de champ de réaction. Dans le modèle du milieu continu sans ions libres dans la région du solvant, la relation entre le potentiel électrostatique de l'espace et la distribution de la charge de l'espace satisfait à l'équation de Poisson. Pour un environnement de solution contenant des ions libres, la distribution spatiale des ions est affectée par le potentiel électrostatique spatial. L'équation PB est une équation aux dérivées partielles concernant la relation entre la distribution du potentiel électrostatique et la distribution de la charge et du diélectrique dans l'espace tridimensionnel, et peut être résolue numériquement. La méthode numérique la plus courante pour résoudre l'équation PB pour les systèmes macromoléculaires tels que les enzymes est la méthode des différences finies (FD), collectivement appelée modèle FDPB (figure 3B). [14]. Avec la FDPB, il est possible de calculer le potentiel électrostatique en trois dimensions sur la base de la distribution des charges spatiales du soluté, ce qui permet de calculer d'autres propriétés telles que l'énergie libre électrostatique. Dans les calculs QM de petits systèmes moléculaires, le champ de réaction est souvent remplacé par le champ électrique généré par la distribution des charges de surface sur la surface de la molécule, et le modèle correspondant est appelé le modèle du milieu continu polarisable (PCM).

Fig. 3 Modèle de continuum électrostatique (A) et Poisson-Boltzmann à différences finies (FDPB) méthode (B)
Fig. 3 Modèle de continuum électrostatique (A) et méthode de Poisson-Boltzmann par différence finie (FDPB) (B).

3.2

Application de la méthode

L'une des applications importantes du modèle de continuum est l'étude de l'état de protonation des groupes de chaînes latérales d'acides aminés chargés dans les molécules d'enzymes. Le logiciel PROPKA prédit le pKa de chaque groupe dissociable en résolvant l'équation PB pour calculer l'énergie libre électrostatique pour différents états de protonation. [50]. La distribution du potentiel électrostatique de surface d'une molécule d'enzyme est un facteur important qui affecte la sélectivité du substrat de l'enzyme. Compte tenu de la structure spatiale et de l'état de protonation d'une molécule d'enzyme, la distribution du potentiel électrostatique de surface d'une molécule d'enzyme peut être calculée par la méthode FDPB, qui prédit également l'effet des mutations des résidus d'acides aminés ou des changements du pH environnemental, des changements de la concentration ionique, etc. sur le potentiel électrostatique de surface. [14].
Lors de l'étude des étapes chimiques de la catalyse enzymatique avec le modèle de grappe QM, il est souvent nécessaire d'utiliser le modèle PCM pour simuler l'influence électrostatique de l'environnement sur la zone de réaction. Si le processus de réaction implique des changements significatifs dans la distribution des charges, les résultats des calculs QM sous vide sans l'utilisation d'un milieu continu ne sont pas raisonnables et peuvent même conduire à des conclusions qualitatives erronées. Dans le modèle QM/MM, le centre de réaction est généralement entouré de molécules solubles qui sont traitées de la manière MM, et il n'est généralement pas nécessaire de prendre en compte le champ de réaction du milieu continu. Toutefois, si la charge nette du système change avant et après la réaction (par exemple, calculs du potentiel d'oxydoréduction), il est probable que la contribution de l'environnement de la solution à l'extérieur des limites du système à l'énergie libre de la réaction doive être prise en compte et, dans ce cas, les résultats QM/MM peuvent être corrigés à l'aide du modèle du milieu continu.
En tant que méthode alliant efficacité et précision, le MM/PBSA peut être utilisé pour analyser l'affinité des complexes protéine-protéine et protéine-petites molécules. [49]. Pour annuler les erreurs, il est conventionnel d'effectuer des simulations de dynamique moléculaire en solvant explicite des complexes afin d'obtenir une collection de conformations ; pour chaque conformation du complexe, calculer l'énergie MM/PBSA du complexe dans son ensemble et de chaque monomère qui compose le complexe, respectivement ; et approximer l'énergie libre de liaison en utilisant la moyenne de la différence entre l'énergie MM/PBSA de l'ensemble et celle des monomères pour l'ensemble de la conformation. Cette méthode peut être utilisée pour analyser les résidus "hotspot" qui affectent l'affinité du substrat et peut également être utilisée pour prédire les changements de sélectivité du substrat dans les mutants.

4

Autres méthodes

4.1

Docking moléculaire

Le docking est le processus informatique qui permet de prédire la structure (et l'affinité) d'un complexe à partir de la structure d'un monomère. L'arrimage petite molécule-protéine est un outil essentiel pour le criblage virtuel de médicaments basé sur la structure, pour lequel plusieurs algorithmes ont été développés [13]. Ces algorithmes et modèles peuvent également être appliqués à l'ancrage de complexes substrat-enzyme. Le criblage virtuel de médicaments nécessite l'examen d'un grand nombre de petites molécules différentes et, pour des raisons d'efficacité informatique, les modifications structurelles du récepteur (ou seulement de la chaîne latérale) ne sont souvent pas prises en compte dans les calculs d'amarrage moléculaire. Contrairement au criblage virtuel, dans les études d'ancrage substrat-enzyme, seuls un ou plusieurs substrats différents sont souvent pris en compte, et les changements structurels de l'enzyme peuvent en principe être mieux pris en compte. La façon la plus simple d'y parvenir est d'obtenir diverses structures enzymatiques par des méthodes d'échantillonnage conformationnel telles que la MD, qui sont arrimées séparément au substrat. Dans l'amarrage substrat-enzyme, il est souvent possible d'utiliser la disposition spatiale relative du substrat et des groupes fonctionnels catalytiques pour trier/évaluer les résultats de l'amarrage.

4.2

Prédiction des pores de petites molécules basée sur la géométrie

De nombreuses études expérimentales ont révélé que certaines mutations éloignées du centre actif peuvent avoir un impact important sur les performances catalytiques des enzymes. Certains de ces sites peuvent agir en modifiant le pore de liaison du substrat/libération du produit, et la taille du pore, les propriétés physicochimiques des résidus autour du pore, etc. peuvent modifier la vitesse de passage du substrat/produit et affecter la sélectivité du substrat. Les méthodes de prédiction des pores peuvent être utilisées pour trouver des résidus chauds pertinents et fournir une base pour la conception de bibliothèques d'évolution dirigée. Plusieurs méthodes basées sur la structure géométrique sont disponibles pour prédire les puits de surface des protéines, les cavités internes, les pores reliant différentes régions, etc. [51-53]. Ces méthodes utilisent des structures spatiales statiques comme données d'entrée et emploient principalement des méthodes géométriques et de théorie des graphes pour réaliser la prédiction avec une grande efficacité de calcul.

4.3

Méthodes de comparaison des centres actifs

Actuellement, une grande quantité de données sur la structure 3D d'enzymes de différents types et familles de structures a été accumulée dans la base de données sur la structure 3D des protéines (PDB). Si nous comparons différentes enzymes, nous constaterons que certaines d'entre elles présentent un degré élevé de similitude au niveau des centres actifs (les centres actifs de la triade catalytique partagés par les protéases à sérine en sont des exemples typiques), même si les séquences structurelles globales ne sont pas similaires. La méthode de comparaison de la structure des centres actifs [54-55] peuvent peut être utilisé pour récupérer automatiquement les centres actifs d'autres enzymes qui sont similaires au centre actif de l'enzyme actuelle. L'empilement de plusieurs centres actifs similaires dans l'espace tridimensionnel et l'analyse des similitudes et des différences entre les différents centres actifs peuvent fournir des informations précieuses pour la sélection des sites de mutation.

5

Résumé

Pour la clarté de la présentation, notre introduction des méthodes susmentionnées est catégorisée. Dans la pratique, les différents types de méthodes ne s'excluent pas mutuellement. Ils peuvent être combinés de nombreuses façons pour mieux répondre aux questions qui nous intéressent. Par exemple, dans les simulations de complexes enzyme-substrat, l'amarrage moléculaire peut être utilisé pour obtenir la conformation initiale de la simulation ; l'ensemble des conformations obtenues à partir des simulations MD peut être utilisé pour l'analyse de prédiction des pores, l'amarrage moléculaire, les simulations QM/MM, etc.Les modèles MM intégrant les états de transition obtenus à partir des modèles QM ou QM/MM peuvent être construits et utilisés pour des simulations MD classiques de longue durée afin d'analyser les effets de l'augmentation et de la diminution de la conformation sur les processus chimiques, ou pour la simulation d'un grand nombre de mutants afin de réaliser un criblage virtuel des mutants sur la base de simulations MD ; l'approche MM/PBSA, que nous avons déjà mentionnée, est une combinaison de la modélisation MD et de la modélisation des milieux continus, etc.
L'étude des systèmes de biomolécules tels que les protéines par des méthodes de chimie computationnelle a une histoire de plus de 40 ans. Ces méthodes ont été utilisées de plus en plus largement dans la recherche sur les enzymes industrielles tout en se développant continuellement. Les équipes de recherche chinoises en chimie computationnelle et en génie enzymatique industriel se développent et leurs capacités de recherche s'améliorent rapidement. L'application de la chimie computationnelle au génie enzymatique s'élargira et s'approfondira au fur et à mesure que la combinaison de ces deux disciplines deviendra de plus en plus étroite. L'ingénierie des protéines, l'évolution dirigée et d'autres techniques ont eu un impact considérable sur la recherche industrielle en matière d'enzymes. Le développement futur des méthodes computationnelles, en particulier la percée de nouvelles méthodes de conception d'enzymes, devrait entraîner de nouvelles percées technologiques pour la recherche industrielle sur les enzymes à l'ère de la biologie synthétique.

Contactez-nous dès maintenant !

Si vous avez besoin de Price, veuillez indiquer vos coordonnées dans le formulaire ci-dessous. Nous vous contacterons généralement dans les 24 heures. Vous pouvez également m'envoyer un courriel info@longchangchemical.com pendant les heures de travail ( 8:30 am to 6:00 pm UTC+8 Mon.~Sat. ) ou utilisez le chat en direct du site web pour obtenir une réponse rapide.

Composé Glucoamylase 9032-08-0
Pullulanase 9075-68-7
Xylanase 37278-89-0
Cellulase 9012-54-8
Naringinase 9068-31-9
β-Amylase 9000-91-3
Glucose oxydase 9001-37-0
alpha-amylase 9000-90-2
Pectinase 9032-75-1
Peroxydase 9003-99-0
Lipase 9001-62-1
Catalase 9001-05-2
TANNASE 9025-71-2
Elastase 39445-21-1
Uréase 9002-13-5
DEXTRANASE 9025-70-1
L-Lactique déshydrogénase 9001-60-9
Déshydrogénase malate 9001-64-3
Cholestérol oxydase 9028-76-6

Contact US

French