Mise à disposition de la plus grande base de données de protéines humaines

Des scientifiques ont annoncé jeudi dans la revue Nature la mise à disposition de la plus grande base de données de protéines qui forment les briques de la vie, ce qui va "changer fondamentalement la recherche en biologie", selon des spécialistes.

Chaque cellule d'un organisme vivant exécute sa fonction à l'aide de protéines qui livrent en permanence des instructions pour maintenir en bonne santé cette cellule et combattre les infections.

À la différence du génome , le protéome humain change en permanence en réponse à des instructions génétiques et des stimuli extérieurs.

La compréhension du fonctionnement des protéines, via la forme qu'elles adoptent, au sein des cellules, est un véritable défi. Les scientifiques se sont échinés à déterminer par l'expérimentation leur fonction précise. Mais après 50 ans de recherche, on ne connait que 17% des acides aminés, ou composants, du protéome humain.

Les chercheurs de Google DeepMind et du Laboratoire européen de biologie moléculaire (EMBL) ont dévoilé jeudi une base de données, libre d'accès, de 20.000 protéines exprimées par le génome humain. Auxquelles s'ajoutent 350.000 protéines de 20 organismes, comme des bactéries ou des souris, utilisés par la recherche. 

Cette base a été obtenue grâce à un programme d'apprentissage automatique capable de prédire avec précision la forme d'une protéine à partir de sa séquence d'acides aminés. Le programme AlphaFold s'est entraîné sur une base de 170.000 structures connues de protéines et il a ensuite prédit la forme de 58% de toutes les protéines du protéome humain. Ce qui a plus que doublé le nombre de structures de protéines humaines connues avec précision.

Les applications potentielles de ces données vont de la recherche sur les maladies génétiques à l'ingénierie de récoltes résistant à la sècheresse.

Selon Paul Nurse, prix Nobel de médecine et directeur de l'Institut Francis Crick, cette avancée est "un grand pas pour l'innovation en biologie". 

John McGeehan, directeur du Centre for Enzyme Innovation à l'Université de Portsmouth, a remarqué que "ce qui prenait des mois et des années à accomplir a été fait en un week-end par AlphaFold".

La capacité à prédire avec un programme informatique la forme d'une protéine à partir de sa séquence d'acides aminés est déjà mise à profit dans certains secteurs de la recherche.

> DeepMind’s AI predicts structures for a vast trove of proteins

Vous souhaitez commenter cet article ?

L'accès à la totalité des fonctionnalités est réservé aux professionnels de la santé.

Si vous êtes un professionnel de la santé vous devez vous connecter ou vous inscrire gratuitement sur notre site pour accéder à la totalité de notre contenu.
Si vous êtes journaliste ou si vous souhaitez nous informer écrivez-nous à redaction@rmnet.be.