En ny komplexitet inom proteinkemi: Algoritm avslöjar förbisedda kemiska kopplingar

by Albert
Representation av en nyupptäckt kväve-syre-svavel-bindning, känd som NOS (blått: kväve, rött: syre, gult: svavel), mellan aminosyrorna glycin och cystein i ett enzym. Källa: Sophia Bazzi (strukturella data från Protein Data Bank, visualisering med hjälp av programvaran Coot)
Proteiner är bland de mest studerade molekylerna inom biologin, men ny forskning från universitetet i Göttingen visar att de fortfarande kan rymma överraskande hemligheter. Forskare har upptäckt tidigare oupptäckta kemiska bindningar i arkiverade proteinstrukturer, vilket avslöjar en oväntad komplexitet i proteinkemin.

Dessa nyupptäckta kväve-syre-svavelbindningar (NOS) breddar vår förståelse för hur proteiner reagerar på oxidativ stress, ett tillstånd där skadliga syrebaserade molekyler ansamlas och kan skada proteiner, DNA och andra viktiga delar av cellen. De nya resultaten har publicerats i Communications Chemistry.

Forskargruppen har systematiskt analyserat över 86 000 högupplösta proteinstrukturer från Protein Data Bank, ett globalt offentligt arkiv för proteinstrukturer, med hjälp av en ny algoritm som de utvecklat internt, kallad SimplifiedBondfinder. Denna pipeline kombinerar maskininlärning, kvantmekanisk modellering och strukturella förfiningsmetoder för att avslöja subtila kemiska bindningar som missats av konventionella analyser.

Illustration av hur forskarna använde sin nya algoritm SimplifiedBondfinder för att avslöja dolda kemiska bindningar i proteiner. Den kombinerar maskininlärning (UMAP*), kvantmekanisk modellering och strukturella förfiningsmetoder. ”*Uniform Manifold Approximation and Projection” är en maskininlärningsalgoritm för dimensionsreduktion. Den användes för att projicera högdimensionella kemiska deskriptordata till ett lågdimensionellt utrymme, vilket möjliggjorde identifiering av kluster som motsvarar kända och nya bindningar. Källa: Sophia Bazzi (proteinstrukturdata från Protein Data Bank, visualisering med hjälp av programvaran Pymol och Coot)

Illustration av hur forskarna använde sin nya algoritm SimplifiedBondfinder för att avslöja dolda kemiska bindningar i proteiner. Den kombinerar maskininlärning (UMAP*), kvantmekanisk modellering och strukturella förfiningsmetoder. ”*Uniform Manifold Approximation and Projection” är en maskininlärningsalgoritm för dimensionsreduktion. Den användes för att projicera högdimensionella kemiska deskriptordata till ett lågdimensionellt utrymme, vilket möjliggjorde identifiering av kluster som motsvarar kända och nya bindningar. Källa: Sophia Bazzi (proteinstrukturdata från Protein Data Bank, visualisering med hjälp av programvaran Pymol och Coot)

Oväntat nog var NOS-bindningarna inte begränsade till tidigare kända aminosyrapar, utan upptäcktes även mellan aminosyraparen arginin-cystein och glycin-cystein. NOS-bindningar upptäcktes först genom forskning ledd av professor Kai Tittmann vid Göttingen universitet.

”Vårt arbete visar att Protein Data Bank fortfarande rymmer dolda kemiska egenskaper”, säger Dr Sophia Bazzi vid Institutet för fysikalisk kemi vid Göttingen universitet, som ledde studien. ”Genom att utveckla nya digitala verktyg och återvända till befintliga data har vi upptäckt kemiska interaktioner som varit oupptäckta i årtionden.”

Dessa NOS-bindningar fungerar som molekylära omkopplare som stabiliserar proteiner under oxidativ stress och potentiellt påverkar en rad biologiska processer. ”Vår metod har mycket vidare implikationer”, tillägger Bazzi. ”Den kan avslöja förbisedda kemiska bindningar, vilket kan leda till förbättrade proteinmodeller och framsteg inom proteinteknik, läkemedelsdesign och syntetisk biologi.”

Mer information: Sophia Bazzi et al, Revealing arginine-cysteine and glycine-cysteine NOS linkages by a systematic re-evaluation of protein structures, Communications Chemistry (2025). DOI: 10.1038/s42004-025-01535-w

Related Articles

Leave a Comment