AI-modellen ”avläser” proteinpar, vilket öppnar upp för nya insikter om sjukdomar och läkemedelsutveckling

by Albert
Den parvisa proteinspråksmodellen (PPLM) lär sig samtidigt från två interagerande proteiner, vilket gör det möjligt att förutsäga interaktion, bindningsstyrka och interaktionsgränssnitt.

Forskare har utvecklat en ny modell för artificiell intelligens (AI) som kan förutsäga hur proteiner interagerar med varandra på ett mer exakt sätt – ett framsteg som kan påskynda läkemedelsutvecklingen och ge djupare insikter i sjukdomar som cancer.

Studien, som leds av professor Zhang Yang, seniorforskare vid Cancer Science Institute of Singapore (CSI Singapore) vid National University of Singapore, och publicerades i Nature Communications, introducerar en parvis proteinspråksmodell (PPLM) som lär sig av två interagerande proteiner samtidigt, istället för att analysera dem isolerat. Detta markerar en betydande förändring i hur AI tillämpas inom biologin, vilket möjliggör mer exakta förutsägelser av protein-protein-interaktioner som ligger till grund för nästan alla cellulära processer.

Ett nytt sätt att förstå proteininteraktioner

Protein-protein-interaktioner är i sig relationella, men de flesta nuvarande AI-modeller tränas på enskilda proteinsekvenser. Detta begränsar deras förmåga att fullt ut fånga hur proteiner känner igen och binder till varandra.

För att lösa detta utvecklade forskarteamet PPLM, en modell specifikt utformad för att lära sig relationer mellan proteiner under träningen. Genom att gemensamt koda parvisa proteinsekvenser fångar PPLM både individuella proteinegenskaper och partnerberoende interaktionsmönster inom ett enhetligt ramverk. Modellen tränades på mer än 3 miljoner proteinpar, vilket gjorde det möjligt att lära sig interaktionsmönster i stor skala.

Stark prestanda i flera uppgifter

Med utgångspunkt i detta utvecklade teamet tre specialiserade verktyg: PPLM-PPI för att förutsäga om proteiner interagerar, PPLM-Affinity för att uppskatta bindningsstyrka och PPLM-Contact för att identifiera interaktionsgränssnitt. I jämförelse med referensdatauppsättningar förbättrade modellen noggrannheten i interaktionsförutsägelserna med upp till cirka 17 % jämfört med ledande metoder, med konsekventa förbättringar över flera arter.

Noterbart är att modellen överträffade både sekvensbaserade och strukturbaserade metoder i utmanande scenarier såsom antikropps–antigen-interaktioner. Dessutom identifierade modellen mönster som stämmer överens med hur proteiner interagerar i verkligheten, vilket indikerar att den kan fånga biologiskt meningsfulla relationer mellan proteiner.

”Detta arbete belyser AI:s växande roll i omvandlingen av livsvetenskaperna. Genom att gå från analys av enskilda proteiner till interaktionsmedveten modellering lägger studien grunden för framtida framsteg inom förutsägelser av multiproteinkomplex, biologi på systemnivå och AI-styrd terapeutisk design”, förklarade professor Zhang, som även är verksam vid Institutionen för biokemi vid NUS Yong Loo Lin School of Medicine och Institutionen för datavetenskap vid NUS School of Computing.

Mot skalbar och translationell påverkan

Genom att förbättra noggrannheten och skalbarheten i modellering av proteininteraktioner kan PPLM stödja ett brett spektrum av tillämpningar, inklusive upptäckt av interaktioner på proteomnivå, identifiering av läkemedelsmål och utveckling av terapier.

NUS-teamet arbetar nu med att ytterligare förbättra modellen genom att integrera strukturella och experimentella data och utvidga dess tillämpning till mer komplexa biologiska system, såsom interaktioner mellan värd och patogen.

Publikationsuppgifter

Jun Liu et al, A paired sequence language model for protein-protein interaction modeling, Nature Communications (2026). DOI: 10.1038/s41467-026-70457-5

Related Articles

Leave a Comment