1: A tudósok olyan mesterséges intelligencia-rendszert hoztak létre, amely képes mesterséges enzimeket generálni a semmiből. A laboratóriumi tesztek során néhány ilyen enzim ugyanolyan jól működött, mint a természetben találhatóak, még akkor is, ha a mesterségesen előállított aminosav-szekvenciájuk jelentősen eltért bármely ismert természetes fehérjétől.
A kísérlet azt bizonyítja, hogy a természetes nyelvi feldolgozás, bár nyelvi szövegek olvasására és írására fejlesztették ki, képes megtanulni legalább a biológia néhány alapelvét. A Salesforce Research fejlesztette ki a ProGen nevű mesterséges intelligenciaprogramot, amely a next-token predikciót használja az aminosav-szekvenciák mesterséges fehérjékké való összeállításához. A tudósok szerint az új technológia erősebb lehet, mint az irányított evolúció, a Nobel-díjas fehérjetervezési technológia, és felpezsdíti a fehérjemérnökség 50 éves területét azáltal, hogy felgyorsítja az új fehérjék kifejlesztését, amelyeket a terápiás szerektől kezdve a műanyag lebontásáig szinte bármire fel lehet használni.
2: „A mesterséges tervek sokkal jobban teljesítenek, mint az evolúciós folyamat által inspirált tervek” – mondta James Fraser, PhD, az UCSF Gyógyszerészeti Iskola biomérnöki és terápiás tudományok professzora, a Nature Biotechnology című szaklapban január 26-án megjelent munka egyik szerzője.
„A nyelvi modell az evolúció aspektusait tanulja, de ez más, mint a normál evolúciós folyamat” – mondta Fraser. „Most már képesek vagyunk e tulajdonságok generálását specifikus hatásokhoz hangolni. Például egy olyan enzimet, amely hihetetlenül hőálló, vagy szereti a savas környezetet, vagy nem lép kölcsönhatásba más fehérjékkel”.” A modell létrehozásához a tudósok egyszerűen betáplálták a gépi tanulási modellbe 280 millió különböző fehérje aminosavszekvenciáját, és hagyták, hogy az néhány hétig eméssze az információt. Ezután finomhangolták a modellt azzal, hogy öt lizozimcsalád 56 000 szekvenciájával és az ezekre a fehérjékre vonatkozó néhány kontextuális információval alapozták meg.
3: A modell gyorsan egymillió szekvenciát generált, és a kutatócsoport 100-at választott ki a teszteléshez az alapján, hogy mennyire hasonlítanak a természetes fehérjék szekvenciáihoz, valamint hogy mennyire természetközeli a mesterséges intelligencia fehérjék mögöttes aminosav-„nyelvtana” és „szemantikája”.
Ebből az első 100 fehérjéből, amelyeket a Tierra Biosciences in vitro szűrt, a kutatócsoport öt mesterséges fehérjét készített, amelyeket sejtekben tesztelt, és összehasonlította aktivitásukat a tyúktojás fehérjében található enzimmel, az úgynevezett tyúktojásfehérje-lizozimmal (HEWL). Hasonló lizozimeket találunk az emberi könnyben, nyálban és tejben, ahol a baktériumok és gombák ellen védekeznek.
A mesterséges enzimek közül kettő a HEWL-hez hasonló aktivitással volt képes lebontani a baktériumok sejtfalát, ugyanakkor szekvenciájuk csak mintegy 18%-ban volt azonos egymással. A két szekvencia körülbelül 90%-ban és 70%-ban megegyezett bármely ismert fehérjével.
4: Egyetlen mutáció egy természetes fehérjében elég, hogy megszüntesse a működését, de egy másik szűrési körben a csoport azt találta, hogy az AI által generált enzimek akkor is aktivitást mutattak, amikor a szekvenciájuknak mindössze 31,4%-a hasonlított bármely ismert természetes fehérjéhez.
A mesterséges intelligencia még azt is képes volt megtanulni, hogy az enzimeknek milyen alakúnak kell lenniük, pusztán a nyers szekvenciaadatok tanulmányozásából. Röntgenkrisztallográfiával mérve a mesterséges fehérjék atomszerkezete pontosan úgy nézett ki, ahogyan annak lennie kellett, bár a szekvenciák semmihez sem hasonlítottak, amit korábban láttak.
A Salesforce Research 2020-ban fejlesztette ki a ProGen-t, egyfajta természetes nyelvi programozás alapján, amelyet kutatóik eredetileg angol nyelvű szövegek generálására fejlesztettek ki. Korábbi munkájukból tudták, hogy a mesterséges intelligenciarendszer képes megtanítani magának a nyelvtant és a szavak jelentését, valamint más mögöttes szabályokat, amelyek az írást jól megkomponálttá teszik.
5: „Ha a szekvencia-alapú modelleket sok adattal képezzük, akkor nagyon hatékonyak a struktúra és a szabályok megtanulásában” – mondta Nikhil Naik, PhD, a Salesforce Research AI-kutatási igazgatója, a tanulmány vezető szerzője. „Megtanulják, hogy milyen szavak fordulhatnak elő együtt, és megtanulják a kompozicionalitást is.”
A fehérjék esetében a tervezési lehetőségek szinte korlátlanok voltak. A lizozimek a fehérjékhez képest kicsik, körülbelül 300 aminosavval. De a 20 lehetséges aminosavval óriási számú (20300) lehetséges kombináció létezik. Ez több, mint az idők során élt összes ember, szorozva a Földön lévő homokszemek számával, szorozva az univerzumban lévő atomok számával.
Tekintettel a korlátlan lehetőségekre, figyelemre méltó, hogy a modell ilyen könnyen képes működő enzimeket létrehozni.
„Az a képesség, hogy a semmiből működő fehérjéket tudunk létrehozni, azt mutatja, hogy a fehérjetervezés új korszakába léptünk” – mondta Ali Madani, PhD, a Profluent Bio alapítója, a Salesforce Research korábbi kutatója és a tanulmány első szerzője. „Ez egy sokoldalú új eszköz áll a fehérjemérnökök rendelkezésére, és már nagyon várjuk a terápiás alkalmazásokat”.
Cikk forrása és további részletek: https://www.sciencedaily.com/releases/2023/01/230126124330.htm
Képek forrása: Flickr (Illusztráció)