Denne artikkelen er produsert og finansiert av Universitetet i Oslo - les mer.
Det finnes flere mulige kombinasjoner av grunnstoffene enn det finnes atomer i universet. (Illustrasjonsfoto: Colourbox)
Det finnes flere mulige molekyler enn atomer i universet. Kunstig intelligens kan hjelpe forskere å finne de best egnede kombinasjonene.
Se for deg at du skal utvikle en ny skjerm til en mobiltelefon eller en ny type medisin. Du vet hvilke egenskaper du ser etter i materialet, og du jakter noe som er bedre enn det vi har i dag.
Det finnes flere mulige molekyler enn det finnes atomer i universet. Derfor er dette en enorm oppgave.
Nå har forskere utviklet et verktøy som kan bli nyttig.
– Vi har utviklet et verktøy som består av et datasett og en algoritme. Til sammen kan dette bidra til å utforske det enorme mulighetsrommet for antall ulike molekyler, forklarer forsker David Balcells ved Hylleraas-senteret ved Universitetet i Oslo.
Fra før finnes det liknende verktøy for organisk kjemi som blir mye brukt i legemiddelindustrien. Men det mangler tilsvarende verktøy for molekyler som inneholder metaller.
En form for kjemisk lego
Metoden forskerne har brukt, kan utforske kombinatoriske eksplosjoner. Det betyr at de bruker en struktur, eller mal, for et molekyl som består av kjente fragmenter.
Fragmentene er deler av molekyler slik som for eksempel en OH-gruppe. OH-gruppen er en molekyldel som finnes på alle stoffer som kalles alkoholer. Slike molekyldeler finnes det mange av. Ved å se dem som byggeklosser kan kjemikere sette sammen nærmest uendelig mange kombinasjoner.
– Det er litt som å bygge lego, med nærmest uendelig mange muligheter. Matematikere har regnet på hvor mange unike molekyler som kan lages ved å kombinere grunnstoffene på ulike måter. Alle mulige kombinasjoner gir oss tallet 10^200.
– Til sammenlikning er antall stjerner i universet estimert til 10^24. Antall atomer i universet er 10^80. Med andre ord er det flere måter å kombinere grunnstoffene på enn det finnes atomer til å lage kombinasjonene, sier Balcells.
Uttrykket 10^80 representerer et tall der 10 er multiplisert med seg selv 80 ganger. I desimalform betyr dette et ettall etterfulgt av 80 nuller. Slike ekstremt store tall brukes ofte i teoretiske beregninger innenfor vitenskap og matematikk.
Slik ser tallet ut:
100000000000000000000000000000000000000000000000000000000000000000000000000000000.
Mange spennende stoffer vi ikke har oppdaget
Programmet som forskerne har laget, kan finne mange flere kombinasjoner enn kjemikere har tid og mulighet til å lage i et laboratorium. Balcells håper programmet kan bidra til å finne stoffer som det ellers ville tatt svært lang tid å utvikle.
– I dette enorme antallet molekyler skjuler det seg mange interessante molekyler som ennå ikke er oppdaget. For å kunne finne slike stoffer må datasettet bestå av kjemiske fragmenter som er mangfoldige og mulige å lage. Og datasettet må være stort, forklarer Balcells.
Han og de andre forskerne har nå klart å lage et slikt datasett og en algoritme som kan sette sammen fragmentene. Algoritmen tar utgangspunkt i en struktur og gjør små, tilfeldige endringer i denne. Resultatet blir en liste med mange ulike molekyler som har optimale egenskaper.
– Algoritmen fungerer som en optimering. Det betyr at den tar utgangspunkt i en mal, eller en struktur, og så lager den mange ulike molekyler ved å mutere den første tilfeldige populasjonen med molekyler, sier Balcells.
Resultatet blir en liste med mange ulike molekyler som har optimale egenskaper.
Algoritmen kan lage stoffer vi ikke vet noe om fra før
Fordi algoritmen lager molekyler som vi ikke nødvendigvis kjenner, er heller ikke alle egenskapene kjent. Forskerne kan likevel optimere en eller to egenskaper, forklarer Balcells. Metoden kalles Pareto Front-optimalisering.
På denne måten kan listen, som kan inneholde milliarder liknende stoffer, kortes ned til noen hundre molekyler som er best på de egenskapene du velger å optimalisere. Denne metoden effektiviserer arbeidet med å finne nye stoffer.
– Med denne algoritmen trenger du et utgangspunkt, forklarer Balcells. Men en fordel er at den virker uten at du trenger å definere grensene for optimalisering. Du må bare sette hvilke egenskaper du ser etter.
To egenskaper som kan optimaliseres med dagens program, er det forskerne kaller HOMO-LUMO-gapet og polariserbarhet, som handler om molekylets egen stabilitet og interaksjon med andre molekyler.
Kommer ikke utenom menneskelig intelligens
Balcells forteller at det er mulig å bruke denne algoritmen til å lage flere generasjoner med molekyler. Du kan ha et ganske stort tall av mulige molekyler, men ved å optimalisere egenskapene du ser etter, kan du begrense antallet til noe som er mer håndterbart.
– Vi kommer likevel ikke utenom menneskelig intelligens, sier Balcells.
– Dette programmet kan hjelpe deg å finne nye muligheter, men du må ha innsikt i kjemi for å plukke ut de molekylene som kan egne seg. Programmet vet ikke hvilke molekyler som vil være billige å produsere, hvilke som er de letteste å lage, eller andre egenskaper som molekylene kan ha, sier han.
Inneholder metaller
Han forteller at liknende metoder har blitt brukt med hell i organisk kjemi. De har blitt nyttige verktøy for blant annet legemiddelprodusenter, men mange legemidler inneholder også metaller. Derfor representerer dette verktøyet en ny mulighet, siden det også tar for seg denne typen molekyler.
Mange enzymer inneholder for eksempel metaller, forteller Balcells. Enzymer har mange viktige oppgaver i kroppen.
Mange typer cellegift inneholder metaller. I tillegg er mange stoffer som er viktige for CO2-resirkulering, grønt hydrogen og andre ting innenfor det grønne skiftet, avhengige av metall-organiske-forbindelser.
– Mange stoffer som etterlikner stoffer i naturen, inneholder metaller. Vi kaller dem biomimetiske stoffer. Ofte er de enklere og mindre enn enzymer, men lettere å lage og jobbe med, sier Balcells.
Selv mener han at utviklingen av nye typer cellegift vil kunne være en av mulighetene det nye programmet vil fungere godt for.
Håper å legge inn enda flere egenskaper
Foreløpig er det et begrenset antall egenskaper som programmet kan optimalisere etter, men Balcells ønsker å utvikle det til også å se etter egenskaper som løselighet, eller evnen til å ta opp lys i ulike bølgelengder.
Han forteller at programmet de har laget er en form for generativ kunstig intelligens.
– Vi har KI som lager bilder eller tekst, og dette programmet lager molekyler, forklarer han.
Referanse:
Hannes Kneiding, Ainara Nova, og David Balcells: Directional multiobjective optimization of metal complexes at the billion-system scale. Nature Computational Science, 2024. (Sammendrag) Doi.org/10.1038/s43588-024-00616-5
forskning.no vil gjerne høre fra deg!
Har du en tilbakemelding, spørsmål, ros eller kritikk? TA KONTAKT HER