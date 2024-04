Forschern des IPK Leibniz-Instituts und des Forschungszentrums Jülich ist jetzt ein Durchbruch bei der Bewältigung dieser Herausforderung gelungen. Unter der Leitung von Jedrzej Jakub Szymanski trainierte das internationale Forscherteam interpretierbare "Deep-Learning"-Modelle, eine Untergruppe von KI-Algorithmen, mit einem riesigen Datensatz von genomischen Informationen aus verschiedenen Pflanzenarten. "Diese Modelle waren nicht nur in der Lage, die Genaktivität anhand von Sequenzen genau vorherzusagen, sondern auch festzustellen, welche Sequenzteile diese Vorhersagen ermöglichen", erklärt der Leiter der IPK-Arbeitsgruppe "Netzwerkanalyse und Modellierung". Die von den Forschern angewandte KI-Technologie ist vergleichbar mit derjenigen, die im Bereich des Computersehens eingesetzt wird, wo es darum geht, Gesichtszüge in Bildern zu erkennen und auf Emotionen zu schließen.

Im Gegensatz zu früheren Ansätzen, die auf statistischer Anreicherung beruhen, entwickelten die Forscher hier ein mathematisches Modell, das anhand von genomischen Sequenzmerkmalen die mRNA-Kopienzahl voraussagen kann. Das Modell berücksichtigt die Struktur des Genmodells und die Sequenzhomologie, also die Genevolution. "Wir waren wirklich erstaunt über die Effektivität. Innerhalb weniger Tage Training haben wir viele bekannte regulatorische Sequenzen wiederentdeckt und festgestellt, dass etwa 50 Prozent der identifizierten Sequenzmerkmale völlig neu waren. Die Modelle ließen sich sogar hervorragend auf Pflanzenarten anwenden, für die sie nicht trainiert wurden. Das macht sie für die Analyse neu sequenzierter Genome so wertvoll", so Szymanski.