Révolution dans l'Agriculture : Un Modèle d’I.A. Décode le Langage Génétique des Plantes
2024-12-18
Auteur: Chloé
Des chercheurs ont développé PlantRNA-FM, une intelligence artificielle innovante capable de déchiffrer le « langage » génétique des plantes en utilisant des données d’ARN de plus de 1 100 espèces végétales. Ce modèle d’IA a été entraîné à décoder des motifs d’ARN et à identifier leurs fonctions spécifiques, à l’image de la façon dont nous comprenons le langage humain. Cette avancée technologique ouvre la voie à des techniques d’amélioration des cultures et de conservation des espèces végétales.
Le transcriptome, qui regroupe tous les ARN produits par le génome d'une plante, joue un rôle crucial dans les fonctions biologiques essentielles, notamment la traduction des protéines. Des études ont révélé que la structure de ces motifs d’ARN est essentielle à leur fonctionnement. Par exemple, des températures ambiantes fraîches (environ 20 °C) semblent favoriser le repliement de certains motifs d’ARN, probablement en réponse à des adaptations environnementales.
Néanmoins, identifier ces motifs fonctionnels reste un défi majeur en raison de la complexité et du nombre étonnant de combinaisons possibles des bases nucléotidiques. Pour une séquence de seulement 50 nucléotides, il existe plus de 1 trillion (1,27 × 10^30) de combinaisons possibles!
Les modèles appelés « modèles de fondation » (Foundation models ou FM) sont prometteurs pour résoudre ce problème. Ce sont des IA de grande taille (comportant jusqu'à plusieurs milliards de paramètres) qui peuvent être pré-entraînées sur des données non étiquetées, ce qui les rend idéales pour des applications biologiques.
PlantRNA-FM, élaboré par une collaboration entre le John Innes Centre, l’Université d’Exeter, la Northeast Normal University et l’Académie chinoise des sciences, est le premier modèle spécifiquement conçu pour identifier les motifs fonctionnels d’ARN dans le règne végétal. Yiliang Ding, co-auteur de l’étude, a souligné que cette avancée pourrait transformer notre compréhension des processus cognitifs des plantes et ouvrir de nouvelles possibilités pour l’amélioration des cultures et la conception génétique assistée par IA.
La technologie de décodage est comparable à la manière dont nous interprétons les langues humaines. Analyser les motifs dans l’ARN peut également révéler des structures secondaires ou tertiaires, ajoutant une autre couche de complexité. Pour ce faire, PlantRNA-FM a été entraîné avec un ensemble de données colossales, comprenant 54 milliards d'éléments d'information, ce qui lui permet de capturer la grande diversité des transcriptomes.
En appliquant un raisonnement similaire à celui que nous utilisons pour comprendre des phrases, le modèle a montré sa capacité à prévoir avec précision les fonctions des séquences et à identifier des motifs spécifiques qui influencent l'efficacité de la traduction génétique en protéines. Des expériences ont validé que les motifs identifiés jouent un rôle essentiel dans ce processus biologique clé.
Haopeng Yu, chercheur au John Innes Centre, a déclaré que cette technologie pourrait révolutionner notre compréhension de la biologie végétale, en aidant à faire face à des défis mondiaux tels que la sécurité alimentaire et la résilience climatique des cultures. De plus, les chercheurs suggèrent que PlantRNA-FM pourrait s'appliquer à l'étude de l'ADN d'autres organismes, comme les invertébrés et les bactéries, ce qui pourrait potentiellement conduire à des percées majeures dans notre compréhension des systèmes écologiques complexes.