IBM et le Marshall Space Flight Center de la NASA ont annoncé une collaboration visant à utiliser la technologie d'intelligence artificielle (IA) d'IBM pour découvrir de nouvelles perspectives dans l'énorme quantité de données scientifiques terrestres et géospatiales de la NASA. Ce travail conjoint permettra d'appliquer pour la première fois la technologie des modèles de base de l'IA aux données des satellites d'observation de la Terre de la NASA. Les modèles de base sont des types de modèles d'IA qui sont formés sur un large ensemble de données non étiquetées, qui peuvent être utilisés pour différentes tâches et qui peuvent appliquer les informations d'une situation à une autre.

Ces modèles ont rapidement fait progresser le domaine de la technologie du traitement du langage naturel (NLP) au cours des cinq dernières années, et IBM est à l'avant-garde des applications des modèles de fondation au-delà du langage. Les observations de la Terre qui permettent aux scientifiques d'étudier et de surveiller notre planète sont recueillies à un rythme et un volume sans précédent. Des approches nouvelles et innovantes sont nécessaires pour extraire des connaissances de ces vastes ressources de données.

L'objectif de ce travail est de fournir aux chercheurs un moyen plus facile d'analyser et de tirer des enseignements de ces grands ensembles de données. La technologie de modèle de fondation d'IBM a le potentiel d'accélérer la découverte et l'analyse de ces données afin de faire progresser rapidement la compréhension scientifique de la Terre et la réponse aux problèmes liés au climat. IBM et la NASA prévoient de développer plusieurs nouvelles technologies pour extraire des informations des observations de la Terre.

L'un des projets consistera à entraîner un modèle de base d'intelligence géospatiale d'IBM sur le jeu de données Harmonized Landsat Sentinel-2 (HLS) de la NASA, un enregistrement des changements de la couverture et de l'utilisation des sols capturés par des satellites en orbite autour de la Terre. En analysant des pétaoctets de données satellitaires pour identifier les changements dans l'empreinte géographique de phénomènes tels que les catastrophes naturelles, les rendements cycliques des cultures et les habitats de la faune et de la flore, cette technologie de modèle de base aidera les chercheurs à fournir une analyse critique des systèmes environnementaux de notre planète. Un autre résultat de cette collaboration devrait être un corpus facilement consultable de la littérature des sciences de la Terre. IBM a développé un modèle NLP entraîné sur près de 300 000 articles de journaux sur les sciences de la Terre pour organiser la littérature et faciliter la découverte de nouvelles connaissances.

Contenant l'une des plus grandes charges de travail d'IA entraînées sur le logiciel OpenShift de Red Hat à ce jour, le modèle entièrement entraîné utilise PrimeQA, le système de réponse aux questions multilingues open-source d'IBM. En plus de fournir une ressource aux chercheurs, le nouveau modèle linguistique pour les sciences de la Terre pourrait être intégré dans les processus de gestion et d'intendance des données scientifiques de la NASA. D'autres projets communs potentiels IBM-NASA dans le cadre de cet accord comprennent la construction d'un modèle de base pour les prévisions météorologiques et climatiques à l'aide de MERRA-2, un ensemble de données d'observations atmosphériques.

Cette collaboration s'inscrit dans le cadre de l'Open-Source Science Initiative de la NASA, un engagement à construire une communauté scientifique ouverte, inclusive, transparente et collaborative au cours de la prochaine décennie.