Desde a sua criação em 1940, o IGN sempre focou na aliança entre competências humanas de análise e interpretação e tecnologias. Hoje, possui uma capacidade de observação ampliada graças ao cruzamento de imagens de satélite, aéreas ou lidar de alta densidade. E para analisar todos estes dados continuamente, a IA desempenha agora um papel decisivo.
“Tomemos um caso emblemático do nosso país: o monitoramento do uso do solo, detalhes Matthieu Porte. Para tornar a IA uma ferramenta poderosa, criaremos algoritmos capazes de ler instantâneos do território e, portanto, descrever a sua composição. Nossos especialistas em análise fotográfica sabem fazer essa descrição em algumas centenas ou milhares de quilômetros quadrados. Amanhã, os algoritmos permitirão estendê-lo a todo o território nacional e fazê-lo com muito mais regularidade. “
Dois grandes projetos ilustram esta ambição. O primeiro, denominado OCS GE (uso do solo em larga escala), visa mensurar a artificialização do território com atualizações a cada três anos. Consiste no desenvolvimento de um modelo de aprendizagem profunda baseado em dados “base” provenientes de fotografias aéreas de alta resolução, para classificar automaticamente áreas de acordo com 16 tipos de cobertura diferentes (floresta, terrenos agrícolas, edifícios, etc.). Feita essa descrição, ela é cruzada com outros dados, como os dos arquivos fundiários transmitidos pelo Centro de Estudos e Perícias em Riscos, Meio Ambiente, Mobilidade e Desenvolvimento (Cerema).
Este projeto não só oferece uma medição mais abrangente da artificialização do solo, mas também visa responder a outro desafio: identificar as chamadas zonas de não alteração. Porque a taxa de variação num período de três anos é estimada em 1% da superfície do território. Fazer tudo de novo todas as vezes, portanto, não faz sentido.
Leia tambémSob nossos pés, uma vida misteriosa que os cientistas estão tentando descobrir
Tempo de atualização do mapa dividido por três
O outro projeto diz respeito à cartografia florestal nacional produzida pelo IGN. Ainda contando com o aprendizado profundo, uma “máscara florestal” poderia ser criada para determinar com precisão a extensão da floresta e o que não faz parte dela. Está operacional desde maio de 2024 no âmbito do lançamento da nova versão deste mapa. “A versão anterior foi um projeto muito grande para nós: demoramos dez anos para concluí-lo! Contar com a inteligência artificial nos permitirá dividir por pelo menos três este prazo “, sublinha Matthieu Porte.
Esta “máscara florestal” não se destina a ser utilizada apenas pelos investigadores do IGN, mas por todos os profissionais da indústria da madeira, bem como pelas partes interessadas ambientais e de planeamento. É por isso que a versão beta (ainda não concluída) já está acessível gratuitamente. Para Arnaud Braun, coordenador do projeto BD Forêt v3, este trabalho foi apenas um “primeiro passo importante antes de tentar descer um pouco mais ao solo e identificar as diferentes espécies de árvores que compõem as florestas. Para isso, a IA integrará imagens atualizadas regularmente a partir de imagens do satélite Sentinel-2, o que permite a compreensão. da sazonalidade que rege os seres vivos, bem como dados lidar HD, que abrem a compreensão da máquina sobre o formato das árvores. “
No entanto, para que os algoritmos sejam eficazes, eles devem ser treinados com dados de aprendizagem adequados. E neste ponto, o IGN tem uma vantagem significativa: a sua capacidade de produzir conjuntos de dados massivos, diversificados e de qualidade. “Com 2 bilhões de pixels, 980 quilômetros quadrados de imagens anotadas para descrever o uso da terra, o conjunto de dados abertos Flair era, por exemplo, após sua publicação, um dos três mais ricos do mundo com DeepGlobe (Facebook, MIT) e LoveDA (Universidade de Wuhan). , China) “, entusiasma-se o coordenador de IA do IGN. Idem para o conjunto de dados PureForest que, com 135.000 imagens lidar de 50 m2 cobrindo 449 florestas de 40 departamentos, constitui o maior conjunto internacional de dados lidar sobre espécies florestais.
Este ativo é essencial para observar o uso do solo e a sua evolução, pois o modelo de IA implementado deve ser capaz de operar de forma fiável em todo o território nacional. Deve, portanto, ser capaz de diferenciar entre ambientes urbanos e naturais dependendo do tipo de telhado, dos componentes da vegetação e até da estação do ano. O maciço dos Vosges não terá no inverno o mesmo aspecto que no final da primavera, por exemplo, e a IA terá, no entanto, de reconhecer isso.
É portanto necessário alimentar o modelo de aprendizagem com amostras muito variadas. “A fotointerpretação é uma experiência muito especializada, especialmente num ambiente florestal. Na nossa empresa, comparamos especialistas a radiologistas de fotografia aérea! Sem a sua experiência inicial, seria impossível para nós criar IA relevante “, acredita Matthieu Porte.
Leia tambémO mundo secreto do solo, entre a natureza e a cultura
Ambição final: um gêmeo digital da França
O IGN não está a agir sozinho para mapear o Antropoceno. Abriu os seus conjuntos de dados, os seus dados de aprendizagem e até os seus códigos algorítmicos de IA, permitindo-lhes ser explorados para lançar projetos em parceria com outros intervenientes na investigação. “Dois são particularmente importantes, descreve Matthieu Porte. A primeira é a nossa parceria com a Genci (Grandes Equipamentos Nacionais de Computação Intensiva) e o CNRS, que nos permite explorar as capacidades do supercomputador Jean-Zay (o supercomputador francês mais poderoso dedicado à pesquisa). Ter acesso a esse poder computacional torna mais fácil e rápido treinar nossos modelos. Além disso, o CarHab é um programa muito ambicioso realizado no âmbito das políticas europeias de protecção da biodiversidade, para o qual trabalhamos em estreita colaboração com conservatórios botânicos. Esta aliança demonstra o interesse em combinar conhecimentos para criar uma IA verdadeiramente útil. “A CarHab pretende produzir até 2026 um mapa preditivo nacional de habitats naturais e seminaturais: isto é, qualquer ambiente que reúna as condições físicas e biológicas necessárias para a existência de uma espécie animal ou vegetal.
Ambição final: o projeto gêmeo digital da França e seus territórios, lançado em maio passado pelo IGN, Cerema e pelo Instituto Nacional de Pesquisa em Ciências e Tecnologias Digitais (Inria). Aqui, a IA desempenhará um papel central na exploração dos milhões de dados obtidos como parte do programa HD lidar em particular.
Para este gémeo, o IGN também tem a ambição de contar com os rápidos desenvolvimentos da IA generativa para tornar possível a produção de dados territoriais descritivos com IA e beneficiar dos contributos da linguagem natural. “O que permitirá modelar o comportamento do território de acordo com os cenários que lhe serão submetidos, decifra Matthieu Porte. O suficiente para oferecer previsões de desenvolvimento de acordo com diferentes opções de desenvolvimento, por exemplo, para melhor orientar a tomada de decisões públicas. “.
Rumo a uma visão 3D de cada parcela
No final de 2020, a IGN lançou um enorme projeto de modelagem 3D usando lidar de alta densidade (HD) do território francês. Objetivo: garantir que até o final de 2025 os raios laser proporcionem uma visão de cada parcela com uma precisão sem precedentes. Sequenciado ao longo de cinco anos, o programa visa fornecer dados 3D relativos ao solo e ao subsolo, que serão homogéneos, ricos, fiáveis, abertos e acessíveis a todos. O potencial trazido por esta modelagem é considerável.
Hoje, os dados lidar já são usados na prevenção de riscos de inundações. Em Outubro de 2020, os aviões da IGN, por exemplo, realizaram pesquisas lidar de emergência em áreas afectadas pela tempestade Alex, a fim de modelar com precisão as mudanças topográficas em vales afectados pelo mau tempo e para facilitar a rápida actualização dos planos de prevenção de riscos. Amanhã, os dados HD lidar relativos às áreas florestais permitirão observar a estrutura dos povoamentos e fornecerão aos investigadores informações sobre a porosidade da cobertura vegetal, um dos principais indicadores da saúde das florestas e da sua capacidade de regeneração. “Isso ajudará a fortalecer o monitoramento das florestas para ter um mapa da sua vulnerabilidade às mudanças climáticas “, sublinha o IGN.
Por Fanny Costes