Estudo combina modelos físicos com modelos numéricos e trabalhar com dados de formatos distintos por meio de uma arquitetura multimodal (foto: Tânia Rego/Agência Brasil)
Publicado em 06/05/2024
José Tadeu Arantes | Agência FAPESP – A previsão de eventos extremos é essencial para a preparação e proteção de regiões vulneráveis – especialmente no atual contexto de mudança climática. No Brasil, a cidade de Santos, no litoral paulista, tem proporcionado estudos de caso relevantes, pois enfrenta marés de tempestade, popularmente conhecidas por “ressacas”, que ameaçam tanto a infraestrutura quanto os ecossistemas locais.
Uma pesquisa, que utilizou como espaço amostral a realidade de Santos, empregou ferramentas avançadas de aprendizado de máquina para otimizar os sistemas atuais de previsão de eventos extremos. Artigo a respeito foi publicado no veículo Proceedings of the AAAI Conference on Artificial Intelligence: “Early Detection of Extreme Storm Tide Events Using Multimodal Data Processing”. O trabalho, que mobilizou grande número de pesquisadores, foi coordenado por Anna Helena Reali Costa, professora titular da Escola Politécnica da Universidade de São Paulo (Poli-USP), e teve, como primeiro autor, o pesquisador Marcel Barros, do Departamento de Engenharia de Computação e Sistemas Digitais da Poli-USP.
Os modelos utilizados atualmente para realizar previsões da altura da maré e da altura média das ondas são baseados no equacionamento físico dos fenômenos envolvidos. São compostos por sistemas de equações diferenciais que contemplam variáveis como relevo, maré astronômica (determinada pela posição relativa de três corpos: Sol, Terra, Lua), regime de ventos, velocidade de correntes, índice de salinização da água etc.
Embora bem-sucedida em diversas áreas, essa modelagem é bastante complexa e depende de uma série de hipóteses simplificadoras. Além disso, é muitas vezes inviável integrar a ela novas fontes de dados medidos que poderiam contribuir para previsões melhores.
Por outro lado, estão em alta os métodos de aprendizado de máquina capazes de identificar padrões em dados e realizar extrapolações para situações novas. Mas tais métodos, em geral, precisam de um grande número de exemplos para serem treinados em tarefas complexas como as demandadas por esse tipo de previsão.
“O nosso estudo une os dois mundos ao desenvolver um modelo baseado em aprendizado de máquina que utiliza os modelos físicos como ponto de partida, mas que consegue refiná-los agregando dados medidos. Essa área de estudo é conhecida como ‘Aprendizado de Máquina Informado pela Física’ (Physics-Informed Machine Learning, na expressão em inglês, da qual deriva a sigla PIML)”, diz Barros.
O pesquisador sublinha que a capacidade de harmonizar essas duas fontes de informação é fundamental para desenvolver previsões mais precisas e confiáveis. Porém, a utilização de dados de sensores impõe desafios técnicos significativos, especialmente devido à natureza irregular desses dados, que podem apresentar problemas como lacunas de informações, deslocamentos temporais e variações nas frequências de amostragem. Em caso de falha, alguns sensores podem levar dias para serem restabelecidos, mas os mecanismos de previsão de marés de tempestade devem ser capazes de continuar operando mesmo sem toda a informação disponível.
“Para abordar situações com dados extremamente irregulares, desenvolvemos uma técnica inovadora para representar a passagem do tempo em redes neurais. Essa representação permite que o modelo seja informado da posição e do tamanho das janelas de dados faltantes e passe a considerá-los nas previsões de altura das marés e ondas”, conta Barros.
E acrescenta que esse avanço técnico permite uma melhor modelagem de fenômenos naturais complexos e pode ser utilizado também na modelagem de outros fenômenos que envolvam séries temporais irregulares, como dados de saúde, redes de sensores em manufatura, indicadores financeiros etc.
“Além disso, o modelo que estamos propondo combina diferentes tipos de redes neurais, de modo a integrar dados multimodais. Isso inclui imagens de satélite, informações tabulares e previsões de modelos numéricos, com a possibilidade de incorporar futuramente outras modalidades de dados, como texto e áudio. Essa abordagem representa um passo importante na direção de sistemas de previsão mais robustos e adaptáveis, capazes de lidar com a complexidade e a variabilidade dos dados associados a eventos climáticos extremos”, comenta Reali Costa.
A professora destaca as três maiores virtudes do modelo: combinar modelos físicos com modelos numéricos; representar de uma nova maneira o tempo para redes neurais; trabalhar com dados de formatos distintos, por meio de uma arquitetura multimodal. “O estudo oferece uma metodologia capaz de melhorar a precisão das previsões de eventos extremos, como as marés de tempestade em Santos. Ao mesmo tempo destaca os desafios e potenciais soluções para a integração de modelos físicos e dados sensoriais em contextos complexos”, resume.
O estudo recebeu apoio da FAPESP por meio do Centro de Inteligência Artificial (C4AI), um Centro de Pesquisa em Engenharia (CPE) constituído pela FAPESP e a IBM Brasil e com sede na Poli-USP.