Descrição
A disponibilidade de séries temporais hidrológicas é fundamental para estudos de recursos hídricos, contudo, falhas e lacunas de dados são recorrentes, resultantes de problemas técnicos, falhas operacionais ou erros de medição. Diante destas demandas, pesquisas recentes realizadas em diversas regiões do Brasil têm avaliado distintos métodos de preenchimento para dados diários, visando compreender sua aplicabilidade e limitações frente a situações que demandam longas séries completas, tais como a modelagem hidrológica contínua. Nesse contexto, objetivo desse estudo foi avaliar e comparar o desempenho de diferentes métodos de preenchimento de dados faltantes em séries temporais hidrológicas, aplicados especificamente à bacia hidrográfica do rio Piracicaba, em Minas Gerais. A área de estudo possui 5.304 km², foram selecionadas cinco estações pluviométricas e três fluviométricas. Foram utilizados dados diários de vazão e precipitação do portal Hidroweb/ANA, no período de 08/01/1998 a 29/10/2001. As séries completas foram manipuladas pela inserção de falhas aleatórias de 5%, 10% e 15%, simulando cenários de perda de dados. Foram testados seis métodos de imputação, abrangendo diferentes complexidades: os estatísticos simples (Média Móvel - MM e Interpolação Linear - IL); os preditivos baseados em regressão (Regressão Linear - RL e Imputação Múltipla por Cadeias de Equações - MICE); e os de Aprendizado de Máquina (Random Forest -RF e Multi-Layer Perceptron - MLP). A eficiência foi avaliada pelo Índice de Willmott de 1981 (d), métrica consolidada em estudos hidrológicos. O desenvolvimento foi realizado em Python na plataforma Google Colab. Os resultados indicaram que métodos baseados em regressão e aprendizado de máquinas (RL, RF, MLP e o MICE) superaram as técnicas simples como o IL e MM, principalmente em cenários de maiores percentuais de falhas. O RF apresentou melhor desempenho para 5% de dados ausentes (d = 0,847), enquanto o MICE foi mais eficiente para 10% e 15% (d = 0,811 e 0,841, respectivamente). Conclui-se que, para este conjunto de dados, métodos baseados em regressão e o MICE foram os mais adequados, sendo recomendado para estudos futuros a avaliação da eficácia de tais séries imputadas para modelagem hidrológica contínua.
| Selecione a modalidade do seu trabalho | Resumo Simples |
|---|