Random Forest para modelagem hidrológica na cidade de São Paulo
Palabras clave:
Random Forest, Modelagem Hidrológica, Previsão de Nível de Rio, Bacia Urbanizada, São PauloResumen
Em Aprendizagem de Máquina, modelos do tipo ensemble são aqueles que combinam diversos outros modelos para fazer uma predição. Um exemplo muito utilizado na literatura é o Random Forest. Esse algoritmo é construído sobre o conceito de bagging, termo usado pela primeira vez como um acrônimo para bootstrap aggregating. O processo de bootstrapping consiste na formação de novos conjuntos de dados replicados do conjunto de dados de treinamento original, cada um com o mesmo tamanho, escolhido aleatoriamente, mas com reposição. Para cada novo replicar, uma árvore de decisão é criada e a previsão final, no caso de regressão, é obtida pela média do resultado de cada preditor individual, sendo o processo chamado aggregating. Neste trabalho, buscamos responder a seguinte pergunta: sob quais circunstâncias, é possível atingir um bom desempenho na previsão do nível de um rio utilizando dados de estações pluviométricas e fluviométricas em uma bacia urbanizada utilizando Random Forest? O foco do estudo é a bacia do rio Tamanduateí, altamente urbanizada, especialmente na porção que fica dentro da cidade de São Paulo. Os dados das estações foram obtidos do site do Departamento de Águas e Energia Elétrica (DAEE) e eles têm amostragem 10-minutal. O objetivo da modelagem é prever o nível do rio na estação do Mercado Municipal, que é a mais próxima do exutório, com algumas horas de antecedência.
Descargas
Citas
L. Breiman. “Bagging predictors”. Em: Machine learning 24 (1996), pp. 123–140.
L. Breiman. “Random forests”. Em: Machine learning 45 (2001), pp. 5–32.
H. Tyralis, G. Papacharalampous e A. Langousis. “A brief review of random forests for water scientists and practitioners and their recent history in water resources”. Em: Water 11.5 (2019), p. 910.