Descrição
A textura do solo é a proporção relativa das três principais partículas minerais presentes no solo: areia, silte e argila. Tradicionalmente, sua determinação é realizada em laboratório pelos métodos da pipeta ou do hidrômetro, que são onerosos, demorados e geram resíduos químicos. Como alternativa a esses métodos tradicionais, dados obtidos por sensores proximais, como a espectrometria por fluorescência de raios-X portátil (pXRF), têm sido cada vez mais utilizados para predizer a textura do solo. Contudo, poucos estudos exploraram a quantidade mínima necessária de amostras para treinar modelos de predição acurados. Assim, o objetivo deste trabalho foi predizer a textura do solo por meio do algoritmo Random Forest e estabelecer a quantidade ideal de amostras para se obter modelos de predição com boa acurácia. A área de estudo está localizada na Universidade Federal de Lavras, Minas Gerais, onde foram coletadas 236 amostras nos horizontes A e B. O algoritmo utilizado foi o RF e foram utilizadas as seguintes variáveis explanatórias: pXRF, pXRF+MS, pXRF+MS+TA e TA, sendo MS a susceptibilidade magnética e TA atributos de terreno. Os modelos foram treinados com diferentes proporções do banco de dados (90, 80, 70, 60, 50, 40, 30, 20 e 10%) e validados com um conjunto de amostras independentes. Utilizou-se R², RMSE, RPD e MAE como índices de validação, sendo considerado o modelo mais acurado aquele com menor valor de RMSE. A estratégia de amostragem buscou cobrir a ampla diversidade de materiais de origem, classes de solo e usos da terra. Foi observado que para a fração argila, 50% das amostras (ou seja, 118 amostras) foram suficientes para treinar um modelo de predição acurado (RPD=2,2; pXRF+MS+TA), para silte 60% (RPD=1,4; pXRF) e para areia 90% (RPD=2,4; pXRF+MS). Observou-se que o modelo para a predição da fração argila apresentou alta acurácia com um menor número de amostras, enquanto a predição da fração areia também se mostrou acurada, mas com um maior número de amostras. O silte não apresentou bom desempenho independentemente do número de amostras no conjunto de treinamento. Conclui-se que o uso de sensores proximais aliado a algoritmos de aprendizado de máquina, como o Random Forest, é uma alternativa eficiente e sustentável para estimar a textura do solo. Além disso, os resultados indicam que a quantidade ideal de amostras varia conforme a fração textural, permitindo otimizar o esforço de amostragem sem comprometer a acurácia preditiva.
Agradecimentos
Os autores agradecem o apoio financeiro das agências CAPES, CNPq e FAPEMIG.
| Selecione a modalidade do seu trabalho | Resumo Simples |
|---|